Web Mining Übung. www.ke.tu-darmstadt.de/lehre/ss13/web-mining/uebungen. Aufgaben. Umfang

Ähnliche Dokumente
KV Betriebssysteme. Mag. iur. Dr. techn. Michael Sonntag

Schumacher, Chris Druckdatum :11:00

Objektorientierte Programmierung für Anfänger am Beispiel PHP

Softwaretechnologie -Wintersemester 2013/ Dr. Günter Kniesel

Einführung und Motivation

E-Commerce Recht Organisatorisches

Was meinen die Leute eigentlich mit: Grexit?

Leichte-Sprache-Bilder

Häufig wiederkehrende Fragen zur mündlichen Ergänzungsprüfung im Einzelnen:

Die Post hat eine Umfrage gemacht

Formular zum Nachweis notwendiger Leistungen für den Master Management & Organisation Studies

PartnerWeb. Anleitung. Personaladministration online erledigen. Telefon:

Um sich zu registrieren, öffnen Sie die Internetseite und wählen Sie dort rechts oben

Unterrichtsformalitäten für Mathematik, 3. Klasse

Bedienungsanleitung. Matthias Haasler. Version 0.4. für die Arbeit mit der Gemeinde-Homepage der Paulus-Kirchengemeinde Tempelhof

Professionelle Seminare im Bereich MS-Office

Reporting Services und SharePoint 2010 Teil 1

40-Tage-Wunder- Kurs. Umarme, was Du nicht ändern kannst.

Prüfungshinweise für mündliche Prüfungen bei C. Schuchart bzw. die schri9liche Prüfung im Master 2011

Hilfedatei der Oden$-Börse Stand Juni 2014

Zentraler Wertungsrichtereinsatz

Programmierung für Mathematik (HS13)

Erstellen von x-y-diagrammen in OpenOffice.calc

Windows Server 2008 (R2): Anwendungsplattform

Kurzanweisung für Google Analytics

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Objektorientierte Programmierung. Kapitel 0: Begrüssung

Einführung in die Programmierung

Anlage zur Deputationsvorlage L 30/17. Änderung der Verordnungen zur Umgestaltung des fünften Prüfungselements. Zeugnisordnung AP-V 2008

Der große VideoClip- Wettbewerb von Media Markt.

Handbuch zur Anlage von Turnieren auf der NÖEV-Homepage

Bachelorarbeiten am Lehrstuhl für Marketing und Services im Sommersemester Hinweise zu den Themen und zum Auswahlprozess

Grafstat Checkliste Internetbefragung

Mitarbeiterbefragung als PE- und OE-Instrument

Webalizer HOWTO. Stand:

Java Script für die Nutzung unseres Online-Bestellsystems

GeoPilot (Android) die App

Anleitung: Ändern von Seiteninhalten und anlegen eines News Beitrags auf der Homepage des DAV Zorneding

Algorithmen & Datenstrukturen 1. Klausur

Kartei zum Lesetagebuch Nr. 2. Kartei zum Lesetagebuch Nr. 1. Kartei zum Lesetagebuch Nr. 4. Kartei zum Lesetagebuch Nr. 3.

Die Anmeldung zum Prüfungsvorbereitungsportal von Westermann in fünf einfachen Schritten:

teischl.com Software Design & Services e.u. office@teischl.com

Informationen Zur Ticketregistrierung

Registrierung Ihres Fachbesucher Tickets

Lizenzen auschecken. Was ist zu tun?

Kleines Handbuch zur Fotogalerie der Pixel AG

trivum Multiroom System Konfigurations- Anleitung Erstellen eines RS232 Protokolls am Bespiel eines Marantz SR7005

Wie Sie beliebig viele PINs, die nur aus Ziffern bestehen dürfen, mit einem beliebigen Kennwort verschlüsseln: Schritt 1

Wintersemester 2010/2011 Rüdiger Westermann Institut für Informatik Technische Universität München

Online-Sendungsverfolgung. Morgenpost Briefservice GmbH

bilder.tibs.at Upload-Assistent

Anleitung zur Online-Schulung

Fragebogen zur Evaluation der Vorlesung und Übungen Computer Grafik, CS231, SS05

Wie richten Sie Ihr Web Paket bei Netpage24 ein

Fragen und Antworten

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Das Seminar ist eine Prüfungsleistung für Bachelor und Masterstudierende der Informatik!

Übung Grundlagen der Programmierung. Übung 03: Schleifen. Testplan Testergebnisse

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin:

Referenzen Typo3. Blog der Internetagentur Irma Berscheid-Kimeridze Stand: Juni 2015

4D Server v12 64-bit Version BETA VERSION

12. Dokumente Speichern und Drucken

Anleitung für die Registrierung und das Einstellen von Angeboten

Zimmertypen. Zimmertypen anlegen

Kurzanleitung Schneider Online Shop

Anleitung über den Umgang mit Schildern

Übung zur Vorlesung Einführung in die Computerlinguistik und Sprachtechnologie

Wir beraten Sie. Wir unterstützen Sie. Wir schaffen Lösungen. Wir bringen Qualität. Wir beraten Sie. Wir unterstützen Sie. Wir schaffen Lösungen

P = U eff I eff. I eff = = 1 kw 120 V = 1000 W

Informationsblatt zu den Seminaren am Lehrstuhl. für Transportsysteme und -logistik

Was ich als Bürgermeister für Lübbecke tun möchte

Entwicklung des Dentalmarktes in 2010 und Papier versus Plastik.

Im Prüfungsteil Mündlicher Ausdruck sollen Sie zeigen, wie gut Sie Deutsch sprechen.

Seminar: Moderne Web Technologien (MWT)

Benutzerhandbuch - Elterliche Kontrolle

Klausur Software-Engineering SS 2005 Iwanowski

DAUERHAFTE ÄNDERUNG VON SCHRIFTART, SCHRIFTGRÖßE

Virtueller Seminarordner Anleitung für die Dozentinnen und Dozenten

Shopz Zugang Neuanmeldung

Handbuch ECDL 2003 Professional Modul 3: Kommunikation Postfach aufräumen und archivieren

Kurzeinführung Excel2App. Version 1.0.0

Übung Info A. Übungsleiter. Informationen (Sprechstunden, Kontaktdaten): André Schaefer Gudrun Fischer

Übungsblatt 3: Algorithmen in Java & Grammatiken

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen

Kundenregistrierung am egeodata Austria Portal

Snippets - das Erstellen von "Code- Fragmenten" - 1

Excel Pivot-Tabellen 2010 effektiv

Präsentation: Google-Kalender. Walli Ruedi Knupp Urdorf

PROSTEP AG: Anmelden für eine mehrtägige Schulung für Opel-Zulieferer

Es sollte die MS-DOS Eingabeaufforderung starten. Geben Sie nun den Befehl javac ein.

Ihre Interessentendatensätze bei inobroker. 1. Interessentendatensätze

HIER GEHT ES UM IHR GUTES GELD ZINSRECHNUNG IM UNTERNEHMEN

Anleitung für Anbieter

Anleitung für die Lohnmeldung via ELM-Standard mittels PartnerWeb

In diesem Kurs lernen Sie, wie in EXCEL Diagramme erzeugt werden und was Sie dabei beachten sollten.

Übungen zu Einführung in die Informatik: Programmierung und Software-Entwicklung: Lösungsvorschlag

Anleitung zur Prüfungsmeldung im SB-Portal

Das Schulsystem in Deutschland (Band 2, Lektion 1)

Zur Bestätigung wird je nach Anmeldung (Benutzer oder Administrator) eine Meldung angezeigt:

Transkript:

www.ke.tu-darmstadt.de/lehre/ss13/web-mining/uebungen zusätzliche Informationen, Registrierung, Upload, Übungsblätter Aufgaben aus dem Bereich Data-, Text- und Web-Mining Crawling, Textanalyse, Textklassifizierung, Clustering, Information Extraction, etc. großer Spielraum bei Lösungsfindung Programmierung ist notwendig aber die Programme sind nur Mittel zum Zweck Umfang Aufgaben teilweise zeitintensiv, je nach Programmiersprache, Vorkenntnisse, Programmierfähigkeit etc. dafür praktischer Einsatz der Techniken aus der Vorlesung 1 J. Fürnkranz

Zeitplan 5 Aufgaben ca. alle 2 Wochen Abgabe sonntags Übungsstunde dienstags neue Übungsblätter in der Regel Anfang der Woche erste Übung Abgabe 5. Mai, Besprechung 7. Mai zusätzliche Betreuungstermin zweiwöchig Beurteilung: 10+2 Bonuspunkte je Übung, max. 50 Punkte Verbesserungen bis zu einem Notengrad sind möglich plus Wissensbonus natürlich nur bei bestandener Klausur! 2 J. Fürnkranz

Gruppenarbeit möglich Gruppengröße max. 3 Registrierung über Upload-Seite TU-ID-Login notwendig Anmeldung in den nächsten Tagen möglich eine Person muss eine Gruppe erzeugen alle anderen treten dann bei (Erzeuger teilt den anderen die Nummer bei) am 2. Mai werden die Gruppen fixiert Gruppenwechsel nachträglich nur über Veranstalter möglich 3 J. Fürnkranz

1 2 3 5 4 4 J. Fürnkranz

Ablauf Übungsstunde Durchbesprechen der abgegebenen Lösungen Gruppen stellen abwechselnd ihre Lösungen vor mindestens ein Teammitglied muss anwesend sein und vorführen können! 1 Abgabe über Upload-Seite ein Teammitglied lädt für alle hoch letzter Upload wird gewertet Upload einer Zip-Datei 2 5 J. Fürnkranz 3

Abgabe enthält Lösungsdokument PDF-Datei präsentierfähig Ergebnisdateien Tabellen, Grafiken etc. Quelldateien und Programm kompilierbar und ausführbar Beispieldateien benutzter Korpus, Webseiten, Wörterbücher, etc. 6 J. Fürnkranz

Form des PDFs Lösung ohne mündliche Erklärung nachvollziehbar! Benotung soll allein anhand PDF-Datei möglich sein zusätzliches Material nur als Nachweis oder für Detailfragen Referenzen auf benutzte Beispieldateien angeben 7 J. Fürnkranz

Tabellen, Diagramme, Graphen: vollständige Beschriftung der Achsen kurze Beschreibung Abb. 2: Gewicht in Abhängigkeit der Flaschen in sinnlosem Datensatz A 8 J. Fürnkranz

Codelistings, Pseudocodes: Aufzeigen der Funktions / Funktionsweise nicht einfach den Source Code hineinkopieren! unbedingt Erklärung! perl -n -l -a -e 'BEGIN{$x=0} {$x+=$f[$#f]} END{print $x}' preisliste.txt Abb. 1: Aufsummierung der Preise (letztes Wort einer Zeile) einer Preisliste 9 J. Fürnkranz

Web Mining Übung Programmierung beliebige Sprache besonders geeignet: Skriptsprachen Python, Perl, Ruby, Groovy aber auch Java, Javascript, etc. Benutzung von Libraries erlaubt doch Aufgabenstellung ist zu beachten implementieren heißt nicht verwenden einige auf Homepage aufgezeigt Weitere Tools matplotlib, jfree, gnuplot für Plots r-project für statistische Berechnungen und Grafiken graphviz fürs Zeichnen von Graphen etc. etc. etc. 10 J. Fürnkranz

Betreuung Eneldo eneldo@ke.tu-darmstadt.de inhaltliche Frage, Übungsbetrieb, Übung Sprechstunde: Dienstag 16:00-17:00 David Kaufmann zusätzlicher Betreuungstermin Nachbesprechung Übungsabgaben, mehr Feedback Zeitpunkt noch festzulegen Forum 11 J. Fürnkranz

Beispiel 1. Übung Überlegen Sie sich eine Web Mining Anwendung, die mit Text- Klassifikationsverfahren gelöst werden könnte. Skizzieren Sie eine mögliche Umsetzung (Sammlung der Trainingsdaten, Klassifikation der Trainingsdaten, Einsatz des gelernten Klassifikators in der Praxis). Schreiben Sie ein einfaches Programm, das eine sortierte Liste der in einem Text vorkommenden Worte (im weitesten Sinn alles was durch Leerzeichen begrenzt wird) mit den assoziierten Häufigkeiten erstellt und z.b. auf STDOUT ausgibt. Vergleichen Sie die 30 am häufigsten vorkommenden Worte in zwei oder mehreren längeren Texten der gleichen Sprache (z.b. E-books, Projekt Gutenberg, etc.). Sind diese Worte als Merkmale für Text- Klassifizierungs-Aufgaben geeignet? Warum? 12 J. Fürnkranz