Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens

Save this PDF as:
 WORD  PNG  TXT  JPG

Größe: px
Ab Seite anzeigen:

Download "Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens"

Transkript

1 Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg

2 Entscheidungsprobleme beim Textmining Information Retrieval passt ein Dokument zur Anfrage? Information Extraction Ist ein Ausdruck vom gesuchten Typ? Klassifikation Gehört ein Dokument zu einer bestimmten Klasse? Gehört ein Wort einer bestimmten Wortart an? Clustering Gehört ein Dokument zu einem (vorher nicht bekannten) Cluster? Entscheidungen werden anhand von Merkmalen (engl. features) getroffen. 2 / 14

3 Entscheidungsprobleme beim Textmining Information Retrieval passt ein Dokument zur Anfrage? Information Extraction Ist ein Ausdruck vom gesuchten Typ? Klassifikation Gehört ein Dokument zu einer bestimmten Klasse? Gehört ein Wort einer bestimmten Wortart an? Clustering Gehört ein Dokument zu einem (vorher nicht bekannten) Cluster? Entscheidungen werden anhand von Merkmalen (engl. features) getroffen. 2 / 14

4 Entscheidungsprobleme beim Textmining Information Retrieval passt ein Dokument zur Anfrage? Information Extraction Ist ein Ausdruck vom gesuchten Typ? Klassifikation Gehört ein Dokument zu einer bestimmten Klasse? Gehört ein Wort einer bestimmten Wortart an? Clustering Gehört ein Dokument zu einem (vorher nicht bekannten) Cluster? Entscheidungen werden anhand von Merkmalen (engl. features) getroffen. 2 / 14

5 Entscheidungsprobleme beim Textmining Information Retrieval passt ein Dokument zur Anfrage? Information Extraction Ist ein Ausdruck vom gesuchten Typ? Klassifikation Gehört ein Dokument zu einer bestimmten Klasse? Gehört ein Wort einer bestimmten Wortart an? Clustering Gehört ein Dokument zu einem (vorher nicht bekannten) Cluster? Entscheidungen werden anhand von Merkmalen (engl. features) getroffen. 2 / 14

6 Entscheidungsprobleme beim Textmining Information Retrieval passt ein Dokument zur Anfrage? Information Extraction Ist ein Ausdruck vom gesuchten Typ? Klassifikation Gehört ein Dokument zu einer bestimmten Klasse? Gehört ein Wort einer bestimmten Wortart an? Clustering Gehört ein Dokument zu einem (vorher nicht bekannten) Cluster? Entscheidungen werden anhand von Merkmalen (engl. features) getroffen. 2 / 14

7 Entscheidungsprobleme beim Textmining Information Retrieval passt ein Dokument zur Anfrage? Information Extraction Ist ein Ausdruck vom gesuchten Typ? Klassifikation Gehört ein Dokument zu einer bestimmten Klasse? Gehört ein Wort einer bestimmten Wortart an? Clustering Gehört ein Dokument zu einem (vorher nicht bekannten) Cluster? Entscheidungen werden anhand von Merkmalen (engl. features) getroffen. 2 / 14

8 Beispiele für Merkmale Merkmale eines Dokuments: Länge TF-IDF-Wert des Wortes Bundesregierung Häufigkeit des Wortart-N-Gramms Präpos. Artikel Nomen... Merkmale eines Wortes: Großgeschrieben ja/nein Wortstamm Wortart Wortart des voranstehenden Wortes... 3 / 14

9 Beispiele für Merkmale Merkmale eines Dokuments: Länge TF-IDF-Wert des Wortes Bundesregierung Häufigkeit des Wortart-N-Gramms Präpos. Artikel Nomen... Merkmale eines Wortes: Großgeschrieben ja/nein Wortstamm Wortart Wortart des voranstehenden Wortes... 3 / 14

10 Entscheidungen anhand von Merkmalen Kombination mehrerer Merkmale durch Entscheidungsregeln if (F 1 > 5 and F 2 == true) or (F 3 < F 2 ) then... und/oder Verrechnung Kosinus-Maß zwischen den TF-IDF-Vektoren Entscheidend: Auswahl der passenden Merkmale Wahl der Verrechnungsvorschrift mit Parametern 4 / 14

11 Entscheidungen anhand von Merkmalen Kombination mehrerer Merkmale durch Entscheidungsregeln if (F 1 > 5 and F 2 == true) or (F 3 < F 2 ) then... und/oder Verrechnung Kosinus-Maß zwischen den TF-IDF-Vektoren Entscheidend: Auswahl der passenden Merkmale Wahl der Verrechnungsvorschrift mit Parametern 4 / 14

12 Entscheidungen anhand von Merkmalen Kombination mehrerer Merkmale durch Entscheidungsregeln if (F 1 > 5 and F 2 == true) or (F 3 < F 2 ) then... und/oder Verrechnung Kosinus-Maß zwischen den TF-IDF-Vektoren Entscheidend: Auswahl der passenden Merkmale Wahl der Verrechnungsvorschrift mit Parametern 4 / 14

13 Entwicklung von Entscheidungsvorschriften Manuelles Vorgehen: 1 explizites Wissen 2 Ermittlung statistischer Zusammenhänge 3 Ausprobieren verschiedener Verrechnungsvorschriften Punkte 2 und 3 können automatisiert werden! Punkt 1? durch Vorgabe der statistischen Modelle durch Vorgabe potenziell hilfreicher Merkmale 5 / 14

14 Entwicklung von Entscheidungsvorschriften Manuelles Vorgehen: 1 explizites Wissen 2 Ermittlung statistischer Zusammenhänge 3 Ausprobieren verschiedener Verrechnungsvorschriften Punkte 2 und 3 können automatisiert werden! Punkt 1? durch Vorgabe der statistischen Modelle durch Vorgabe potenziell hilfreicher Merkmale 5 / 14

15 Entwicklung von Entscheidungsvorschriften Manuelles Vorgehen: 1 explizites Wissen 2 Ermittlung statistischer Zusammenhänge 3 Ausprobieren verschiedener Verrechnungsvorschriften Punkte 2 und 3 können automatisiert werden! Punkt 1? durch Vorgabe der statistischen Modelle durch Vorgabe potenziell hilfreicher Merkmale 5 / 14

16 Eingabe Merkmal: Attribut-Wert-Paar kann verschiedene Ausprägungen haben endlich viele mögliche Ausprägungen (nominal) (z.b. Wortart = Nomen, Adjektiv, Verb,... oder großgeschrieben = ja, nein) unendlich viele mögliche Ausprägungen (numerisch) (z.b. TF-IDF-Wert = Gleitkommazahl) Zu untersuchende Objekte Repräsentation durch Merkmalsvektoren Darstellung als Vektoren/Punkte im Merkmalsraum 6 / 14

17 Eingabe Merkmal: Attribut-Wert-Paar kann verschiedene Ausprägungen haben endlich viele mögliche Ausprägungen (nominal) (z.b. Wortart = Nomen, Adjektiv, Verb,... oder großgeschrieben = ja, nein) unendlich viele mögliche Ausprägungen (numerisch) (z.b. TF-IDF-Wert = Gleitkommazahl) Zu untersuchende Objekte Repräsentation durch Merkmalsvektoren Darstellung als Vektoren/Punkte im Merkmalsraum 6 / 14

18 Arten des Lernens Überwachtes Lernen Vorgabe von Beispieldaten mit bekannter Lösung (Trainingsdaten) ML lernt Modell aus den Trainingsdaten und wendet es auf neue Fälle an z.b.: Klassifikation Unüberwachtes Lernen Beispieldaten ohne Zuordnung ML untersucht statistische Zusammenhänge und erstellt daraus ein Modell z.b.: Clustering 7 / 14

19 Arten des Lernens Überwachtes Lernen Vorgabe von Beispieldaten mit bekannter Lösung (Trainingsdaten) ML lernt Modell aus den Trainingsdaten und wendet es auf neue Fälle an z.b.: Klassifikation Unüberwachtes Lernen Beispieldaten ohne Zuordnung ML untersucht statistische Zusammenhänge und erstellt daraus ein Modell z.b.: Clustering 7 / 14

20 Merkmalsraum Klasse_1 Klasse_2 EINGABE EINGABE 1 8 / 14

21 Evaluation Beispiel: Klassifikation von Wörtern Wolfgang is reading a book. It was written by Günther Grass. He likes famous authors. Grass was a very famous author. if (uppercase == true) and (position > 1 or length > 4) then -> personal name else -> not a personal name guter Klassifikator? 9 / 14

22 Evaluation Beispiel: Klassifikation von Wörtern Wolfgang is reading a book. It was written by Günther Grass. He likes famous authors. Grass was a very famous author. if (uppercase == true) and (position > 1 or length > 4) then -> personal name else -> not a personal name guter Klassifikator? 9 / 14

23 Evaluation Beispiel: Klassifikation von Wörtern Wolfgang is reading a book. It was written by Günther Grass. He likes famous authors. Grass was a very famous author. if (uppercase == true) and (position > 1 or length > 4) then -> personal name else -> not a personal name guter Klassifikator? 9 / 14

24 Evaluation Generalisierung Wann war das Lernen erfolgreich? Lernen optimiert hinsichtlich der gelernten Beispiele Maßgeblich: Erfolgreiche Behandlung künftiger (ungesehener) Eingaben Evaluierung nötig Generalisierungsfähigkeit: Lernen der Zusammenhänge statt Auswendiglernen 10 / 14

25 11 / 14 Textmining SS 2015 Evaluation Überwachtes Lernen Vorgehen beim überwachten Lernen: 1. Lernphase Beispiele Trainieren (Trainingsdaten) eines Modells 2. Evaluierung Zusätzliche Beispiele Testen (Testdaten) des Modells Wichtig: Strikte Trennung von Trainings- und Testdaten (z.b. Aufteilung 80/20), um unabhängige Evaluierung zu gewährleisten Generalisierungsfähigkeit: Erfolgsrate auf Testdaten ähnlich hoch wie auf Trainingsdaten

26 12 / 14 Textmining SS 2015 Evaluation Evaluationsmaße Beispiel: Krebs-Früherkennung Person X Vorsorgeuntersuchung (VU) durchführen? Evaluation: Akkuratheit: % korrekte Entscheidungen Problem: Testdaten: 1% der Bevölkerung hat Krebs 2 Klassifikatoren: Methode Ergebnis: VU für A alle Krebsfälle + zusätzliche 3% der Bevölkerung B niemanden Welche Methode ist besser?

27 12 / 14 Textmining SS 2015 Evaluation Evaluationsmaße Beispiel: Krebs-Früherkennung Person X Vorsorgeuntersuchung (VU) durchführen? Evaluation: Akkuratheit: % korrekte Entscheidungen Problem: Testdaten: 1% der Bevölkerung hat Krebs 2 Klassifikatoren: Methode Ergebnis: VU für A alle Krebsfälle + zusätzliche 3% der Bevölkerung B niemanden Welche Methode ist besser?

28 Evaluation Evaluationsmaße Beispiel: Krebs-Früherkennung Person X Evaluation: Problem: Vorsorgeuntersuchung (VU) durchführen? Akkuratheit: % korrekte Entscheidungen Testdaten: 1% der Bevölkerung hat Krebs 2 Klassifikatoren: Methode Ergebnis: VU für A alle Krebsfälle + zusätzliche 3% der Bevölkerung B niemanden Welche Methode ist besser? Methode Accuracy A 97% B 99% 12 / 14

29 Evaluation Evaluationsmaße (2) Krebs kein Krebs VU true positive (TP) false positive (FP) keine VU false negative (FN) true negative (TN) FP/FN verursachen unterschiedliche Kosten unterschiedl. Maße: Precision: Wie viele der Verdachtsfälle sind echte Krebsfälle? #TP Precision = #TP + #FP Recall: Für wie viele der echten Krebsfälle wird Vorsorgeuntersuchung durchgeführt? #TP Recall = #TP + #FN F-Score: Kompromiss zwischen Precision und Recall Precision Recall F-Score = 2 Precision + Recall 13 / 14

30 Evaluation Evaluationsmaße (2) Krebs kein Krebs VU true positive (TP) false positive (FP) keine VU false negative (FN) true negative (TN) FP/FN verursachen unterschiedliche Kosten unterschiedl. Maße: Precision: Wie viele der Verdachtsfälle sind echte Krebsfälle? #TP Precision = #TP + #FP Recall: Für wie viele der echten Krebsfälle wird Vorsorgeuntersuchung durchgeführt? #TP Recall = #TP + #FN F-Score: Kompromiss zwischen Precision und Recall Precision Recall F-Score = 2 Precision + Recall 13 / 14

31 Evaluation Evaluationsmaße (2) Krebs kein Krebs VU true positive (TP) false positive (FP) keine VU false negative (FN) true negative (TN) FP/FN verursachen unterschiedliche Kosten unterschiedl. Maße: Precision: Wie viele der Verdachtsfälle sind echte Krebsfälle? #TP Precision = #TP + #FP Recall: Für wie viele der echten Krebsfälle wird Vorsorgeuntersuchung durchgeführt? #TP Recall = #TP + #FN F-Score: Kompromiss zwischen Precision und Recall Precision Recall F-Score = 2 Precision + Recall 13 / 14

32 Evaluation Evaluationsmaße (2) Krebs kein Krebs VU true positive (TP) false positive (FP) keine VU false negative (FN) true negative (TN) FP/FN verursachen unterschiedliche Kosten unterschiedl. Maße: Precision: Wie viele der Verdachtsfälle sind echte Krebsfälle? #TP Precision = #TP + #FP Recall: Für wie viele der echten Krebsfälle wird Vorsorgeuntersuchung durchgeführt? #TP Recall = #TP + #FN F-Score: Kompromiss zwischen Precision und Recall Precision Recall F-Score = 2 Precision + Recall 13 / 14

33 Evaluation Evaluationsmaße (2) Krebs kein Krebs VU true positive (TP) false positive (FP) keine VU false negative (FN) true negative (TN) FP/FN verursachen unterschiedliche Kosten unterschiedl. Maße: Precision: Wie viele der Verdachtsfälle sind echte Krebsfälle? #TP Precision = #TP + #FP Recall: Für wie viele der echten Krebsfälle wird Vorsorgeuntersuchung durchgeführt? #TP Recall = #TP + #FN F-Score: Kompromiss zwischen Precision und Recall Precision Recall F-Score = 2 Precision + Recall 13 / 14

34 Evaluation Klassifikationsmethoden Klasse_1 Klasse_2 EINGABE EINGABE 1 verteilungsfreie Verfahren (z.b. Entscheidungsbaum) statistische Verfahren parametrische (z.b. Naive-Bayes) nicht-parametrische (z.b. Nearest-Neighbor) 14 / 14

Seminar Text- und Datamining Datamining-Grundlagen

Seminar Text- und Datamining Datamining-Grundlagen Seminar Text- und Datamining Datamining-Grundlagen Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 23.05.2013 Gliederung 1 Klassifikationsprobleme 2 Evaluation

Mehr

Seminar Künstliche Intelligenz WS 2013/14 Grundlagen des Maschinellen Lernens

Seminar Künstliche Intelligenz WS 2013/14 Grundlagen des Maschinellen Lernens Seminar Künstliche Intelligenz WS 2013/14 Grundlagen des Maschinellen Lernens Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 19.12.2013 Allgemeine Problemstellung

Mehr

Evaluation. Caroline Sporleder. Computational Linguistics Universität des Saarlandes. Sommersemester 2011 26.05.2011

Evaluation. Caroline Sporleder. Computational Linguistics Universität des Saarlandes. Sommersemester 2011 26.05.2011 Evaluation Caroline Sporleder Computational Linguistics Universität des Saarlandes Sommersemester 2011 26.05.2011 Caroline Sporleder Evaluation (1) Datensets Caroline Sporleder Evaluation (2) Warum evaluieren?

Mehr

Einführung in das Maschinelle Lernen I

Einführung in das Maschinelle Lernen I Einführung in das Maschinelle Lernen I Vorlesung Computerlinguistische Techniken Alexander Koller 26. Januar 2015 Maschinelles Lernen Maschinelles Lernen (Machine Learning): äußerst aktiver und für CL

Mehr

Inhalt. 4.1 Motivation. 4.2 Evaluation. 4.3 Logistische Regression. 4.4 k-nächste Nachbarn. 4.5 Naïve Bayes. 4.6 Entscheidungsbäume

Inhalt. 4.1 Motivation. 4.2 Evaluation. 4.3 Logistische Regression. 4.4 k-nächste Nachbarn. 4.5 Naïve Bayes. 4.6 Entscheidungsbäume 4. Klassifikation Inhalt 4.1 Motivation 4.2 Evaluation 4.3 Logistische Regression 4.4 k-nächste Nachbarn 4.5 Naïve Bayes 4.6 Entscheidungsbäume 4.7 Support Vector Machines 4.8 Neuronale Netze 4.9 Ensemble-Methoden

Mehr

ML-Werkzeuge und ihre Anwendung

ML-Werkzeuge und ihre Anwendung Kleine Einführung: und ihre Anwendung martin.loesch@kit.edu (0721) 608 45944 Motivation Einsatz von maschinellem Lernen erfordert durchdachtes Vorgehen Programmieren grundlegender Verfahren aufwändig fehlerträchtig

Mehr

Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK

Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 16.05.2013 Gliederung 1 Vorverarbeitung

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Mehrdeutigkeit der Wortart Einführung in die Computerlinguistik Statistische Modellierung und Evaluation WS 2008/2009 Manfred Pinkal Sie haben in Moskau liebe genossen Sie haben in Moskau liebe Genossen

Mehr

Vorlesung Maschinelles Lernen

Vorlesung Maschinelles Lernen Vorlesung Maschinelles Lernen Additive Modelle Katharina Morik Informatik LS 8 Technische Universität Dortmund 7.1.2014 1 von 34 Gliederung 1 Merkmalsauswahl Gütemaße und Fehlerabschätzung 2 von 34 Ausgangspunkt:

Mehr

Textmining Klassifikation von Texten Teil 1: Naive Bayes

Textmining Klassifikation von Texten Teil 1: Naive Bayes Textmining Klassifikation von Texten Teil 1: Naive Bayes Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten 1: Naive

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Statistische Modellierung I WS 2010/2011 Manfred Pinkal Wortartinformation Wortartinformation ist eine wichtige Voraussetzung für die syntaktische Analyse. Woher kommt

Mehr

Kapitel ML: I. I. Einführung. Beispiele für Lernaufgaben Spezifikation von Lernproblemen

Kapitel ML: I. I. Einführung. Beispiele für Lernaufgaben Spezifikation von Lernproblemen Kapitel ML: I I. Einführung Beispiele für Lernaufgaben Spezifikation von Lernproblemen ML: I-8 Introduction c STEIN/LETTMANN 2005-2010 Beispiele für Lernaufgaben Autoeinkaufsberater Welche Kriterien liegen

Mehr

Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell

Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten Teil

Mehr

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining.

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining. Personalisierung Personalisierung Thomas Mandl Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung Klassifikation Die Nutzer werden in vorab bestimmte Klassen/Nutzerprofilen

Mehr

Kapitel 11* Grundlagen ME. Aufbau eines ME-Systems Entwicklung eines ME-Systems. Kapitel11* Grundlagen ME p.1/12

Kapitel 11* Grundlagen ME. Aufbau eines ME-Systems Entwicklung eines ME-Systems. Kapitel11* Grundlagen ME p.1/12 Kapitel 11* Kapitel11* Grundlagen ME p.1/12 Grundlagen ME Aufbau eines ME-Systems Entwicklung eines ME-Systems Kapitel11* Grundlagen ME p.2/12 Aufbau eines ME-Systems (1) on line Phase digitalisiertes

Mehr

INTELLIGENTE DATENANALYSE IN MATLAB. Evaluation & Exploitation von Modellen

INTELLIGENTE DATENANALYSE IN MATLAB. Evaluation & Exploitation von Modellen INTELLIGENTE DATENANALYSE IN MATLAB Evaluation & Exploitation von Modellen Überblick Schritte der Datenanalyse: Datenvorverarbeitung Problemanalyse Problemlösung Anwendung der Lösung Aggregation und Selektion

Mehr

INTELLIGENTE DATENANALYSE IN MATLAB. Evaluation & Exploitation von Modellen

INTELLIGENTE DATENANALYSE IN MATLAB. Evaluation & Exploitation von Modellen INTELLIGENTE DATENANALYSE IN MATLAB Evaluation & Exploitation von Modellen Überblick Schritte der Datenanalyse: Datenvorverarbeitung Problemanalyse Problemlösung Anwendung der Lösung Aggregation und Selektion

Mehr

Decision Tree Learning

Decision Tree Learning Decision Tree Learning Computational Linguistics Universität des Saarlandes Sommersemester 2011 28.04.2011 Entscheidungsbäume Repräsentation von Regeln als Entscheidungsbaum (1) Wann spielt Max Tennis?

Mehr

, Data Mining, 2 VO Sommersemester 2008

, Data Mining, 2 VO Sommersemester 2008 Evaluation 188.646, Data Mining, 2 VO Sommersemester 2008 Dieter Merkl e-commerce Arbeitsgruppe Institut für Softwaretechnik und Interaktive Systeme Technische Universität Wien www.ec.tuwien.ac.at/~dieter/

Mehr

Data Mining und maschinelles Lernen

Data Mining und maschinelles Lernen Data Mining und maschinelles Lernen Einführung und Anwendung mit WEKA Caren Brinckmann 16. August 2000 http://www.coli.uni-sb.de/~cabr/vortraege/ml.pdf http://www.cs.waikato.ac.nz/ml/weka/ Inhalt Einführung:

Mehr

TEXTKLASSIFIKATION. WS 2011/12 Computerlinguistik I Deasy Sukarya & Tania Bellini

TEXTKLASSIFIKATION. WS 2011/12 Computerlinguistik I Deasy Sukarya & Tania Bellini TEXTKLASSIFIKATION WS 2011/12 Computerlinguistik I Deasy Sukarya & Tania Bellini GLIEDERUNG 1. Allgemeines Was ist Textklassifikation? 2. Aufbau eines Textklassifikationssystems 3. Arten von Textklassifikationssystemen

Mehr

Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK

Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 08.05.2014 Gliederung 1 Vorverarbeitung

Mehr

Einführung. Einführung in die Methoden der Künstlichen Intelligenz. Maschinelles Lernen. Lernen und Agenten. Beispiele

Einführung. Einführung in die Methoden der Künstlichen Intelligenz. Maschinelles Lernen. Lernen und Agenten. Beispiele Einführung Einführung in die Methoden der Künstlichen Intelligenz Maschinelles Lernen Dr. David Sabel WS 2012/13 Direkte Programmierung eines intelligenten Agenten nicht möglich (bisher) Daher benötigt:

Mehr

WMS Block: Management von Wissen in Dokumentenform PART: Text Mining. Myra Spiliopoulou

WMS Block: Management von Wissen in Dokumentenform PART: Text Mining. Myra Spiliopoulou WMS Block: Management von Wissen in nform PART: Text Mining Myra Spiliopoulou WIE ERFASSEN UND VERWALTEN WIR EXPLIZITES WISSEN? 1. Wie strukturieren wir Wissen in nform? 2. Wie verwalten wir nsammlungen?

Mehr

Mining High-Speed Data Streams

Mining High-Speed Data Streams Mining High-Speed Data Streams Pedro Domingos & Geoff Hulten Departement of Computer Science & Engineering University of Washington Datum : 212006 Seminar: Maschinelles Lernen und symbolische Ansätze Vortragender:

Mehr

20.01.2015 Fabian Grimme und Tino Krüger 1 INDREX. Evaluierung von H2O. Enterprise Data Management Beuth Hochschule für Technik

20.01.2015 Fabian Grimme und Tino Krüger 1 INDREX. Evaluierung von H2O. Enterprise Data Management Beuth Hochschule für Technik 20.01.2015 Fabian Grimme und Tino Krüger 1 INDREX Evaluierung von H2O Enterprise Data Management Beuth Hochschule für Technik 20.01.2015 Fabian Grimme und Tino Krüger 2 INDREX im Überblick In-Database

Mehr

INTELLIGENTE DATENANALYSE IN MATLAB

INTELLIGENTE DATENANALYSE IN MATLAB INTELLIGENTE DATENANALYSE IN MATLAB Evaluation & Exploitation von Modellen Überblick Sh Schritte der Datenanalyse: Datenvorverarbeitung Problemanalyse Problemlösung Anwendung der Lösung Aggregation und

Mehr

INTELLIGENTE DATENANALYSE IN MATLAB. Überwachtes Lernen: Entscheidungsbäume

INTELLIGENTE DATENANALYSE IN MATLAB. Überwachtes Lernen: Entscheidungsbäume INTELLIGENTE DATENANALYSE IN MATLAB Überwachtes Lernen: Entscheidungsbäume Literatur Stuart Russell und Peter Norvig: Artificial Intelligence. Andrew W. Moore: http://www.autonlab.org/tutorials. 2 Überblick

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Statistische Verfahren in der lexikalischen Semantik Evaluation Annotation eines Goldstandard : Testkorpus mit der relevanten Zielinformation (z.b. Wortart) Automatische

Mehr

Wissensentdeckung in Datenbanken

Wissensentdeckung in Datenbanken Wissensentdeckung in Datenbanken Deep Learning (II) Nico Piatkowski und Uwe Ligges Informatik Künstliche Intelligenz 25.07.2017 1 von 14 Überblick Faltungsnetze Dropout Autoencoder Generative Adversarial

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Statistische Verfahren in der lexikalischen Semantik WS 2/22 Manfred Pinkal Beispiel: Adjektive im Wahrig-Korpus Frequenzen in einem kleinen Teilkorpus: n groß - -

Mehr

Computerlinguistik in Requirements Engineering

Computerlinguistik in Requirements Engineering Computerlinguistik in Requirements Engineering Dr. Leonid Kof kof@in.tum.de TU München, Fakultät für Informatik, Lehrstuhl Software und Systems Engineering 24.11.06 Leonid Kof, TUM: Computerlinguistik

Mehr

Automatisches Übersetzen von Gebärdensprache

Automatisches Übersetzen von Gebärdensprache 5. Aachener Gebärdenworkshop 2004 29.10.2004 Automatisches Übersetzen von Gebärdensprache Jan Bungeroth Human Language Technology and Pattern Recognition Lehrstuhl für Informatik VI D-52056 Aachen, Deutschland

Mehr

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 16. FEBRUAR 2012 1. Schlüsselworte Semantic Web, Opinion Mining, Sentiment Analysis, Stimmungsanalyse,

Mehr

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,

Mehr

Mathe III. Garance PARIS. Mathematische Grundlagen III. Evaluation. 16. Juli /25

Mathe III. Garance PARIS. Mathematische Grundlagen III. Evaluation. 16. Juli /25 Mathematische Grundlagen III Evaluation 16 Juli 2011 1/25 Training Set und Test Set Ein fairer Test gibt an, wie gut das Modell im Einsatz ist Resubstitution: Evaluation auf den Trainingsdaten Resubstitution

Mehr

6 Systematisches Testen von Programmen

6 Systematisches Testen von Programmen 6 Systematisches Testen von Programmen Testen Untersuchung des Source-Codes nach Fehlern und Anomalien Stefan Lucks, Software-Entwicklung für Sichere Systeme SS 04, Kapitel 6 p.1/24 Untersuchung des Source-Codes

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Klassifikation Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Einführung Problemstellung Evaluation Overfitting knn Klassifikator Naive-Bayes

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Statistische Modellierung WS 2011/2012 Manfred Pinkal Wortartinformation Wortartinformation ist eine wichtige Voraussetzung für die syntaktische Analyse. Woher kommt

Mehr

Moderne Methoden der KI: Maschinelles Lernen

Moderne Methoden der KI: Maschinelles Lernen Moderne Methoden der KI: Maschinelles Lernen Prof. Dr.Hans-Dieter Burkhard Vorlesung Entscheidungsbäume Darstellung durch Regeln ID3 / C4.5 Bevorzugung kleiner Hypothesen Overfitting Entscheidungsbäume

Mehr

Data Mining Anwendungen und Techniken

Data Mining Anwendungen und Techniken Data Mining Anwendungen und Techniken Knut Hinkelmann DFKI GmbH Entdecken von Wissen in banken Wissen Unternehmen sammeln ungeheure mengen enthalten wettbewerbsrelevantes Wissen Ziel: Entdecken dieses

Mehr

Einführung in die Methoden der Künstlichen Intelligenz. Maschinelles Lernen

Einführung in die Methoden der Künstlichen Intelligenz. Maschinelles Lernen Einführung in die Methoden der Künstlichen Intelligenz Maschinelles Lernen Dr. David Sabel WS 2012/13 Stand der Folien: 14. Februar 2013 Einführung Direkte Programmierung eines intelligenten Agenten nicht

Mehr

Data Mining und Maschinelles Lernen

Data Mining und Maschinelles Lernen Data Mining und Maschinelles Lernen Wintersemester 2015/16 Musterlösung für das 7. Übungsblatt Aufgabe 1 Evaluierungsmethoden Ein Datenset enthält 2 n Beispiele, wobei genau n Beispiele positiv sind und

Mehr

Mustererkennung. Übersicht. Unüberwachtes Lernen. (Un-) Überwachtes Lernen Clustering im Allgemeinen k-means-verfahren Gaussian-Mixture Modelle

Mustererkennung. Übersicht. Unüberwachtes Lernen. (Un-) Überwachtes Lernen Clustering im Allgemeinen k-means-verfahren Gaussian-Mixture Modelle Mustererkennung Unüberwachtes Lernen R. Neubecker, WS 01 / 01 Übersicht (Un-) Überwachtes Lernen Clustering im Allgemeinen k-means-verfahren 1 Lernen Überwachtes Lernen Zum Training des Klassifikators

Mehr

Maschinelle Sprachverarbeitung: Part-of-Speech-Tagging

Maschinelle Sprachverarbeitung: Part-of-Speech-Tagging HUMBOLDT-UNIVERSITÄT ZU BERLIN Institut für Informatik Lehrstuhl Wissensmanagement Maschinelle Sprachverarbeitung: Part-of-Speech-Tagging Tobias Scheffer Ulf Brefeld POS-Tagging Zuordnung der Wortart von

Mehr

Machine Learning in Azure Hätte ich auf der Titanic überlebt? Olivia Klose Technical Evangelist, Microsoft @oliviaklose oliviaklose.

Machine Learning in Azure Hätte ich auf der Titanic überlebt? Olivia Klose Technical Evangelist, Microsoft @oliviaklose oliviaklose. Machine Learning in Azure Hätte ich auf der Titanic überlebt? Olivia Klose Technical Evangelist, Microsoft @oliviaklose oliviaklose.com 13.06.20 15 SQLSaturday Rheinland 2015 1. Zu komplex: Man kann

Mehr

Weka: Software-Suite mit Maschineller Lernsoftware

Weka: Software-Suite mit Maschineller Lernsoftware : Software-Suite mit Maschineller Lernsoftware Computational Linguistics Universität des Saarlandes Sommersemester 2011 21.04.2011 Erste Schritte Waikato Environment for Knowledge Analysis entwickelt von

Mehr

APTs: Sind gezielte Angriffe normal? Jürgen Eckel Eckel.J@ikarus.at Helene Hochrieser Hochrieser.H@ikarus.at

APTs: Sind gezielte Angriffe normal? Jürgen Eckel Eckel.J@ikarus.at Helene Hochrieser Hochrieser.H@ikarus.at APTs: Sind gezielte Angriffe normal? Jürgen Eckel Eckel.J@ikarus.at Helene Hochrieser Hochrieser.H@ikarus.at Welche Anomalien können gefunden werden? Wie lässt sich anormales Verhalten extrahieren? Zeithorizont

Mehr

3: Systematisches Testen

3: Systematisches Testen Stefan Lucks 3: Systematisches Testen 70 E für Sichere Vert. Systeme (2007) 3: Systematisches Testen Testen ist ein Prozess, ein Programm mit der Absicht auszuführen, Fehler zu finden. Man muss destruktiv

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/

Mehr

Information Retrieval in P2P-Netzen

Information Retrieval in P2P-Netzen Information Retrieval in P2P-Netzen Vorstellung der Vortragsthemen zum Seminar Henrik Nottelmann 30. Oktober 2003 Henrik Nottelmann 1/21 Grundstruktur A) Filesharing-Systeme (3 Themen) B) Zugriffsstrukturen

Mehr

Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser

Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser Gliederung Einleitung Problemstellungen Ansätze & Herangehensweisen Anwendungsbeispiele Zusammenfassung 2 Gliederung

Mehr

2. Lernen von Entscheidungsbäumen

2. Lernen von Entscheidungsbäumen 2. Lernen von Entscheidungsbäumen Entscheidungsbäume 2. Lernen von Entscheidungsbäumen Gegeben sei eine Menge von Objekten, die durch Attribut/Wert- Paare beschrieben sind. Jedes Objekt kann einer Klasse

Mehr

4. Lernen von Entscheidungsbäumen. Klassifikation mit Entscheidungsbäumen. Entscheidungsbaum

4. Lernen von Entscheidungsbäumen. Klassifikation mit Entscheidungsbäumen. Entscheidungsbaum 4. Lernen von Entscheidungsbäumen Klassifikation mit Entscheidungsbäumen Gegeben sei eine Menge von Objekten, die durch /Wert- Paare beschrieben sind. Jedes Objekt kann einer Klasse zugeordnet werden.

Mehr

Data Mining mit RapidMiner

Data Mining mit RapidMiner Motivation Data Mining mit RapidMiner CRISP: DM-Prozess besteht aus unterschiedlichen Teilaufgaben Datenvorverarbeitung spielt wichtige Rolle im DM-Prozess Systematische Evaluationen erfordern flexible

Mehr

Computerlinguistische Textanalyse

Computerlinguistische Textanalyse Computerlinguistische Textanalyse 10. Sitzung 06.01.2014 Einführung in die Textklassifikation Franz Matthies Lehrstuhl für Computerlinguistik Institut für Germanistische Sprachwissenschaft Friedrich-Schiller

Mehr

Künstliche Intelligenz Maschinelles Lernen

Künstliche Intelligenz Maschinelles Lernen Künstliche Intelligenz Maschinelles Lernen Stephan Schwiebert Sommersemester 2009 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Maschinelles Lernen Überwachtes Lernen

Mehr

VBA-Programmierung: Zusammenfassung

VBA-Programmierung: Zusammenfassung VBA-Programmierung: Zusammenfassung Programmiersprachen (Definition, Einordnung VBA) Softwareentwicklung-Phasen: 1. Spezifikation 2. Entwurf 3. Implementierung Datentypen (einfach, zusammengesetzt) Programmablaufsteuerung

Mehr

Information-Retrieval: Evaluation

Information-Retrieval: Evaluation Information-Retrieval: Evaluation Claes Neuefeind Fabian Steeg 17. Dezember 2009 Themen des Seminars Boolesches Retrieval-Modell (IIR 1) Datenstrukturen (IIR 2) Tolerantes Retrieval (IIR 3) Vektorraum-Modell

Mehr

Künstliche Intelligenz im Fahrzeug

Künstliche Intelligenz im Fahrzeug Künstliche Intelligenz im Fahrzeug Mittwoch, 20. September 2017 Stufen des automatisierten Fahrens Stufe 0 nur Fahrer Stufe 1 Assistiert Stufe 2 Teilautomatisiert Stufe 3 Hochautomatisiert Stufe 4 Vollautomatisiert

Mehr

Client-Server-Beziehungen

Client-Server-Beziehungen Client-Server-Beziehungen Server bietet Dienste an, Client nutzt Dienste Objekt ist gleichzeitig Client und Server Vertrag zwischen Client und Server: Client erfüllt Vorbedingungen eines Dienstes Server

Mehr

Lösungvorschlag zum Übungsblatt 6: Software-Entwicklung I (WS 2007/08)

Lösungvorschlag zum Übungsblatt 6: Software-Entwicklung I (WS 2007/08) Prof. Dr. A. Poetzsch-Heffter Dipl.-Inform. J. O. Blech Dipl.-Inform. M. J. Gawkowski Dipl.-Inform. N. Rauch TU Kaiserslautern Fachbereich Informatik AG Softwaretechnik Lösungvorschlag zum Übungsblatt

Mehr

Data Mining-Modelle und -Algorithmen

Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,

Mehr

Vorlesung Wissensentdeckung

Vorlesung Wissensentdeckung Gliederung Vorlesung Wissensentdeckung Additive Modelle Katharina Morik, Weihs 1 Merkmalsauswahl Gütemaße und Fehlerabschätzung.6.015 1 von 33 von 33 Ausgangspunkt: Funktionsapproximation Aufteilen der

Mehr

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7.

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. Semestralklausur zur Vorlesung Web Mining Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. 2004 Name: Vorname: Matrikelnummer: Fachrichtung: Punkte: (1).... (2)....

Mehr

Volkswagen Data Lab Connected Car Fahrererkennung mit MATLAB

Volkswagen Data Lab Connected Car Fahrererkennung mit MATLAB Volkswagen Data Lab Connected Car Fahrererkennung mit MATLAB K-SI/LD1 Julia Fumbarev München, 27.06.2017 Mega-Trend: Fahrzeugvernetzung Herausforderungen für die OEMs: 4Synchronisierung unterschiedlicher

Mehr

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining.

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining. Motivation Themenblock: Klassifikation Praktikum: Data Warehousing und Data Mining Ziel Item hat mehrere Attribute Anhand von n Attributen wird (n+)-tes vorhergesagt. Zusätzliches Attribut erst später

Mehr

Data-Mining: Ausgewählte Verfahren und Werkzeuge

Data-Mining: Ausgewählte Verfahren und Werkzeuge Fakultät Informatik Institut für Angewandte Informatik Lehrstuhl Technische Informationssysteme Data-Mining: Ausgewählte Verfahren und Vortragender: Jia Mu Betreuer: Dipl.-Inf. Denis Stein Dresden, den

Mehr

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Ausgangssituation Kaizen Data Mining ISO 9001 Wenn andere Methoden an ihre Grenzen stoßen Es gibt unzählige Methoden, die Abläufe

Mehr

Lazar (Lazy-Structure-Activity Relationships)

Lazar (Lazy-Structure-Activity Relationships) Lazar (Lazy-Structure-Activity Relationships) Martin Gütlein, Albert-Ludwigs-Universität Freiburg Dr. Christoph Helma, in silico toxicology gmbh, Basel Halle, 4.3.2013 Advanced Course des AK Regulatorische

Mehr

Algorithms for Regression and Classification

Algorithms for Regression and Classification Fakultät für Informatik Effiziente Algorithmen und Komplexitätstheorie Algorithms for Regression and Classification Robust Regression and Genetic Association Studies Robin Nunkesser Fakultät für Informatik

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Seminarvortrag zum Thema maschinelles Lernen I - Entscheidungsbäume. von Lars-Peter Meyer. im Seminar Methoden wissensbasierter Systeme

Seminarvortrag zum Thema maschinelles Lernen I - Entscheidungsbäume. von Lars-Peter Meyer. im Seminar Methoden wissensbasierter Systeme Seminarvortrag zum Thema maschinelles Lernen I - Entscheidungsbäume von Lars-Peter Meyer im Seminar Methoden wissensbasierter Systeme bei Prof. Brewka im WS 2007/08 Übersicht Überblick maschinelles Lernen

Mehr

2 Evaluierung von Retrievalsystemen

2 Evaluierung von Retrievalsystemen 2. Evaluierung von Retrievalsystemen Relevanz 2 Evaluierung von Retrievalsystemen Die Evaluierung von Verfahren und Systemen spielt im IR eine wichtige Rolle. Gemäß der Richtlinien für IR der GI gilt es,...

Mehr

Deutsche Suchmaschinen im Vergleich: AltaVista.de, Fireball.de, Google.de und Lycos.de

Deutsche Suchmaschinen im Vergleich: AltaVista.de, Fireball.de, Google.de und Lycos.de Deutsche Suchmaschinen im Vergleich: AltaVista.de, Fireball.de, Google.de und Lycos.de Joachim Griesbaum 1 / Marc Rittberger 2 / Bernard Bekavac 1 1 Universität Konstanz Fach D 87 D-78457 Konstanz 2 Heinrich-Heine-Universität

Mehr

Bachelorarbeit. Tobias Eichler. Sentiment-Analysis durch überwachtes Lernen: Vergleich und Bewertung von Konzepten zur Vorverarbeitung

Bachelorarbeit. Tobias Eichler. Sentiment-Analysis durch überwachtes Lernen: Vergleich und Bewertung von Konzepten zur Vorverarbeitung Bachelorarbeit Tobias Eichler Sentiment-Analysis durch überwachtes Lernen: Vergleich und Bewertung von Konzepten zur Vorverarbeitung Fakultät Technik und Informatik Studiendepartment Informatik Faculty

Mehr

Kapitel MK:IV. IV. Modellieren mit Constraints

Kapitel MK:IV. IV. Modellieren mit Constraints Kapitel MK:IV IV. Modellieren mit Constraints Einführung und frühe Systeme Konsistenz I Binarization Generate-and-Test Backtracking-basierte Verfahren Konsistenz II Konsistenzanalyse Weitere Analyseverfahren

Mehr

Abschnitt 16: Objektorientiertes Design

Abschnitt 16: Objektorientiertes Design Abschnitt 16: Objektorientiertes Design 16. Objektorientiertes Design 16 Objektorientiertes Design Informatik 2 (SS 07) 610 Software-Entwicklung Zur Software-Entwicklung existiert eine Vielfalt von Vorgehensweisen

Mehr

Text Mining. Bachelorarbeit

Text Mining. Bachelorarbeit Text Mining Bachelorarbeit Abteilung Informatik Hochschule für Technik Rapperswil Herbstsemester 2013 Autor: Betreuer: Projektpartner: Experte: Gegenleser: Quentin Willimann Prof. Hansjörg Huser INS Stefan

Mehr

Vorlesung Wissensentdeckung

Vorlesung Wissensentdeckung Vorlesung Wissensentdeckung Additive Modelle Katharina Morik, Weihs 2.6.2015 1 von 33 Gliederung 1 Merkmalsauswahl Gütemaße und Fehlerabschätzung 2 von 33 Ausgangspunkt: Funktionsapproximation Die bisher

Mehr

Artificial Life und Multiagentensysteme

Artificial Life und Multiagentensysteme Vortrag im Rahmen des Seminars: Artificial Life und Multiagentensysteme Prof. Dr. Winfried Kurth Sommersemester 2003 Prognose von Zeitreihen mit GA/GP Mathias Radicke, Informatikstudent, 10. Semester Gliederung

Mehr

Whitebox-Tests: Allgemeines

Whitebox-Tests: Allgemeines -Tests: Allgemeines Andere Bezeichnungen Logic driven, Strukturelles Der Tester entwickelt Testfälle aus einer Betrachtung der Ablauflogik des Programms unter Berücksichtigung der Spezifikation Intuitiv

Mehr

Programmiertechnik II

Programmiertechnik II Analyse von Algorithmen Algorithmenentwurf Algorithmen sind oft Teil einer größeren Anwendung operieren auf Daten der Anwendung, sollen aber unabhängig von konkreten Typen sein Darstellung der Algorithmen

Mehr

Data Mining - Wiederholung

Data Mining - Wiederholung Data Mining - Wiederholung Norbert Fuhr 9. Juni 2008 Problemstellungen Problemstellungen Daten vs. Information Def. Data Mining Arten von strukturellen Beschreibungen Regeln (Klassifikation, Assoziations-)

Mehr

Moderne Methoden der KI: Maschinelles Lernen

Moderne Methoden der KI: Maschinelles Lernen Moderne Methoden der KI: Maschinelles Lernen Prof. Dr.Hans-Dieter Burkhard Vorlesung Sommer-Semester 2008 Konzept-Lernen Konzept-Lernen Lernen als Suche Inductive Bias Konzept-Lernen: Problemstellung Ausgangspunkt:

Mehr

Qualitätssicherungsmaßnahmen. Schwerpunkt: Monitoring

Qualitätssicherungsmaßnahmen. Schwerpunkt: Monitoring Qualitätssicherungsmaßnahmen für Stud.IP Schwerpunkt: Monitoring Qualitätssicherung für Stud.IP Technische Qualität Usability Akzeptanz Supportanfragen Technische Qualitätssicherung Unit Testing Definition

Mehr

Reranking. Parse Reranking. Helmut Schmid. Institut für maschinelle Sprachverarbeitung Universität Stuttgart

Reranking. Parse Reranking. Helmut Schmid. Institut für maschinelle Sprachverarbeitung Universität Stuttgart Institut für maschinelle Sprachverarbeitung Universität Stuttgart schmid@ims.uni-stuttgart.de Die Folien basieren teilweise auf Folien von Mark Johnson. Koordinationen Problem: PCFGs können nicht alle

Mehr

Data Mining auf Datenströmen Andreas M. Weiner

Data Mining auf Datenströmen Andreas M. Weiner Technische Universität Kaiserslautern Fachbereich Informatik Lehrgebiet Datenverwaltungssysteme Integriertes Seminar Datenbanken und Informationssysteme Sommersemester 2005 Thema: Data Streams Andreas

Mehr

Java Übung. Übung 2. Werner Gaulke. 19. April Universität Duisburg-Essen Kommedia, Übung EinPro SS06, Einführung in Java - Übung.

Java Übung. Übung 2. Werner Gaulke. 19. April Universität Duisburg-Essen Kommedia, Übung EinPro SS06, Einführung in Java - Übung. Java Übung Übung 2 Universität Duisburg-Essen Kommedia, Übung EinPro SS06, 19. April 2006 (UniDUE) 19. April 2006 1 / 13 Java Programme Java Programme bestehen aus (meist mehreren) Klassen. In den Klassen

Mehr

1. Lernen von Konzepten

1. Lernen von Konzepten 1. Lernen von Konzepten Definition des Lernens 1. Lernen von Konzepten Lernziele: Definitionen des maschinellen Lernens kennen, Klassifikationen des maschinellen Lernens kennen, Das Prinzip des induktiven

Mehr

Softwareprojektpraktikum Maschinelle Übersetzung

Softwareprojektpraktikum Maschinelle Übersetzung Softwareprojektpraktikum Maschinelle Übersetzung Jan-Throsten Peter, Andreas Guta {peter,guta}@i6.informatik.rwth-aachen.de Vorbesprechung 3. Aufgabe 6. Mai 2014 Human Language Technology and Pattern Recognition

Mehr

Dokumenten-Clustering. Norbert Fuhr

Dokumenten-Clustering. Norbert Fuhr Dokumenten-Clustering Norbert Fuhr Dokumenten-Clustering (Dokumenten-)Cluster: Menge von ähnlichen Dokumenten Ausgangspunkt Cluster-Hypothese : die Ähnlichkeit der relevanten Dokumente untereinander und

Mehr

DPF Dynamic Partial distance Function

DPF Dynamic Partial distance Function DPF Dynamic Partial distance Function Vorgelegt von Sebastian Loose (MatrikelNR.: 169172), Computervisualistikstudent im 4. Semester. Hausarbeit zum Papier DPF A Perceptual Distance Function for Image

Mehr

Vorbereitungsaufgaben

Vorbereitungsaufgaben Praktikum Bildverarbeitung / Bildinformationstechnik Versuch BV 4 / BIT 3: Mustererkennung Paddy Gadegast, CV00, 160967 Alexander Opel, CV00, 16075 Gruppe 3 Otto-von-Guericke Universität Magdeburg Fakultät

Mehr

Informationsextraktion

Informationsextraktion Informationsextraktion Bestimmte Anwendungen bei der semantischen Verarbeitung erfordern keine tiefe linguistische Analyse mit exakter Disambiguierung (= eine einzige und korrekte Lesart). Hierzu gehört

Mehr

Information Retrieval Einführung

Information Retrieval Einführung Information Retrieval Einführung Kursfolien Karin Haenelt 22.7.2015 Themen Traditionelles Konzept / Erweitertes Konzept Auffinden von Dokumenten Rankingfunktionen Auffinden und Aufbereiten von Information

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Statistische Modellierung Fragebogenaktion Bachelor-StudentInnen http://www.coli.uni-saarland.de/bsc/page.php?id=fragebogen WS 2013/2014 Andrea Horbach mit Folien von

Mehr

KLASSIFIZIERUNG VON SCHADSOFTWARE ANHAND VON SIMULIERTEM NETZWERKVERKEHR

KLASSIFIZIERUNG VON SCHADSOFTWARE ANHAND VON SIMULIERTEM NETZWERKVERKEHR Retail KLASSIFIZIERUNG VON SCHADSOFTWARE ANHAND VON SIMULIERTEM NETZWERKVERKEHR Technology Life Sciences & Healthcare Florian Hockmann Ruhr-Universität Bochum florian.hockmann@rub.de Automotive Consumer

Mehr

Seminar MAMMAMIA WS 2012/13 Literaturrecherche

Seminar MAMMAMIA WS 2012/13 Literaturrecherche Seminar MAMMAMIA WS 2012/13 Literaturrecherche Richard Schaller Martin Hacker Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 15.11.2012 Gliederung 1 Wie finde ich relevante Literatur?

Mehr