Ringvorlesung interdisziplinäre, angewandte Mathematik: Maschinelles Lernen

Größe: px
Ab Seite anzeigen:

Download "Ringvorlesung interdisziplinäre, angewandte Mathematik: Maschinelles Lernen"

Transkript

1 Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Ringvorlesung interdisziplinäre, angewandte Mathematik: Maschinelles Lernen Niels Landwehr, Paul Prasse,

2 Termine VL Dienstag 12:15-13:45, Raum VL Mittwoch 12:15-13:45, Raum Übung Donnerstag 14:15-15:45, Raum (Matlabübungen, Poolraum Campus Griebnitzsee) 2

3 Literatur Chris Bishop: Pattern Recognition and Machine Learning. 30 Exemplare in der Bibliothek. 3

4 Themen Einleitung Bayes sche lineare Regression Generalisierte lineare Klassifikation Unsupervised Feature Learning, Deep Learning Evaluierung 4

5 Maschinelles Lernen?! s v 1 gt 2 g t 2 System Daten Lern-Algorithmus Modell

6 Überblick über heutige Einleitung Arten von Lernproblemen: Überwachtes Lernen (Klassifikation, Regression, ordinale Regression, Empfehlungen, Sequenzen und Strukturen) Unüberwachtes Lernen Unsupervised Feature Learning Modelle Verlustfunktionen, Regularisierer, Risiko Evaluierung 6

7 Überwachtes Lernen: Grundbegriffe Instanz In der Statistik: unabhängige Variable m X kann z.b. Vektorraum über Attribute sein ( X ) Instanz ist in diesem Fall Belegung der Attribute. x x x x X Zielvariable: 1 m Merkmalsvektor y Y In der Statistik: abhängige Variable Ein Modell bildet Instanzen auf die Zielvariable ab. x Modell y 7

8 Überwachtes Lernen: Klassifikation Eingabe: Instanz x X. z.b. Merkmalsvektor x1 x... x m Ausgabe: Klasse y Y ; endliche Menge. Klasse wird auch als Zielattribut bezeichnet y heißt auch (Klassen)Label x Klassifikator y Y 8

9 Klassifikation: Beispiel Eingabe: x X. X = Menge aller möglichen Kombinationen einer Menge von Wirkstoffem Attribute Wirkstoff 1 enthalten? Wirkstoff 6 enthalten? Instanz x Belegung der Attribute, Merkmalsvektor Wirkstoffkombination Ausgabe: yy { toxisch, ok} Klassifikator / 9

10 Klassifikation: Beispiel Eingabe: Instanz x X. X = Menge aller 16x16 Pixel Bitmaps Attribute Grauwert Pixel 1 Grauwert Pixel 256 Instanz x Pixelwerte Ausgabe: yy {0,1, 2,3, 4,5,6,7,8,9} : erkannte Ziffer Klassifikator "6" 10

11 Klassifikation: Beispiel Eingabe: Instanz x X. X = Bag-of-Words-Repräsentation aller möglichen -Texte Attribute Wort 1 kommt vor? Wort N kommt vor? N Instanz x Alternative Beneficiary Friend Sterling Zoo Dear Beneficiary, your address has been picked online in this years MICROSOFT CONSUMER AWARD as a Winner of One Hundred and Fifty Five Thousand Pounds Sterling Ausgabe: yy { spam, ok} Dear Beneficiary, We are pleased to notify you that your address has been picked online in this second quarter's MICROSOFT CONSUMER AWARD (MCA) as a Winner of One Hundred and Fifty Five Thousand Pounds Sterling Klassifikator Spam 11

12 Klassifikation Klassifikator soll aus Trainingsdaten gelernt werden. Klassifikator Klassifikator "6" Dear Beneficiary, Klassifikator We are pleased to notify you that your address has been picked online in this second quarter's MICROSOFT CONSUMER AWARD (MCA) as a Winner of One Hundred and Fifty Five Thousand Pounds Sterling Spam 12

13 Klassifikationslernen Eingabe Lernproblem: Trainingsdaten. x X x y y y 11 1m n1 1 n x x nm T n Ausgabe: Modell y : X Y zum Beispiel y ( x) T, wenn x 0, sonst Trainingsdaten: T {( x, y ),,( x, y )} n 1 1 n n Linearer Klassifikator mit Parametervektor. 13

14 Klassifikationslernen Eingabe Lernproblem: Trainingsdaten. x X x y y y 11 1m n1 1 n T n Trainingsdaten: T {( x, y ),,( x, y )} nm n 1 1 n n x x Ausgabe: Modell Modellklassen: (Generalisierte) Lineare Modelle Entscheidungsbäume Ensemble- Klassifikatoren y : X Y 14

15 Überwachtes Lernen: Regression Eingabe: Instanz x X. z.b. Merkmalsvektor x1 x... x m Ausgabe: kontinuierlicher Wert, z.b Toxizität. y Wie toxisch ist Kombination? y 15

16 Regressionslernen Eingabe Lernproblem: Trainingsdaten. x X x 11 1m n1 x x nm T n Ausgabe: Modell y : X Y zum Beispiel y y y 1 n y T ( x ) x Trainingsdaten: T {( x, y ),,( x, y )} n 1 1 n n Generalisiertes lineares Modell mit Parametervektor. 16

17 Überwachtes Lernen: Ordinale Regression Eingabe: Instanz x X. Ausgabe: diskreter Wert yy, es existiert jedoch eine Ordnung auf den Elementen von Y. Große Abweichungen zwischen Vorhersage des Modells und echtem Wert sind schlechter als kleine. Zufrieden mit der Wirkung? 17

18 Überwachtes Lernen: Taxonomieklassifikation Eingabe: Instanz x X. Ausgabe: diskreter Wert yy; es gibt eine baumförmige Ordnung auf den Elementen von Y. Vorhersage ist umso schlechter, je weiter vorhergesagter und tatsächlicher Knoten auseinanderliegen. 18

19 Überwachtes Lernen: Sequenz- und Strukturvorhersage Eingabe: Instanz x X. Ausgabe: Sequenz, Baum oder Graph yy. Beispielanwendungen: Parsen natürlicher Sprache Proteinfaltungen AAGCTTGCACTGCCGT 19

20 Überwachtes Lernen: Rankings Eingabe: Anfrage q, Liste von Items I 1,, I n. Ausgabe: Sortierung der Items Trainingsdaten: Nutzer klickt nach Anfrage q auf I j : Item sollte höher gerankt werden als weiter oben stehende Items, die nicht angeklickt wurden. 20

21 Überwachtes Lernen: Empfehlungen Eingabe: Benutzer, Items, Kontextinformationen. Ausgabe: Wie sehr wird ein Vorschlag einem Benutzer gefallen? Trainingsdaten: Ratings, Käufe, Seitenaufrufe. 21

22 Unüberwachtes Lernen Trainingsdaten beim unüberwachten Lernen: Menge von Instanzen x X. Zusätzliche Annahmen über Prozess der Entstehung der Daten, beispielsweise Unabhängigkeiten von Zufallsvariablen. Ziel ist das Aufdecken von Strukturen in den Daten: Beispielsweise wahrscheinlichste Aufteilung in Cluster von Instanzen, die bestimmte, nicht direkt beobachtete Eigenschaften teilen. 22

23 Clusteranalyse: Beispiel kampagnen Eingabe: Strom von s. Ausgabe: Partitionierung in Teilmengen, die zur selben Kampagne gehören. Hello, This is Terry Hagan. Our company confirms you are legible for a $ loan for a $380.00/month. Dear Mr/Mrs, This is Brenda Dunn. Our office confirms you can get a $ loan for a $ per month payment. Dear friend, You are invited for a barbeque! Cluster 1 Cluster 2 Cluster 3 23

24 Clusteranalyse: Beispiel Marktsegmentierung Eingabe: Daten über Kundenverhalten. Ausgabe: Partitionierung in Cluster von Kunden, die ähnliche Produktpräferenzen haben. Cluster 1 Cluster 2 24

25 Unsupervised Feature Learning, Deep Learning Einige Klassifikationsprobleme sind erst nach der Konstruktion geeigneter Merkmals lösbar Schrittweise Transformation der rohen Eingabedaten in höhere Merkmale Label Individuendiskriminierende Merkmale Gesichts-Teile Gwyneth Paltrow Merkmale werden aus ungelabelten Instanzen gewonnen. Lokale Muster Grauwertmatrix 25

26 Wahrscheinlichkeit eines Ausgangs-Signals Deep Learning Eingänge Index i x h x h d ( h ) 2 2 k k x k k k 0 ( h ) 1 1 k k k x k k 0 Index k... x d Synaptische Gewichte: Werden durch Lernprozesse Verstärkt oder abgeschwächt Ausgabe-Ebene Gewichtete Eingangssignale werden aggregiert Axon: Ausgangssignal: Gewichtete Eingangssignale Signale in Form von Spikes Verbindungen zu anderen Nervenzellen 1 Verdeckte Ebenen 0 x x m Eingabe-Ebene 26

27 Überblick Arten von Lernproblemen: Überwachtes Lernen (Klassifikation, Regression, ordinale Regression, Empfehlungen, Sequenzen und Strukturen) Unüberwachtes Lernen Reinforcement-Lernen (Exploration vs. Exploitation) Modelle Verlustfunktionen, Regularisierer, Risiko Evaluierung 27

28 Klassifikationslernen Eingabe Lernproblem: Trainingsdaten. x X x y y y 11 1m n1 1 n T n Trainingsdaten: T {( x, y ),,( x, y )} nm n 1 1 n n x x Ausgabe: Klassifikator y : X Y Wie kann Lernalgorithmus Modell (Klassifikator) aus Trainingsdaten lernen? Suchproblem im Raum aller Modelle 28

29 Modellraum, Parameterraum Modellraum, Parameterraum, Hypothesenraum : Klassifikator hat Parameter ist Menge der Modelle (Klassifikatoren), die Lernverfahren in Betracht zieht. Modellraum ist einer der Freiheitsgrade beim maschinellen Lernen, viele Räume gebräuchlich. Heisst auch Language Bias Beispiel: Lineare Modelle y ( x),, sonst m wenn x j j

30 Verlustfunktion, Optimierungskriterium Lernprobleme werden als Optimierungsaufgaben formuliert. Verlustfunktion misst, wie gut Modell zu Trainingsdaten passt Regularisierungsfunktion misst, ob das Modell nach unserem Vorwissen wahrscheinlich ist. Optimierungskriterium ist Summe aus Verlust und Regularisierer. Suche Minimum des Optimierungskriteriums Insgesamt wahrscheinlichstes Modell, gegeben Trainingsdaten und Vorwissen. 30

31 Verlustfunktion Verlustfunktion: Wie schlimm ist es, wenn Modell y (x i ) vorhersagt obwohl der echte Wert der Zielvariable y i ist? ( y ( x ), y ) Mittlerer Verlust auf den gesamten Trainingsdaten : n n 1 Empirisches Risiko Rˆ( ) ( y ( i ), yi ) n x i i i1 T Beispiel: Binäres Klassifikationsproblem mit positiver Klasse (+1) und negativer Klasse (-1). False Positives und False Negatives gleich schlimm. Zero-One Loss: 0/1( y ( xi), yi) 0, wenn y ( xi) 1, sonst y i 31

32 Verlustfunktion Beispiel: diagnostische Klassifikationsprobleme, übersehene Erkrankungen (False Negatives) schlimmer als False Positives. Kostenmatrix c FP, c FN yi 1 yi 1 ( y( xi ), yi ) y( xi ) 1 0 cfp y ( xi ) 1 cfn 0 32

33 Verlustfunktion Beispiel Verlustfunktion Regression: Vorhersage möglichst dicht an echtem Wert des Zielattributes Quadratischer Fehler ( ( ), ) ( ( ) ) 2 y xi yi y xi yi 2 33

34 Verlustfunktion Wie schlimm ist es, wenn Modell y vorhersagt obwohl der echte Wert der Zielvariable y ist? Verlust ( y', y) Verlustfunktion ist aus der jeweiligen Anwendung heraus motiviert. 34

35 Beispiel- Kombinationen Suche nach Modell Suche nach Klassifikator für Kombination toxisch. Modellraum: y ( x),, sonst m wenn x j j 1 0 Trainingsdaten Medikamente in der Kombination x 1 x 2 x 3 x 4 x 5 x 6 y x x x x Ansatz: empirisches Risiko sollte minimal sein * n arg min ( y ( ), y ) x i1 01 / i i Gibt es ein solches Modell? Gibt es mehrere? 35

36 Beispiel- Kombinationen Suche nach Modell Suche nach Klassifikator für Kombination toxisch. Modellraum: y ( x),, sonst m wenn x j j 1 0 Trainingsdaten Medikamente in der Kombination x 1 x 2 x 3 x 4 x 5 x 6 y x x x x Modelle mit Verlust von 0: y ( x ), wenn x 1 y ( x ), wenn x x 2 y ( x ), wenn 2x4 x

37 Beispiel- Kombinationen Suche nach Modell Suche nach Klassifikator für Kombination toxisch. Modellraum: y ( x),, sonst m wenn x j j 1 0 Trainingsdaten Medikamente in der Kombination x 1 x 2 x 3 x 4 x 5 x 6 y x x x x Modelle mit Verlust von 0: y ( x ), wenn x 1 y ( x ), wenn x x 2 y ( ), wenn 2x4 x6 1 x Modelle mit einem empirischem Risiko von 0 bilden den Versionenraum. Versionenraum ist leer bei widersprüchlichen Daten. 37

38 Beispiel- Kombinationen Suche nach Modell Suche nach Klassifikator für Kombination toxisch. Modellraum: y ( x),, sonst m wenn x j j 1 0 Trainingsdaten Medikamente in der Kombination x 1 x 2 x 3 x 4 x 5 x 6 y x x x x Modelle mit Verlust von 0: y ( x ), wenn x 1 y ( x ), wenn x x 2 y ( ), wenn 2x4 x6 1 x Modelle im Versionenraum unterscheiden sich in ihrer Vorhersage für einige Instanzen, die nicht in der Trainingsmenge vorkommen. Welches ist das Richtige? 38

39 Unsicherheit In der Praxis erreicht man niemals Gewissheit darüber, ein korrektes Modell gefunden zu haben. Daten können widersprüchlich sein (z.b. durch Messfehler) Viele unterschiedliche Modelle können einen niedrigen Verlust haben. Das korrekte Modell liegt vielleicht gar nicht im Modellraum. Lernen als Optimierungsproblem Verlustfunktion: Grad der Konsistenz mit Trainingsdaten Regularisierer: A-Priori-Wahrscheinlichkeit der Modelle 39

40 Regularisierer Verlustfunktion drückt aus, wie gut Modell zu Daten passt Regularisierer: drückt Annahme darüber aus, ob Modell a priori wahrscheinlich ist. Unabhängig von den Trainingsdaten. Je höher der Regularisierungsterm für ein Modell, desto unwahrscheinlicher Häufig wird die Annahme ausgedrückt, dass wenige der Attribute für ein gutes Modell ausreichen. Anzahl der Attribute, L 0 -Regularisierung Betrag der Attribut-Gewichtungen, L 1 -Regularisierung Quadrat der Attribut-Gewichtungen, L 2 -Regularisierung. 40

41 Regularisierer Kandidaten: y ( x ), wenn x 1 y ( x ), wenn x x 2 y ( ), wenn 2x x 1 x T T T Regularisierer: L 0 -Regularisierung L 1 -Regularisierung L 2 -Regularisierung ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

42 Optimierungskriteruim Regularisiertes empirisches Risiko: Trade-Off zwischen mittlerem Verlust und Regularisierer 1 n ( y ( ), ) ( ) i 1 i yi n x Parameter steuert Trade-Off zwischen Verlust und Regularisierer. 42

43 Optimierungsproblem Rechtfertigung für Optimierungskriterium? Mehrere Rechtfertigungen und Herleitungen. Wahrscheinlichstes Modell (MAP-Modell). Niedrige obere Schranke für Fehler auf zukünftigen Daten abhängig von. (SRM). Lernen ohne Regularisierung ist ill-posed Problem; keine eindeutige Lösung, oder Lösung hängt extrem stark von minimalen Änderungen in den Daten ab. 43

44 Beispiel- Kombinationen Regularisierte empirische Risikominimierung Suche nach Klassifikator für Kombination toxisch. Modellraum: y ( x),, m wenn x j j sonst 1 0 Trainingsdaten Medikamente in der Kombination x 1 x 2 x 3 x 4 x 5 x 6 y x x x x Regularisiertes empirisches Risiko: 1 n 1 0/ 1( y ( i), y ) 0( ) i i n x Modell mit minimalem regularisiertem empirischem Risiko: y ( x ), wenn x 1 für <0.5. y ( x ) für >

45 Evaluierung von Modellen Wie gut wird ein Modell in Zukunft funktionieren? Zukünftige Instanzen werden entsprechend einer (unbekannten) Verteilung p( x, y) gezogen. Risiko: erwarteter Verlust unter R( ) ( y ( x), y) p( x, y) dx y p( x, y) Ist das empirische Risiko auf den Trainingsdaten ein brauchbarer Schätzer für das Risiko? 45

46 Evaluierung von Modellen Wie gut wird ein Modell in Zukunft funktionieren? Zukünftige Instanzen werden entsprechend einer (unbekannten) Verteilung p( x, y) gezogen. Risiko: erwarteter Verlust unter p( x, y) Ist das empirische Risiko auf den Trainingsdaten ein brauchbarer Schätzer für das Risiko? Problem: Alle Modelle aus dem Version Space haben ein emp. Risiko von 0 auf Trainingsdaten. Ein Klassifikator, der einfach nur die Trainingsdaten in einer Tabelle speichert hat ein empirisches Risiko von 0 auf Trainingsdaten. 46

47 Evaluierung von Modellen Wie gut wird ein Modell in Zukunft funktionieren? Zukünftige Instanzen werden entsprechend einer (unbekannten) Verteilung p( x, y) gezogen. Risiko: erwarteter Verlust unter Empirisches Risiko auf den Trainingsdaten ist ein extrem optimistischer Schätzer für das Risiko. Risiko wird auf Daten geschätzt, die nicht zum Training verwendet wurden. Training-and-Test. N-fold Cross Validation. p( x, y) 47

48 Optimierungsproblem Einstellung von? Teile verfügbare Daten in Trainings- und Testdaten Iteriere über Werte für Training auf Trainingsdaten, finde Modell Bestimme auf Testdaten Wähle Wert mit minimalem Verlust Trainiere mit allen Daten R( ) 48

49 Daten, Modelle, Lernprobleme Überwachtes Lernen: Finde Funktion, die wahrscheinlich die Trainingsdaten erzeugt hat. Verlustfunktion: Übereinstimmung zwischen Vorhersage des Modells und Wert der Zielvariable in den Trainingsdaten. Regularisierer: Übereinstimmung mit Vorwissen. Unüberwachtes Lernen: Keine Zielvariable, entdecke Struktur in den Daten, z.b. durch Einteilung der Instanzen in Cluster mit gemeinsamen Eigenschaften. 49

Problemanalye und Datenvorverarbeitung

Problemanalye und Datenvorverarbeitung Organisation Hören Sie die electure mathematische Grundlagen Interesse an Tutorium? Vielleicht 7.5., 12-14h? Am Donnersteg bieten wir zwei Übungsgruppen an (Freitag, 1. Mai, ist frei) Donnerstag 10-12

Mehr

Maschinelles Lernen Entscheidungsbäume

Maschinelles Lernen Entscheidungsbäume Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Maschinelles Lernen Entscheidungsbäume Paul Prasse Entscheidungsbäume Eine von vielen Anwendungen: Kreditrisiken Kredit - Sicherheiten

Mehr

Seminar Künstliche Intelligenz WS 2013/14 Grundlagen des Maschinellen Lernens

Seminar Künstliche Intelligenz WS 2013/14 Grundlagen des Maschinellen Lernens Seminar Künstliche Intelligenz WS 2013/14 Grundlagen des Maschinellen Lernens Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 19.12.2013 Allgemeine Problemstellung

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Clusteranalyse. Tobias Scheffer Thomas Vanck

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Clusteranalyse. Tobias Scheffer Thomas Vanck Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Clusteranalyse Tobias Scheffer Thomas Vanck Überblick Problemstellung/Motivation Deterministischer Ansatz: K-Means Probabilistischer

Mehr

Clusteranalyse: Gauß sche Mischmodelle

Clusteranalyse: Gauß sche Mischmodelle Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Clusteranalyse: Gauß sche Mischmodelle iels Landwehr Überblick Problemstellung/Motivation Deterministischer Ansatz: K-Means Probabilistischer

Mehr

Bayes sches Lernen: Übersicht

Bayes sches Lernen: Übersicht Bayes sches Lernen: Übersicht Bayes sches Theorem MAP, ML Hypothesen MAP Lernen Minimum Description Length Principle Bayes sche Klassifikation Naive Bayes Lernalgorithmus Teil 5: Naive Bayes + IBL (V.

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Entscheidungsbäume

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Entscheidungsbäume Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Entscheidungsbäume Christoph Sawade/Niels Landwehr Jules Rasetaharison, Tobias Scheffer Entscheidungsbäume Eine von vielen Anwendungen:

Mehr

Identifizierung regulärer Ausdrücke zum Blockieren von Email-Kampagnen

Identifizierung regulärer Ausdrücke zum Blockieren von Email-Kampagnen Identifizierung regulärer Ausdrücke zum Blockieren von Email-Kampagnen Paul Prasse, Tobias Scheffer Universität Potsdam Motivation Spammer verbreitet Postmaster schreibt I m a [a-z]+ russian (girl lady).

Mehr

Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens

Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 17.04.2015 Entscheidungsprobleme beim Textmining

Mehr

Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell

Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten Teil

Mehr

Entscheidungsbäume. Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen

Entscheidungsbäume. Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Entscheidungsbäume Christoph Sawade /Niels Landwehr/Paul Prasse Silvia Makowski Tobias Scheffer Entscheidungsbäume Eine von vielen

Mehr

Maschinelles Lernen Entscheidungsbäume

Maschinelles Lernen Entscheidungsbäume Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Maschinelles Lernen Entscheidungsbäume Christoph Sawade /Niels Landwehr/Paul Prasse Dominik Lahmann Tobias Scheffer Entscheidungsbäume

Mehr

x 2 x 1 x 3 5.1 Lernen mit Entscheidungsbäumen

x 2 x 1 x 3 5.1 Lernen mit Entscheidungsbäumen 5.1 Lernen mit Entscheidungsbäumen Falls zum Beispiel A = {gelb, rot, blau} R 2 und B = {0, 1}, so definiert der folgende Entscheidungsbaum eine Hypothese H : A B (wobei der Attributvektor aus A mit x

Mehr

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002) 6. Bayes-Klassifikation (Schukat-Talamazzini 2002) (Böhm 2003) (Klawonn 2004) Der Satz von Bayes: Beweis: Klassifikation mittels des Satzes von Bayes (Klawonn 2004) Allgemeine Definition: Davon zu unterscheiden

Mehr

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining.

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining. Motivation Themenblock: Klassifikation Praktikum: Data Warehousing und Data Mining Ziel Item hat mehrere Attribute Anhand von n Attributen wird (n+)-tes vorhergesagt. Zusätzliches Attribut erst später

Mehr

Vorlesung Maschinelles Lernen

Vorlesung Maschinelles Lernen Vorlesung Maschinelles Lernen Additive Modelle Katharina Morik Informatik LS 8 Technische Universität Dortmund 7.1.2014 1 von 34 Gliederung 1 Merkmalsauswahl Gütemaße und Fehlerabschätzung 2 von 34 Ausgangspunkt:

Mehr

Elementare Begriffe der Wahrscheinlichkeitstheorie für die Sprachverarbeitung

Elementare Begriffe der Wahrscheinlichkeitstheorie für die Sprachverarbeitung Elementare Begriffe der Wahrscheinlichkeitstheorie für die Sprachverarbeitung Kursfolien Karin Haenelt 1 Übersicht Wahrscheinlichkeitsfunktion P Wahrscheinlichkeit und bedingte Wahrscheinlichkeit Bayes-Formeln

Mehr

Künstliche Intelligenz Maschinelles Lernen

Künstliche Intelligenz Maschinelles Lernen Künstliche Intelligenz Maschinelles Lernen Stephan Schwiebert Sommersemester 2009 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Maschinelles Lernen Überwachtes Lernen

Mehr

Projekt Maschinelles Lernen WS 06/07

Projekt Maschinelles Lernen WS 06/07 Projekt Maschinelles Lernen WS 06/07 1. Auswahl der Daten 2. Evaluierung 3. Noise und Pruning 4. Regel-Lernen 5. ROC-Kurven 6. Pre-Processing 7. Entdecken von Assoziationsregeln 8. Ensemble-Lernen 9. Wettbewerb

Mehr

Vorlesung Wissensentdeckung

Vorlesung Wissensentdeckung Gliederung Vorlesung Wissensentdeckung Additive Modelle Katharina Morik, Weihs 1 Merkmalsauswahl Gütemaße und Fehlerabschätzung.6.015 1 von 33 von 33 Ausgangspunkt: Funktionsapproximation Aufteilen der

Mehr

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7.

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. Semestralklausur zur Vorlesung Web Mining Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. 2004 Name: Vorname: Matrikelnummer: Fachrichtung: Punkte: (1).... (2)....

Mehr

Kapitel ML: I. I. Einführung. Beispiele für Lernaufgaben Spezifikation von Lernproblemen

Kapitel ML: I. I. Einführung. Beispiele für Lernaufgaben Spezifikation von Lernproblemen Kapitel ML: I I. Einführung Beispiele für Lernaufgaben Spezifikation von Lernproblemen ML: I-8 Introduction c STEIN/LETTMANN 2005-2010 Beispiele für Lernaufgaben Autoeinkaufsberater Welche Kriterien liegen

Mehr

Überblick. Einführung in die automatische Mustererkennung Grundlagen der Wahrscheinlichkeitsrechnung

Überblick. Einführung in die automatische Mustererkennung Grundlagen der Wahrscheinlichkeitsrechnung Grundlagen Überblick Einführung in die automatische Mustererkennung Grundlagen der Wahrscheinlichkeitsrechnung Klassifikation bei bekannter Wahrscheinlichkeitsverteilung Entscheidungstheorie Bayes- Entscheidungsfunktionen

Mehr

Seminar Text- und Datamining Datamining-Grundlagen

Seminar Text- und Datamining Datamining-Grundlagen Seminar Text- und Datamining Datamining-Grundlagen Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 23.05.2013 Gliederung 1 Klassifikationsprobleme 2 Evaluation

Mehr

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining.

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining. Personalisierung Personalisierung Thomas Mandl Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung Klassifikation Die Nutzer werden in vorab bestimmte Klassen/Nutzerprofilen

Mehr

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,

Mehr

Signalverarbeitung 2. Volker Stahl - 1 -

Signalverarbeitung 2. Volker Stahl - 1 - - 1 - Überblick Bessere Modelle, die nicht nur den Mittelwert von Referenzvektoren sondern auch deren Varianz berücksichtigen Weniger Fehlklassifikationen Mahalanobis Abstand Besseres Abstandsmaß basierend

Mehr

Moderne Methoden der KI: Maschinelles Lernen

Moderne Methoden der KI: Maschinelles Lernen Moderne Methoden der KI: Maschinelles Lernen Prof. Dr.Hans-Dieter Burkhard Vorlesung Entscheidungsbäume Darstellung durch Regeln ID3 / C4.5 Bevorzugung kleiner Hypothesen Overfitting Entscheidungsbäume

Mehr

Einführung: Bayessches Lernen. Dipl.-Inform. Martin Lösch. martin.loesch@kit.edu (0721) 608 45944. Dipl.-Inform. Martin Lösch

Einführung: Bayessches Lernen. Dipl.-Inform. Martin Lösch. martin.loesch@kit.edu (0721) 608 45944. Dipl.-Inform. Martin Lösch Einführung: martin.loesch@kit.edu (0721) 608 45944 Übersicht Motivation & Hintergrund Naiver Bayes-Klassifikator Bayessche Netze EM-Algorithmus 2 Was ist eigentlich? MOTIVATION & HINTERGRUND 3 Warum Lernen

Mehr

ADS: Algorithmen und Datenstrukturen 2

ADS: Algorithmen und Datenstrukturen 2 ADS: Algorithmen und Datenstrukturen 2 Teil 5 Prof. Peter F. Stadler & Dr. Christian Höner zu Siederdissen Bioinformatik/IZBI Institut für Informatik & Interdisziplinäres Zentrum für Bioinformatik Universität

Mehr

Maschinelles Lernen: Neuronale Netze. Ideen der Informatik Kurt Mehlhorn

Maschinelles Lernen: Neuronale Netze. Ideen der Informatik Kurt Mehlhorn Maschinelles Lernen: Neuronale Netze Ideen der Informatik Kurt Mehlhorn 16. Januar 2014 Übersicht Stand der Kunst im Bilderverstehen: Klassifizieren und Suchen Was ist ein Bild in Rohform? Biologische

Mehr

Maschinelles Lernen: Neuronale Netze. Ideen der Informatik

Maschinelles Lernen: Neuronale Netze. Ideen der Informatik Maschinelles Lernen: Neuronale Netze Ideen der Informatik Kurt Mehlhorn Adrian Neumann 16. Januar 2014 Übersicht Biologische Inspiration Stand der Kunst in Objekterkennung auf Bildern Künstliche Neuronale

Mehr

Data Mining und maschinelles Lernen

Data Mining und maschinelles Lernen Data Mining und maschinelles Lernen Einführung und Anwendung mit WEKA Caren Brinckmann 16. August 2000 http://www.coli.uni-sb.de/~cabr/vortraege/ml.pdf http://www.cs.waikato.ac.nz/ml/weka/ Inhalt Einführung:

Mehr

Fragenkatalog zur Vorlesung "Grundlagen des Data Mining" (WS 2006/07)

Fragenkatalog zur Vorlesung Grundlagen des Data Mining (WS 2006/07) Fragenkatalog zur Vorlesung "Grundlagen des Data Mining" (WS 2006/07) 1. Grenzen Sie die Begriffe "Daten" und "Wissen" mit je 3 charakteristischen Eigenschaften gegeander ab. 2. Nennen Sie vier verschiedene

Mehr

Datenbankanwendung. Prof. Dr.-Ing. Sebastian Michel TU Kaiserslautern. Wintersemester 2014/15. smichel@cs.uni-kl.de

Datenbankanwendung. Prof. Dr.-Ing. Sebastian Michel TU Kaiserslautern. Wintersemester 2014/15. smichel@cs.uni-kl.de Datenbankanwendung Wintersemester 2014/15 Prof. Dr.-Ing. Sebastian Michel TU Kaiserslautern smichel@cs.uni-kl.de Wiederholung: Anfragegraph Anfragen dieses Typs können als Graph dargestellt werden: Der

Mehr

Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten

Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 4.1 4. Statistische Entscheidungsverfahren Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten Beispiel:

Mehr

Data Mining - Wiederholung

Data Mining - Wiederholung Data Mining - Wiederholung Norbert Fuhr 9. Juni 2008 Problemstellungen Problemstellungen Daten vs. Information Def. Data Mining Arten von strukturellen Beschreibungen Regeln (Klassifikation, Assoziations-)

Mehr

Mathe III. Garance PARIS. Mathematische Grundlagen III. Evaluation. 16. Juli /25

Mathe III. Garance PARIS. Mathematische Grundlagen III. Evaluation. 16. Juli /25 Mathematische Grundlagen III Evaluation 16 Juli 2011 1/25 Training Set und Test Set Ein fairer Test gibt an, wie gut das Modell im Einsatz ist Resubstitution: Evaluation auf den Trainingsdaten Resubstitution

Mehr

Kapitel 11* Grundlagen ME. Aufbau eines ME-Systems Entwicklung eines ME-Systems. Kapitel11* Grundlagen ME p.1/12

Kapitel 11* Grundlagen ME. Aufbau eines ME-Systems Entwicklung eines ME-Systems. Kapitel11* Grundlagen ME p.1/12 Kapitel 11* Kapitel11* Grundlagen ME p.1/12 Grundlagen ME Aufbau eines ME-Systems Entwicklung eines ME-Systems Kapitel11* Grundlagen ME p.2/12 Aufbau eines ME-Systems (1) on line Phase digitalisiertes

Mehr

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp Datenanalyse (PHY31) Herbstsemester 015 Olaf Steinkamp 36-J- olafs@physik.uzh.ch 044 63 55763 Einführung, Messunsicherheiten, Darstellung von Messdaten Grundbegriffe der Wahrscheinlichkeitsrechnung und

Mehr

Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 2016

Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 2016 Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 1 M. Sperber (matthias.sperber@kit.edu) S. Nguyen (thai.nguyen@kit.edu) Übungsblatt 3 Maschinelles Lernen und Klassifikation Abgabe online

Mehr

Anhang 4. Bias durch Überdiagnose von papillären Mikrokarzinomen

Anhang 4. Bias durch Überdiagnose von papillären Mikrokarzinomen Anhang 4 Bias durch Überdiagnose von papillären Mikrokarzinomen Bias durch Überdiagnose von papillären Mikrokarzinomen H. Bertelsmann AG Epidemiologie und Medizinische Statistik Universität Bielefeld Dezember

Mehr

Latente Dirichlet-Allokation

Latente Dirichlet-Allokation Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Latente Dirichlet-Allokation Tobias Scheffer Peter Haider Paul Prasse Themenmodellierung Themenmodellierung (Topic modeling) liefert

Mehr

Hannah Wester Juan Jose Gonzalez

Hannah Wester Juan Jose Gonzalez Neuronale Netze Supervised Learning Proseminar Kognitive Robotik (SS12) Hannah Wester Juan Jose Gonzalez Kurze Einführung Warum braucht man Neuronale Netze und insbesondere Supervised Learning? Das Perzeptron

Mehr

Bayes Klassifikatoren M E T H O D E N D E S D A T A M I N I N G F A B I A N G R E U E L

Bayes Klassifikatoren M E T H O D E N D E S D A T A M I N I N G F A B I A N G R E U E L Bayes Klassifikatoren M E T H O D E N D E S D A T A M I N I N G F A B I A N G R E U E L Inhalt Grundlagen aus der Wahrscheinlichkeitsrechnung Hypothesenwahl Optimale Bayes Klassifikator Naiver Bayes Klassifikator

Mehr

Kapitel 5: Ensemble Techniken

Kapitel 5: Ensemble Techniken Ludwig Maximilians Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Knowledge Discovery in Databases II im Sommersemester 2009 Kapitel 5:

Mehr

I. Deskriptive Statistik 1

I. Deskriptive Statistik 1 I. Deskriptive Statistik 1 1. Einführung 3 1.1. Grundgesamtheit und Stichprobe.................. 5 1.2. Merkmale und Verteilungen..................... 6 1.3. Tabellen und Grafiken........................

Mehr

Inhaltsverzeichnis. Vorwort

Inhaltsverzeichnis. Vorwort V Vorwort XI 1 Zum Gebrauch dieses Buches 1 1.1 Einführung 1 1.2 Der Text in den Kapiteln 1 1.3 Was Sie bei auftretenden Problemen tun sollten 2 1.4 Wichtig zu wissen 3 1.5 Zahlenbeispiele im Text 3 1.6

Mehr

Neuronale Netze. Anna Wallner. 15. Mai 2007

Neuronale Netze. Anna Wallner. 15. Mai 2007 5. Mai 2007 Inhalt : Motivation Grundlagen Beispiel: XOR Netze mit einer verdeckten Schicht Anpassung des Netzes mit Backpropagation Probleme Beispiel: Klassifikation handgeschriebener Ziffern Rekurrente

Mehr

3. Entscheidungsbäume. Verfahren zum Begriffslernen (Klassifikation) Beispiel: weiteres Beispiel: (aus Böhm 2003) (aus Morik 2002)

3. Entscheidungsbäume. Verfahren zum Begriffslernen (Klassifikation) Beispiel: weiteres Beispiel: (aus Böhm 2003) (aus Morik 2002) 3. Entscheidungsbäume Verfahren zum Begriffslernen (Klassifikation) Beispiel: weiteres Beispiel: (aus Böhm 2003) (aus Morik 2002) (aus Wilhelm 2001) Beispiel: (aus Böhm 2003) Wann sind Entscheidungsbäume

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2012, SS 2012 1 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen

Mehr

Statistische Verfahren in der Künstlichen Intelligenz, Bayesische Netze

Statistische Verfahren in der Künstlichen Intelligenz, Bayesische Netze Statistische Verfahren in der Künstlichen Intelligenz, Bayesische Netze Erich Schubert 6. Juli 2003 LMU München, Institut für Informatik, Erich Schubert Zitat von R. P. Feynman Richard P. Feynman (Nobelpreisträger

Mehr

Projekt 7. Machine Learning. (Matthias Bethge) 7.1 Overtüre

Projekt 7. Machine Learning. (Matthias Bethge) 7.1 Overtüre Projekt 7 Machine Learning Matthias Bethge) 7. Overtüre Alles messen, was messbar ist - und messbar machen, was noch nicht messbar ist. Galileo Galilei 564-642) Ziel der quantitativen Wissenschaft ist

Mehr

3. Das Reinforcement Lernproblem

3. Das Reinforcement Lernproblem 3. Das Reinforcement Lernproblem 1. Agierender Agent in der Umgebung 2. Discounted Rewards 3. Markov Eigenschaft des Zustandssignals 4. Markov sche Entscheidung 5. Werte-Funktionen und Bellman sche Optimalität

Mehr

Data Mining Anwendungen und Techniken

Data Mining Anwendungen und Techniken Data Mining Anwendungen und Techniken Knut Hinkelmann DFKI GmbH Entdecken von Wissen in banken Wissen Unternehmen sammeln ungeheure mengen enthalten wettbewerbsrelevantes Wissen Ziel: Entdecken dieses

Mehr

Computer Vision: AdaBoost. D. Schlesinger () Computer Vision: AdaBoost 1 / 10

Computer Vision: AdaBoost. D. Schlesinger () Computer Vision: AdaBoost 1 / 10 Computer Vision: AdaBoost D. Schlesinger () Computer Vision: AdaBoost 1 / 10 Idee Gegeben sei eine Menge schwacher (einfacher, schlechter) Klassifikatoren Man bilde einen guten durch eine geschickte Kombination

Mehr

Konzepte der AI: Maschinelles Lernen

Konzepte der AI: Maschinelles Lernen Konzepte der AI: Maschinelles Lernen Nysret Musliu, Wolfgang Slany Abteilung für Datenbanken und Artificial Intelligence Institut für Informationssysteme, TU-Wien Übersicht Was ist Lernen? Wozu maschinelles

Mehr

5. Clusteranalyse. Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften

5. Clusteranalyse. Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften 5. Clusteranalyse Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften benennen und anwenden können, einen Test auf das Vorhandensein einer Clusterstruktur kennen, verschiedene

Mehr

Minimale Anzahl von Hinweisen bei Sudoku

Minimale Anzahl von Hinweisen bei Sudoku Minimale Anzahl von Hinweisen bei Sudoku Sascha Kurz sascha.kurz@uni-bayreuth.de (basierend auf Arbeiten von Ariane Papke und Gary McGuire et al.) Oberseminar Effizienz dezentraler Strukturen, Bayreuth,

Mehr

Ein- und Zweistichprobentests

Ein- und Zweistichprobentests (c) Projekt Neue Statistik 2003 - Lernmodul: Ein- Zweistichprobentests Ein- Zweistichprobentests Worum geht es in diesem Modul? Wiederholung: allgemeines Ablaufschema eines Tests Allgemeine Voraussetzungen

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2014, SS 2014 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source: http://arxiv.org/abs/1312.6082,

Mehr

1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...

1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente... Inhaltsverzeichnis 0 Einführung 1 1 Zufallsvorgänge und Wahrscheinlichkeiten 5 1.1 Zufallsvorgänge.......................... 5 1.1.1 Ergebnismengen..................... 6 1.1.2 Ereignisse und ihre Verknüpfung............

Mehr

Algorithmische Modelle als neues Paradigma

Algorithmische Modelle als neues Paradigma Algorithmische Modelle als neues Paradigma Axel Schwer Seminar über Philosophische Grundlagen der Statistik, WS 2010/11 Betreuer: Prof. Dr. Thomas Augustin München, den 28. Januar 2011 1 / 29 LEO BREIMAN

Mehr

Stochastische Lernalgorithmen

Stochastische Lernalgorithmen Stochastische Lernalgorithmen Gerhard Jäger 14. Mai 2003 Das Maximum-Entropy-Prinzip Der Entropiebegriff Entropie: Chaos, Unordung, Nicht-Vorhersagbarkeit,... Begriff kommt ursprünglich aus der Physik:

Mehr

(Lineare) stochastische Optimierung

(Lineare) stochastische Optimierung (Lineare) stochastische Optimierung Bsp: Aus zwei Sorten Rohöl wird Benzin und Heizöl erzeugt. Die Produktivität sowie der Mindestbedarf (pro Woche) und die Kosten sind in folgender Tabelle angegeben:

Mehr

Schriftlicher Test Teilklausur 2

Schriftlicher Test Teilklausur 2 Technische Universität Berlin Fakultät IV Elektrotechnik und Informatik Künstliche Intelligenz: Grundlagen und Anwendungen Wintersemester 2009 / 2010 Albayrak, Fricke (AOT) Opper, Ruttor (KI) Schriftlicher

Mehr

Vortrag zum Paper Results of the Active Learning Challenge von Guyon, et. al. Sören Schmidt Fachgebiet Knowledge Engineering

Vortrag zum Paper Results of the Active Learning Challenge von Guyon, et. al. Sören Schmidt Fachgebiet Knowledge Engineering Vortrag zum Paper Results of the Active Learning Challenge von Guyon, et. al. Sören Schmidt Fachgebiet Knowledge Engineering 11.12.2012 Vortrag zum Paper Results of the Active Learning Challenge von Isabelle

Mehr

Neuronale Netze. Gehirn: ca Neuronen. stark vernetzt. Schaltzeit ca. 1 ms (relativ langsam, vgl. Prozessor)

Neuronale Netze. Gehirn: ca Neuronen. stark vernetzt. Schaltzeit ca. 1 ms (relativ langsam, vgl. Prozessor) 29 Neuronale Netze Gehirn: ca. 10 11 Neuronen stark vernetzt Schaltzeit ca. 1 ms (relativ langsam, vgl. Prozessor) Mustererkennung in 0.1s 100 Schritte Regel 30 Was ist ein künstl. neuronales Netz? Ein

Mehr

Data Mining-Modelle und -Algorithmen

Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,

Mehr

Reinforcement Learning

Reinforcement Learning Reinforcement Learning 1. Allgemein Reinforcement Learning 2. Neuronales Netz als Bewertungsfunktion 3. Neuronales Netz als Reinforcement Learning Nils-Olaf Bösch 1 Allgemein Reinforcement Learning Unterschied

Mehr

Modellbasierte Diagnosesysteme

Modellbasierte Diagnosesysteme Modellbasierte Diagnosesysteme Diagnose: Identifikation eines vorliegenden Fehlers (Krankheit) auf der Basis von Beobachtungen (Symptomen) und Hintergrundwissen über das System 2 Arten von Diagnosesystemen:

Mehr

Bayes sche Klassifikatoren. Uwe Reichel IPS, LMU München 16. Juli 2008

Bayes sche Klassifikatoren. Uwe Reichel IPS, LMU München 16. Juli 2008 Bayes sche Klassifikatoren Uwe Reichel IPS, LMU München reichelu@phonetik.uni-muenchen.de 16. Juli 2008 Inhalt Einleitung Grundlagen der Wahrscheinlichkeitsrechnung Noisy-Channel-Modell Bayes sche Klassifikation

Mehr

Weka: Software-Suite mit Maschineller Lernsoftware

Weka: Software-Suite mit Maschineller Lernsoftware : Software-Suite mit Maschineller Lernsoftware Computational Linguistics Universität des Saarlandes Sommersemester 2011 21.04.2011 Erste Schritte Waikato Environment for Knowledge Analysis entwickelt von

Mehr

Mathematik III - Statistik für MT(Master)

Mathematik III - Statistik für MT(Master) 3. Regressionsanalyse Fachbereich Grundlagenwissenschaften Prof. Dr. Viola Weiß Wintersemester 0/03 Mathematik III - Statistik für MTMaster 3. Empirische Regressionsgerade Optimalitätskriterium: Die Summe

Mehr

Ideen der Informatik. Maschinelles Lernen. Kurt Mehlhorn Adrian Neumann Max-Planck-Institut für Informatik

Ideen der Informatik. Maschinelles Lernen. Kurt Mehlhorn Adrian Neumann Max-Planck-Institut für Informatik Ideen der Informatik Maschinelles Lernen Kurt Mehlhorn Adrian Neumann Max-Planck-Institut für Informatik Übersicht Lernen: Begriff Beispiele für den Stand der Kunst Spamerkennung Handschriftenerkennung

Mehr

Moderne Methoden der KI: Maschinelles Lernen

Moderne Methoden der KI: Maschinelles Lernen Moderne Methoden der KI: Maschinelles Lernen Prof. Dr. sc. Hans-Dieter Burkhard Vorlesung Sommer-Semester 2009 1. Einführung: Definitionen Grundbegriffe Lernsysteme Maschinelles Lernen Lernen: Grundbegriffe

Mehr

4. Kumulierte Häufigkeiten und Quantile

4. Kumulierte Häufigkeiten und Quantile 4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen interessiert, sondern an der Häufigkeit von Intervallen. Typische Fragestellung:

Mehr

Einsatz von Reinforcement Learning in der Modellfahrzeugnavigation

Einsatz von Reinforcement Learning in der Modellfahrzeugnavigation Einsatz von Reinforcement Learning in der Modellfahrzeugnavigation von Manuel Trittel Informatik HAW Hamburg Vortrag im Rahmen der Veranstaltung AW1 im Masterstudiengang, 02.12.2008 der Anwendung Themeneinordnung

Mehr

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5 Inhaltsverzeichnis Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite 1.0 Erste Begriffsbildungen 1 1.1 Merkmale und Skalen 5 1.2 Von der Urliste zu Häufigkeitsverteilungen 9 1.2.0 Erste Ordnung

Mehr

Grundlagen des Maschinellen Lernens Kap. 4: Lernmodelle Teil II

Grundlagen des Maschinellen Lernens Kap. 4: Lernmodelle Teil II 1. Motivation 2. Lernmodelle Teil I 2.1. Lernen im Limes 2.2. Fallstudie: Lernen von Patternsprachen 3. Lernverfahren in anderen Domänen 3.1. Automatensynthese 3.2. Entscheidungsbäume 3.3. Entscheidungsbäume

Mehr

Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser

Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser Gliederung Einleitung Problemstellungen Ansätze & Herangehensweisen Anwendungsbeispiele Zusammenfassung 2 Gliederung

Mehr

Eine zweidimensionale Stichprobe

Eine zweidimensionale Stichprobe Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,

Mehr

Teil: lineare Regression

Teil: lineare Regression Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge

Mehr

Signalverarbeitung 2. Volker Stahl - 1 -

Signalverarbeitung 2. Volker Stahl - 1 - - 1 - Hidden Markov Modelle - 2 - Idee Zu klassifizierende Merkmalvektorfolge wurde von einem (unbekannten) System erzeugt. Nutze Referenzmerkmalvektorfolgen um ein Modell Des erzeugenden Systems zu bauen

Mehr

Vorlesung Maschinelles Lernen

Vorlesung Maschinelles Lernen Vorlesung Maschinelles Lernen Strukturelle Modelle SVMstruct Katharina Morik LS 8 Künstliche Intelligenz Fakultät für Informatik 16.12.2008 1 von 35 Gliederung LS 8 Künstliche Intelligenz Fakultät für

Mehr

10. Vorlesung. Grundlagen in Statistik. Seite 291. Martin-Luther-Universität Halle/Wittenberg

10. Vorlesung. Grundlagen in Statistik. Seite 291. Martin-Luther-Universität Halle/Wittenberg . Vorlesung Grundlagen in Statistik Seite 29 Beispiel Gegeben: Termhäufigkeiten von Dokumenten Problemstellung der Sprachmodellierung Was sagen die Termhäufigkeiten über die Wahrscheinlichkeit eines Dokuments

Mehr

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management für Betriebswirtschaft und internationales Management Sommersemester 2015 Prof. Dr. Stefan Etschberger Hochschule Augsburg Preismesszahl: Misst Preisveränderung eines einzelnen Gutes: Preis zum Zeitpunkt

Mehr

1. Lernen von Konzepten

1. Lernen von Konzepten 1. Lernen von Konzepten Definition des Lernens 1. Lernen von Konzepten Lernziele: Definitionen des maschinellen Lernens kennen, Klassifikationen des maschinellen Lernens kennen, Das Prinzip des induktiven

Mehr

Übersicht. Allgemeines Modell lernender Agenten. Lernende Agenten (1) Lernende Agenten (2)

Übersicht. Allgemeines Modell lernender Agenten. Lernende Agenten (1) Lernende Agenten (2) Übersicht Allgemeines Modell lernender Agenten I Künstliche Intelligenz II Problemlösen III Wissen und Schlußfolgern IV Logisch Handeln V Unsicheres Wissen und Schließen VI Lernen 18. Lernen aus Beobachtungen

Mehr

Evaluation. Caroline Sporleder. Computational Linguistics Universität des Saarlandes. Sommersemester 2011 26.05.2011

Evaluation. Caroline Sporleder. Computational Linguistics Universität des Saarlandes. Sommersemester 2011 26.05.2011 Evaluation Caroline Sporleder Computational Linguistics Universität des Saarlandes Sommersemester 2011 26.05.2011 Caroline Sporleder Evaluation (1) Datensets Caroline Sporleder Evaluation (2) Warum evaluieren?

Mehr

Einführung in die Methoden der Künstlichen Intelligenz. Maschinelles Lernen

Einführung in die Methoden der Künstlichen Intelligenz. Maschinelles Lernen Einführung in die Methoden der Künstlichen Intelligenz Maschinelles Lernen Dr. David Sabel WS 2012/13 Stand der Folien: 14. Februar 2013 Einführung Direkte Programmierung eines intelligenten Agenten nicht

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Statistische Modellierung I WS 2010/2011 Manfred Pinkal Wortartinformation Wortartinformation ist eine wichtige Voraussetzung für die syntaktische Analyse. Woher kommt

Mehr

Statistik, Geostatistik

Statistik, Geostatistik Geostatistik Statistik, Geostatistik Statistik Zusammenfassung von Methoden (Methodik), die sich mit der wahrscheinlichkeitsbezogenen Auswertung empirischer (d.h. beobachteter, gemessener) Daten befassen.

Mehr

Inhaltsverzeichnis. Grundlagen

Inhaltsverzeichnis. Grundlagen Grundlagen 1 Logik und Mengen... 1 1.1 Elementare Logik... 1 1.2 Elementare Mengenlehre... 10 1.3 Schaltalgebra... 15 1.3.1 Anwendung: Entwurf von Schaltkreisen... 21 1.4 Mit dem digitalen Rechenmeister...

Mehr

Was bisher geschah Künstliche Neuronen: Mathematisches Modell und Funktionen: Eingabe-, Aktivierungs- Ausgabefunktion Boolesche oder reelle Ein-und

Was bisher geschah Künstliche Neuronen: Mathematisches Modell und Funktionen: Eingabe-, Aktivierungs- Ausgabefunktion Boolesche oder reelle Ein-und Was bisher geschah Künstliche Neuronen: Mathematisches Modell und Funktionen: Eingabe-, Aktivierungs- Ausgabefunktion Boolesche oder reelle Ein-und Ausgaben Aktivierungsfunktionen: Schwellwertfunktion

Mehr

Mathematik in den Life Siences

Mathematik in den Life Siences Gerhard Keller Mathematik in den Life Siences Grundlagen der Modellbildung und Statistik mit einer Einführung in die Statistik-Software R 49 Abbildungen Verlag Eugen Ulmer Stuttgart Inhaltsverzeichnis

Mehr

Algorithms for Regression and Classification

Algorithms for Regression and Classification Fakultät für Informatik Effiziente Algorithmen und Komplexitätstheorie Algorithms for Regression and Classification Robust Regression and Genetic Association Studies Robin Nunkesser Fakultät für Informatik

Mehr

WEKA A Machine Learning Interface for Data Mining

WEKA A Machine Learning Interface for Data Mining WEKA A Machine Learning Interface for Data Mining Frank Eibe, Mark Hall, Geoffrey Holmes, Richard Kirkby, Bernhard Pfahringer, Ian H. Witten Reinhard Klaus Losse Künstliche Intelligenz II WS 2009/2010

Mehr

Kapitel VIII - Tests zum Niveau α

Kapitel VIII - Tests zum Niveau α Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel VIII - Tests zum Niveau α Induktive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo Siebenschuh Testsituationen

Mehr