Mustererkennung und Klassifikation

Ähnliche Dokumente
Überblick. Einführung in die automatische Mustererkennung Grundlagen der Wahrscheinlichkeitsrechnung

Automatische Mustererkennung

Inhaltliche Planung für die Vorlesung

Digitale Bildverarbeitung Einheit 11 Klassifikation

Seminar Künstliche Intelligenz WS 2013/14 Grundlagen des Maschinellen Lernens

Syntaktische und Statistische Mustererkennung. Bernhard Jung

Konzepte der AI: Maschinelles Lernen

Reinforcement Learning

Data-Mining: Ausgewählte Verfahren und Werkzeuge

Proseminar - Data Mining

Neuronale Netze. Anna Wallner. 15. Mai 2007

Support Vector Machines und Kernel-Methoden

Kapitel ML: I. I. Einführung. Beispiele für Lernaufgaben Spezifikation von Lernproblemen

Kapitel LF: I. Beispiele für Lernaufgaben. Beispiele für Lernaufgaben. LF: I Introduction c STEIN

Einführung in die Methoden der Künstlichen Intelligenz

Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 2016

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester Prof. Dr. R. D. Reiß

2. Datenvorverarbeitung

Sports Data Mining. The Field and Methodology. Sublogo Fachbereich Informatik Prof. Johannes Fürnkranz 1

Statistische Methoden der Datenanalyse

Softcomputing Biologische Prinzipien in der Informatik. Neuronale Netze. Dipl. Math. Maria Oelinger Dipl. Inform. Gabriele Vierhuff IF TIF

0 Einführung: Was ist Statistik

Proseminar - Data Mining

WEKA A Machine Learning Interface for Data Mining

Wahrscheinlichkeiten

Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion

Künstliche Neuronale Netze und Data Mining

Seminar Visual Analytics and Visual Data Mining

Neuronale Netze. Gehirn: ca Neuronen. stark vernetzt. Schaltzeit ca. 1 ms (relativ langsam, vgl. Prozessor)

Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell

One-class Support Vector Machines

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Clusteranalyse. Tobias Scheffer Thomas Vanck

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining

1 Inhaltsverzeichnis. 1 Einführung...1

1. Lernen von Konzepten

Session: 1 SO Selbstoptimierte Zustandsüberwachung für die Prognose von Fehlzuständen für Windkraftanlagen SO-Pro (Resolto)

Andreas Scherer. Neuronale Netze. Grundlagen und Anwendungen. vieweg

Textmining Klassifikation von Texten Teil 1: Naive Bayes

Data Mining - Wiederholung

Einsatz von Reinforcement Learning in der Modellfahrzeugnavigation

MUSTERERKENNUNG. Meine Lehrveranstaltungen für... Informatiker & Bioinformatiker & Informatikerinnen & Bioinformatikerinnen

Crashkurs Mathematik für Ökonomen

3. Das Reinforcement Lernproblem

Data Mining für die industrielle Praxis

Einführung in die Methoden der Künstlichen Intelligenz. Maschinelles Lernen

Klausurtermine Informatik Herbst 2016 Stand: Änderungen sind rot markiert Wochentag Prüfungstermin: Prüfungsbezeichnung: Raum/Räume:

Detecting Near Duplicates for Web Crawling

Selected Topics in Machine Learning and Reverse Engineering

Frequent Itemset Mining + Association Rule Mining

Data Mining und Knowledge Discovery in Databases

Automatische Erkennung von Objekten in 3D Millimeterwellen Bilddaten für den QPS Sicherheitsscanner

Data Mining (ehem. Entscheidungsunterstützungssysteme)

Mathematisch-algorithmische Grundlagen für Big Data

Vorlesung Maschinelles Lernen

2.2. Wissenschaftstheoretische Grundzüge der Gewinnung von Erkenntnissen über Märkte 10

Eine kleine Einführung in neuronale Netze

Maschinelles Lernen: Neuronale Netze. Ideen der Informatik Kurt Mehlhorn

Entscheidungsunterstützende Systeme

Theoretische Informatik 1

Neuronale Netze. Literatur: J. Zupan, J. Gasteiger: Neural Networks in Chemistry and Drug Design, VCH, Weinheim, 2nd Ed. 1999, ISBN

Computerlinguistische Textanalyse

x 2 x 1 x Lernen mit Entscheidungsbäumen

Künstliche neuronale Netze

DIPLOMARBEIT. Martin-Luther-Universität Halle-Wittenberg. Detektion von Transkriptionsfaktorbindestellen mit Support-Vektor-Maschinen

Text-Mining: Einführung

Moderne Methoden der KI: Maschinelles Lernen

Grundlagen von Support Vector Maschinen und Anwendungen in der Bildverarbeitung

Klassifikation im Bereich Musik

Proseminar - Data Mining

Predictive Modeling mit künstlich neuronalen Netzen

Vorlesung Maschinelles Lernen

Fachhochschule Köln. Konzepte des maschinellen Lernens. Ausarbeitung. Florian Keller

Neuronale Netze in der Phonetik: Grundlagen. Pfitzinger, Reichel IPSK, LMU München {hpt 24.

DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 374

Kapitel ML:IV. IV. Statistische Lernverfahren. Wahrscheinlichkeitsrechnung Bayes-Klassifikation Maximum-a-Posteriori-Hypothesen

Data Mining und maschinelles Lernen

Was ist Informatik? Alexander Lange

Fragenkatalog zur Vorlesung "Grundlagen des Data Mining" (WS 2006/07)

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke

9 Resümee. Resümee 216

Clusteranalyse. Anwendungsorientierte Einführung. R. Oldenbourg Verlag München Wien. Von Dr. Johann Bacher

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining.

Bachelorarbeit Erkennung von Fließtext in PDF-Dokumenten

(hoffentlich kurze) Einführung: Neuronale Netze. Dipl.-Inform. Martin Lösch. (0721) Dipl.-Inform.

Neuronale Netze. Einführung i.d. Wissensverarbeitung 2 VO UE SS Institut für Signalverarbeitung und Sprachkommunikation

Kleines Handbuch Neuronale Netze

Moderne Methoden der KI: Maschinelles Lernen

Martin Stetter WS 04/05, 2 SWS. VL: Dienstags 8:30-10 Uhr

Logische Programmierung

Einführung in die Wahrscheinlichkeitsrechnung

WS 2009/10. Diskrete Strukturen

6.6 Vorlesung: Von OLAP zu Mining

P (X = 2) = 1/36, P (X = 3) = 2/36,...

Predictive Modeling Markup Language. Thomas Morandell

Maschinelles Lernen: Neuronale Netze. Ideen der Informatik

3. Leistungserbringer

KNN-Methode zur Einschätzung von Veränderungen des Salzgehaltes in Ästuaren

Statistik für Ökonomen

Statistik, Geostatistik

Text Mining Praktikum. Durchführung: Andreas Niekler Zimmer: Paulinum (P) 818

Transkript:

Mustererkennung und Klassifikation WS 2007/2008 Fakultät Informatik Technische Informatik Prof. Dr. Matthias Franz mfranz@htwg-konstanz.de www-home.htwg-konstanz.de/~mfranz/heim.html

Grundlagen Überblick Einführung in die automatische Mustererkennung Grundlagen der Wahrscheinlichkeitsrechnung Klassifikation bei bekannter Wahrscheinlichkeitsverteilung Entscheidungstheorie Bayes-Klassifikator Entscheidungsfunktionen bei gaußverteilten Daten Unüberwachtes Lernen bei unbekannter Verteilung der Daten Nichtparametrische Klassifikation Probleme bei hochdimensionalen Daten Lineare Klassifikation, Perzeptron Nicht linear trennbare Systeme Nichtlineare Klassifikatoren Vergleich von Klassifikatoren Unüberwachtes Lernen Hauptkomponentenanalyse K-Means-Clustering Agglomeratives Clustern M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 2

Literaturverzeichnis (1) Standardwerke zu Mustererkennung und Klassifikation R.O.Duda, P.E.Hart & D.G.Stork, Pattern Classification, Wiley, 654 Seiten, 2001. Klassische Einführung in die Mustererkennung.Vorlesungsstoff wird gut erklärt, geht an vielen Stellen über den Vorlesungsstoff hinaus. S. Haykin, Neural Networks: a comprehensive foundation, Prentice Hall, 842 Seiten, 1998. Ebenfalls ein gut geschriebener Klassiker. Sehr umfangreich, Fokus auf neuronale Netze (ist in diesem Kurs eher Nebensache), aber fast alles aus der Vorlesung wird auch erklärt. T. Hastie, R. Tibshirani & J. Friedman, The elements of statistical learning, Springer, 533 Seiten, 2001. Standardwerk, geschrieben aus Sicht der Statistik. Schwerer zugänglich, aber lohnend. Geht ebenfalls über den Vorlesungsstoff hinaus. C.M.Bishop, Pattern recognition and machine learning; Springer, 738 Seiten, 2005. Sehr umfangreich, auf dem neuesten Stand in Richtung maschinelles Lernen. R.Rojas, Theorie der neuronalen Netze; Springer, ca. 300 Seiten, 1996. Eines der wenigen deutschsprachigen Bücher zu diesem Thema, deckt nur Teile der Vorlesung ab. M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 3

Literaturverzeichnis (2) Weiterführende Literatur B. Schölkopf & A. Smola, Learning with kernels, MIT Press, 644 Seiten, 2002 behandelt im vollen Umfang sogenannte Kernelmethoden (z.b. Supportvektormaschinen), die momentan einige der leistungsfähigsten Algorithmen stellen. D. MacKay, Information theory, inference and learning algorithms; Cambridge University, 550 Seiten, 2003. behandelt maschinelles Lernen mit probabilistischen Methoden im informationstheoretischen Kontext, sehr gut geschrieben. M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 4

Grundlagen Überblick Einführung in die automatische Mustererkennung Grundlagen der Wahrscheinlichkeitsrechnung Klassifikation bei bekannter Wahrscheinlichkeitsverteilung Entscheidungstheorie Bayes-Klassifikator Entscheidungsfunktionen bei gaußverteilten Daten Unüberwachtes Lernen bei unbekannter Verteilung der Daten Nichtparametrische Klassifikation Probleme bei hochdimensionalen Daten Lineare Klassifikation, Perzeptron Nicht linear trennbare Systeme Nichtlineare Klassifikatoren Vergleich von Klassifikatoren Unüberwachtes Lernen Hauptkomponentenanalyse K-Means-Clustering Agglomeratives Clustern M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 5

Mustererkennung und Klassifikation: Begriffe Klassifizierung oder Klassifikation (von lat. classis, Klasse, und facere, machen ) nennt man das Zusammenfassen von Objekten zu Klassen. Kategorisierung ist der Prozess, bei dem unterschiedliche Objekte als gleichwertig betrachtet werden. Sie ist ein fundamentaler kognitiver Vorgang bei Wahrnehmung und Verständnis von Konzepten und Objekten, beim Entscheidungsprozess und bei allen Arten von Interaktion mit der Umwelt. Kategorisierung und Klassifizierung bedeuten eigentlich dasselbe, Klassifizierung bezieht sich jedoch auf mathematische oder technische Prozesse, Kategorisierung auf Psychologie und Bedeutung. Kategorisierung bzw. Klassifizierung sind Voraussetzung für Abstraktion und Begriffsbildung und damit letztlich für Intelligenz. Mustererkennung bezeichnet ein Verfahren, gemessene Signalen automatisch in Kategorien einzuordnen, d.h sie automatisch zu klassifizieren. M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 6

Beispiel für eine Mustererkennungsaufgabe (1) [aus Duda et al., 2001] M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 7

Beispiel für eine Mustererkennungsaufgabe (2) [aus Duda et al., 2001] M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 8

Beispiel für eine Mustererkennungsaufgabe (3) [aus Duda et al., 2001] M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 9

Beispiel für eine Mustererkennungsaufgabe (4) [aus Duda et al., 2001] M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 10

Beispiel für eine Mustererkennungsaufgabe (5) [aus Duda et al., 2001] M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 11

Beispiel für eine Mustererkennungsaufgabe (6) [aus Duda et al., 2001] M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 12

Zentrale Begriffe in der statistischen Mustererkennung Merkmal Vorverarbeitung Segmentierung Merkmalsextraktion Trainingsbeispiele Entscheidungskosten, Kostenfunktion Entscheidungstheorie Klassengrenze Generalisierung M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 13

Drei grundlegende Ansätze in der Mustererkennung 1. Syntaktisch: Dinge werden so durch Folgen von Symbolen beschrieben, dass Objekte der gleichen Kategorie die selben Beschreibungen aufweisen. Das Problem der Mustererkennung stellt sich in diesem Fall als Suche nach einer formalen Grammatik dar, also nach einer Menge von Symbolen und Regeln zum Zusammenfügen derselben. 2. Statistisch: Ziel ist es hier, ein Objekt in die Kategorie mit der höchsten Wahrscheinlichkeit einzusortieren. Statt Merkmale nach vorgefertigten Regeln auszuwerten, werden sie hier einfach als Zahlenwerte gemessen und in einem Merkmalsvektor zusammengefasst. Eine mathematische Funktion ordnet dann jedem denkbaren Merkmalsvektor eindeutig eine Kategorie zu. 3. Strukturell: verbindet verschiedene syntaktische und/oder statistische Verfahren zu einem einzigen neuen Verfahren. Die grundlegende Merkmalserkennung wird dabei allgemeinen statistischen Verfahren überlassen, während übergeordnete Inferenzverfahren Spezialwissen über das Sachgebiet einbringen. M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 14

Syntaktische Mustererkennung Syntaktischer Mustererkenner: Regel 1: Wenn gelb und länglich, dann Banane rot, rund Regel 2: Wenn rot und rund, dann Apfel Erfordert eindeutige Attribute gelb, länglich M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 15

Statistische Mustererkennung [aus Duda et al., 2001] M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 16

Strukturelle Mustererkennung -Teile des Objekts werden mit statistischen Techniken detektiert. -Struktur, d.h. Konstellation der Teile wird zusätzlich gelernt. M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 17

Strukturelle Mustererkennung (2) M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 18

Abgrenzung zu anderen Gebieten Bei der Klassifikation werden den Inputs diskrete Outputs zugewiesen (d.h. die jeweilige Bezeichnung der Klasse). Sind die Outputs dagegen kontinuierliche Größen, spricht man von Regression, bei ordinalen Outputs von Rangfolgenbestimmung (Ranking). Künstliche Intelligenz: Teilgebiet der Informatik, das mit der Automatisierung intelligenten Verhaltens befasst ist. Mustererkennung als grundlegende Voraussetzung für intelligentes Verhalten ist ein zentraler Bestandteil der KI. Data mining: explorative Datenanalyse zur Entdeckung von Mustern in (meist großen) Datenbeständen. Methoden der Mustererkennung werden als zentraler Bestandteil im Data mining eingesetzt. Maschinelles Lernen: Oberbegriff für die künstliche Generierung von Wissen aus Erfahrung. Damit beinhaltet maschinelles Lernen nicht nur die Mustererkennung, sondern auch Techniken wie Regression, Interpolation und Dichteschätzung M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 19

Schema eines Mustererkennungsystems Zentrales Thema der Vorlesung Merkmale sollten invariant gegenüber unwichtigentransformationen sein (z.b. Verschiebung, Drehung, Skalierung) Segmentierung ist eines der schwierigsten Probleme in der Mustererkennung [aus Duda et al., 2001] M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 20

Invariante Merkmale? M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 21

... M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 22

Designzyklus eines Mustererkennungssystems Hauptprobleme: 1. Überanpassung An Trainingsbeispiele (Overfitting) 2. Begrenzte Rechenkapazität [aus Duda et al., 2001] M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 23

Lernen anhand von Beispielen Überwachtes Lernen: Zu jedem Trainingsbeispiel ist die Klassenzugehörigkeit bekannt Unüberwachtes Lernen: Klassen müssen über natürliche Gruppen gefunden werden (Clustering) Halbüberwachtes Lernen: die Klassenzugehörigkeit ist nur für ein paar Trainingsbeispiele bekannt, die anderen müssen sinnvoll eingeordnet werden Bekräftigungslernen (Reinforcement Learning): Aktionen des Mustererkenners werden nur mit falsch oder richtig bewertet, die Klassenzugehörigkeit wird nicht mitgeteilt. M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 24

Unüberwachtes Lernen M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 25

Halbüberwachtes Lernen M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 26

Überwachtes und Bekräftigungslernen Überwachtes Lernen Reinforcement-Lernen [S. Dennis, 1997] M.O.Franz, September 2007 Mustererkennung und Klassifikation - Einführung 27