Übersicht. Definition Daten Problemklassen Fehlerfunktionen

Größe: px

Ab Seite anzeigen:

Download "Übersicht. Definition Daten Problemklassen Fehlerfunktionen"

Kirsten Geier
vor 5 Jahren
Abrufe

1 Übersicht 1 Maschinelle Lernverfahren Definition Daten Problemklassen Fehlerfunktionen 2 Entwickeln von maschinellen Lernverfahren Aufteilung der Daten Underfitting und Overfitting Erkennen Regularisierung Datenmenge und Learning Curves 3 Zusammenfassung und praktische Tipps Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten 9. Mai / 49

2 Feststellen von Bias oder Variance Bias: Unteranpassung an Trainingsdaten (underfit). Modell nicht mächtig genug. prediction Variance: feature Überanpassung an Trainingsdaten (overfit). prediction Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten feature 9. Mai / 49

3 Feststellen von Bias oder Variance Bias: Unteranpassung an Trainingsdaten (underfit). Modell nicht mächtig genug. Zu wenige Merkmale? Zu viel Regularisierung? prediction feature Variance: Überanpassung an Trainingsdaten (overfit). Zu viele Parameter/Merkmale? Zu wenig Regularisierung? Zu wenige Daten? prediction Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten feature 9. Mai / 49

4 Fehlerrate bei Erhöhen der Modellkapazität error train error number of features Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten 9. Mai / 49

5 Diagnose: Underfitting oder Overfitting? Angenommen der Crossvalidierungsfehler is groß. Ist es ein Bias- (underfitting) oder Variance- (overfitting) Problem? error cv error train error number of features Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten 9. Mai / 49

6 Diagnose: Underfitting oder Overfitting? Angenommen der Crossvalidierungsfehler is groß. Ist es ein Bias (underfitting) oder Variance (overfitting) Problem? error high bias (underfitting) cv error high variance (overfitting) train error number of features Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten 9. Mai / 49

7 Diagnose: Underfitting oder Overfitting Bias (underfitting): Jtrain (θ) hoch Jcv (θ) J train (θ) Variance (underfitting): J train (θ) niedrig Jcv (θ) >> J train (θ) Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten 9. Mai / 49

8 Übersicht 1 Maschinelle Lernverfahren Definition Daten Problemklassen Fehlerfunktionen 2 Entwickeln von maschinellen Lernverfahren Aufteilung der Daten Underfitting und Overfitting Erkennen Regularisierung Datenmenge und Learning Curves 3 Zusammenfassung und praktische Tipps Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten 9. Mai / 49

9 Regularisierung Term zur Fehlerfunktion hinzuaddiert (und mitoptimiert) wird, und der etreme Werte für Merkmalsgewichte bestraft. Zum Beispiel L2-Norm, θ 2 J(θ) = 1 2m m (h θ ( (i) ) y (i) ) 2 + λ i=1 Ausmaß der Regularisierung wird durch Hyperparameter λ gewählt. Kleines, genau richtiges and großes λ: n j=1 θ 2 n prediction prediction prediction feature feature feature Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten 9. Mai / 49

10 Auswahl des Regularisierungs-Parameters J(θ): zu optimierende Fehlerfunktion auf Trainingsdaten mit Regularisierungsterm. J train (θ), J cv (θ), J test (θ): Fehlerfunktionen ohne Regularisierungsterm. Welches λ sollte gewählt werden? 0, 0.01, 0.02, 0.05, ? Separates Modell für jeden Wert trainieren. Das Beste Modell auf Kreuzvalidierungsdaten wählen. Ergebnis auf den Testdaten berechnen. Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten 9. Mai / 49

11 Overfitting und Underfitting in Abhängigkeit von λ error high bias (underfitting) high variance (overfitting) cv error train error low λ λ high λ Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten 9. Mai / 49

12 Übersicht 1 Maschinelle Lernverfahren Definition Daten Problemklassen Fehlerfunktionen 2 Entwickeln von maschinellen Lernverfahren Aufteilung der Daten Underfitting und Overfitting Erkennen Regularisierung Datenmenge und Learning Curves 3 Zusammenfassung und praktische Tipps Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten 9. Mai / 49

13 Learning Curves Learning Curve : Fehlerfunktion in Abhängigkeit von der Datenmenge. Je mehr Daten im Training vorhanden sind, desto schwieriger ist es ein Modell zu finden, dass alle Trainingsdaten perfekt modelliert... error train error training set size m Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten 9. Mai / 49

14 Learning Curves Learning Curve : Fehlerfunktion in Abhängigkeit von der Datenmenge Je mehr Daten im Training vorhanden sind, desto schwieriger ist es ein Modell zu finden, dass alle Trainingsdaten perfekt modelliert jedoch steigt bei mehr Trainingsdaten die Qualität der Vorhersage für ungesehene Daten. error cv error train error training set size m Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten 9. Mai / 49

15 Learning Curves bei underfitting-modellen Bei underfitting-modellen ändert sich der Fehler in Abhängigkeit von zusätzlichen Daten nicht wesentlich. error cv error train error training set size m Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten 9. Mai / 49

16 Learning Curves bei overfitting-modellen Großer Unterschied zwischen Trainings- und Testfehler. Zusätzliche Trainingsdaten reduzieren den Testfehler. Zusätzliche Trainingsdaten erhöhen den Trainingsfehler (weniger Overfitting) error cv error train error training set size m Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten 9. Mai / 49

17 Übersicht 1 Maschinelle Lernverfahren Definition Daten Problemklassen Fehlerfunktionen 2 Entwickeln von maschinellen Lernverfahren Aufteilung der Daten Underfitting und Overfitting Erkennen Regularisierung Datenmenge und Learning Curves 3 Zusammenfassung und praktische Tipps Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten 9. Mai / 49

18 Sind mehr Daten immer besser? Daten zu gewinnen ist mit Aufwand verbunden. Wann lohnt sich dieser Aufwand? Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten 9. Mai / 49

19 Sind mehr Daten immer besser? Banko and Brill 2001: It s not who has the best algorithm that wins. It s who has the most data. Annahmen: Merkmale enkodieren alle wesentlichen Informationen, so dass ein Mensch die Entscheidung souverän treffen könnte. Der Lernalgorithmus hat eine hohe Kapazität (hohe Varianz, overfitting). Unter diesen Annahmen ist es eine gute Idee, mehr Daten zu gewinnen. Ansonsten ist es vielversprechender, an Merkmalen und Algorithmus zu arbeiten. Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten 9. Mai / 49

20 Zusammenfasssung: Verbessern von Performanz Ausgangssituation: Klassifikator hat zu große Fehlerrate auf Kreuzvalidierungsdaten. Diagnostik: Learning Curves Testfehler und CV-Fehler für 10%, 20%, % der Testdaten anzeigen. Overfitting oder Underfitting. Nächste Schritte: Problem ist Overfitting: λ erhöhen Weniger Merkmale Mehr Trainingsdaten Problem ist Underfitting: λ erniedrigen Merkmalskombinationen Zusätzliche Merkmale Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten 9. Mai / 49

21 Fehleranalyse Beginne mit einem einfachen Algorithmus, der schnell implementiert werden kann. Auf Kreuzvalidierungsdaten testen und Hyperparameter optimieren. Learning Curves anzeigen, um zu sehen ob mehr Daten oder mehr Features helfen könnten. Fehleranalyse: Von Hand Beispiele in den Kreuzvalidierungsdaten suchen, bei denen der Algorithmus Fehler gemacht hat. Gibt es systematische Fehler? Falls das Problem Underfitting war, neue Features anhand der Beobachtungen konstruieren. Falls das Problem Overfitting war, Features anhand der Beobachtungen generalisieren (oder neue Daten gewinnen). Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten 9. Mai / 49

22 Fehleranalyse: Spam- Beispiel 500 Beispiele in Kreuzvalidierungsset 100 falsch klassifiziert Durchsehen und von Hand kategorisieren: Welche Art von Pharma Gefälschte Produkte Fishing- s andere Welche Features könnten helfen: Länge der Beabsichtigte 5chreibfehl3r andere Bestimmte Merkmale müssen quantitativ evaluiert werden: Stemming, Muster in der Groß- und Kleinschreibung... Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten 9. Mai / 49

23 Noch Fragen? Benjamin Roth (CIS LMU München) Planen and Evaluieren von Machine Learning Eperimenten 9. Mai / 49

Ähnliche Dokumente

Marina Sedinkina Folien von Benjamin Roth Planen (CIS LMU andmünchen) Evaluieren von Machine Learning Experimenten 1 / 38

Planen and Evaluieren von Machine Learning Eperimenten Marina Sedinkina Folien von Benjamin Roth CIS LMU München Evaluieren von Machine Learning Eperimenten 1 / 38 Übersicht 1 Entwickeln von maschinellen