Anpassungsrechnungen mit kleinsten Quadraten und Maximum Likelihood

Ähnliche Dokumente
Anpassungsrechnungen mit kleinsten Quadraten und Maximum Likelihood

Parameteranpassung mit kleinsten Quadraten und Maximum Likelihood

Schätzung von Parametern

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38

Theorie Parameterschätzung Ausblick. Schätzung. Raimar Sandner. Studentenseminar "Statistische Methoden in der Physik"

Numerische Methoden und Algorithmen in der Physik

Die Maximum-Likelihood-Methode

Inhaltsverzeichnis. 4 Statistik Einleitung Wahrscheinlichkeit Verteilungen Grundbegriffe 98

Rechnernutzung in der Physik Teil 3 Statistische Methoden der Datenanalyse

Statistische Methoden der Datenanalyse

Einführung in die Maximum Likelihood Methodik

Statistics, Data Analysis, and Simulation SS 2017

Statistik und Datenanalyse (Handout zum Seminarvortrag von Norman Bhatti, gehalten am )

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp

Institut für Stochastik Prof. Dr. N. Henze Dipl.-Math. V. Riess

Wichtige Definitionen und Aussagen

Einige Konzepte aus der Wahrscheinlichkeitstheorie (Wiederh.)

Statistische Methoden der Datenanalyse

Übung 1: Wiederholung Wahrscheinlichkeitstheorie

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp

4.1 Stichproben, Verteilungen und Schätzwerte. N(t) = N 0 e λt, (4.1)

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp

Statistik - Fehlerrechnung - Auswertung von Messungen

Rechnernutzung in der Physik

2.Tutorium Multivariate Verfahren

Wahrscheinlichkeit und Statistik: Zusammenfassung

OLS-Schätzung: asymptotische Eigenschaften

Statistische Datenanalyse

Einige Konzepte aus der Wahrscheinlichkeitstheorie (Review)

Statistik, Datenanalyse und Simulation

Statistik - Fehlerrechnung - Auswertung von Messungen

Mathematik für Biologen

Einführung in die Stochastik für Informatiker Übungsaufgaben mit Lösungen

Zufallsvariablen [random variable]

Statistik Einführung // Stichprobenverteilung 6 p.2/26

70 Wichtige kontinuierliche Verteilungen

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Statistics, Data Analysis, and Simulation SS 2017

Computergestützte Datenanalyse in der Kern- und Teilchenphysik

Willkommen zur Vorlesung Statistik (Master)

3. Gemeinsame und bedingte Verteilung, stochastische Unabhängigkeit

Chi-Quadrat-Verteilung

Übungen zur Vorlesung Statistische Methoden Kapitel 1-2

Statistik und Wahrscheinlichkeitsrechnung

Wahrscheinlichkeitsrechnung und Statistik

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

2. Stochastische ökonometrische Modelle. - Modelle der ökonomischen Theorie an der Wirklichkeit überprüfen

Willkommen zur Vorlesung Statistik (Master)

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management

Wahrscheinlichkeitstheorie und Statistik für Studierende des Maschinenbaus vom

Der Erwartungswert E[g(X)] von g(x) ist definiert. g(x k )w(x = x k ),

Kapitel 3 Schließende Statistik

Biostatistik, Sommer 2017

Spezielle Verteilungen

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

DWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr

Lineare Regression (Ein bisschen) Theorie

Fit for Abi & Study Stochastik

Vorlesung: Lineare Modelle

K8 Stetige Zufallsvariablen Theorie und Praxis

0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1

Prüfungsfächer: Die Prüfung erstreckt sich auf die folgenden Prüfungsfächer: Maß- und Integrationstheorie Wahrscheinlichkeitstheorie Statistik

Aufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten:

5. Spezielle stetige Verteilungen

Statistik II. Regressionsanalyse. Statistik II

Mathematik für Naturwissenschaften, Teil 2

Mathematische Werkzeuge R. Neubecker, WS 2016 / 2017

Die Varianz (Streuung) Definition

1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...

Statistische Methoden in den Umweltwissenschaften

Ökonometrie. Hans Schneeweiß. 3., durchgesehene Auflage. Physica-Verlag Würzburg-Wien 1978 ISBN

Statistische Inferenz

Mathematische Statistik Aufgaben zum Üben. Schätzer

Moderne Methoden der Datenverarbeitung in der Physik I

Kapitel VI - Maximum-Likelihood-Schätzfunktionen

Zusammenfassung: diskrete und stetige Verteilungen. Woche 4: Gemeinsame Verteilungen. Zusammenfassung: diskrete und stetige Verteilungen

Vorwort zur fünften Auflage. Liste der Beispiele. Häufig benutzte Symbole und Bezeichnungen

Wahrscheinlichkeiten. Verteilungen

Kapitel XII - Kennzahlen mehrdimensionaler Zufallsvariablen

Teil VI. Gemeinsame Verteilungen. Lernziele. Beispiel: Zwei Würfel. Gemeinsame Verteilung

Statistik. R. Frühwirth Teil 1: Deskriptive Statistik. Statistik. Einleitung Grundbegriffe Merkmal- und Skalentypen Aussagen und

Kapitel 1 Einführung. Angewandte Ökonometrie WS 2012/13. Nikolaus Hautsch Humboldt-Universität zu Berlin

Statistik III. Walter Zucchini Fred Böker Andreas Stadie

Auswertung von Messungen Teil II

Lösung Übungsblatt 5

Statistik in Geodäsie, Geoinformation und Bauwesen

Statistische und numerische Methoden der Datenanalyse

Simultane Mehrgleichungssysteme: Parameterschätzung

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

4. Gemeinsame Verteilung und Grenzwertsätze

4. Gemeinsame Verteilung und Grenzwertsätze

Klassifikation von Daten Einleitung

Multivariate Verfahren

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Übung zu Empirische Ökonomie für Fortgeschrittene SS 2009

Das Histogramm ist glockenförmig. Es würde bei mehr als vier Fehlerquellen sich der Glockenform noch besser annähern.

Mehrdimensionale Verteilungen und Korrelation

Bestimmte Zufallsvariablen sind von Natur aus normalverteilt. - naturwissenschaftliche Variablen: originär z.b. Intelligenz, Körpergröße, Messfehler

Copula Funktionen. Eine Einführung. Nils Friewald

Transkript:

Anpassungsrechnungen mit kleinsten Quadraten und Maximum Likelihood KARLSRUHER INSTITUT FÜR TECHNOLOGIE (KIT) 0 KIT 06.01.2012 Universität des Fabian Landes Hoffmann Baden-Württemberg und nationales Forschungszentrum in der Helmholtz-Gemeinschaft www.kit.edu

Gliederung Einleitung Grundlagen Wahrscheinlichkeit Eigenschaften von Schätzern Maximum-Likelihood-Methode Prinzip Beispiel Fehlerberechnung Eigenschaften Methode der kleinsten Quadrate Prinzip Zusammenhang mit Maximum-Likelihood Lineare Kleinste Quadrate und Fehlerfortpflanzung X 2 -Test Eigenschaften Zusammenfassung 1 06.01.2012 Fabian Hoffmann

Das Problem 0.5159 6.1404 0.0409 0.004181 1.2335 0.3405 0.0819 0.004434 2.0768 0.0963 0.1228 0.004827 3.0872 0.0525 0.1637 0.005328 4.0816 0.0294 0.2046 0.005910 4.8890 0.0188 0.2456 0.006552 5.5414 0.0161 0.2865 0.007237 6.0929 0.0123 0.3274 0.007955 6.5342 0.0123 0.3684 0.008698 6.8709 0.0122 0.4093 0.009459 7.1006 0.0086 0.4502 0.010234 7.2838 0.0085 0.4912 0.011021 7.3960 0.0080 0.5321 0.011817 7.4743 0.0069 0.5730 0.012620 7.4906 0.0067 0.6139 0.013430 7.4860 0.0064 0.6549 0.014244 7.4650 0.0080 0.6958 0.015063 7.4396 0.0063 0.7367 0.015885 2 06.01.2012 Fabian Hoffmann Man hat viele Daten Die Theorie hat wenige Parameter Parameter müssen so angepasst werden, dass sie gut zu den Daten passen

Die Lösung Anpassungsrechnung (auch Parameterschätzung, Parameteranpassung, Ausgleichungsrechnung, Fitting) mit Maximum-Likelihood-Methode Methode der kleinsten Quadrate 3 06.01.2012 Fabian Hoffmann

Wahrscheinlichkeitsverteilung Eine Wahrscheinlichkeitsverteilung kann diskret (Bsp. Würfel, Spin) oder kontinuierlich sein. 4 06.01.2012 Fabian Hoffmann

Wahrscheinlichkeitsverteilung kontinuierliche Wahrscheinlichkeit Definition Wahrscheilichkeitsdichtefunktion (probability density function, pdf) P (a < x < b) = mit b a f (x) dx = 1 f (x) dx 5 06.01.2012 Fabian Hoffmann

Erwartungswert und Varianz Definition Erwartungswert einer Funktion h(x): E[h (x)] = h (x) f (x) dx 6 06.01.2012 Fabian Hoffmann

Erwartungswert und Varianz Definition Erwartungswert einer Funktion h(x): E[h (x)] = h (x) f (x) dx Definition Mittelwert=Erwartungswert von x x = E[x] = xf (x) dx 6 06.01.2012 Fabian Hoffmann

Erwartungswert und Varianz Definition Varianz von x: V [x] = E[(x x ) 2 ] = E[x 2 ] E[x] 2 7 06.01.2012 Fabian Hoffmann

Erwartungswert und Varianz Definition Varianz von x: V [x] = E[(x x ) 2 ] = E[x 2 ] E[x] 2 Definition Kovarianz von x und y: cov[x, y] = E[(x x )(y y )] = E[x y] E[x]E[y] 7 06.01.2012 Fabian Hoffmann

Erwartungswert und Varianz Definition Kovarianzmatrix: V[x] = E[(x x )(x x ) T ] cov(x 1, x 1 ) cov(x 1, x 2 )... cov(x 1, x n ) cov(x 2, x 1 ) cov(x 2, x 2 )... cov(x 2, x n ) V =... cov(x n, x 1 ) cov(x n, x 2 )... cov(x n, x n ) 8 06.01.2012 Fabian Hoffmann

Zentraler Grenzwertsatz S sei die Summe aus N unabhängigen Zufallsvariablen mit Mittelwert a i und Varianz V i. Dann gilt: E[S] = N i=1 a i V [S] = N i=1 V i Für N ist die pdf von S eine Normalverteilung 9 06.01.2012 Fabian Hoffmann

Eigenschaften von Schätzern Ein Schätzer sollte folgende Eigenschaften haben: Konsistenz Erwartungstreue Effizienz Robustheit Effizienz und Robustheit stehen oft in Widerspruch zueinander. Benötigte Rechenleistung sollte gering sein 10 06.01.2012 Fabian Hoffmann

Eigenschaften von Schätzern Ein Schätzer sollte folgende Eigenschaften haben: Konsistenz: lim â = a 0 N Erwartungstreue Effizienz Robustheit Effizienz und Robustheit stehen oft in Widerspruch zueinander. Benötigte Rechenleistung sollte gering sein 10 06.01.2012 Fabian Hoffmann

Eigenschaften von Schätzern Ein Schätzer sollte folgende Eigenschaften haben: Konsistenz: lim â = a 0 N Erwartungstreue: E[â] = a 0 Effizienz Robustheit Effizienz und Robustheit stehen oft in Widerspruch zueinander. Benötigte Rechenleistung sollte gering sein 10 06.01.2012 Fabian Hoffmann

Eigenschaften von Schätzern Ein Schätzer sollte folgende Eigenschaften haben: Konsistenz: lim â = a 0 N Erwartungstreue: E[â] = a 0 Effizienz: V [â] sollte minimal sein Robustheit Effizienz und Robustheit stehen oft in Widerspruch zueinander. Benötigte Rechenleistung sollte gering sein 10 06.01.2012 Fabian Hoffmann

Eigenschaften von Schätzern Ein Schätzer sollte folgende Eigenschaften haben: Konsistenz: lim â = a 0 N Erwartungstreue: E[â] = a 0 Effizienz: V [â] sollte minimal sein Robustheit: Kein Einfluss von falschen Daten/Voraussetzungen Effizienz und Robustheit stehen oft in Widerspruch zueinander. Benötigte Rechenleistung sollte gering sein 10 06.01.2012 Fabian Hoffmann

Maximum-Likelihood-Methode Definition Likelihood-Funktion L (a) = f (x i, a) i beschreibt die Wahrscheinlichkeit die Messwerte {x i } zu erhalten. Maximum-Likelihood-Methode: Maximierung der Likelihood-Funktion Praktisch meist Minimierung der negative Log-Likelihood-Funktion: F (a) = ln L (a) = ln f (x i, a) i 11 06.01.2012 Fabian Hoffmann

Maximum-Likelihood-Methode 12 06.01.2012 Fabian Hoffmann

Maximum-Likelihood-Methode 13 06.01.2012 Fabian Hoffmann

Einfaches Beispiel Lebensdauer f (t, γ) = γe γt mit γ = 1 τ F (γ) = N ln (γ) + N i=1 γt i d dγ F (γ) = N N γ +! t i = 0 i=1 ˆτ = 1ˆγ N = t i N i=1 14 06.01.2012 Fabian Hoffmann

Einfaches Beispiel Lebensdauer Angenommen es kann nur im Zeitintervall 0 < t < t max gemessen werden. F (γ) = N ˆτ = γe γt f (t, γ) = 1 e γt max [ ( ) ] ln 1 e γt max ln (γ). N t i N + t max exp( t max / ˆτ) 1 exp( t i=1 max / ˆτ) Dies ist nur numerisch auswertbar. + N i=1 γt i 15 06.01.2012 Fabian Hoffmann

Fehlerberechnung Parabolischer Fall Bei großen Proben ist die Fehlerzuordnung einfach: Nach dem Zentralen Grenzwertsatz geht die Likelihood-Funktion gegen eine Gauß-Funktion, bei großen Stichproben. Entwicklung: F (a) = F (â) + 1 2 d2 F (â a) 2 + O(a 3 ) da 2 Vergleich mit Gauß: ln(gauß) = const + 1 2 F (â ± r σ) = F (â) + r 2 2 (â a) 2 σ 2 16 06.01.2012 Fabian Hoffmann

Fehlerberechnung Allgemeiner Fall Es können asymmetrische Konfidenzgrenzen definiert werden: F (â + r σ + ) = F (â) + r 2 2 F (â r σ ) = F (â) + r 2 2 17 06.01.2012 Fabian Hoffmann

Eigenschaften der Maximum-Likelihood-Methode Schätzer ist invariant unter Parameter-Transformation: ĝ(a) = g(â) Normalerweise konsistent Nicht immer erwartungstreu Erwartungstreu für N Effizienteste Methode Nicht robust, da Wahrscheinlichkeitsdichte exakt bekannt sein muss Kann hohe Rechenleistung erfordern 18 06.01.2012 Fabian Hoffmann

Methode der kleinsten Quadrate Definition S = N (y i a i ) 2 i=1 σi 2 = N yi 2 i=1 σi 2 N Messwerte y i mit Varianz σi 2 a i aus Theorie y i heißen Residuen Methode der kleinsten Quadrate: Minimiere S y 1 y 2 Allgemeiner Fall mit Kovarianzmatrix V und y =. y N S = y T V 1 y 19 06.01.2012 Fabian Hoffmann

Methode der kleinsten Quadrate 20 06.01.2012 Fabian Hoffmann

Methode der kleinsten Quadrate 21 06.01.2012 Fabian Hoffmann

Zusammenhang von Maximum-Likelihood und Kleinste Quadrate negative log-likelihood für gaußsche Wahrscheinlichkeitsdichte. ( ) 1 F (a) = ln i σ 2π e 1 (x i a) 2 2 σ 2 = const + 1 2 i (x i a) 2 σ 2 = const + 1 2 S(a) 22 06.01.2012 Fabian Hoffmann

Lineare Kleinste Quadrate Lineare Theorie t(x a) = a i t i (x) i Zur Vereinfachung gleiche Varianzen S = 1 σ 2 (y i t(x i )) 2 i S a j = 2 σ 2 t j (x i )(y i t(x i )) =! 0 i Normalengleichung: i t j (x i ) k â k t k (x i ) = y i t j (x i ) i 23 06.01.2012 Fabian Hoffmann

Lineare Kleinste Quadrate Matrixschreibweise t 1 (x 1 ) t 2 (x 1 )... t p (x 1 ) t 1 (x 2 ) t 2 (x 2 )... t p (x 2 ) A =.. t 1 (x n ) t 2 (x n )... t p (x n ) a 1 a 2 a =. a p y 1 y 2 y =. Normalengleichung: (A T A)â = A T y â = (A T A) 1 A T y y n 24 06.01.2012 Fabian Hoffmann

Allgemeine Lösung mit Gewichtsmatrix W = V 1 : Fehlerfortpflanzung: â = (A T WA) 1 A T Wy = By V a = ByB T V a = (A T WA) 1 A T WV ( ) T (A T WA) 1 A T W V a = (A T WA) 1 A T WA(A T WA) 1 V a = (A T WA) 1 25 06.01.2012 Fabian Hoffmann

X 2 -Test Xk 2 -Verteilung gibt die Wahrscheinlichkeitsdichte für die Summe der Quadrate von k standard-normalverteilten Zufallsvariablen (k Freiheitsgrade) an. Für gaußsche Fehler folgt S einer X 2 Verteilung mit n p Freiheitsgraden. Wahrscheinlichkeit den Wert S oder größeren zu bekommen: S = f (X 2 )dx 2 Wenn diese Wahrscheinlichkeit zu klein ist (z.b 1%), dann wird die Theorie verworfen. 26 06.01.2012 Fabian Hoffmann

Eigenschaften von linearen Kleinsten Quadraten Es gibt analytische Lösung Konsistent und erwartungstreu, wenn Daten unverzerrt sind Effizienteste lineare erwartungsteue Methode Nicht Robust, wegen Außreißern in den Daten Benötigte Rechenleistung eher gering Bei gaußschen Fehlern Fit-Qualität mit X 2 27 06.01.2012 Fabian Hoffmann

Eigenschaften von linearen Kleinsten Quadraten Es gibt analytische Lösung Konsistent und erwartungstreu, wenn Daten unverzerrt sind Effizienteste lineare erwartungsteue Methode Nicht Robust, wegen Außreißern in den Daten Benötigte Rechenleistung eher gering Bei gaußschen Fehlern Fit-Qualität mit X 2 27 06.01.2012 Fabian Hoffmann

Zusammenfassung Maximum-Likelihood Kleinste Quadrate Voraussetzung pdf exakt bekannt Mittelwerte und Varianzen Konsistent Ja Ja Erwartungstreu Nur asymptotisch Im linearen Fall Effizient maximal maximal Robust Nein (pdf muss exakt bekannt sein) Nein (Ausreißer) Rechenaufwand kann sehr hoch werden im linearen Fall gering Fit-Qualität nein bei gaußschen Fehlern Gleich bei gaußschen Fehlern 28 06.01.2012 Fabian Hoffmann

Literatur Volker Blobel, Erich Lohrmann: Statistische und numerische Methoden der Datenanalyse Gerhard Bohm, Günter Zech: Einführung in Statistik und Messwertanalyse für Physiker http://www-library.desy.de/preparch/books/vstatmp.pdf Roger Barlow: Statistics: A Guide to the Use of Statistical Methods in the Physical Sciences 29 06.01.2012 Fabian Hoffmann