Statistik, Datenanalyse und Simulation

Dr. Michael O. Distler distler@kph.uni-mainz.de Mainz, 24. Mai 2011

3. Schätzung von Parametern Problemstellung: Aus fehlerbehafteten Messungen möglichst genaue Ergebnisse erarbeiten zusammen mit Aussagen über Zuverlässigkeit und Grenzen. Vorsicht: Messungen unterliegen einer Reihe von unkontrollierbaren Einflüssen, welche zufällig genannt werden - sie sind also mit statistischen Fehlern versehen. Daneben gibt es aber noch systematische Fehler, die durch eine fehlerhafte Methode hervorgerufen werden, etwa durch falsche Messinstrumente oder falsche Formeln bei der Auswertung. Systematische Fehler müssen anders behandelt werden als statistische Fehler. So können sie auch durch Mittelung über mehrere Messungen nicht reduziert werden.

Schätzung von Parametern Formal: Messung von n unabhängigen Werten x 1, x 2,..., x n der Zufallsvariablen x bzw. x. (Stichprobe) Aufgabe: Beste Schätzung eines (mehrerer) Parameter. Diese Schätzung ist selbst auch eine Zufallsvariable. Deshalb sollen auch Aussagen über Fehler und Korrelationskoeffizienten gemacht werden. Allgemeine Kriterien für eine Methode zur Bestimmung von Parametern mit Schätzwert â und wahrem Wert a 0 : 1 Konsistenz: lim n â = a 0. 2 Erwartungstreue: E[â] = a 0. 3 Effizienz: Varianz von â klein. 4 Robustheit gegenüber falschen Daten und Voraussetzungen. Wobei die letzten beiden Kriterien häufig im Widerspruch sind.

3.1 Robuste Schätzung von Mittelwerten n x = 1 n i=1 x i Konsistenz? ok (Zentraler Grenzwertsatz) Erwartungstreue? ok E[ˆx] = 1 n n i=1 E[x i] =< x >. Effizienz? Robustheit?

Mittelwert einer symmetrischen Verteilung Für symmetrische Verteilungen (die keine Gauß-Verteilungen sind) ist das Stichprobenmittel weder effizient noch robust. Wahrscheinlichkeitsdichte p(x) 0.5 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 4 2 0 2 4 Zufallsvariable x f(x) g(x) h(x) 1 x 2 +1 Breit-Wigner-Verteilung: f (x) = 1 π Gauß-Verteilung: g(x) = 1 e x 2 /2 2π Doppelt-Exponentiell: h(x) = 1 2 e x

Mittelwert einer symmetrischen Verteilung Besser: Getrimmter Mittelwert (Mittelwert mit Abschneiden) Weglassen der (1 2r)n/2 größten und kleinsten Messwerte einer Stichprobe. Grenzfälle: r = 0,5: Mittelwert r 0: Median. Für eine unbekannte sym. Verteilung liefert r = 0,23 das robustete Verfahren mit einer Effizienz von 82%.

Mittelwert einer Gleichverteilung Die genaueste Schätzung ist gegeben durch: x = ˇx + ˆx 2 mit ˇx (ˆx) kleinster (größter) Wert der Stichprobe. 1800 0.1 1600 0.01 1400 0.001 1200 0.0001 Häufigkeit 1000 800 600 absoluter Fehler 1e 05 1e 06 1e 07 400 1e 08 200 1e 09 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Mittelwert der Stichprobe 1e 10 10 100 1000 10000 100000 1e+06 1e+07 1e+08 Größe der Stichprobe Die beste Schätzung liefert die bessere Varianz, die wie (1/n) 2 (statt (1/ n) 2 ) gegen Null geht.

3.2 Die Maximum-Likelihood-Methode Stichprobe von n Werten x i. Zugrunde liegende Wahrscheinlichkeitsdichte f (x a) sei bekannt und normiert f (x a) dx = 1. Likelihood-Funktion: L(a) = f (x 1 a) f (x 2 a)... f (x n a) = n f (x i a) Die beste Schätzung für â entspricht dem Maximum der Likelihood-Funktion. Maximum wie üblich durch Ableiten und Nullsetzen: i=1 dl(a) da oder L(a k ) a k für alle k

Die Maximum-Likelihood-Methode In der Praxis meist Logarithmus der Likelihood-Funktion l(a) = ln L(a) bzw. negativer Logarithmus: F(a) = l(a) = n ln f (x i a) i=1 Natürlich muss F(a) minimiert werden. negative Log-Likelihood-Funktion

Die Maximum-Likelihood-Methode Beispiel: Die Zerfallswinkelverteilung eins bestimmten Teilchens möge durch die folgende Wahrscheinlichkeitsdichte gegeben sein: f (x a) = 1 (1 + ax) 2 mit x = cos θ Angenommen, n Werte x i = cos θ i (θ i = Zerfallswinkel) sind gemessen worden. Die Aufgabe besteht darin, die beste Schätzung â des Zerfallsparameters a zu finden, welcher das Teilchen charakterisiert. Die Wahrscheinlichkeitsdichte ist für Werte 1 x +1 bereits richtig normiert, und kann so direkt in der negativen Log-Likelihood-Funktion verwendet werden: F(a) = n ln 1 2 (1 + ax i) i=1

Die Maximum-Likelihood-Methode