Statistik und Wahrscheinlichkeitsrechnung Prof. Dr. Michael Havbro Faber 8.04.009 1
Inhalt der heutigen Vorlesung Zusammenfassung der letzten Vorlesung Übersicht über Schätzung und Modellbildung Modellevaluation durch statistische Tests Der Test für die Güte der Anpassung Der Kolmogorov Smirnov Test für die Güte der Anpassung Modellvergleich 8.04.009
Zusammenfassung der letzten Vorlesung Wir betrachteten die Möglichkeit, die Parameter einer Verteilung basierend auf Beobachtungen/Daten abschätzen zu können. Was haben wir gelernt? DieParametereiner einer Verteilung können z. B. anhandfolgender Methoden geschätzt werden: Methode der Momente (MoM) Maximum Likelihood Methode Methode (MLM) 8.04.009 3
Zusammenfassung der letzten Vorlesung Methode der Momente (MoM) Punktschätzung DasPrinzipder MoMist: Wirschätzen die Parameter, indem wir die analytisch berechneten Momente mit den Stichprobenmomenten gleichsetzen. m 1 1 n n n i 1 ˆ x i 1 x fx ( x, ) dx m 1 n xˆ i n i 1 x f X ( x, ) Dies führt zu k Gleichungen, welche gelöst werden müssen, um k Parameter abzuschätzen. 8.04.009 4 dx
Zusammenfassung der letzten Vorlesung Maximum Likelihood Methode (MLM) Schätzung der Parameter und ihrer Verteilung Die Parameter werden geschätzt, indem die Likelihood, dass die Parameter die Beobachtungen/Daten repräsentieren, maximiert wird. n L( θ xˆ) f ( ˆ X xi θ) i1 n =å i= 1 l( θ xˆ) log( f ( xˆ θ)) X min( l ( θ xˆ )) θ i μ ( 1 1 1 C H H i,,.., l( θ xˆ ) =- * = θ θ θ θ i ) T n 8.04.009 5
Übersicht Schätzung und Modellbildung Unterschiedliche Typen aninformationwerden genutzt, um Ingenieurmodelle zu entwickeln. Subektive Information Frequentistische Information Subektiv Physikalisches Verständnis Erfahrung Urteil Frequentistisch Daten Wahrscheinlichkeitspapier Verteilungsfamilie Verteilungsparameter Probabilistisches Modell Stichprobenstatistiken Konfidenzintervalle Statistische Signifikanz Methode der Momente Maximum Likelihood Methode 8.04.009 6
Kleine Denkaufgabe 11.3 Die Werte dreier Stichproben wurden auf das Wahrscheinlichkeitspapier einer Gumbel Verteilung aufgetragen (siehe Grafik). Welche Stichprobe(n) kann man als Realisation(en) einer Gumbel Verteilung betrachten? -ln(-ln(i i/(n+1)) )) Stichprobe 1 Stichprobe Stichprobe 3 8.04.009 x i 7
Kleine Denkaufgabe 11.3 Lösung Stichprobe 1 -ln(-ln(i i/(n+1)) )) x i 8.04.009 8
Nehmen wiran, dass wireine bestimmteverteilungsfunktion gewählt haben, um die Unsicherheit eines unsicheren Ereignisses zu modellieren. Daten physikalische Gesetze Verteilungsfamilie f ( x) X Druckfestigkeit Beton Daten Verteilungsparameter θ x Nun wird die Wahl der Verteilung geprüft durch statistische Tests. 8.04.009 9
Zwei unterschiedliche h Fälle werden bt betrachtet: htt Verifizierung von p x (x) 1 Diskreten Verteilungsfunktionen χ Test Kontinuierlichen Verteilungsfunktionen Kolmogorov Smirnov Test f x (x) x 8.04.009 10 x
χ Der Test für diegüte der Anpassung Die Idee dahinter ist, dass die Differenzen zwischen der erwarteten und der beobachteten Datenverteilung klein sein sollten, wenn die gewählte Verteilungsfamilie die Stichprobe gut beschreiben kann. 10 9 Beob bachtunge en 8 7 6 5 4 3 i beobachtete Häufigkeiten postulierte Häufigkeiten 1 0 0 5 5 30 30 35 35 Druckfestigkeit Beton (MPa) 8.04.009 11
χ Der Test für diegüte der Anpassung Wie wir bereits wissen, ist eine diskrete kumulative i1 Wahrscheinlichkeitsverteilungsfunktion wie folgt gegeben: Px ( ) px ( ) i 1 Wahrscheinlichkeitsdichtefunktion Kumulative Wahrscheinlichkeitsverteilungsfunktion p X (x) B P X (x) A 1 x x 8.04.009 1
χ Der Test für diegüte der Anpassung Es sei n die Anzahl Beobachtungen einer diskreten Zufallsvariable X. Die Anzahl an Beobachtungen von X x ist N, eine binomial verteilte Zufallsvariable: E X np( x ) N p, Postulierte Häufigkeiten Var X np ( x )(1 p ( x )) N p, (1 p ( x )) 8.04.009 13
χ Der Test für diegüte der Anpassung Es sei n die Anzahl Beobachtungen einer diskreten Zufallsvariable X. Die Anzahl an Beobachtungen von X x ist N, eine binomial verteilte Zufallsvariable: E X np( x ) N p, Postulierte Häufigkeiten Var X np ( x )(1 p ( x )) N p, (1 p ( x )) Wenn das postulierte Modell korrekt und n gross genug ist, dann ist gemäss dem zentralen Grenzwertsatz die Differenz ε standard normalverteilt. N N N o, p,, (1 p( x)) p Beobachtete Häufigkeiten 8.04.009 14
Der χ Test für diegüte der Anpassung Statistik und Wahrscheinlichkeitsrechnung Werden die quadrierten Differenzen der beobachteten und erwarteten Häufigkeiten summiert, dann erhalten wir: k k ( N o, Np, ) 3 10 k 1 1 N ( N oi, Npi, ) p, (1 p( x)) 9 1 Beobachtun ngen Anzahl an 1 χ verteilt mit 0 k 1 Freiheitsgraden 8 7 6 5 4 3 m N i1 pi, 0 1 3 4 beobachtete Häufigkeiten postulierte Häufigkeiten Anzahl Unfälle pro Monat 8.04.009 15
Der χ Test für diegüte der Anpassung Es wird nun auf einem e Signifikanzniveau Sg eau getestet, ob die desumme aller ae beobachteten quadrierten Differenzen plausibel ist. Dafür wird die Nullhypothese H 0 aufgestellt, die besagt, dass die gewählte Verteilungsfunktion die beobachtete Stichprobe repräsentiert. Die Vorgehensregel lautet dann: P ( m ) Die Alternativhypothese h H 1 ist weit weniger informativ, weil mit ihr ausser der postulierten Verteilung alle anderen Verteilungen akzeptiert werden. v k1 ist der Fraktilwert der Verteilung mit Freiheitsgraden. 8.04.009 16
Der χ Test für diegüte der Anpassung Wir betrachten folgendes Beispiel: Als Verteilungsfunktion für 0 Beobachtungen der Betondruckfestigkeit nehmen wir die Normalverteilung an. Der Mittelwert beträgt Die Standardabweichung 33 MPa. 5 MPa. Die Parameter werden nicht aus den vorhandenen Beobachtungen geschätzt. Die Normalverteilung l ist eine kontinuierliche Verteilung. Sie kann edoch ganz einfach diskretisiert werden. 8.04.009 17
Der χ Test für die Güte der Anpassung Statistik und Wahrscheinlichkeitsrechnung Die Dichtefunktion der gewählten Verteilungsfunktion wird diskretisiert: Gewählte Verteilungsfunktion Wah hrscheinlichkeit tsdichte 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.0 0.01 0 0 10 0 30 40 50 60 Druckfestigkeit Beton (MPa) 8.04.009 18
Der χ Test für die Güte der Anpassung Statistik und Wahrscheinlichkeitsrechnung Die Dichtefunktion der gewählten Verteilungsfunktion wird diskretisiert: Gewählte Verteilungsfunktion Wah hrscheinlichkeit tsdichte 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.0 0.01 0 0 10 0 30 40 50 60 Druckfestigkeit Beton (MPa) 533 5 33 5 Intervall 0 5: 0 ( ) ( ) 00.0551. 10 Totale Anzahl an Versuchen 8.04.009 19
Der χ Test für die Güte der Anpassung Wah hrscheinlichkeit tsdichte Statistik und Wahrscheinlichkeitsrechnung Die Dichtefunktion der gewählten Verteilungsfunktion wird diskretisiert: 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.0 0.01 Gewählte Verteilungsfunktion 0 0 10 0 30 40 50 60 Druckfestigkeit Beton (MPa) 533 5 An nzahl Beobacht tungen 9 8 7 6 5 4 3 1 0 33 5 Erwartetes Histogramm 0 5 5 30 30 35 35 Druckfestigkeit Beton (MPa) Intervall 0 5: 0 ( ) ( ) 00.0551. 10 Totale Anzahl an Versuchen 8.04.009 0
Der χ Test für diegüte der Anpassung Die beobachteten und erwarteten Histogramme können nun verglichen werden. Beobachtun ngen Anzahl an 10 9 8 7 6 5 4 3 1 0 0 5 5 30 30 35 35 beobachtete Häufigkeiten postulierte Häufigkeiten Druckfestigkeit Beton (MPa) 8.04.009 1
Der χ Test für diegüte der Anpassung Beobachtun ngen Anzahl an Die beobachteten und erwarteten Histogramme können nun verglichen werden. 10 9 8 7 6 5 4 3 1 0 Aufgrund der kleinen Anzahl an Stichproben werden die zwei unteren Intervalle zusammengeführt. 0 5 5 30 30 35 35 beobachtete Häufigkeiten postulierte Häufigkeiten Druckfestigkeit Beton (MPa) Druckfestigkeit Beton (MPa) 8.04.009 Beobachtun ngen Anzahl an 10 9 8 7 6 5 4 3 1 0 0 30 30 35 35
Der χ Test für diegüte der Anpassung Statistik und Wahrscheinlichkeitsrechnung Berechnungen zum genannten Beispiel k ( No, N p, ) m N 1 p, Intervall [MPa] x beobachtete Häufigkeiten vorausgesagte Wahrscheinlichkeiten postulierte Häufigkeiten N o,, Stichproben Statistik 0 30 5 0.967 5.9334 0.1468 30 35 9 0.381 7.6544 0.365 35 6 0.3446 6.41 0.065 p( x ) N p Summe: 0.40987 Auf einem Signifikanzniveau von 5% erhalten wir für die χ Verteilung Mit N=3 1= Freiheitsgraden aus der Tabelle: = 5.99. Da 0.40987 kleiner ist als 5.99, kann die Nullhypothese H 0 nicht verworfen werden. 8.04.009 3
Der χ Test für diegüte der Anpassung Statistik und Wahrscheinlichkeitsrechnung Wird einer oder mehrere Parameter der gewählten Verteilung aus dem gleichen Datensatz bestimmt, welcher auch für den Test verwendet wurde, dann muss die Anzahl der Freiheitsgrade entsprechend reduziert werden: v k 1 Unter der Annahme, dass die Varianz aus den Daten bestimmt wurde, aber nicht der Mittelwert, erhalten wir n= 3-1-1=1 Freiheitsgrade. 8.04.009 4
Der χ Test für diegüte der Anpassung Wenn wir eine Normalverteilung annehmen mit den Parametern = 33.00 und = 405 4.05, erhalten hlt wir folgendes Ergebnis: Intervall x beobachtete vorausgesagte postulierte Stichproben [MPa] Häufigkeiten N Wahrscheinlichkeiten px ( ) Häufigkeiten N Statistik N o, N p, 0 30 5 0.743 5.4851 0.049 30 35 9 0.381 7.634 0.486 35 6 0.3446 6.8916 0.1153 Summe: 0.4068 8.04.009 5
Der χ Test für diegüte der Anpassung Wenn wir eine Normalverteilung annehmen mit den Parametern = 33.00 und = 405 4.05, erhalten hlt wir folgendes Ergebnis: Intervall x beobachtete vorausgesagte postulierte Stichproben [MPa] Häufigkeiten N Wahrscheinlichkeiten px ( ) Häufigkeiten N Statistik N o, N p, 0 30 5 0.743 5.4851 0.049 30 35 9 0.381 7.634 0.486 35 6 0.3446 6.8916 0.1153 Summe: 0.40683 Auf einem Signifikanzniveau von 5% erhalten wir für die χ Verteilung mit N=3 1 1=1 Freiheitsgraden aus der Tabelle: bll = 3.84. Da 0.40689 kleiner ist als 3.84, kann die Nullhypothese H 0 nicht verworfen werden. 8.04.009 6
Kleine Denkaufgabe 11. Welche Methode zur Schätzung der Verteilungsparameter gp ist in der Lage, die statistischen Unsicherheiten zu berücksichtigen? Methode der Momente Maximum Likelihood Methode keine der beiden genannten Methoden 8.04.009 7
Kleine Denkaufgabe 11. Lösung Welche Methode zur Schätzung der Verteilungsparameter gp ist in der Lage, die statistischen Unsicherheiten zu berücksichtigen? Maximum Likelihood Methode 8.04.009 8
Der Kolmogorov Smirnov Test für die Güte der Anpassung Die Idee hinter dem Kolmogorov Smirnov Test ist folgende: Wenn die kumulative Wahrscheinlichkeitsverteilungsfunktion der gewählten Verteilung für die Beobachtungen in Betracht Bt htkommt, dann sollte die maximale Differenz zwischen der beobachteten und der postulierten kumulativen Wahrscheinlichkeitsverteilungsfunktion max klein sein. max n, 8.04.009 9
Der Kolmogorov Smirnov Test für die Güte der Anpassung Die kumulative Wahrscheinlichkeitsverteilungsfunktion der Beobachtungen kann berechnet werden als: o i Fo ( xˆ i ) = n Folgende Stichprobenstatistik wird benutzt: max n n i max F xˆ F xˆ max F xˆ i1 i1 n o o o o i p i p i 8.04.009 30
Der Kolmogorov Smirnov Test für die Güte der Anpassung Die Kolmogorov Smirnov Stichprobenstatistik wird folgendermassen ermittelt: i x i F xo (x i ) F xp (x i ) i 1 4.4 0.05 0.04716 0.00784 7.6 0.1 0.140071 0.040071-1 (F x (x)) F () 3 7.8 0.15 0.14917 0.0008300083 x (x) 1.5 1 0.5 0-0.5-1 -1.5 0.98 0.84 0.50 0.15-0.0 0 5 30 35 40 45 x 4 7.9 0. 0.153864 0.046136 5 8.5 0.5 0.18406 0.06594 6 30.1 0.3 0.80957 0.019043 7 30.3 0.35 0.94598 0.05540 8 31.7 0.4 0.39743 0.0056800568 9 3. 0.45 0.436441 0.013559 10 3.8 0.5 0.484047 0.015953 11 33.3 0.55 0.539 0.06078 1 33.5 0.6 0.53988 0.06017 13 34.1 0.65 0.587064 0.0693606936 14 34.6 0.7 0.65516 0.074484 15 35.8 0.75 0.716 0.03774 16 35.9 0.8 0.719043 0.080957 17 36.8 0.85 0.776373 0.07367 18 37.1 0.9 0.79389 0.106108 19 39. 0.95 0.8951 0.057488 0 39.7 1 0.909877 0.09013 8.04.009 31
Der Kolmogorov Smirnov Test für die Güte der Anpassung Die Kolmogorov Smirnov Statistik ist tabelliert: n 1 5 10 15 0 5 30 40 50 60 70 80 0.01 0.9950 0.6686 0.4889 0.404 0.354 0.3166 0.899 0.51 0.60 0.067 0.1917 0.1795 0.05 0.9750 0.5633 0.4093 0.3376 0.941 0.640 0.417 0.101 0.1884 0.173 0.1598 0.1496 0.1 0.9500 0.5095 0.3687 0.3040 0.647 0.377 0.176 0.1891 0.1696 0.1551 0.1438 0.1347 0 0. 0.9000 0.4470 0.36 0.659 0.315 0079 0.079 0.1903 0.1654 0.1484 01357 0.1357 0.158 0.1179 Für n = 0 und = 5% erhalten wir 0.941, im Vergleich zur beobachteten Statistik von 0.1061 die Nullhypothese H 0 kann nicht verworfen werden auf einem Signifikanzniveau von 5%. 8.04.009 3
Kleine Denkaufgabe 11.3 Welcher Schritt ist für die Berechnung der Fisher Informationsmatrix wesentlich? erste partielle ill Ableitung der logarithmierten i Likelihood Funktion erste partielle Ableitung der logarithmierten Verteilungsfunktion zweite partielle Ableitung der logarithmierten Likelihood Funktion 8.04.009 33
Kleine Denkaufgabe 11.3 Lösung Welcher Schritt ist für die Berechnung der Fisher Informationsmatrix notwendig? zweite partielle Ableitung der logarithmierten Likelihood Funktion 8.04.009 34
Modellvergleich Modellverifizierung durch statistische Tests kann genutzt werden, um die Plausibilität eines bestimmten Modells in Bezug auf einen bestimmten Datensatz zu quantifizieren. Zwei Fälle müssen in Betracht gezogen werden: 1. Es kann gezeigt werden, dass die Hypothese akzeptiert werden kann.. Es kann gezeigt werden, dass die Hypothese verworfen werden muss. Welche Information ist in diesen beiden Fällen enthalten? 8.04.009 35
Modellvergleich Wenn ein Signifikanztest zeigt, g, dass eine Hypothese akzeptiert werden kann: Wir müssen uns daran erinnern, dass auch andere Modelle (Verteilungen) in Frage kommen tatsächlich ist es oft der Fall, dass mehrere Modelle den Signifikanztest bestehen! Wenn ein Signifikanztest ifik zeigt, dass eine Hypothese verworfen werden muss: Dies heisst nicht unbedingt, dass das gewählte Modell schlecht ist es könnte bedeuten, dass der Beweis einfach nicht stark genug ist, um die entsprechende Signifikanz zu zeigen zu wenig Daten! 8.04.009 36
Modellvergleich dll l Wenn zwei Modellhypothesen akzeptiert werden können, dh d.h. beide Modelle plausibel sind, dann können wir die Güte der Anpassung der zwei Modelle testen: 1. Direkter Vergleich der Stichprobenstatistik kann nicht beweiskräftig sein, u.a. aufgrund unterschiedlicher Freiheitsgrade.. Vergleich der Stichproben Likelihood. 8.04.009 37
Modellvergleich dll l Betrachten wir ein Beispiel mit zwei unterschiedlichen Modellen: Modell 1: N(33;5) Parameter nicht aus den gleichen Daten geschätzt n=3 1= 3 1 χ Stichprobenstatistik = 0.40987 Stichprobenwahrscheinlichkeit = 0.8151 Modell ll: N(33;4.05) Parameter aus den gleichen Daten geschätzt n=3 1 1=11 1=1 χ Stichprobenstatistik = 0.40683 Stichprobenwahrscheinlichkeit = 0.536 8.04.009 38
Zusammenfassung Statistik und Wahrscheinlichkeitsrechnung Die Wahl eines geeigneten probabilistischen Modells kann durch Signifikanztests unterstützt werden. Der χ Test wurde für diskrete Verteilungen entwickelt. Der Kolmogorov Smirnov Test wurde für kontinuierliche Verteilungen entwickelt. Die Güte der Anpassung verschiedener Modellalternativen kann durch den Vergleich verschiedenen Stichproben Likelihoods geprüft werden. 8.04.009 39
Vielen Dank für die Aufmerksamkeit. 8.04.009 40