Standardnormalverteilung 1720 erstmals von Abraham de Moivre beschrieben 1809 und 1816 grundlegende Arbeiten von Carl Friedrich Gauß 1870 von Adolphe Quetelet als "ideales" Histogramm verwendet alternative Bezeichnungen: Gaußsche Glockenkurve;Fehlerkurve Natürliche Prozesse Körpergröße, Gewicht von Lebewesen Messung von physikalischen Größen Messfehlermodell Variable, die sich aus der Summe von vielen zufälligen Einzelwerten ergeben zentraler Grenzwertsatz Statistik 2 für SoziologInnen 1 Normalverteilung Stetige Zufalls-Variable Erweitert man den Begriff der diskreten Zufallsvariable für stetige Merkmale gibt es einige Probleme Die Wahrscheinlichkeit einen bestimmten konkreten Wert zu beobachten ist null, da es ja unendlich viele unterschiedliche Wert gibt Eine stetige Zufallsvariable liefert daher Wahrscheinlichkeitswerte immer nur für Intervalle. Man erhält Wahrscheinlichkeiten indem man eine Fläche evaluiert. Konkret betrachtet man das Integral unter der Dichtefunktion, die das steige Analogon zur Wahrscheinlichkeitsfunktion bildet. Statistik 2 für SoziologInnen 2 Normalverteilung 1
Dichtefunktion f(x) Dichtefunktion 1) f(x) > 0 für alle x 2) Gesamte Fläche unter der Kurve ist 1 Einzelne Werte von f(x) können größer als 1 sein! f(x) ist eine Dichte aber keine Wahrscheinlichkeit Statistik 2 für SoziologInnen 3 Normalverteilung Stetige Verteilungsfunktion Die theoretische Verteilungsfunktion einer steigen Zufallsvariablen X mit Dichtefunktion f(x) bezeichnen wir mit F(t) und wird durch das Integral definiert Statistik 2 für SoziologInnen 4 Normalverteilung 2
Beziehung zwischen Dichte- und Verteilungsfunktion Dichtefunktion f(x) Verteilungsfunktion F(x) 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0-3,5-3,0-2,5-2,0-1,5-1,0-0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 1 0,8 0,6 0,4 0,2 0-4 -3-2 -1 0 1 2 3 4 Statistik 2 für SoziologInnen 5 Normalverteilung Wahrscheinlichkeiten als Integral P(a X b) = P(X b) - P(X a) = F(b) - F(a) P(a X b) f (x)dx b a Statistik 2 für SoziologInnen 6 Normalverteilung 3
Erwartungswert und Varianz einer stetigen ZV E(X) x f(x)dx V(X) ² [x E(X)]² f (x)dx Var(X) = E(X 2 ) [E(X)] 2 Statistik 2 für SoziologInnen 7 Normalverteilung Dichtefunktion In der einfachsten Form: Standardnormalverteilung X~N(0; 1) E(X)=0 Erwartungswert = 0 V(X)=1 Varianz bzw. Standard-Abweichung =1 1 e x 2 / 2 f ( x ) e 2 Statistik 2 für SoziologInnen 8 Normalverteilung 4
Die Standard-Normalverteilung.1 0.2 0.3 0.0 0. 0.4 Wendepunkte -3-2 -1 0 1 2 3 Statistik 2 für SoziologInnen 9 Normalverteilung Die Standard-Normalverteilung 1 0.2 0.3 0.0 0.1 0.4 Flaeche = 0,6827-3 -2-1 0 1 2 3 Statistik 2 für SoziologInnen 10 Normalverteilung 5
0.3 0.4 Die Standard-Normalverteilung 0.1 0.2 Flaeche = 0,9545 0.0-3 -2-1 0 1 2 3 Leitregel: Ca. 95% der Beobachtungen liegen im Bereich Erwartungswert plus/minus 2*Standardabweichung Statistik 2 für SoziologInnen 11 Normalverteilung Verschiedene Normalverteilungen 0.2 0.4 0.6 0.8 0.0 0 Standardnormalverteilung N(0; 0,25) Kleinere Varianz N(0; 1) Größere Varianz N(0; 4) -6-4 -2 0 2 4 6 Statistik 2 für SoziologInnen 12 Normalverteilung 6
Verschiedene Normalverteilungen 0.8 N(-3; 0,25) 0.2 0.4 0.6 Verschiebung und Stauchung N(0; 1) N(2; 1) 0.0-6 -4-2 0 2 4 6 Unterschiedlicher Erwartungswert bei konstanter Varianz Statistik 2 für SoziologInnen 13 Normalverteilung Dichtefunktion Im allgemeinen: Normalverteilung mit Erwartungswert und Varianz ² X~N( ; ²) E(X) = V(X) = ² f ( x ) 1 e 2 1 x 2 ( ) 2 Statistik 2 für SoziologInnen 14 Normalverteilung 7
Lineartransformation Wenn X eine normalverteilte Zufallsvariable ist, dann ist auch Y=a+bX normalverteilt. E(Y)=E(a+bX)=a+bE(X) V(Y)=V(a+bX)=b²V(X) Knapp formuliert: Sei X~N( ²) und Y=a+bX dann gilt Y~N(a+b ; b² ²) Änderung des Erwartungswertes: Verschiebung (Translation) Änderung der Varianz: Dehnung oder Stauchung der Verteilungsform Prinzipielle Gestalt der Glockenkurve bleibt erhalten Statistik 2 für SoziologInnen 15 Normalverteilung Standardisierung Aus dem vorigen folgt: Sei X~N( ²) dann gilt für Z=(X- standardisierte Variable Z~N(0;1) Durch Anwendung der Standardisierung lässt sich jede Normalverteilung in die Standardnormalverteilung d t überführen. Tabellen für Wahrscheinlichkeiten der Standardnormalverteilung Statistik 2 für SoziologInnen 16 Normalverteilung 8
Standardisierung Anwendungsbeispiel: X sei die Körpergröße in cm von einer bestimmten Population Es sei X~N(175; 64) Z=(X-175)/8 P(167<X<183)= =P((167-175)/8<Z<(183-175)/8)= =P(-1<Z<1)=0,6826 1) Statistik 2 für SoziologInnen 17 Normalverteilung Unterschiedlicher Maßstab! 0.02 0.04 167 183 N(175; 64) 150 160 170 180 190 200 Koerpergroesse in cm 0.4 0.0 0.0 0.2 N(0; 1) -3-2 -1 0 1 2 3 Standardeinheiten Statistik 2 für SoziologInnen 18 Normalverteilung 9
Gemeinsame y-achse 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00-4 -3-2 -1 0 1 2 3 4 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 150 160 170 180 190 200 Standardnormalverteilung Verteilung der Körpergrößen Statistik 2 für SoziologInnen 19 Normalverteilung Gemeinsame x-achse Standardnormal-Verteilung Verteilung der Körpergrößen Statistik 2 für SoziologInnen 20 Normalverteilung 10
Bestimmung von Wahrscheinlichkeiten Die Verteilungsfunktion der Standardnormalverteilung ergibt sich durch Integration der Dichtefunktion Notation: Bleymüller: F N (z) Schlittgen: (z) z 1 2 1 u 2 FN ( z ) e du 2 Statistik 2 für SoziologInnen 21 Normalverteilung Von der Dichte zur Verteilungsfunktion Dichtefunktion Verteilungsfunktion 0.5 0.2 0.3 0.4 1.0 P(X<1)=0,8413 0.4 0.6 0.8 P(X<1)=0,8413 0.0 0.1 0.0 0.2-3 -2-1 0 1 2 3-3 -2-1 0 1 2 3 Statistik 2 für SoziologInnen 22 Normalverteilung 11
-3,5-3,0-2,5-2,0-1,5-1,0-0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5-3,5-3,0-2,5-2,0-1,5-1,0-0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5-3,5-3,0-2,5-2,0-1,5-1,0-0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 Dichtefunktion Verteilungsfunktion 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 1 0,8 0,6 0,4 0,2 0,05 0 0-4 -3-2 -1 0 1 2 3 4 Grenzwert: -1 Prob(Z<-1)= 0,15866 Dichtefunktion Verteilungsfunktion 0,45 1 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,8 0,6 0,4 0,2 0,05 0 0-4 -3-2 -1 0 1 2 3 4 Grenzwert: 0 Prob(Z<0)= 0,5 Dichtefunktion Verteilungsfunktion 0,45 1 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,8 0,6 0,4 0,2 0,05 0 0-4 -3-2 -1 0 1 2 3 4 Grenzwert: 1 Prob(Z<1)= 0,84134 Statistik 2 für SoziologInnen 23 Normalverteilung Ausnützung der Symmetrie um Null P(Z < a) = 1 - P(Z < -a) oder P(Z < -a) = 1 - P(Z < a) 0.4 0.1 0.2 0.3 -aa aa 0.0-3 -2-1 0 1 2 3 P(Z>a) = P(Z<-a) Statistik 2 für SoziologInnen 24 Normalverteilung 12
Arbeit mit Tabellen: P(Z<1)=? (1) liegt zwischen 0,841 und 0,842 Grob: P(Z<1) = (1) = 0,8415 Lineare Interpolation: P(Z<1) = (1) = 0,8413 P(Z<-1)=? (a)=1- (-a) bzw. (-a)=1- (a) P(Z<-1)=1 - (1) = 1-0,8413 = 0,1587 (-1) liegt zwischen 0,158 und 0,159 Statistik 2 für SoziologInnen 25 Normalverteilung Beispiel Wir wollen für eine Normalverteilung mit Erwartungswert 170 und Standardabweichung 16 die Wahrscheinlichkeit einen Wert kleiner als 180 zu erhalten ermitteln. P(X<180) = =P(Z<(180-170)/16)=P(Z<0,625)=F N (0,625)= =0,734 Statistik 2 für SoziologInnen 26 Normalverteilung 13
Normalverteilung in Excel: NORMVERT Für eine Normalverteilung mit Erwartungswert 170 und Standardabweichung 16 gilt, dass die Wahrscheinlichkeit einen Wert kleiner als 180 zu erhalten 73,4% beträgt. Statistik 2 für SoziologInnen 27 Normalverteilung Wahrscheinlichkeiten der Normalverteilung Statistik 2 für SoziologInnen 28 Normalverteilung 14
Erwartungswert: 170 Varianz: 256 Standardabweichung: 16,0000 0,0300 0,0250 0,7340 0,2660 Grenzwert: 180 0,0200 Prob(X < 180) = 0,7340 Prob(X > 180) = 0,2660 0,0150 0,0100 0,0050 Hinweis: Eingabefelder für die Parameter der Normalverteilung und dem gewünschten Grenzwert sind hellgrün markiert. 0,0000 106,0000 112,2720 118,5440 124,8160 131,0880 137,3600 143,6320 149,9040 156,1760 162,4480 168,7200 174,9920 181,2640 187,5360 193,8080 200,0800 206,3520 212,6240 218,8960 225,1680 231,4400 Statistik 2 für SoziologInnen 29 Normalverteilung X~N(175; 64) P(X<175)=? P(Z<(175-175)/8) = (0)= 0,5 0.04 P(X<175) 150 160 170 180 190 200 Koerpergroesse in cm 0.4 0.0 0.2 0.0 0.02 P(Z<0) -3-2 -1 0 1 2 3 Standardeinheiten Statistik 2 für SoziologInnen 30 Normalverteilung 15
X~N(175; 64) P(X<175)=? P(Z<(175-175)/8) = (0)= 0,5 P(X<181)=? P(Z<(181-175)/8) = (0,75)= 0,7734 P(X>177)=? P(Z>(177-175)/8)= =1-P(Z<0,25)= =1- (0,25)= =1-0,5987=0,4013 Beispiel zur Körpergröße E(X)= 175 V(X)= 64 (X)= 8 Grenzwert: Ge e 181 Dieser Wert kann variiert werden P(X<181)= 77,33726476% P(X>181)= 22,66273524% Statistik 2 für SoziologInnen 31 Normalverteilung 0.04 0.05 P(X<181)=0.7734 0.0 0.01 0.02 0.03 150 160 170 180 190 200 Koerpergroesse in cm Statistik 2 für SoziologInnen 32 Normalverteilung 16
0.04 0.05 P(X>177)=0.4013 0.0 0.01 0.02 0.03 150 160 170 180 190 200 Koerpergroesse in cm Statistik 2 für SoziologInnen 33 Normalverteilung Erwartungswert: 175 Varianz: 64 Standardabweichung: 8,0000 0,0600 0,05000500 0,7734 0,2266 Grenzwert: 181 0,0400 Prob(X < 181) = 0,7734 Prob(X > 181) = 0,2266 0,0300 0,0200 0,0100 Hinweis: Eingabefelder für die Parameter der Normalverteilung und dem gewünschten Grenzwert sind hellgrün markiert. 0,0000 143,0000 146,1360 149,2720 152,4080 155,5440 158,6800 161,8160 164,9520 168,0880 171,2240 174,3600 177,4960 180,6320 183,7680 186,9040 190,0400 193,1760 196,3120 199,4480 202,5840 205,7200 Statistik 2 für SoziologInnen 34 Normalverteilung 17
Beispiel IQ-Test E(X)= 100 V(X)= 225 (X)= ( ) 15 4-Sigma Gesellschaft Personen mit einem IQ über 160 P(X>100+4* )=? 100+4*s= 160 P(X>160)= 0,00317% Bei 100.000 000 317 3,17 1 von 31.574 In Österreich leben: 8.032.926 Menschen Österreicher in 4-Sigma 254 Statistik 2 für SoziologInnen 35 Normalverteilung Wahrscheinlichkeiten für Intervalle P(a<X<b) = P(X<b) P(X<a) X~N(175; 64) P(177<X<181) 181) =? P(X<181) - P(X<177) = =P(Z<(181-175)/8) - P(Z<(177-175)/8) = = (0,75) - (0,25) = = 0,7734-0,5987 = 0,1747 Statistik 2 für SoziologInnen 36 Normalverteilung 18
0.04 0.05 P(177<X<181)=0.1747 0.0 0.01 0.02 0.03 150 160 170 180 190 200 Koerpergroesse in cm Statistik 2 für SoziologInnen 37 Normalverteilung Erwartungswert: 175 Varianz: 64 Standardabweichung: d 80000 8,0000 0,0600 0,0500 0,5987 0,1747 0,2266 Untergrenze: 177 Obergrenze: 181 Prob(177< X < 181) = 0,1747 Prob( X < 177) = 0,5987 Prob( X > 181) = 0,2266 0,0400 0,0300 0,0200 0,0100 Hinweis: i Eingabefelder für die Parameter der Normalverteilung und die Grenzwerte sind hellgrün markiert. 0,0000 143,0000 146,1360 149,2720 152,4080 155,5440 158,6800 161,8160 164,9520 168,0880 171,2240 174,3600 177,4960 180,6320 183,7680 186,9040 190,0400 193,1760 196,3120 199,4480 202,5840 205,7200 Statistik 2 für SoziologInnen 38 Normalverteilung 19
Symmetrische Intervalle P(-1<Z<1)=? P(-1<Z<1)= (1) - (-1)= 0,8413-0,1587 = 0,6826 P(-a<Z<a)=P(Z<a)-P(Z<-a)= (a)-(1- (a))=2 (a)-1 P(-a<Z<a)=2 (a)-1 P(-1<Z<1)= 2* (1) -1=2*0,8413-1=0,6826 Statistik 2 für SoziologInnen 39 Normalverteilung X~N(175; 64) Wie groß ist die Wahrscheinlichkeit, dass eine Person maximal 8 cm vom Erwartungswert abweicht? P(167<X<183) = ((183-175)/8) - ((167-175)/8) (1) - (-1) = 0,8413-0,1587 = 0,6827 P(167<X<183) = 2* ((183-175)/8) -1= = 2* (1)-1 = 2*0,8413-1 = 0,6827 Statistik 2 für SoziologInnen 40 Normalverteilung 20
Erwartungswert: 175 Varianz: 64 Standardabweichung: 8,0000 0,0600 0,0500 0,1587 0,6827 0,1587 maximale Abweichung: 8 0,0400 Prob(167< X < 183) = 0,6827 Prob(X < 167) = 0,1587 Prob(X > 183) = 0,1587 0,0300 0,0200 0,0100 Hinweis: Eingabefelder für die Parameter der Normalverteilung und die maximale Abweichung sind hellgrün markiert. 0,0000 143,0000 146,1360 149,2720 152,4080 155,5440 158,6800 161,8160 164,9520 168,0880 171,2240 174,3600 177,4960 180,6320 183,7680 186,9040 190,0400 193,1760 196,3120 199,4480 202,5840 205,7200 Statistik 2 für SoziologInnen 41 Normalverteilung Inverse Fragestellung Gesucht sind Quantilwerte z für die bestimmte Wahrscheinlichkeitsaussagen gelten: P(Z< z ) = (z ) = P(Z<z ) = z Nachschlagen in der Tabelle: ==> z Gesucht ist jene Körpergröße x für die gilt, daß die Wahrscheinlichkeit P(X<x )=0,9 Lösung: x = + z x = 175 + 1,2816*8 Statistik 2 für SoziologInnen 42 Normalverteilung 21
Erwartungswert: 175 Varianz: 64 Standardabweichung: 8,0000 0,0600 0,0500 185,2524 0,9000 0,1000 Wahrscheinlichkeit: 0,9 Quantil von Z~N(0;1): 1,2816 0,0400 0,0300 Grenzwert = 185,2524 Prob(185,25 < 0,9) = 0,9000 Prob(185,25 > 0,9) = 0,1000 0,0200 0,0100 Hinweis: Eingabefelder für die Parameter der Normalverteilung und der gewünschten Wahrscheinlichkeit sind hellgrün markiert. 0,0000 143,0000 146,1360 149,2720 152,4080 155,5440 158,6800 161,8160 164,9520 168,0880 171,2240 174,3600 177,4960 180,6320 183,7680 186,9040 190,0400 193,1760 196,3120 199,4480 202,5840 205,7200 Statistik 2 für SoziologInnen 43 Normalverteilung Normalverteilung in Excel: NORMINV Für eine Standardnormalverteilung gilt, dass die Wahrscheinlichkeit einen Wert kleiner als 1,644485 zu erhalten 95% beträgt. Statistik 2 für SoziologInnen 44 Normalverteilung 22
Symmetrie von Quantilen Aus der Symmetrie der NV folgt unmittelbar, daß das -Quantil und das (1- -Quantil einer Standardnormalverteilung symmetrisch um null liegen: Sei z jener Quantil für den gilt (z ) = bzw. (z 1- ) =1- dann gilt: (-z ) ) =1- bzw. (-z 1- ) ) = P(Z<z ) = z P(Z<z ) = P(Z<z ) = 1- z Statistik 2 für SoziologInnen 45 Normalverteilung Zentrale Schwankungsintervalle auch Streubereiche symmetrische Intervalle um den Erwartungswert [ -c; +c] c] Von Interesse sind Aussagen der Form a) P( -c < X < +c) =? b) P( -? < X < +?) = 1- Wir ordnen dem zentralen Schwankungsbereich die Wahrscheinlichkeit 1- zu. Dadurch kommt außerhalb des Bereichs an jedem Ende eine Randwahrscheinlichkeit von /2 zustande. Statistik 2 für SoziologInnen 46 Normalverteilung 23
Konzept zentraler Schwankungsintervalle 0.1 0.2 0.3 0.4 alpha/2 1-alpha alpha/2 0.0-3 -2-1 0 1 2 3 Statistik 2 für SoziologInnen 47 Normalverteilung Zentrale Schwankungsintervalle Sei X~N(, ²) so ergibt sich das zentrale Schwankungsintervall,welches eine Wahrscheinlichkeit von 1- abdeckt durch: [ -z 1- /2 ; + z 1- /2 ] bzw. P( - z 1- /2 < X < + z 1- /2 ) = 1- Für =0,1 ( =0,05; =0,01) ergibt sich aus der Tabelle für z 1- /2 d.h. P( - 1,6449 < Z < + ) = 0,9 P( - 1,96 < Z < + ) = 0,95 P( - 2,5758 < Z < + 2,5758) = 0,99 Statistik 2 für SoziologInnen 48 Normalverteilung 24
X~N(175; 64) Gesucht ist ein zentrales Schwankungsintervall, das eine Wahrscheinlichkeit von 0,95 aufweist P( - z 1- /2 < X < + z 1- /2 ) = 1- = 0,05 1- /2 = 0,975 P(175-1,96*8 < X < 175 + 1,96*8) = 0,95 P(159,32 < X < 190,68) = 0,95 Falls man eine höhere Wahrscheinlichkeit anstrebt wird iddas Intervall größer: P(175-2,5758 *8 < X < 175 + 2,5758 *8) = 0,99 P(154,39 < X < 195,61) = 0,99 Statistik 2 für SoziologInnen 49 Normalverteilung Erwartungswert: 175 0,0600 Varianz: 64 Standardabweichung: 8,0000 0,0500 159,32 0,95 190,68 Hinweis: Wahrscheinlichkeit des zentralen Intervalls 1- : 0,95 1- /2 Quantil von Z~N(0;1): 1,9600 Prob(159,32< X < 190,68) = 0,9500 Untergrenze: 159,32 Obergrenze: 190,68 Eingabefelder für die Parameter der Normalverteilung und die Wahrscheinlichkeit für das zentrale Intervall sind hellgrün markiert. 0,0400 0,0300 0,0200 0,0100 0,0000 143,0000 146,1360 149,2720 152,4080 155,5440 158,6800 161,8160 164,9520 168,0880 171,2240 174,3600 177,4960 180,6320 183,7680 186,9040 190,0400 193,1760 196,3120 199,4480 202,5840 205,7200 Statistik 2 für SoziologInnen 50 Normalverteilung 25
Erwartungswert: 175 0,0600 Varianz: 64 Standardabweichung: 8,0000 0,0500 154,39 0,99 195,61 Wahrscheinlichkeit des zentralen Intervalls 1- : 0,99 1- /2 Quantil von Z~N(0;1): 2,5758 Prob(154,39< X < 195,61) = 0,9900 Untergrenze: 154,39 Obergrenze: 195,61 0,0400 0,0300 0,0200 0,0100 Hinweis: Eingabefelder für die Parameter der Normalverteilung und die Wahrscheinlichkeit für das zentrale Intervall sind hellgrün markiert. 0,0000 143,0000 146,1360 149,2720 152,4080 155,5440 158,6800 161,8160 164,9520 168,0880 171,2240 174,3600 177,4960 180,6320 183,7680 186,9040 190,0400 193,1760 196,3120 199,4480 202,5840 205,7200 Statistik 2 für SoziologInnen 51 Normalverteilung 26