Wahrscheinlichkeitsverteilungen

Universität Bielefeld 3. Mai 2005

Wahrscheinlichkeitsrechnung

Wahrscheinlichkeitsrechnung Das Ziehen einer Stichprobe ist die Realisierung eines Zufallsexperimentes. Die Wahrscheinlichkeitsrechnung betrachtet Zufallsexperimente und die daraus resultierenden Ereignisse. Wie wahrscheinlich ist es, daß bestimmte Ereignisse A eintreten (z. B. Würfeln einer bestimmten Augenzahl)? Die Wahrscheinlichkeit eines Ereignisses p(a) läßt sich über die relative Häufigkeit H(A) schätzen: H(A) = p(a) = n A n (1) n A = Anzahl der günstigen Ereignisse A n = Anzahl der möglichen Ereignisse

Bernoulli-Theorem: Die Wahrscheinlichkeit π(a) für ein Ereignis A wird durch die relative Häufigkeit p(a) = n a /n geschätzt. Die Schätzung fällt umso genauer aus, je größer n ist. ( n ) A p n π(a) e 0 (2) Gleichung 2 gilt für n. Wenn ein Ereignis mit der Wahrscheinlichkeit π(a) auftritt und n voneinander unabhängige, gleichartige Zufallsexperimente durchgeführt werden, dann geht die Wahrscheinlichkeit für eine Differenz e zwischen relativer Häufigkeit n A n und Wahrscheinlichkeit π(a) gegen Null. Beispiel: Die Wahrscheinlichkeit, eine bestimmte Augenzahl zu würfeln, beträgt 0.1 6.

Simulation des Werfens eines Würfels Anzahl der Würfe A π(a) 10 50 100 1000 10000 100000 1000000 1 0.1 6 0.2000 0.1400 0.1800 0.1780 0.1674 0.1668 0.1666 2 0.1 6 0.2000 0.1600 0.1500 0.1670 0.1676 0.1651 0.1666 3 0.1 6 0.2000 0.2200 0.1900 0.1530 0.1637 0.1673 0.1660 4 0.1 6 0.0000 0.1800 0.1600 0.1590 0.1680 0.1672 0.1669 5 0.1 6 0.1000 0.1000 0.1300 0.1540 0.1656 0.1683 0.1673 6 0.1 6 0.3000 0.2000 0.1900 0.1890 0.1677 0.1652 0.1666 Anzahl der Würfe Größe einer Stichprobe Wahrscheinlichkeit eines Ereignisses Anteilswert in der Grundgesamtheit

Simulation des Werfens eines Würfels relative Häufigkeit relative Häufigkeit 0.3 0.25 0.2 0.15 0.1 0.05 0 0.3 0.25 0.2 0.15 0.1 0.05 0 10 Würfe 1 2 3 4 5 6 1000 Würfe Augenzahl 1 2 3 4 5 6 Augenzahl relative Häufigkeit relative Häufigkeit 0.3 0.25 0.2 0.15 0.1 0.05 0 0.3 0.25 0.2 0.15 0.1 0.05 0 100Würfe 1 2 3 4 5 6 1000000 Würfe Augenzahl 1 2 3 4 5 6 Augenzahl

Anteilswerte der Zahl 6 bei 100 Würfen und 10 Wiederholungen Versuch Nr. 1 2 3 4 5 6 7 8 9 10 Anteil in % 20 19 20 20 20 15 17 13 13 18 Bernoulli-Experiment: Wahrscheinlichkeit für das Werfen der Zahl 6: 0.1 6 Wahrscheinlichkeit für das Werfen einer anderen Zahl: 0.8 3 Nur der Anteil in Versuch Nr. 7 kommt dem Erwartungswert von 0.1 6 nahe. Alle anderen Werte weichen mehr oder weniger von dem erwarteten Anteilswert ab. Die Abweichung zwischen empirischen und erwarteten Anteilswert läßt sich über eine Wahrscheinlichkeitsfuktion genau angeben.

Die Versuchsreihe wird von auf 10 auf 1000 erweitert: Es wird wiederum die Häufigkeit notiert, mit der bei jeweils 100 Würfen die Zahl 6 fällt. Theoretisch kann die Zahl 6 bei jedem dieser 1000 Experimente zwischen 0 und 100mal fallen. Das Experiment entspricht dem Ziehen von 1000 Stichproben des Umfangs 100. Anteilswerte, die weit vom Erwartungswert (0.1 6) liegen, kommen selten oder gar nicht vor. Anteilswerte, die nah am Erwartungswert (0.1 6) liegen, kommen häufig vor. 51% der Anteilswerte liegen unter der Häufigkeit von 17%, 49% der Anteilswerte liegen über der Häufigkeit von 17%.

Anteilswerte der Zahl 6 bei 100 Würfen und 1.000 Wiederholungen Häufigkeit kum. Häufigkeit Anteil absolut in % absolut in % 6% 4 0.4 4 0.4 7% 4 0.4 8 0.8 8% 2 0.2 10 1.0 9% 18 1.8 28 2.8 10% 24 2.4 52 5.2 11% 33 3.3 85 8.5 12% 67 6.7 152 15.2 13% 72 7.2 224 22.4 14% 98 9.8 322 32.2 15% 90 9.0 412 41.2 16% 98 9.8 510 51.0 17% 106 10.6 616 61.6 18% 99 9.9 715 71.5 19% 74 7.4 789 78.9 20% 72 7.2 861 86.1 21% 45 4.5 906 90.6 22% 43 4.3 949 94.9 23% 19 1.9 968 96.8 24% 14 1.4 982 98.2 25% 12 1.2 994 99.4 26% 4 0.4 998 99.8 27% 1 0.1 999 99.9 29% 1 0.1 1000 100.0

Anteilswerte der Zahl 6 bei 100 Würfen und 1.000 Wiederholungen Häufigkeit in % 12 11 10 9 8 7 6 5 4 3 2 1 0 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Anteilswert in %

Wahrscheinlichkeitsfunktion der Binomialverteilung: f B (x n; p) = ( ) n p x (1 p) n x, für x = 0, 1, 2,..., n. (3) x n ist die Anzahl der Wiederholungen in einem Experiment. p ist die Wahrscheinlichkeit, daß ein Experiment auftritt. x ist die Ausprägung der Zufallsvariablen. f B (x n; p) ist die Wahrscheinlichkeit x unter der Bedingung, daß n und p zutrifft. p ist die Wahrscheinlichkeit, daß ein Experiment auftritt.

Exkurs: Anzahl der Kombinationen, die für x Objekte aus insgesamt n Objekten möglich sind: ( ) n = x n! x! (n x)! Die Anzahl der Möglichkeiten 6 Zahlen aus insgesamt 49 Zahlen zu ziehen, beträgt: ( ) 49 = 6 49! 6! (49 6)! = 13983816

Beispiel: Wie wahrscheinlich ist es, daß bei einer Durchführung des Experiments (100mal würfeln) die 6 mit einem Anteil von 20% (x = 20) auftritt: ( ) 100 f B (20 100; 0,1 6) = 0.1 6 20 (1 0.1 6) 100 20 20 = 100! 20! (100 20)! 2.735 10 16 4.629 10 7 = 5.359833704038 10 20 1.266 10 22 = 0.0679 Der theoretisch zu erwartende Wert beträgt demnach 6.79%. Bei 1000 Experimenten trat die Augenzahl 6 mit einer Wahrscheinlichkeit von 7.2% 20mal auf.

von Zufallsvariablen lassen sich durch Parameter beschreiben: 1. Erwartungswert: Der Erwartungswert einer diskreten Variablen X ist der Wert, der bei unendlich vielen Wiederholungen des Experiments zu erwarten ist. Bei einer Binomialverteilung lautet dieser: E(X ) = n p (4) 2. Varianz: Die Varianz einer diskreten Variablen X informiert darüber, wie stark die einzelnen Werte um den Erwartungswert. Bei einer Binomialverteilung lautet diese: Var(X ) = n p q; q = 1 p (5)

Beispiel: Wie hoch ist der Erwartungswert und die Varianz, bei 100 Würfen eine Augenzahl von 6 zu erhalten? E(X ) = n p = 100 0.1 6 = 16. 6 Var(X ) = n p q = 100 0.1 6 0.8 3 = 13. 8

Von einer stetigen Variablen wird dann gesprochen, wenn die Werte einer Variablen sich nicht nur nach diskreten Merkmalen unterscheiden (beim Würfel sind dies Werte von 1 bis 6), sondern auch Werte dazwischen erreichen können. Eine stetige Variable hat einen kontinuierlichen Merkmalsraum. Für eine stetige Variable gilt die Wahrscheinlichkeitsfunktion der Normalverteilung. Beispiel für eine stetige Variable ist das in einer Stichprobe erhobene Alter. Bei dem folgenden Beispiel werden 1000 Stichprobe mit einer Größe von N=1000 Personen gezogen. Der Altersmittelwert der Grundgesamtheit beträgt 37,268 Jahre. In der folgenden Abbildung ist die Verteilung der Stichprobenmittelwerte (Altersdurchschnitte) dargestellt.

Altersdurchschnitte bei 1.000 Stichproben der Größe 1.000 8 7 6 Häufigkeit in % 5 4 3 2 1 0 34.5 35 35.5 36 36.5 37 37.5 38 38.5 39 39.5 40 Stichprobenmittelwert

Die Formel der Normalverteilungsfunktion lautet: f N (x x; s 2 1 ) = 2π e s Zwei Parameter kennzeichnen die Funktion: 1 2 ( x x 1. Das arithmetische Mittel der Verteilung: x 2. Die Varianz der Verteilung: s 2 Eigenschaften der Normalverteilung: s ) 2 (6) Symmetrische Verteilung mit einem Gipfel: 50% der Fläche liegen jeweils links und rechts von x. Sie nähert sich asymptotisch der x-achse und dem Funktionswert 0 wenn x gegen + oder strebt.

Normalverteilungen mit verschiedenen Parametern x und s 2 0.8 0.7 0.6 x=0; s²=0,25 ƒ(x) 0.5 0.4 0.3 0.2 0.1 x=0; s²=4 x=0; s²=1 x=2; s²=1 0-5 -4-3 -2-1 0 1 2 3 4 5 x

Die Fläche unterhalb der Normalverteilung gibt an, wie viele x-werte sich in einem bestimmten Bereich der Verteilung befinden. Um von der Basis einer Stichprobe Aussagen über die Grundgesamtheit treffen zu können, müssen Flächen unterhalb der Normalverteilung berechnet werden können. Die Flächenbestimmung kann über die Standardnormalverteilung vorgenommen werden: f (x) = 1 2π e x2 2 (7)

Die Standardnormalverteilung ist die Normalverteilung, deren Mittelwert Null (x = 0) und deren Varianz Eins (s 2 = 1) ist. Die Werte der Standardnormalverteilung werden als z-werte bezeichnet. Die Flächen der Standardnormalverteilung werden in den meisten Lehrbüchern der Statistik in Tabellenform abgedruckt (z. B. im Lehrbuch von Gehring/Weins als z-verteilung im Anhang A).

Flächen unter der Standardormalverteilung a) z = 2,5; Φ(z) = 0,9938 b) z = -0,95; Φ(z) = 0,1711 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 0-4 -3-2 -1 0 1 2 3 4-4 -3-2 -1 0 1 2 3 4 c) z = 1,49; Φ(z) = 0,0681 d) z(a)=-1,03; z(b)=2; Φ( z)=0,8257 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 0-4 -3-2 -1 0 1 2 3 4-4 -3-2 -1 0 1 2 3 4

Flächenberechnung: Fläche links vom z-wert: Bei z = 2.5 ergibt sich eine Fläche Φ(z) = 0.9938 Fläche rechts vom z-wert: Bei z = 1.49 ergibt sich eine Fläche 1 Φ(z) = 0.0681 Flächenberechnung zwischen zwei Werten z a und z b : Bei z a = 1.03 und z b =2.0 ergibt sich eine Fläche von: Φ zb Φ za = 0.9772 0.1515 = 0.8257

Für die Intervalle um den Mittelwert (-1;1), (-2;2) und (-3;3) ergeben sich folgende Flächen: 1. Zwischen 1 und +1 liegen 68,27% der Fläche bzw. der z-werte. 2. Zwischen 2 und +2 liegen 95,45% der Fläche bzw. der z-werte. 3. Zwischen 3 und +3 liegen 99,73% der Fläche bzw. der z-werte.

Normalverteilung Standardnormalverteilung: Jede beliebige Normalverteilung kann durch eine z-transformation in eine Standardnormalverteilung überführt werden: z = x i x (8) s Aus der Standardnormalverteilung läßt sich auch umgekehrt jede beliebige Verteilung mit dem Mittelwert x und der Standardabweichung s konstruieren: x i = x + z s (9) Um festzustellen, wieviel Prozent der Fläche zwischen zwei x-werten liegt, standardisiert man die beiden x-werte, um die Flächen aus der Tabelle abzulesen: (10) Φ( x) = Φ xb Φ xa = Φ x2 x/s Φ x1 x/s = Φ zb Φ za

Beispiel: Gegeben ist eine Normalverteilung mit folgenden Parametern: 1. x = 3 2. s = 4 Berechnet werden soll die Fläche zwischen den Werten x 1 = 2 und x 2 = 5: Φ( x) = Φ 5 Φ 2 = Φ 5 3 /4 Φ 2 3 /4 = Φ 0.5 Φ 0.25 = 0.6915 0.4013 = 0.2902 29.02% der Werte liegen zwischen den beiden Werten x 1 = 2 und x 2 = 5.

Verteilung der Stichprobenmittelwerte: Die Verteilung der Stichprobenmittelwerte läßt sich auch durch ihren Mittelwert und ihre Varianz beschreiben ( siehe Abbildung Altersdurchschnitte bei 1.000 Stichproben der Größe 1.000) Der Mittelwert der Stichprobenmittelwerte entspricht dem wahren Mittelwert der in der Grundgesamtheit. Der wahre Mittelwert wird mit dem griechischen Buchstaben µ bezeichnet. Die Varianz der Stichprobenmittelwerte ist von der Streuung des Merkmals in der Grundgesamtheit abhängig. Diese Streuung wird mit σ 2 bezeichnet. Die Varianz der Stichprobenmittelwerte ist auch von der Stichprobengröße abhängig: Je größer der Umfang der gezogenen Stichproben, desto kleiner ist die Abweichung von wahren Mittelwert der Grundgesamtheit.

Die Varianz der Stichprobenmittelwerte entspricht dem Verhältnis zwischen Streuung des Merkmals und Umfang der Stichprobe: σ 2 x = σ2 n Die Standardabweichung der Stichprobenmittelwerte wird auch als Standardfehler des Mittelwerts bezeichnet: σ x = σ 2 x = σ 2 (11) n = σ n (12) Werden die Parameter µ und σ x in die allgemeine Formel der Normalverteilungsfunktion eingesetzt, dann erhält man die Gleichung der Stichprobenmittelwerteverteilung: f N ( x µ; σ 2 x) = σ x 1 2π e 1 2 ( x µ σ x ) 2 (13)

Beispiel: Gegeben ist die Altersverteilung in der Grundgesamtheit mit folgenden Parametern: 1. µ = 37.268 2. σ 2 = 504.4516 3. σ x = 504.4516 1000 = 0.71025 Werden die Parameter in die Gleichung der Stichprobenmittelwerteverteilung eingetragen, dann erhält man die Wahrscheinlichkeitsdichte: f N (37,2 37.268; 0.71025 2 ) = 1 0.71025 1 2π e 2 ( 37.2 37.268 ) 0.71025 2 = 0.5617 e 0.00458 = 0.5591

Der Wert der Wahrscheinlichkeitsdichte wird mit der gewählten Intervallbreite von 0.1 multipliziert: 0.5591 0.1 = 0.05591 6% Etwa 6% der 1000 simulierten Stichproben haben einen Altersdurchschnitt von 37.2 Jahren. Bernoulli-Theorem: Mit zunehmender Zahl an Stichproben wird sich der empirische Wert dem theoretischen Wert annähern. Die empirische Verteilung nähert sich damit immer mehr der Normalverteilung.

Die Flächenberechnung der Stichprobenmittelwerteverteilung erfolgt über die Tabelle der z-verteilung. Die x-werte werden in z-werte transformiert: z = x µ σ x (14) Die Umkehrung der Gleichung lautet: x = µ + z σ x (15) x ist bei einer Stichprobenmittelwerteverteilung ein beliebiger Wert der Verteilung und nicht wie bei der Normalverteilung das arithmetische Mittel.

Für die Flächenberechnung der Stichprobenmittelwerte gilt: 1. Zwischen µ 1 σ x und µ + 1 σ x liegen 68,27% der Stichprobenmittelwerte. 2. Zwischen µ 2 σ x und µ + 2 σ x liegen 95,45% der Stichprobenmittelwerte. 3. Zwischen µ 3 σ x und µ + 3 σ x liegen 99,73% der Stichprobenmittelwerte. Zentraler Grenzwertsatz: Mittelwerte aus beliebigen Verteilungen folgen mit zunehmendem Stichprobenumfang einer Normalverteilung.