Fit for Abi & Study Stochastik

Fit for Abi & Study Stochastik Prof. Dr. Tilla Schade Hochschule Harz 15. und 16. April 2014 No. 1

Stochastik besteht aus: Wahrscheinlichkeitsrechnung Statistik No. 2

Gliederung Grundlagen Zufallsgrößen Wahrscheinlichkeitsverteilungen Schätzen und Testen No. 3

Grundlagen 1 Was ist ein Zufallsexperiment? Ergebnismenge ist Ω Teilmengen von Ω heißen Ereignisse, einelementige Ereignisse sind Elementarereignisse Eine Abbildung P ordnet jedem Ereignis A Ω eine Wahrscheinlichkeit P(A) zu, so dass folgendes gilt: 0 P(A) 1, P( ) = 0 und P(Ω) = 1, Für disjunkte Ereignisse A und B gilt P(A B) = P(A)+P(B). No. 4

Grundlagen 2 Wie berechnet man Wahrscheinlichkeiten? 1. Laplace-Wahrscheinlichkeit: Alle Elementarereignisse sind gleich wahrscheinlich, dann ist P(A) = A Ω 2. Baumdiagramm (wann wird addiert, wann multipliziert?) 3. Die Wahrscheinlichkeiten einiger Ereignisse sind bekannt (Man kennt eine Funktion zur Beschreibung der Wahrscheinlichkeiten.) No. 5

Grundlagen 3 Abzählformeln. 1. Permutationen von n Elementen 1.1 ohne Wiederholung: n! 1.2 mit Wiederholung: n! n 1! n 2!... n k! 2. Variationen: k Elemente aus n auswählen mit Anordnung 2.1 ohne Wiederholung: n(n 1)...(n k + 1) = n! (n k)! 2.2 mit Wiederholung: n k 3. Kombinationen: k Elemente aus n auswählen ohne Anord. ( 3.1 ohne Wiederholung: n ) k = n! (n k)! k! ( 3.2 mit Wiederholung: n+k 1 ) ( k = n+k 1 ) n 1 No. 6

Grundlagen 4 Bedingte Wahrscheinlichkeiten: P B (A) = P(A B) P(B) Zwei Ereignisse A und B heißen unabhängig, wenn P(A B) = P(A) P(B) Satz von der totalen Wahrscheinlichkeit: P(A) = n i=1 P Bi (A) P(B i ). Satz von Bayes: P A (B k ) = P Bk (A) P(B k ) n i=1 P B i (A) P(B i ). No. 7

Zufallsgrößen 1 Eine Zufallsgröße X beschreibt das Ergebnis eines Zufallsexperimentes durch eine Zahl: Wir unterscheiden diskrete Zufallsgrößen, stetige Zufallsgrößen. X : Ω R Zu beachten ist auch die Skalierung der Zufallsgröße: nominal ordinal metrisch No. 8

Zufallsgrößen 2 Die Abbildung f, die für eine diskrete Zufallsgröße die Wahrscheinlichkeiten angibt, heißt Wahrscheinlichkeitsfunktion. Beispiel: X = Augensumme beim Würfeln mit zwei Würfeln. x 2 3 4 5 6 7 8 9 10 11 12 f(x) 1 36 2 36 3 36 4 36 5 36 6 36 5 36 Diese Funktion kann man auch zeichnen... 4 36 3 36 2 36 1 36 No. 9

Zufallsgrößen 3 Wahrscheinlichkeitsfunktion für die Zufallsgröße X : Augensumme von zwei Würfeln. f(x) 5 36 3 36 1 36 2 3 5 7 10 12 Augensumme X No. 10

Zufallsgrößen 4 Eine andere Funktion, die die Wahrscheinlichkeitsverteilung einer (diskreten) Zufallsgröße beschreibt, ist die Verteilungsfunktion F : F(z) = x i z f(x i ) No. 11

Zufallsgrößen 5 Verteilungsfunktion für die Zufallsgröße X : Augensumme für zwei Würfel. F(x) 1 0.5 0.3 0.1 2 3 5 7 10 12 Augensumme X No. 12

Zufallsgrößen 6 Eine stetige Zufallsgröße X kann alle Werte innerhalb eines Intervalls ( R ) annehmen. Hier kann man keine Wahrscheinlichkeit für einzelne Werte angeben. Die Wahrscheinlichkeitsverteilung wird durch eine stetige Funktion f beschrieben, die Dichtefunktion heißt. Beispiel: f(x) = 1 3 e 1 3 x für x [0, ) Die Wahrscheinlichkeit, dass die Zufallsgröße X einen Wert in einem Intervall [a, b] annimmt, ist dann gleich dem Integral: P(a X b) = b a f(x) dx No. 13

Zufallsgrößen 7 Die Dichtefunktion f(x) = 1 3 e 1 3 x sieht folgendermaßen aus: 0.3 0.2 0.1 1 5 No. 14

Zufallsgrößen 8 Die Verteilungsfunktion F einer stetigen Zufallsgröße X gibt (wie im diskreten Fall) die Wahrscheinlichkeit an, dass X einen Wert einer Zahl z annimt, ist also allgemein definiert als Integral P(X z) = F(z) = z f(x) dx Für unser Beispiel f(x) = 1 3 e 1 3 x erhalten wir die Verteilungsfunktion also durch Integrieren: F(z) = = z 1 0 3 e 1 3 x dx [ e 1 x] z 3 = 1 e 1 3 z 0 = e 1 3 z ( e 0 ) No. 15

Zufallsgrößen 9 Gezeichnet sieht F(z) = 1 e 1 3 z so aus: 1 0.5 0.2 1 5 No. 16

Zufallsgrößen 10 Kennwerte einer Zufallsvariablen 1.) Lageparameter: Erwartungswert einer Zufallsvariablen X : diskret: E(X) = i x i P(X = x i ) = i x i f(x i ) stetig: E(X) = R x f(x) dx No. 17

Zufallsgrößen 11 Kennwerte 2.) Streuungsparameter: Varianz einer Zufallsvariablen X : diskret: V(X) = i (x i E(X)) 2 P(X = x i ) = i (x i E(X)) 2 f(x i ) stetig: V(X) = R (x E(X)) 2 f(x) dx No. 18

Wahrscheinlichkeitsverteilungen 1 Diskrete Wahrscheinlichkeitsverteilungen: 1. Binomialverteilung 2. hypergeometrische Verteilung 3. Gleichverteilung 4. Poissonverteilung No. 19

Wahrscheinlichk.-verteilungen 2 Die Binomialverteilung B(n, p) Bernoulli-Experiment: zwei mögliche Ergebnisse (Erfolg, Misserfolg) Erfolgswahrscheinlichkeit p wird n-mal ausgeführt. X = Anzahl Erfolge bei n Versuchen Wahrscheinlichkeiten: ( ) n P(X = k) = p k (1 p) (n k). k No. 20

Wahrscheinl.-verteilungen 3 Hypergeometrische Verteilung H(N, M, n) Gegeben ist eine Urne mit N Kugeln, davon sind M Kugeln weiß und N M schwarz. Es werden n Kugeln ohne Zurücklegen gezogen. X = Anzahl weißer Kugeln unter den n gezogenen Kugeln. Wahrscheinlichkeiten: P(X = k) = ( M N M ) k) ( ( N n) n k No. 21

Wahrsch.-verteilungen 4 Diskrete Gleichverteilung: n mögliche Ergebnisse x 1, x 2,..., x n gleich wahrscheinlich, also P(X = x i ) = 1 n für alle i = 1,...,n. Poissonverteilung: P(µ) X = Anzahl... z.b. Telefonanrufe in 30 min. mögliche Werte von X: 0, 1, 2, 3,... Wahrscheinlichkeiten: P(X = k) = µk k! e µ wobei µ der Parameter der Verteilung ist. No. 22

Ws.-verteilungen 5 Stetige Wahrscheinlichkeitsverteilungen 1. Gleichverteilung auf einem Intervall [a, b] 2. Normalverteilung 3. Exponentialverteilung 4. und viele weitere... No. 23

Ws.-verteilg. 6 Die Normalverteilung N(µ,σ 2 ) hat Dichtefunktion f(x) = 1 e (x µ)2 2σ 2 2πσ 2 Dabei ist der Parameter µ der Erwartungswert der Verteilung und der Parameter σ 2 die Varianz der Verteilung. Die Standardnormalverteilung hat Parameter µ = 0 und σ = 1, also ist die Dichte ϕ(x) = 1 e x2 2 2π und die Verteilungsfunktion Φ(z) = 1 2π z e x2 2 dx No. 24

Ws.-vert. 7 Die Wahrscheinlichkeiten einer normalverteilten Zufallsgröße X N(µ,σ 2 ) werden meist nicht aus der Dichtefunktion berechnet, sondern mit Hilfe einer Tabelle der Standardnormalverteilung N(0, 1) bestimmt. Dazu muss die normalverteilte Zufallsgröße X auf eine standardnormalverteilte Zufallsgröße Z transformiert werden: X N(µ,σ 2 ) = Z = X µ σ N(0, 1). No. 25

Ws.-v. 8 Die Verteilungsfunktion einer standardnormalverteilten Zufallsgröße X ist streng monoton wachsend, für jeden Wert z R gibt es genau einen Wert Φ(z) (0, 1). Umgekehrt: für jeden Wert α (0, 1) gibt es einen (eindeutig bestimmten) Wert c R, für den Φ(c) = α. Dieser Wert c heißt das α-quantil der Standardnormalverteilung. No. 26

Ws.-v. 9 Verteilungsfunktion der Standardnormalverteilung: Φ(x) 1 0.5 0.2 3 1 1 3 x No. 27

Approximation der Binomialverteilung durch eine Normalverteilung X sei eine binomialverteilte Zufallsvariable (X B(n, p)) Ist n p (1 p) > 9, stimmen die Wahrscheinlichkeiten für die Werte von X recht gut mit den Wahrscheinlichkeiten der Normalverteilung N(µ,σ 2 ) überein. Dabei ist µ = np und σ 2 = np(1 p). Deshalb gilt ( ) k µ+0.5 P(X k) Φ σ ( ) ( ) m µ+0.5 k µ 0.5 P(k X m) Φ Φ σ σ No. 28

Schätzen und Testen 1 Statistik: Stichprobe = Erkenntnisse über die Grundgesamtheit Eine Stichprobe besteht aus n Merkmalswerten x 1,..., x n. 1. Schätzwerte für die Kennwerte der Verteilung 2. Konfidenzintervalle 3. Hypothesentests No. 29

Schätzen und Testen 2 Schätzen von Parametern: Gegeben sind n Werte x 1,..., x n (aus einer Stichprobe). Schätzwert für den Erwartungswert der Verteilung: x = 1 n n i=1 x i arithmetischer Mittelwert Schätzwert für die Varianz der Verteilung: s 2 = 1 n 1 n (x i x) 2 empirische Varianz i=1 Schätzwert für den Parameter p einer Binomialverteilung: ˆp = k n No. 30

Schätzen und Testen 3 Konfidenzintervall: Für eine gegebene Stichprobe x 1,..., x n ist ein Intervall [a, b] gesucht, in dem der Erwartungswert der Verteilung mit einer statistischen Sicherheit von γ liegt. γ Konfidenzniveau, α = 1 γ Irrtumswahrscheinlichkeit / Signifikanzniveau Beispiel: Für eine normalverteilte Grundgesamtheit ist ein Konfidenzintervall für den Erwartungswert (bei bekannter Varianz σ 2 ): [x c σ n, x + c σ n ] Dabei ist c das (1 α 2 )-Quantil der Standardnormalverteilung. No. 31

Schätzen und Testen 4 Statistische Tests: Es gibt eine Nullhypothese H 0. Aufgrund einer Stichprobe soll entschieden werden, ob H 0 stimmt oder ob die Alternative H 1 richtig ist. Dabei sind zwei Arten von Fehlentscheidung möglich: Fehler 1. Art: Die Nullhypothese wird abgelehnt, obwohl sie richtig ist. Fehler 2. Art: Die Nullhypothese wird angenommen, obwohl sie falsch ist. Der Fehler 1. Art wird durch das Signifikanzniveau α begrenzt. No. 32

Schätzen und Testen 5 Vorgehensweise bei einem statistischen Test: 1. Festlegung der Hypothesen H 0 und H 1. 2. Festlegen des Signifikanzniveaus α. 3. Wahl der Testgröße T. 4. Bestimmung des Annahmebereiches A und des Ablehnungsbereiches A (für T ). 5. Berechnung des Wertes der Testgröße aus der Stichprobe. 6. Entscheidung. No. 33

Schätzen und Testen 6 Es gibt viele verschiedene Tests: Parametertests (H 0 ist eine Aussage über einen Parameter) Verteilungstests, Differenzentests (zum Vergleich zweier Grundgesamtheiten) Unabhängigkeitstests... No. 34

Schätzen und Testen 7 Parametertest für den Erwartungswert µ einer normalverteilten Zufallsgröße X (bei bekannter Varianz σ 2 ). Es gibt zwei Möglichkeiten, wie die Nullhypothese aussehen kann: H 0 : µ = µ 0 zweiseitiger Test H 0 : µ µ 0 oder H 0 : µ µ 0 einseitiger Test In jedem Fall ist die Testgröße T = x µ 0 σ n N(0, 1) (x wird aus der Stichprobe bestimmt) No. 35

Schätzen und Testen 8 Einseitige Nullhypothese: H 0 : µ µ 0 Der Annahmebereich sieht so aus: µ dabei ist c = (1 α)-quantil c No. 36

Schätzen und Testen 9 Zweiseitige Nullhypothese: H 0 : µ = µ 0 Der Annahmebereich sieht so aus: µ c dabei ist c = (1 α 2 )-Quantil. c No. 37

Schätzen und Testen 10 Parametertest für den Parameter p einer binomialverteilten Zufallsgröße X: Wieder zwei Möglichkeiten für die Nullhypothese: H 0 : p p 0 einseitig Annahmebereich: [0, k] (mit P(X k) 1 α) H 0 : p = p 0 zweiseitig Annahmebereich: [k 1, k 2 ] (mit P(k 1 X k 2 ) 1 α) No. 38

Schätzen und Testen 11 Parametertest für den Parameter p einer binomialverteilten Zufallsgröße X unter Verwendung der Approximation durch die Normalverteilung: Wir ermitteln aus der Stichprobe (n Versuche) den Schätzwert ˆp = k n und berechnen daraus die Testgröße T = (ˆp p 0 ) n p0 (1 p 0 ) N(0, 1) Der Annahmebereich wird dann mit Hilfe der Standardnormalverteilung bestimmt. No. 39

Mittagspause! No. 40