Biostatistik, Winter 2011/12 Wahrscheinlichkeitstheorie:, Unabhängigkeit Prof. Dr. Achim Klenke http://www.aklenke.de 6. Vorlesung: 02.12.2011 1/30 Inhalt 1 Wahrscheinlichkeit 2 2/30
Wahrscheinlichkeit Bedingte Wahrscheinlichkeit Beispiel Wir werfen einen fairen sechsseitigen Würfel, nennen das Ergebnis X und betrachten die Ereignisse A := {X 3} = Augenzahl drei oder kleiner, B := {X {2, 4, 6}} = Augenzahl gerade. Offenbar ist P[A] = 1 und P[B] = 1. Wie groß ist aber die 2 2 Wahrscheinlichkeit, dass B eintritt, wenn wir schon wissen, dass A eintritt? Wenn A eintritt, nimmt X die Werte 1,2,3 mit gleicher Wahrscheinlichkeit an. Also: gesuchte Wahrscheinlichkeit ist 1/3. 3/30 Wahrscheinlichkeit Bedingte Wahrscheinlichkeit Definition Seien A und B Ereignisse. Wir definieren die bedingte Wahrscheinlichkeit für das Eintreten von B, gegeben, dass A eintritt, durch P[B A] = P[A B], falls P[A] > 0, P[A] 0, sonst. 4/30
Wahrscheinlichkeit Bedingte Wahrscheinlichkeit Beispiel (Fortsetzung) A := {X 3} = Augenzahl Drei oder kleiner, B := {X {2, 4, 6}} = Augenzahl gerade. Die Wahrscheinlichkeit dafür, dass B eintritt, gegeben, dass A eintritt, ist P[B A] = P[A B] P[A] = P[X = 2] P[X {1, 2, 3}] = 1/6 1/2 = 1 3. 5/30 Wahrscheinlichkeit Bedingte Wahrscheinlichkeit Beispiel 2: Zweifacher Würfelwurf X 1 =Augenzahl erster Wurf, X 2 =Augenzahl zweiter Wurf, S = X 1 + X 2 = Augensumme. Wie groß ist die Wahrscheinlichkeit dafür, dass der erste Wurf höchstens eine Drei ist, wenn die Augensumme genau Acht ist? A := {S = 8} = { (X 1, X 2 ) {(2, 6), (3, 5), (4, 4), (5, 3), (6, 2)} }, B := { X 1 {1, 2, 3} }. P[B A] = P[A B] P[A] = P[(X 1, X 2 ) {(2, 6), (3, 5)}] P[S = 8] = 2/36 5/36 = 2 5. 6/30
Wahrscheinlichkeit Die Ereignisse A 1,..., A n heißen Alternativen, wenn immer genau eines der Ereignisse eintritt. Formal: A i A j = für i j und A 1 A 2... A n = Ω. Satz () Seien A 1,..., A n Alternativen und B ein Ereignis. Dann gilt P[A k B] = P[B A k] P[A k ] n i=1 P[B A i] P[A i ]. Speziell ist P[A B] = P[B A] P[A] P[B A] P[A] + P[B A c ] P[A c ]. 7/30 Wahrscheinlichkeit Beispiel Es sind 0.5% der Bevölkerung mit HIV infiziert (Prävalenz). Ein Test erkennt eine HIV Infektion mit 95% Wahrscheinlichkeit (Sensitivität). Bei einer nicht-infizierten Person schlägt der Test mit Wahrscheinlichkeit 6% dennoch an (Spezifität 94%). Bei einer zufällig gewählten Person schlägt der Test an. Wie groß ist die Wahrscheinlichkeit, dass diese Person tatsächlich krank ist? 8/30
Wahrscheinlichkeit Beispiel (Fortsetzung) A = Person infiziert, B = Test schlägt an, Prävalenz: P[A] = 0.005 Sensitivität: P[B A] = 0.95 Spezifität: P[B c A c ] = 0.94, also P[B A c ] = 0.06. : Gesuchte Wahrscheinlichkeit ist P[B A] P[A] P[A B] = P[B A] P[A] + P[B A c ] P[A c ] 0.95 0.005 = = 0.074 = 7.4%. 0.95 0.005 + 0.06 0.995 9/30 Anzahl der Erfolge Beispiel: Gartenkresse in der Petrischale 100 Samenkörner. Wie viele keimen nach zwei Tagen? Modellannahme: Das Keimen ist unabhängig voneinander und mit Wahrscheinlichkeit p der Fall. Mathematische Formulierung: X 1, X 2,..., X 100 Zufallsvariablen mit Wertebereich W = {0, 1}. { 1, falls i-ter Samen gekeimt hat, X i = 0, sonst. Modellannahme liefert: Zufallsvariablen sind unabhängig und P[X i = 1] = p für jedes i = 1,..., 100. (Bernoulli-Verteilung). 100 S := i=1 X i = Anzahl gekeimte Samen. Welche Verteilung hat die Zufallsvariable S? 10/30
Anzahl der Erfolge Beispiel: Gartenkresse in der Petrischale (2) Zufallsvariablen sind unabhängig und P[X i = 1] = p für jedes i = 1,..., 100. 100 S := i=1 X i = Anzahl gekeimte Samen. P[S = 0] = P[X 1 = 0 und X 2 = 0 und... und X 100 = 0] [ 100 ] = P {X i = 0} i=1 = P[X 1 = 0] 100 = (1 p) 100. 11/30 Anzahl der Erfolge Beispiel: Gartenkresse in der Petrischale (3) P[S = 1] = P[X 1 = 1 und X i = 0 für i 1] + P[X 2 = 1 und X i = 0 für i 2]. + P[X 100 = 1 und X i = 0 für i 100] =100 P[X 1 = 1 und X i = 0 für i 1] =100 p(1 p) 99. 12/30
Anzahl der Erfolge Beispiel: Gartenkresse in der Petrischale (4) P[S = 2] = P[X 1 = X 2 = 1 und X i = 0 für i 1, 2] + P[X 1 = X 3 = 1 und X i = 0 für i 1, 3]. + P[X 99 = X 100 = 1 und X i = 0 für i 99, 100] =100 99 1 2 P[X 1 = X 2 = 1 und X i = 0 für i 1, 2] 100 99 = p 2 (1 p) 98. 2 13/30 Anzahl der Erfolge Beispiel: Gartenkresse in der Petrischale (5) 100 99 98 P[S = 3] = P [ X 1 = X 2 = X 3 = 1 und 2 3 X i = 0 für i 1, 2, 3 ] 100 99 98 = p 3 (1 p) 97. 2 3 14/30
Anzahl der Erfolge Beispiel: Gartenkresse in der Petrischale (6) Für jedes k = 1,..., 100 gilt P[S = k] =b 100,p (k) := 100 99 (100 k + 1) = p k (1 p) 100 k. 2 3 k b 100,p heißt Binomialverteilung mit Parametern 100 und p. 15/30 Binomialverteilung b 100,0.2 0.00 0.02 0.04 0.06 0.08 0.10 0 7 15 24 33 42 51 60 69 78 87 96 16/30
Binomialverteilung b 100,0.5 0.00 0.02 0.04 0.06 0.08 0.10 0 7 15 24 33 42 51 60 69 78 87 96 17/30 Binomialverteilung b 100,0.8 0.00 0.02 0.04 0.06 0.08 0.10 0 7 15 24 33 42 51 60 69 78 87 96 18/30
Binomialverteilung b 100,0.98 0.00 0.10 0.20 0.30 0 7 15 24 33 42 51 60 69 78 87 96 19/30 Allgemeine Form der Binomialverteilung Sei S die Anzahl der Erfolge in n unabhängigen Zufallsexperimenten, die jeweils mit gleicher Wahrscheinlichkeit p einen Erfolg zeigen. Dann gilt ( ) n P[S = k] = b n,p (k) := p k (1 p) n k, k wobei der Binomialkoeffizient ( ) n = k n! k!(n k)! die Anzahl der Möglichkeiten beschreibt, k Objekte aus n Objekten auszuwählen (ohne Beachtung der Reihenfolge). b n,p heißt Binomialverteilung mit Parametern n und p. 20/30
Seltene Ereignisse Beispiel In Deutschland werden pro Jahr im Mittel 8 Blitztote registriert. Wie groß ist Wahrscheinlichkeit dafür, dass es in diesem Jahr genau 5 Blitztote gibt? Annahme: Für jeden der n = 80 000 000 Bundesbürger besteht die gleiche Wahrscheinlichkeit p, dieses Jahr vom Blitz getroffen zu werden. Die Ereignisse sind unabhängig. Im Mittel werden also np = 8 Menschen vom Blitz getroffen. Es folgt p = 8/80 000 000 = 10 7. Also ist die gesuchte Wahrscheinlichkeit b 80 000 000,10 7(5) = 0.0916. 21/30 Poisson-Verteilung Bezeichnet S die Anzahl von Erfolgen bei sehr kleiner Erfolgswahrscheinlichkeit p und sehr großer Anzahl von Versuchen n, und ist λ := pn, so gilt (approximativ) λ λk P[S = k] = e k!. Diese Verteilung heißt Poisson-Verteilung Poi λ mit Parameter λ. Der Parameter λ gibt die mittlere Anzahl von Erfolgen an. Beispiel Blitztote Anzahl der Blitztote ist etwa Poisson-verteilt mit λ = 8. Wahrscheinlichkeit für genau 5 Blitztote ist also etwa 8 85 Poi 8 (5) = e 5! = 0.0916. Vergleich mit exakter Rechnung: sehr gute Näherung. 22/30
Poissonverteilung Beispiel: Radioaktiver Zerfall Pro Sekunde misst ein Geigerzähler im Mittel 3 radioaktive Zerfälle. Anzahl X der Zerfälle in einer gegebenen Sekunde ist zufällig. Zerlegung in Mikrosekunden: in jeder Mikrosekunde mit Wahrscheinlichkeit 3/1 000 000 ein Zerfall. Seltene Ereignisse, unabhängig nach dem Paradigma der Physik Atome altern nicht. Also ist X Poisson-verteilt mit Parameter 3. 23/30 Hypergeometrische Verteilung Definition In einer Population der Größe N tragen K Individuen ein bestimmtes Merkmal. Nacheinander werden n Individuen (ohne Rücklegen) untersucht. Sei X die Anzahl der Beobachtungen des Merkmals unter diesen n Individuen. Dann ist P[X = k] = Hyp K,N K,n (k) := ( K k )( ) N K n k ( ). N n Hyp K,N K,n heißt hypergeometrische Verteilung mit Parametern K, N K und n. 24/30
Hypergeometrische Verteilung Beispiel Wie groß ist beim Skat die Wahrscheinlichkeit, dass der Geber genau drei Asse erhält? N = 32, K = 4, n = 10. Wahrscheinlichkeit ist ( )( ) 4 28 Hyp 4,28,10 (3) = 3 7 ( ) =... = 66 32 899. 10 25/30 Zusammenfassung wichtiger diskreter Wartezeit auf ersten Erfolg: geometrische Verteilung γ p (k) = (1 p) k p. Anzahl der Erfolge unabhängiger Versuche: Binomialverteilung ( ) n b n,p (k) = p k (1 p) n k. k Anzahl der Erfolge seltener Ereignisse mit Mittel λ: Poissonverteilung λ λk Poi λ (k) = e k!. Anzahl gezogener markierter Objekte (ohne Rücklegen): Hypergeometrische Verteilung ( )( ) K N K Hyp K,N K,n (k) := k n k ( ) N. n 26/30