Biostatistik, Winter 2011/12 : Binomial, Gauß Prof. Dr. Achim Klenke http://www.aklenke.de 10. Vorlesung: 20.01.2012 1/31 Inhalt 1 Einführung Binomialtest 2/31
Beispiel Einführung Bohnenlieferant liefert Säcke mit weißen und schwarzen (teuren) Bohnen. Lieferant behauptet: H 0 = Anteil schwarzer Bohnen θ = 1 4. Unser Verdacht: H 1 : θ < 1 4. Stichprobe: n Bohnen, daraus x schwarz. H 0 verwerfen, falls x K. H 0 beibehalten, falls x > K. Problem: Wie ist K zu wählen? 3/31 Beispiel Einführung Zwei Fehlermöglichkeiten 1 Fehler 1. Art H 0 ist wahr, aber (zufälligerweise) ist x K. [Falsches Verwerfen von H 0 ] 2 Fehler 2. Art H 0 ist falsch, aber (zufälligerweise) ist x > K. [Ungültigkeit von H 0 wird nicht erkannt.] Problem Wie sind n und K zu wählen, damit Wahrscheinlichkeiten für Fehler 1. und 2. Art klein sind? 4/31
Einführung Fahrplan für Testprobleme 1 Schranke α (0, 1) für die Wahrscheinlichkeit des Fehlers 1. Art festlegen (Niveau). Typisch: α = 0.05, α = 0.01. 2 n (möglichst groß) wählen (= Kosten). 3 K wählen, sodass Wahrscheinlichkeit(Fehler 1. Art) α. 5/31 Einführung Fahrplan für Testprobleme Variante: Fallzahlplanung 1 Schranke α (0, 1) für die Wahrscheinlichkeit des Fehlers 1. Art festlegen (Niveau). 2 Schranke β (0, 1) für die Wahrscheinlichkeit des Fehlers 2. Art festlegen. 3 Minimales n und optimales K berechnen, sodass Wahrscheinlichkeit (Fehler 1. Art) α Wahrscheinlichkeit (Fehler 2. Art) β. 6/31
Formales Testproblem Einführung Niveau α (0, 1) festlegen. X = Beobachtungsraum Θ = Parametermenge P ϑ Verteilung der zufälligen Beobachtung X (Werte in X), falls ϑ Θ wahrer Parameter. H 0 Θ : konservative Hypothese oder Nullhypothese. H 1 Θ \ H 0 : Gegenhypothese oder Alternative. 7/31 Definition: Test Einführung Ein Test für H 0 gegen H 1 ist eine Abbildung ϕ : X {0, 1}. ϕ(x) = 1 ϕ(x) = 0 H 0 verwerfen, H 0 bewahren. Gilt P ϑ [ϕ(x) = 1] α für jedes ϑ H 0, so hält ϕ das Niveau α ein. Für ϑ H 1 ist G ϑ (ϕ) := P ϑ [ϕ(x) = 1] die Schärfe. 8/31
Konstruktion von Einführung Gibt es eine Abbildung T : X R und eine Menge R R mit ϕ(x) = 1 T (x) R, so heißt T tatistik für ϕ mit Verwerfungsbereich R. 9/31 p-werte Einführung Gegeben: Testproblem mit tatistik T für jedes Niveau α einen Verwerfungsbereich R α es gelte R α R α, falls α α. Definition Für gegebene Beobachtung x X ist der p-wert p = p(x) die kleinste Zahl p, sodass T (x) R p. Mit anderen Worten: p(x) ist die kleinste Zahl, sodass der Test zum Niveau p die Hypothese gerade noch verworfen hätte. 10/31
Binomialtest Binomialtest Niveau α (0, 1). X = {0,..., n} Menge der möglichen Beobachtungen (die Anzahl der Erfolge ) Θ = [0, 1] oder Θ [0, 1] Menge der Erfolgswahrscheinlichkeiten, die in Betracht kommen. Verteilung P p = b n,p, p Θ Binomialverteilung. Hypothese H 0 = {p 0 } (p 0 ist unser Vorurteil) Gegenhypothese H 1 [0, p 0 ): linksseitige Alternative Gegenhypothese H 1 (p 0, 1]: rechtsseitige Alternative Gegenhypothese H 1 [0, 1] \ {p 0 }: beidseitige Alternative x p 0 n tatistik T (x) = p0 (1 p 0 )n 11/31 Verwerfungsregel Binomialtest x p 0 n Test verwirft H 0, wenn T (x) = von 0 stark p0 (1 p 0 )n abweicht. Linksseitige Alternative H 1 [0, p 0 ). H 0 verwerfen, falls T (x) z 1 α. z 1 α Quantil der Normalverteilung (Tabelle!). Rechtsseitige Alternative H 1 (p 0, 1]. H 0 verwerfen, falls T (x) z 1 α. Beidseitige Alternative H 1 [0, 1] \ {p 0 }. H 0 verwerfen, falls T (x) z 1 α/2. 12/31
Fallzahlplanung Binomialtest Gegenhypothese mit Lücke zu H 0. WSK für Fehler 2. Art soll kleiner als β sein. Einseitige Alternative H 1 = [0, p 1 ] für p 1 < p 0 oder H 1 = [p 1, 1] für p 1 > p 0. Kleinste Fallzahl: ( p1 (1 p 1 ) z 1 β + ) 2 p 0 (1 p 0 ) z 1 α n =. p 0 p 1 13/31 Beispiel Anteil der Knaben unter allen Neugeborenen p =? Hypothese H 0 : p = 1 2. Gegenhypothese H 1 : p > 1 2. Test zum Niveau α = 1%. Stichprobe n, darunter x Knaben. Verwirf H 0, falls T (x) z 0.99 = 2.32635. Stadt Düsseldorf 1999: n = 5234 Geburten, x = 2676 Knaben. T (x) = x p 0 n p0 (1 p 0 )n = 2676 1 2 5234 1 1 2 2 5234 = 1.63 < 2.32635. Fazit Der Test verwirft H 0 nicht.
Beispiel, p-werte Binomialtest Zu welchem Niveau hätte der Test die Hypothese verworfen? T (x) = 1.631 α = 2%? z 0.98 = 2.053 > T (x) : NEIN. α = 5%? z 0.95 = 1.645 > T (x) : NEIN. α = 5.1%? z 0.949 = 1.635 > T (x) : NEIN. α = 5.2%? z 0.948 = 1.626 < T (x) : JA! Kleinster Wert von α, sodass der Test H 0 verwirft, heißt p-wert. Hier p-wert = 5.2%. Kleiner p-wert (< 1%): Test ist stark signifikant. Großer p-wert: Test liefert keine Aussage. 15/31 Beispiel Binomialtest Fallzahlplanung Gegenhypothese präzisieren: H 1 : p > p 1 = 0.51. Grenze für Fehler 2. Art β = 0.05. Minimale Fallzahl ( ) 2 p1 (1 p n = 1 ) z 1 β + p 0 (1 p 0 ) z 1 α p 0 p 1. ( 0.51 0.49 z0.95 + 1 2 = z ) 2 0.99. 0.01 ( 0.2499 1.64485 + 1 2 = 2.32635 ) 2. 0.01 = 39 420. 16/31
, Problemstellung Merkmal (Messgröße) zufällig und normalverteilt. Erwartungswert µ R unbekannt. Varianz σ 2 > 0 bekannt. Hypothese H 0 = {µ 0 } für ein µ 0 R (Lehrmeinung). Alternative H 1. H 1 : H 1 : H 1 : µ < µ 0 linksseitig, µ > µ 0 rechtsseitig, µ µ 0 beidseitig. Test zum Niveau α (0, 1). 17/31 Linksseitige Alternative Verwerfungsregel Alternative H 1 (, µ 0 ). Stichprobe x 1,..., x n. tatistik T (x) = x µ 0 σ/ n. Verwirf H 0 zugunsten von H 1, falls T (x) z 1 α. p-wert p(x) = Φ(T (x)) = 1 Φ( T (x)). Φ Verteilungsfunktion der Normalverteilung (Tabelle!). 18/31
Linksseitige Alternative Fallzahlplanung für H 1 (, µ 1 ], µ 1 < µ 0. β = Schranke für Fehler 2. Art. Minimale Fallzahl ( ) 2 n = σ 2 z1 β + z 1 α. µ 0 µ 1 19/31 Rechtsseitige Alternative Verwerfungsregel Alternative H 1 (µ 0, ). Stichprobe x 1,..., x n. tatistik T (x) = x µ 0 σ/ n. Verwirf H 0 zugunsten von H 1, falls T (x) z 1 α. p-wert p(x) = Φ( T (x)) = 1 Φ(T (x)). 20/31
Rechtsseitige Alternative Fallzahlplanung für H 1 [µ 1, ), µ 1 > µ 0. β = Schranke für Fehler 2. Art. Minimale Fallzahl ( ) 2 n = σ 2 z1 β + z 1 α. µ 0 µ 1 21/31 Beidseitige Alternative Verwerfungsregel Alternative H 1 R \ {µ 0 }. Stichprobe x 1,..., x n. tatistik T (x) = x µ 0 σ/ n. Verwirf H 0 zugunsten von H 1, falls T (x) z 1 α/2. p-wert p(x) = 2 ( 1 Φ( T (x) ) ). 22/31
Beidseitige Alternative Fallzahlplanung für H 1 {µ : µ µ 0 d} für ein d > 0. β = Schranke für Fehler 2. Art. Minimale Fallzahl ( ) n = σ 2 z1 β + z 2 1 α/2. d 23/31 Beispiel: beidseitig Steinlaus (Petrophaga lorioti) Stichprobe mit n = 10. Test verwirft, falls Gewicht (in µg) normalverteilt mit σ 2 = 25. Lehrmeinung (H 0 ): Mittelwert µ = µ 0 = 80. Unser Verdacht: Das ist falsch! Testen zum Niveau α = 1%. T (x) := x µ 0 σ/ n = x 80 5/ 10 z 1 α/2 = z 0.995 24/31
Quantile der Normalverteilung β = 1 α/2 = 1 1%/2 = 0.995 β z β 0.8 0.84162 0.9 1.28155 0.95 1.64485 0.975 1.95996 0.98 2.05375 0.99 2.32635 β z β 0.995 2.57583 0.9975 2.80703 0.998 2.87816 0.999 3.09023 0.9995 3.29053 25/31 Beispiel: beidseitig Steinlaus (Petrophaga lorioti) Stichprobe mit n = 10. Test verwirft, falls Gewicht (in µg) normalverteilt mit σ 2 = 25. Lehrmeinung (H 0 ): Mittelwert µ = µ 0 = 80. Unser Verdacht: Das ist falsch! Testen zum Niveau α = 1%. T (x) := x µ 0 σ/ n = x 80 5/ 10 z 1 α/2 = z 0.995 = 2.57583. 26/31
Beispiel: beidseitig Daten und Auswertung x = 76.2, also i 1 2 3 4 5 6 7 8 9 10 x i 80 70 82 71 73 75 95 76 68 72 T (x) = x 80 5/ 10 = 2.403 < 2.57583. Fazit Test verwirft H 0 nicht zum Niveau α = 1%. 27/31 Beispiel: beidseitig Daten und Auswertung Wir haben x = 76.2, also T (x) = x 80 5/ 10 = 2.403. p-wert p(x) = 2 ( 1 Φ( T (x) ) ) = 2(1 Φ(2.403)) 28/31
Normalverteilung Φ x 0 1 2 3 4 5 6 7 8 9 1.00.8413.8438.8461.8485.8508.8531.8554.8577.8599.8621 1.10.8643.8665.8686.8708.8729.8749.8770.8790.8810.8830 1.20.8849.8869.8888.8907.8925.8944.8962.8980.8997.9015 1.30.9032.9049.9066.9082.9099.9115.9131.9147.9162.9177 1.40.9192.9207.9222.9236.9251.9265.9279.9292.9306.9319 1.50.9332.9345.9357.9370.9382.9394.9406.9418.9429.9441 1.60.9452.9463.9474.9485.9495.9505.9515.9525.9535.9545 1.70.9554.9564.9573.9582.9591.9599.9608.9616.9625.9633 1.80.9641.9649.9656.9664.9671.9678.9686.9693.9699.9706 1.90.9713.9719.9726.9732.9738.9744.9750.9756.9762.9767 2.00.9773.9778.9783.9788.9793.9798.9803.9808.9812.9817 2.10.9821.9826.9830.9834.9838.9842.9846.9850.9854.9857 2.20.9861.9865.9868.9871.9875.9878.9881.9884.9887.9890 2.30.9893.9896.9898.9901.9904.9906.9909.9911.9913.9916 2.40.9918.9920.9922.9925.9927.9929.9931.9932.9934.9936 2.50.9938.9940.9941.9943.9945.9946.9948.9949.9951.9952 2.60.9953.9955.9956.9957.9959.9960.9961.9962.9963.9964 2.70.9965.9966.9967.9968.9969.9970.9971.9972.9973.9974 2.80.9974.9975.9976.9977.9977.9978.9979.9980.9980.9981 2.90.9981.9982.9983.9983.9984.9984.9985.9985.9986.9986 29/31 Beispiel: beidseitig Daten und Auswertung Wir haben x = 76.2, also T (x) = x 80 5/ 10 = 2.403. p-wert p(x) = 2 ( 1 Φ( T (x) ) ) = 2(1 Φ(2.403)) = 2(1 0.9918) = 0.0164. Der p-wert ist also p(x) = 1.64%. 30/31
Beispiel: beidseitig Fallzahlplanung Niveau α = 1%. σ 2 = 25. Alternative spezifizieren: H 1 = µ < 77 oder µ > 83. Fehler 2. Art maximal β = 5%. Stichprobenumfang ist mindestens (mit d = 3) ) 2 ( n = σ 2 z1 β + z 1 α/2 d ( ) 2 z0.95 + z 0.995 = 25 3 ( ) 2 1.64485 + 2.57583 = 25 = 49.484. 3 31/31