Biostatistik, Winter 2011/12 / Übungsaufgaben Prof. Dr. Achim Klenke http://www.aklenke.de 13. Vorlesung: 10.02.2012 1/51 Aufgabe 1 Aufgabenstellung Übungsaufgaben Ein Pharmakonzern möchte ein neues Schlankheitsmedikament auf den Markt bringen. Um die Wirksamkeit zu überprüfen, wird das Medikament an 11 Versuchspersonen getestet. Nach einer Woche haben sich die folgenden Gewichtsveränderungen ergeben (in kg): 1.2 0.3 2.5 0.8 0.4 1.6 0.3 1.7 1.2 1.3 1.5 Sie möchten nun mittels eines Median- die Wirksamkeit des Medikaments auf einem Niveau von 5% testen. 2/51
Aufgabe 1 Aufgabenstellung Übungsaufgaben (a) Formulieren Sie Hypothese und Alternative. (b) Bestimmen Sie die tatistik T und den p-wert (entweder exakt oder mit der Näherungsformel aus der Vorlesung). (c) Können Sie die Hypothese verwerfen? 3/51 Aufgabe 1 Lösung (a) Übungsaufgaben Nullhypothese: Gewicht verändert sich (im Mittel) nicht. Schwankungen sind zufällig. Alternative: Gewicht wird (im Mittel) geringer. Formale Beschreibung Gewicht nach einer Woche ist zufällig mit Median m. Nullhypothese: m = 0. Alternative: m < 0 (linksseitige Alternative). 4/51
Theorie: Mediantest Linksseitige Alternative m Q < m P Übungsaufgaben p-wert ( ) T (x) n 1 T (x) 2 p = b n,0.5 (k) 1 Φ. n/4 k=0 Verwerfungsregel H 0 wird zum Niveau α verworfen, falls p α. 5/51 Aufgabe 1 Lösung (b) tatistik Übungsaufgaben T (x) = Anzahl der i mit x i > 0. = 3. Stichprobengröße n = 11. p-wert nach Vorlesung (approximativ) ( ) n 1 T (x) 2 p(x) 1 Φ n/4 ( ) 5 3 = 1 Φ = 1 Φ(1.20) = 1 0.8849 = 0.1151. 11/4 Exakt p(x) = 3 b 11,0.5 (k) = 0.113. k=0 6/51
Aufgabe 1 Lösung (c) Übungsaufgaben Verwerfungsregel H 0 wird zum Niveau α verworfen, falls p α. Wir haben α = 0.05 und p = 0.113. Also wird die Nullhypothese nicht verworfen. 7/51 Aufgabe 1 Antwortsatz Übungsaufgaben Die Nullhypothese, dass durch das Präparat im Mittel keine Gewichtsveringerung eintritt, wurde mit einem einseitigen Mediantest zum Niveau 5% an einer Stichprobe der Größe 11 getestet. Bei den gegebenen Daten konnte die Nullhypothese nicht verworfen werden. Der p-wert beträgt 0.113. 8/51
Aufgabe 2 Aufgabenstellung Übungsaufgaben Um zu testen, ob ein Medikament die Reaktionszeit verlängert, wurde in einer Ministudie bei elf Probanden ein Reaktionstest durchgeführt. Sechs zufällig gewählte Probanden erhielten vorher das Medikament. Bei ihnen wurden die folgenden Reaktionszeiten x i gemessen (in s): 0.78 0.63 0.86 0.90 0.83 0.84. Als Kontrolle wurden die Reaktionszeiten y i der fünf unbehandelten Probanden gemessen: 0.82 0.62 0.66 0.69 0.91. Sie wollen nun mittels des Wilcoxon-Rangtests die Hypothese testen, dass das Medikament die Reaktionszeit nicht verlängert. 9/51 Aufgabe 2 Aufgabenstellung Übungsaufgaben (a) Müssen Sie zum Testen dieser Hypothese einseitig oder zweiseitig testen? (b) Bestimmen Sie Rangsumme U(x, y) für die Reaktionszeiten der Probanden. (c) Können Sie die Hypothese auf einem Signifikanzniveau von 5% verwerfen? (Verwenden Sie das Tabellenwerk ) (d) Bestimmen Sie den p-wert mit Hilfe der Näherungsformel aus der Vorlesung. 10/51
Aufgabe 2 Übungsaufgaben Lösung (a), Formulierung der Hypothesen Nullhypothese: Reaktionszeit verändert sich nicht. Alternative: Reaktionszeit verlängert sich (so ist die Aufgabenstellung formuliert). Also einseitig testen. Sei P die Verteilung der x und Q die Verteilung der y. Nullhypothese: P = Q. Alternative: Q < P (linksseitige Alternative). 11/51 Aufgabe 2 Lösung (b), Bestimmung von U Übungsaufgaben x i 0.78 0.63 0.86 0.90 0.83 0.84 y j 0.82 0.62 0.66 0.69 0.91 0.62 0.63 0.66 0.69 0.78 0.82 0.83 0.84 0.86 0.90 0.91 1 3 4 4 4 4 Rangsumme U(x, y) = 1 + 3 + 4 + 4 + 4 + 4 = 20. 12/51
Übungsaufgaben Wilcoxon Rangsummentest Linksseitige Alternative: Q kleiner als P Verwerfungsregel Verwirf H 0 zugunsten von H 1, falls U(x, y) > u m,n;1 α mn 2 + mn(m + n + 1) 12 z 1 α. p-wert mn U(x, y) p 1 Φ 2. mn(m+n+1) 12 13/51 Aufgabe 2 Lösung (c), Ausführung des Übungsaufgaben m = 6, n = 5, α = 0.05, U(x, y) = 20. Verwerfungsregel Verwirf H 0 zugunsten von H 1, falls U(x, y) > u 6,5;0.95 = 24. Wegen U(x, y) = 20 24 verwirft der Test H 0 nicht zum Niveau 5%. 14/51
Aufgabe 2 Lösung (d), Bestimmung des p-wertes Übungsaufgaben p-wert mn U(x, y) p 1 Φ 2 mn(m+n+1) 12 ( ) U(x, y) 15 = 1 Φ 30 ( ) 5 = 1 Φ 30 Der p-wert beträgt 0.2. = 1 Φ(0.91) = 1 0.8186 = 0.1814. 15/51 Definition des Konfidenzintervalls Sei α (0, 1) (typisch: α = 5% oder α = 1%). Sei Θ R eine Menge von Parametern, die in Betracht gezogen werden. Eine Vorschrift x C(x), die jeder Beobachtung x X ein Intervall C(x) Θ zuordnet heißt Konfidenzintervall zum Konfidenzniveau 1 α, falls: P ϑ [C(X) ϑ] 1 α für alle ϑ Θ. Die Wahrscheinlichkeit, dass bei gegebener Beobachtung x der wahre Parameterwert ϑ in C(x) liegt, ist mindestens 1 α. 16/51
Beispiel 1 Eine Waage hat erfahrungsgemäß eine Toleranz von σ = 0.01g. Es wird eine Probe zehnmal gewogen, um ein präziseres Ergebnis zu bekommen. Messwerte in Gramm: 2.281 2.300 2.305 2.306 2.303 2.294 2.301 2.298 2.307 2.317 Es soll ein 95% Konfidenzintervall bestimmt werden. 17/51 Beispiel 1 Annahme: Die Daten sind normalverteilt mit σ = 0.01g und unbekanntem Erwartungswert µ, der geschätzt werden soll. 18/51
Normalverteilung mit bekannter Varianz Messgröße streut um wahren Wert µ mit einem Fehler, der normalverteilt ist mit bekannter Varianz σ 2. W = R, X = R n, Θ = R P µ = N µ,σ 2 Konfidenzintervall ist C(x) = [x n σ z 1 α/2, x + n σ ] z 1 α/2. Dabei ist z 1 α/2 das (1 α/2)-quantil der Normalverteilung, x = 1 n (x 1 +... + x n ) Mittelwert der Stichprobe. 19/51 Beispiel 1 Mittelwert (aus den Daten ausgerechnet) Streuung σ = 0.01g (bekannt). α = 1 0.95 = 0.05, also x = 2.3012g. z 1 α/2 = z 1 0.05/2 = z 0.975 = 20/51
Quantile der Normalverteilung α z α 0.8 0.84162 0.9 1.28155 0.95 1.64485 0.975 1.95996 0.98 2.05375 0.99 2.32635 α z α 0.995 2.57583 0.9975 2.80703 0.998 2.87816 0.999 3.09023 0.9995 3.29053 21/51 Beispiel 1 Mittelwert (aus den Daten ausgerechnet) Streuung σ = 0.01g (bekannt). α = 1 0.95 = 0.05, also x = 2.3012g. z 1 α/2 = z 1 0.05/2 = z 0.975 = 1.95996. C(x) = [x n σ z 1 α/2, x + n σ ] z 1 α/2 [ = 2.3012 0.01 1.95996, 2.3012 + 0.01 ] 1.95996 10 10 = [2.3012 0.0062, 2.3012 + 0.0062] = [2.295, 2.3074]. 22/51
Beispiel 2 Die mittlere Carapaxlänge der Atlantischen Weißen Garnele soll bestimmt werden. Dazu werden 50 Tiere vermessen. Daten in mm 12.2 11.0 12.3 10.5 11.5 12.0 10.5 12.5 11.4 12.8 11.9 11.9 10.2 10.8 10.5 11.9 13.3 10.9 12.1 12.2 11.5 10.1 9.6 11.7 10.7 12.0 10.9 8.6 10.4 10.6 11.6 12.3 12.8 11.5 10.6 10.2 12.0 10.1 10.8 13.2 10.6 12.9 12.6 11.1 10.7 12.7 10.6 12.6 12.4 12.0 Es soll ein 99% Konfidenzintervall bestimmt werden. 23/51 Beispiel 2 Modellierung: Daten etwa normalverteilt mit unbekannter Varianz σ 2 und unbekanntem Erwartungswert µ, der geschätzt werden soll. Es soll ein Konfidenzintervall C(x) zum Niveau 1 α mit α = 0.01 bestimmt werden. 24/51
Normalverteilung mit unbekannter Varianz Messgröße streut um wahren Wert µ mit einem Fehler, der normalverteilt ist mit unbekannter Varianz σ 2. W = R, X = R n, Θ = R [0, ) P µ,σ 2 = N µ,σ 2. σ 2 > 0 unbekannt, µ R ist zu schätzen. Konfidenzintervall für µ ist [ C(x) = x s n 1 t n 1; 1 α/2, x + s ] n 1 t n 1; 1 α/2. n n Dabei ist t n 1; 1 α/2 das (1 α/2)-quantil der t-verteilung mit n 1 Freiheitsgraden und s n 1 = 1 n (x i x) n 1 2 Schätzwert für die Streuung. i=1 25/51 Beispiel 2 Aus den Daten berechnen: Mittelwert x = 11.436, Stichprobenumfang n = 50, korrigierte Stichprobenstreuung Quantil aus der Tabelle s n 1 = 1.023. t n 1; 1 α/2 = t 49,0.995 = 2.68. Also ist das Konfidenzintervall [ C(x) = x s n 1 t n 1; 1 α/2, x + s ] n 1 t n 1; 1 α/2 n n [ = 11.436 1.023 2.68, 11.436 1.023 ] 2.68 50 50 = [11.436 0.388, 11.436 + 0.388] = [11.048, 11.824]. 26/51
Beispiel 2 Unter der Normalverteilungsannahme ist ein 99% Konfidenzintervall für die mittlere Carapax Länge der Atlantischen Weißen Garnele (bei den beobachteten Daten) C(x) = [11.0, 11.9]. 27/51 Beispiel 3 Welcher Anteil p der Bevölkerung ist linkshändig? Es werden n = 5400 Personen befragt (davon x = 621 linkshändig), und es soll ein 95% Konfidenzintervall bestimmt werden. 28/51
Binomialverteilung, Normalapproximation [ x C(x) = n F, x ] n + F mit dem Fehler F = 1 x ( 1 x ) n n n z 1 α/2. 29/51 Beispiel 3 Es ist α = 0.05, n = 5400, x = 621 = 0.115. Also n 5400 z 1 α/2 = z 0.975 = 1.95996 und der Fehler F = 1 x ( 1 x ) z 1 α/2 n n n 1 = 0.115(1 0.115) 1.95996 5400 = 0.0085. Konfidenzintervall für p: C(x) = [x/n F, x/n + F] = [0.115 0.0085, 0.1150 + 0.0085] = [0.106, 0.124]. 30/51
Beispiel 3 Aus den beobachteten Daten folgt als 95% Konfidenzintervall für den Anteil der Linkshänder in der Bevölkerung C = [0.106, 0.124]. 31/51 Formales Testproblem Niveau α (0, 1) festlegen. X = Beobachtungsraum Θ = Parametermenge P ϑ Verteilung der zufälligen Beobachtung X (Werte in X), falls ϑ Θ wahrer Parameter. H 0 Θ : konservative Hypothese oder Nullhypothese. H 1 = Θ \ H 0 : Gegenhypothese oder Alternative. 32/51
Definition: Test Ein Test für H 0 gegen H 1 ist eine Abbildung ϕ : X {0, 1}. ϕ(x) = 1 ϕ(x) = 0 H 0 verwerfen, H 0 bewahren. Gilt P ϑ [ϕ(x) = 1] α für jedes ϑ H 0, so hält ϕ das Niveau α ein. Für ϑ H 1 ist G ϑ (ϕ) := P ϑ [ϕ(x) = 1] die Schärfe. 33/51 Konstruktion von Gibt es eine Abbildung T : X R und eine Menge R R mit ϕ(x) = 1 T (x) R, so heißt T tatistik für ϕ mit Verwerfungsbereich R. 34/51
p-werte Gegeben: Testproblem mit tatistik T für jedes Niveau α einen Verwerfungsbereich R α es gelte R α R α, falls α α. Definition Für gegebene Beobachtung x X ist der p-wert p = p(x) die kleinste Zahl p, sodass T (x) R p. Mit anderen Worten: p(x) ist die kleinste Zahl, sodass der Test zum Niveau p die Hypothese gerade noch verworfen hätte. 35/51 Beispiel 1 Grundproblem In einem Lehrbuch finden Sie die Aussage, dass 10% der Bevölkerung linkshändig ist. Da in Ihrem Bekanntenkreis viele Linkshänder sind, werden Sie misstrauisch. Durch eine Umfrage soll die Aussage des Lehrbuch geprüft werden. 36/51
Beispiel 1 Erste Präzisierungen Eine Umfrage unter n Personen soll die Lehrbuchmeinung testen, dass der Anteil p der Linkshänder gleich 10% ist. Sie vermuten p > 0.1 (rechtsseitige Alternative). Es wird also ein rechtsseitiger Binomialtest durchgeführt. (Art des ) Sie wollen sich mit Wahrscheinlichkeit höchstens α = 0.1% blamieren, indem Sie die Lehrbuchmeinung verwerfen, obwohl sie korrekt ist. (Niveau des ) Sie wollen einen Anteil von p 12% mit Wahrscheinlichkeit mindestens 1 β = 95% entdecken. (Schärfe des ) 37/51 Verwerfungsregel x p 0 n Test verwirft H 0, wenn T (x) = von 0 stark p0 (1 p 0 )n abweicht. Linksseitige Alternative H 1 [0, p 0 ). H 0 verwerfen, falls T (x) z 1 α. z 1 α Quantil der Normalverteilung (Tabelle!). Rechtsseitige Alternative H 1 (p 0, 1]. H 0 verwerfen, falls T (x) z 1 α. Beidseitige Alternative H 1 [0, 1] \ {p 0 }. H 0 verwerfen, falls T (x) z 1 α/2. 38/51
Fallzahlplanung Gegenhypothese mit Lücke zu H 0. WSK für Fehler 2. Art soll kleiner als β sein. Einseitige Alternative H 1 = [0, p 1 ] für p 1 < p 0 oder H 1 = [p 1, 1] für p 1 > p 0. Kleinste Fallzahl: ( p1 (1 p 1 ) z 1 β + ) 2 p 0 (1 p 0 ) z 1 α n =. p 0 p 1 39/51 Beispiel 1 Fallzahlplanung ( p1 (1 p 1 ) z 1 β + ) 2 p 0 (1 p 0 ) z 1 α n = p 0 p 1 ( 0.12(1 0.12) z0.95 + ) 2 0.1(1 0.1) z 0.999 = 0.02 ( 0.12(1 0.12) 1.64485 + 0.1(1 0.1) 3.09023 = = 5340.6. 0.02 Es müssen also mindestens n = 5341 Personen befragt werden. ) 2 40/51
Beispiel 1 Testdesign Es sollen nun n = 5400 Personen befragt werden. Sei x die Anzahl der Linkshänder. Sei T (x) = x p 0 n p0 (1 p 0 )n = x 540 = x 540 0.1 0.9 5400 22.05. Der Test verwirft H 0 zugunsten von H 1 : p > 0.1, falls T (x) z 1 α = z 0.999 = 3.09023. 41/51 Beispiel 1 Daten und Ergebnis Unter den n = 5400 Befragten sind x = 621 Linkshänder. Wir erhalten T (x) = x 540 621 540 = = 3.67. 22.05 22.05 Dies ist größer als der kritische Wert 3.09023, also verwirft der Test die Nullhypothese. Der p-wert beträgt 1 Φ(T (x)) = 0.00012. 42/51
Beispiel 1 Antwortsatz Von 5400 befragten Personen gaben 621 an, linkshändig zu sein. Ein rechtsseitiger Binomialtest hat die Nullhypothese, dass der Anteil der Linkshänder in der Bevölkerung 10% sei zum Niveau 0.1% verworfen zugunsten der Alternative, dass dieser Anteil größer sei. Der p-wert des Test beträgt 0.00012. 43/51 Beispiel 2 Fragestellung Fastnachtskreppel wiegen im Mittel 60g. Stimmt das? Ein Test mit 20 Kreppeln soll Klarheit schaffen. 44/51
Beispiel 2 Modellierung Wir nehmen an, dass das Gewicht (in Gramm) der Kreppel (ungefähr) normalverteilt ist mit Erwartungswert µ und unbekannter Varianz σ 2. Nullhypothese: µ = 60 Alternative: µ 60 (beidseitig). Es soll also ein beidseitiger t-test durchgeführt werden. Als Niveau legen wir 5% fest. 45/51 Beidseitige Alternative Verwerfungsregel Alternative H 1 R \ {µ 0 }. Stichprobe x 1,..., x n. tatistik T (x) = x µ 0 s n 1 / n. Verwirf H 0 zugunsten von H 1, falls T (x) t n 1;1 α/2. p-wert p(x) = 2(1 t n 1 ( T (x) )). t n 1 Verteilungsfunktion der t n 1 -Verteilung (Tabelle T4). 46/51
Beispiel 2 Daten und Ergebnis Der Test verwirft H 0, falls T (x) t 19;0.975 = 2.093. Messwerte ergeben x = 59.1, s n 1 = 1.1. Also ist T (x) = x µ 0 s n 1 / n = 59.1 60 1.1/ 20 = 3.659. Wegen T (x) = 3.659 > 2.093 verwirft der Test die Hypothese zum Niveau 5%. Der p-wert beträgt p(x) = 2(1 t 19 (3.65)) = 2(1 0.99915) = 0.0017. 47/51 Beispiel 1 Fragestellung Zweistichproben- Bei Korkeichen soll untersucht werden, ob die Dicke der Korkschicht von der Himmelsrichtung abhängt. An 30 Korkeichen werden die Korkschichtdicken jeweils an der Westseite und der Nordseite gemssen. 48/51
Beispiel 1 Formalisierung Zweistichproben- Korkdicke Westen x W,1,..., x W,30 Korkdicke Norden x N,1,..., x N,30. Unterschiede zwischen einzelnen Bäumen könnten gravierender sein als der Einfluss der Himmelsrichtung. Daher: gepaarter Test. Korkdicken könnten das Ergebnis vieler kleiner Einflüsse über die Jahre hinweg sein. Daher Normalverteilungsannahme für die Differenzen x N,i x W,i. Varianz unbekannt. Also gepaarter t-test. Alternative unspezifisch, also beidseitiger Test. 49/51 Beispiel 2 Fragestellung Zweistichproben- Sind Wattwürmer in Nordfriesland im Mittel länger als in Ostfriesland? Dazu werden jeweils 30 Wattwürmer gefangen und ausgemessen. 50/51
Beispiel 2 Formalisierung Zweistichproben- Länge Wattwürmer Ostfriesland x O,1,..., x O,30 Länge Wattwürmer Nordfriesland x N,1,..., x N,30. Individuen haben nicht miteinander zu tun. Daher: ungepaarter Test. Länge der Wattwürmer könnte das Ergebnis vieler kleiner Einflüsse über die Jahre hinweg sein. Daher Normalverteilungsannahme. Varianz unbekannt. Also ungepaarter t-test. Es gibt keinen Grund anzunehmen, dass die Varianzen gleich sind, also Welsh-Test. Hypothese: Wattwürmer gleich lang (im Mittel) Alternative: Im Norden länger als im Osten, also einseitig testen. 51/51