Biostatistik, Winter 2011/12 Vergleich zweier Stichproben, nichtparametrische Tests Prof. Dr. Achim Klenke http://www.aklenke.de 11. Vorlesung: 27.01.2012 1/86 Inhalt 1 Tests t-test 2 Vergleich zweier Stichproben Gepaarter t-test Ungepaarter t-test Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Vergleich: Gepaarter vs ungepaarter t-test 3 Nichtparametrische Lagetests Der Mediantest Wilcoxon Rangsummentest 4 χ 2 -Test χ 2 -Test 2/86
Tests t-test, Problemstellung t-test Merkmal (Messgröße) zufällig und normalverteilt. Erwartungswert µ R unbekannt. Varianz σ 2 > 0 unbekannt. Hypothese H 0 = {µ 0 } für ein µ 0 R (Lehrmeinung). Alternative H 1. H 1 : H 1 : H 1 : µ < µ 0 linksseitig, µ > µ 0 rechtsseitig, µ µ 0 beidseitig. Problem Entwickle Test zum Niveau α (0, 1). 3/86 Vergleich mit Gaußtest Gemeinsam Messwerte normalverteilt, µ unbekannt. Stichprobe x 1,..., x n H 0 verwerfen, wenn Teststatistik T (x) groß (rechtsseitige Alternative). Anders bei t-test Varianz σ 2 unbekannt, schätzen durch sn 1 2 = 1 n (x i x) 2 n 1 i=1 Teststatistik T (x) = x µ 0 s n 1 / n. t-quantile t n 1;1 α statt Normal-Quantile z α. Keine Fallzahlplanung möglich, da σ 2 unbekannt.
Tests Linksseitige Alternative t-test Verwerfungsregel Alternative H 1 (, µ 0 ). Stichprobe x 1,..., x n.teststatistik T (x) = x µ 0 s n 1 / n. Verwirf H 0 zugunsten von H 1, falls T (x) t n 1;1 α. p-wert p(x) = t n 1 (T (x)) = 1 t n 1 ( T (x)). t n 1 Verteilungsfunktion der t n 1 -Verteilung (Tabelle A.4). 5/86 Tests t-test Rechtsseitige Alternative Verwerfungsregel Alternative H 1 (µ 0, ). Stichprobe x 1,..., x n. Teststatistik T (x) = x µ 0 s n 1 / n. Verwirf H 0 zugunsten von H 1, falls T (x) t n 1;1 α. p-wert p(x) = t n 1 ( T (x)) = 1 t n 1 (T (x)). t n 1 Verteilungsfunktion der t n 1 -Verteilung (Tabelle A.4). 6/86
Tests Beidseitige Alternative t-test Verwerfungsregel Alternative H 1 R \ {µ 0 }. Stichprobe x 1,..., x n. Teststatistik T (x) = x µ 0 s n 1 / n. Verwirf H 0 zugunsten von H 1, falls T (x) t n 1;1 α/2. p-wert p(x) = 2(1 t n 1 ( T (x) )). t n 1 Verteilungsfunktion der t n 1 -Verteilung (Tabelle A.4). 7/86 Tests Beispiel: Straußeneier t-test Straußeneier, Gewicht µ unbekannt, normalverteilt. Konservative Hypothese: µ = µ 0 = 110. Alternative H 1 : µ 110. Beidseitiger t-test zum Niveau α = 0.05 mit Stichprobengröße n verwirft H 0, falls T (x) = x 110 s n 1 / 10 t 9;1 α/2 = t 9; 0.975 = 2.2622. 8/86
Tests t-test Gesammelte Daten Test verwirft H 0, falls x 110 s n 1 / 10 t 9; 0.975 = 2.2622. i 1 2 3 4 5 6 7 8 9 10 x i 106 110 100 103 109 101 97 103 111 99 Wir berechnen x = 103.9, s n 1 = 4.886 und T (x) = 103.9 110 4.886/ 10 = 3.9476. Fazit Wegen T (x) = 3.9476 > 2.2622 verwirft der Test H 0 gegen H 1 zum Niveau 5% 9/86 Straußeneier, p-wert Tests t-test Allgemeine Formel Hier T (x) = 3.9476 Tabelle: p(x) = 2(1 t n 1 ( T (x) )). p-wert ist t 9 (3.9) = 0.99819. p(x) = 2(1 t 9 ( T (x) )) = 2(1 t 9 (3.90)) = 0.00362 = 0.362%. Der beidseitige t-test verwirft zu jedem Niveau α > 0.362%. 10/86
Tests t-test Anstieg des Niveaus beim Ersetzen t n 1 durch z Für große n können die Quantile von t n 1 durch die von N 0,1 ersetzt werden. Fehler im Niveau: n Fehler einseitiger Test Fehler zweiseitiger Test 5 0.04 0.08 10 0.016 0.032 20 0.008 0.016 30 0.006 0.011 40 0.004 0.008 50 0.004 0.007 100 0.002 0.004 200 0.001 0.002 11/86 Grundproblem Vergleich zweier Stichproben Gepaarter t-test Bei n Individuen soll eine Messgröße x unter zwei Versuchsbedingungen gemessen werden. Unterscheiden sich die Mittelwerte der Messungen? 12/86
Modellierung Vergleich zweier Stichproben Gepaarter t-test Unter Versuchsbedingung 1 sind die Messwerte x (1) 1,..., x (1) n unabhängig mit Erwartungswerte µ 1. Unter Versuchsbedingung 2 sind die Messwerte x (2) 1,..., x (2) n unabhängig mit Erwartungswerte µ 2. Annahme (Hoffnung!!!): Die Differenzen x (2) 1 x (1) 1,..., x (2) n x (1) n sind (ungefähr) normalverteilt mit unbekannter Varianz σ 2 (und Erwartungswert µ 2 µ 1 ). Nullhypothese (H 0 ): µ 1 = µ 2. Alternative (H 1 ): µ 1 µ 2 (beidseitig) µ 1 < µ 2 (rechtsseitig) µ 1 > µ 2 (linksseitig). 13/86 Verfahren Vergleich zweier Stichproben Gepaarter t-test Unter der Nullhypothese sind die Differenzen x k = x (2) k x (1) k unabhängig normalverteilt mit unbekannter Varianz σ 2 und Erwartungswert µ = µ 2 µ 1 = 0. Also verfahren wir jetzt wie im bekannten t-test: Teststatistik T (x) = x s n 1 / n, wobei ist und x = 1 n n x k = 1 n k=1 s 2 n 1 = 1 n 1 n k=1 (x (2) k x (1) k ) n (x i x) 2. k=1 14/86
Vergleich zweier Stichproben Linksseitige Alternative Gepaarter t-test Verwerfungsregel Nullhypothese (H 0 ): µ 2 = µ 1 Alternative (H 1 ): µ 2 < µ 1. Verwirf H 0 zugunsten von H 1, falls T (x) t n 1;1 α. p-wert p(x) = t n 1 (T (x)) = 1 t n 1 ( T (x)). t n 1 Verteilungsfunktion der t n 1 -Verteilung (Tabelle A.4). 15/86 Vergleich zweier Stichproben Rechtsseitige Alternative Gepaarter t-test Verwerfungsregel Nullhypothese (H 0 ): µ 2 = µ 1 Alternative (H 1 ): µ 2 > µ 1. Verwirf H 0 zugunsten von H 1, falls T (x) t n 1;1 α. p-wert p(x) = t n 1 ( T (x)) = 1 t n 1 (T (x)). t n 1 Verteilungsfunktion der t n 1 -Verteilung (Tabelle A.4). 16/86
Vergleich zweier Stichproben Beidseitige Alternative Gepaarter t-test Verwerfungsregel Nullhypothese (H 0 ): µ 2 = µ 1 Alternative (H 1 ): µ 2 µ 1. Verwirf H 0 zugunsten von H 1, falls T (x) t n 1;1 α/2. p-wert p(x) = 2(1 t n 1 ( T (x) )). t n 1 Verteilungsfunktion der t n 1 -Verteilung (Tabelle A.4). 17/86 Vergleich zweier Stichproben Gepaarter t-test Beispiel: Orientierung von Zugvögeln Zugvögel werden einer Beleuchtung mit bestimmter Farbe (grün oder blau) ausgesetzt. Ist das Orientierungsverhalten (magnetischer Kompass) abhängig von der Farbe? 18/86
Vergleich zweier Stichproben Gepaarter t-test Beispiel: Orientierung von Zugvögeln Zugvögel werden einer Beleuchtung mit bestimmter Farbe (grün oder blau) ausgesetzt. Ist die Genauigkeit der Orientierung (magnetischer Kompass) abhängig von der Farbe? Nullhypothese: Nein. Alternative: Doch. 19/86 Vergleich zweier Stichproben Gepaarter t-test Beispiel: Orientierung von Zugvögeln Versuchsanordnung Es werden n = 17 Trauerschnäpper in Käfigen einer Beleuchtung mit blauem Licht ausgesetzt (Versuchsbedingung 1) und jeweils in mehreren Durchgängen ihre Flugrichtung ermittelt. Die Flugrichtung wird als Punkt auf einem Kreis dargestellt. Aus allen Punkten auf dem Kreis wird der Schwerpunktvektor ermittelt. Danach der gleiche Versuch mit grünem Licht (Bedingung 2). 20/86
Vergleich zweier Stichproben Gepaarter t-test Beispiel: Orientierung von Zugvögeln Bestimmung des Schwerpunktvektors Je variabler die Richtungen, desto kürzer der Pfeil! 21/86 Vergleich zweier Stichproben Gepaarter t-test Beispiel: Orientierung von Zugvögeln Ansatz des Tests Für jeden Vogel i = 1,..., 17 bezeichnen wir mit x (1) i die Länge des Schwerpunktvektors bei blauem Licht und mit x (2) i die Länge des Schwerpunktvektors bei grünem Licht. x i = x (2) i x (1) i. Festlegung des Niveaus: α = 5%. Schwerpunktvektoren sind Mittelwerte vieler zufälliger Beobachtungen, also etwa normalverteilt (zentraler Grenzwertsatz). Also: Gepaarter t-test mit beidseitiger Alternative und Niveau 5%. Verwerfe H 0, falls T (x) > t n 1;1 α/2 = t 16;0.975 = 2.12. 22/86
Vergleich zweier Stichproben Gepaarter t-test Beispiel: Orientierung von Zugvögeln Daten und Durchführung Differenzen x i : Mittelwert und Streuung: 0.05 0.00 0.05 0.10 0.15 0.20 x = 0.0518 s n 1 = 0.0912. x t-statistik T (x) = s n 1 / n = 0.0518 0.0912/ 17 2.34. Also ist T (x) = 2.34 > 2.12 = t 16;0.975. p-wert: p(x) = 2(1 t n 1 ( T (x) )) = 2(1 t 16 (2.34)) = 2(1 0.983) = 0.034. 23/86 Vergleich zweier Stichproben Gepaarter t-test Beispiel: Orientierung von Zugvögeln Fazit Wir können die Hypothese, dass die Farbe des Lichtes keine Rolle für die Orientierungsgenauigkeit der Trauerschnäpper spielt, zum Niveau 5% verwerfen. 24/86
Vergleich zweier Stichproben Ungepaarter t-test Beispiel: Backenzähne von Hipparions (c): public domain 25/86 Vergleich zweier Stichproben Ungepaarter t-test Beispiel: Backenzähne von Hipparions Die Daten 77 Backenzähne gefunden in den Chiwondo Beds, Malawi, jetzt in den Sammlungen des Hessischen Landesmuseums, Darmstadt 26/86
Vergleich zweier Stichproben Ungepaarter t-test Beispiel: Backenzähne von Hipparions Zuordnung Die Zähne wurden zwei Arten zugeordnet: Hipparion africanum 4 Mio. Jahre, 39 Zähne Hipparion libycum 2,5 Mio. Jahre, 38 Zähne 27/86 Vergleich zweier Stichproben Ungepaarter t-test Beispiel: Backenzähne von Hipparions Geologischer Hintergrund Vor 2,8 Mio. Jahren kühlte sich das Klima weltweit ab. Das Klima in Ostafrika: warm-feucht kühl-trocken Hipparion: Laubfresser Grasfresser 28/86
Vergleich zweier Stichproben Ungepaarter t-test Beispiel: Backenzähne von Hipparions Frage Hipparion: Laubfresser Grasfresser andere Nahrung andere Zähne? Messungen: mesiodistale Länge Lässt sich die Nullhypothese, dass die Zähne gleich sind, zum Niveau 1% verwerfen? 29/86 Die Theorie Vergleich zweier Stichproben Ungepaarter t-test Annahme: Wir haben zwei unabhängige Stichproben x 1,1,..., x 1,n1 und x 2,1,..., x 2,n2. Die x 1,i stammen aus einer Normalverteilung mit (unbekanntem) Mittelwert µ 1 und unbekannter Varianz σ 2 > 0, die x 2,i aus einer Normalverteilung mit (unbekanntem) Mittelwert µ 2 und derselben Varianz σ 2. 30/86
Die Theorie Vergleich zweier Stichproben Ungepaarter t-test Seien x 1 = 1 n 1 x 1,i, x 2 = 1 n 2 n 1 n 2 i=1 i=1 die jeweiligen Stichprobenmittelwerte, s 1 = 1 n 1 (x 1,i x 1 ) n 1 1 2, i=1 s 2 = 1 n 2 (x 2,i x 2 ) n 2 1 2, i=1 die (korrigierten) Stichprobenstreuungen. x 2,i 31/86 Die Theorie Vergleich zweier Stichproben Ungepaarter t-test Wir möchten die Hypothese H 0 : µ 1 = µ 2 prüfen. Wenn µ 1 = µ 2 gilt, so sollte x 1 = x 2 bis auf Zufallsschwankungen gelten, denn E[x 1 ] = µ 1, E[x 2 ] = µ 2. Was ist die Skala der typischen Schwankungen von x 2 x 1? Var(x 1 x 2 ) = σ 2( 1 n 1 + 1 n 2 ) Problem (wie bereits im ein-stichproben-fall): Wir kennen σ 2 nicht. Wir schätzen es im zwei-stichproben-fall durch die gepoolte Stichprobenvarianz s 2 = (n 1 1)s 2 1 + (n 2 1)s 2 2 n 1 + n 2 2 und bilden die Teststatistik T (x) = x 2 x 1. 1 s n 1 + 1 n 2 32/86
Die Theorie Vergleich zweier Stichproben Ungepaarter t-test Es gilt dann: Wenn µ 1 = µ 2 gilt, so ist T (x) = x 2 x 1. 1 s n 1 + 1 n 2 t-verteilt mit n 1 + n 2 2 Freiheitsgraden. 33/86 Die Theorie Linksseitige Alternative Vergleich zweier Stichproben Ungepaarter t-test Verwerfungsregel Nullhypothese (H 0 ): µ 2 = µ 1 Alternative (H 1 ): µ 2 < µ 1. Verwirf H 0 zugunsten von H 1, falls T (x) t n1 +n 2 2;1 α. p-wert p(x) = t n1 +n 2 2(T (x)) = 1 t n1 +n 2 2( T (x)). t n1 +n 2 2 Verteilungsfunktion der t n1 +n 2 2-Verteilung (Tabelle A.4). 34/86
Die Theorie Rechtsseitige Alternative Vergleich zweier Stichproben Ungepaarter t-test Verwerfungsregel Nullhypothese (H 0 ): µ 2 = µ 1 Alternative (H 1 ): µ 2 > µ 1. Verwirf H 0 zugunsten von H 1, falls T (x) t n1 +n 2 2;1 α. p-wert p(x) = t n1 +n 2 2( T (x)) = 1 t n1 +n 2 2(T (x)). t n1 +n 2 2 Verteilungsfunktion der t n1 +n 2 2-Verteilung (Tabelle A.4). 35/86 Die Theorie Beidseitige Alternative Vergleich zweier Stichproben Ungepaarter t-test Verwerfungsregel Nullhypothese (H 0 ): µ 2 = µ 1 Alternative (H 1 ): µ 2 µ 1. Verwirf H 0 zugunsten von H 1, falls T (x) t n1 +n 2 2;1 α/2. p-wert p(x) = 2(1 t n1 +n 2 2( T (x) )). t n1 +n 2 2 Verteilungsfunktion der t n1 +n 2 2-Verteilung (Tabelle A.4). 36/86
Vergleich zweier Stichproben Ungepaarter t-test Beispiel: Backenzähne von Hipparions Die Daten H. libycum H. africanum x A = 25.9, s A = 2.2 x A s A x A + s A x L = 28.4, s L = 4.3 x L s L x L + s L 25 30 35 40 mesiodistale Länge [mm] 37/86 Vergleich zweier Stichproben Ungepaarter t-test Beispiel: Backenzähne von Hipparions Die Daten n A = 39, x A = 25.9, s A = 2.2 n L = 38, x L = 28.4, s L = 4.3 Gepoolte Stichprobenstreuung (n A 1)sA 2 s = + (n L 1)sL 2 n A + n L 2 38 2.22 + 37 4.3 = 2 = 3.402. 39 + 38 2 Es folgt T (x) = x L x A 28.4 25.9 = 1 s n A + 1 3.402 1/39 + 1/38 = 3.22. n L 38/86
Vergleich zweier Stichproben Ungepaarter t-test Beispiel: Backenzähne von Hipparions Durchführung des Tests Nullhypothese µ 1 = µ 2, Alternative µ 1 µ 2 (beidseitig). Test verwirft zum Niveau α = 1%, wenn T (x) > t na +n L 2;1 α/2 = t 75;0.995 2.65. Tatsächliche Daten: T (x) = 3.22 > 2.65. p-wert p(x) = 2(1 t na +n L 2( T (x) )) = 2(1 t 75 (3.22)) = 2(1 0.998) = 0.002. Diesen p-wert sollte man nicht glauben, weil die Modellanahmen zu optimistisch waren. 39/86 Vergleich zweier Stichproben Ungepaarter t-test Beispiel: Backenzähne von Hipparions Fazit Der ungepaarte Zweistichproben-t-Test verwirft die Nullhypothese, dass die mesiodistale Länge der Backenzähne bei Hipparion africanum und Hipparion libycum gleich Erwartungswert hätten, zu Gunsten der zweiseitigen Alternative zum Niveau 1%. 40/86
Vergleich zweier Stichproben Die Theorie (Welch Test) Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Annahme: Wir haben zwei unabhängige Stichproben x 1,1,..., x 1,n1 und x 2,1,..., x 2,n2. Die x 1,i stammen aus einer Normalverteilung mit (unbekanntem) Mittelwert µ 1 und unbekannter Varianz σ 2 1 > 0, die x 2,i aus einer Normalverteilung mit (unbekanntem) Mittelwert µ 2 und möglicherweise anderer Varianz σ 2 2. 41/86 Vergleich zweier Stichproben Die Theorie (Welch Test) Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Seien s 1 = 1 n 1 (x 1,i x 1 ) n 1 1 2, i=1 s 2 = 1 n 2 (x 2,i x 2 ) n 2 1 2, i=1 die (korrigierten) Stichprobenstreuungen. 42/86
Vergleich zweier Stichproben Die Theorie (Welch Test) Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Unter der Hypothese µ 1 = µ 2 ist die Teststatistik T (x) = x 2 x 1 s 2 1 n 1 + s2 2 n 2 ungefähr t-verteilt mit f Freiheitsgraden, wobei f aus den Daten geschätzt wird: ( ) s 2 2 1 n 1 + s2 2 n 2 f =. s 4 1 n 2 1 (n 1 1) + s4 2 n 2 2 (n 2 1) 43/86 Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Die Theorie (Welch Test) Linksseitige Alternative Verwerfungsregel Nullhypothese (H 0 ): µ 2 = µ 1 Alternative (H 1 ): µ 2 < µ 1. Verwirf H 0 zugunsten von H 1, falls T (x) t f ;1 α. p-wert p(x) = t f (T (x)) = 1 t f ( T (x)). t f Verteilungsfunktion der t f -Verteilung (Tabelle A.4). 44/86
Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Die Theorie (Welch Test) Rechtsseitige Alternative Verwerfungsregel Nullhypothese (H 0 ): µ 2 = µ 1 Alternative (H 1 ): µ 2 > µ 1. Verwirf H 0 zugunsten von H 1, falls T (x) t f ;1 α. p-wert p(x) = t f ( T (x)) = 1 t f (T (x)). t f Verteilungsfunktion der t f -Verteilung (Tabelle A.4). 45/86 Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Die Theorie (Welch Test) Beidseitige Alternative Verwerfungsregel Nullhypothese (H 0 ): µ 2 = µ 1 Alternative (H 1 ): µ 2 µ 1. Verwirf H 0 zugunsten von H 1, falls T (x) t f ;1 α/2. p-wert p(x) = 2(1 t f ( T (x) )). t f Verteilungsfunktion der t f -Verteilung (Tabelle A.4). 46/86
Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Versuchsaufbau im Pflanzenphysiologischen Praktikum In vier Petrischalen werden jeweils exakt 100 Samen Gartenkresse ausgebracht. Gewässert wird mit (A) Aqua dest. (zur Kontrolle) (B) ABS Lösung (C) Saccharose-Lösung (D) Saccharose-ABS-Lösung Nach zwei Tagen wird gezählt, wie viele Samen gekeimt haben. 47/86 Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Im Praktikum wird jeder Versuch dreimal durchgeführt. Versuch A B C D Keime Schale 1 90 85 45 25 Keime Schale 2 88 87 44 27 Keime Schale 3 91 75 45 29 0 20 60 100 A B C D 48/86
Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung 0 20 60 100 A B C D (A) Aqua dest. (B) ABS (C) Saccharose (D) Saccharose- ABS Fragen Ist die Hemmung bei B schon vorhanden? Hemmt Saccharose (C)? Hemmt Saccharose mit ABS (D) stärker als Saccharose? Ist die Wirkung von Saccharose und ABS gleich? 49/86 Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Vergleich C gegen D Vermutung: Hemmung bei ABS+Saccharose (D) stärker als bei Saccharose (C). Test zum Niveau α = 1% soll Klarheit schaffen. Nullhypothese: (D) genauso wie (C) Alternative: (D) hemmt stärker. 50/86
Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Vergleich C gegen D, Welch Test Daten x C,1 = 45, x C,2 = 44, x C,3 = 45 x D,1 = 25, x D,2 = 27, x D,3 = 29 Idee: Daten etwa normalverteilt mit unbekannten Mittelwerten µ C und µ D und unbekannten Varianzen σ 2 C, σ2 D. Nullhypothese (H 0 ) µ C = µ D Alternative (H 1 ) µ C > µ D. Linksseitiger Zwei-Stichproben t-test mit unterschiedlichen Varianzen (Welch Test). 51/86 Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Vergleich C gegen D, Welch Test x C,1 = 45, x C,2 = 44, x C,3 = 45 x D,1 = 25, x D,2 = 27, x D,3 = 29 x C = 44.67, x D = 27. s C = 1 3 (x C,i x C ) 2 2 i=1 1 = 2 ((45 44.67)2 + (44 44.67) 2 + (45 44.67) 2 ) = 0.57735. 52/86
Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Vergleich C gegen D, Welch Test x C,1 = 45, x C,2 = 44, x C,3 = 45 x D,1 = 25, x D,2 = 27, x D,3 = 29 x C = 44.67, x D = 27. s D = 1 3 (x D,i x D ) 2 2 i=1 1 = 2 ((25 27)2 + (27 27) 2 + (29 27) 2 ) = 2. 53/86 Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Vergleich C gegen D, Welch Test t-statistik T (x) = Freiheitsgrade f = x C = 44.67, x D = 27. s C = 0.57735, s D = 2. x D x C = + s2 D nd s 2 C n C ( s 2 C n C + s2 D nd ) 2 sc 4 + s4 nc 2 D (n C 1) nd 2 (n D 1) 27 44.67 0.5735 2 + 22 3 3 = 14.7. =... = 2.331. 54/86
Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Vergleich C gegen D, Welch Test t-statistik Freiheitsgrade T (x) = 14.7. f = 2.331. Der linksseitige Test zum Niveau α = 0.01 verwirft H 0, falls T (x) < t f,1 α = t 2.331;0.99 5.77. (Alternativ: Tabellenwert t 2;0.99 = 6.96) Wegen T (x) = 14.7 < 5.77 verwirft der Test zum Niveau 1% die Nullhypothese. p-wert p(x) = t 2.331 ( 14.7) = 0.0012. Alternativ: Tabellenwert p(x) t 2 ( 14.7) = 0.0023. 55/86 Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Vergleich C gegen D, Ergebnis Mit Hilfe eines ungepaarten einseitigen t-tests bei unterschiedlichen Varianzen (Welch Test) wird die Nullhypothese (Saccharose hemmt die Keimung gleich gut wie ein Lösung mit Saccharose und ABS) auf dem Niveau 1% gegen die Alternative (S hemmt nicht so gut wie S+ABS) verworfen. Der p-wert beträgt p 0.0023 (bzw. p = 0.0012, wenn man exakt mit dem Computer rechnet, statt den p-wert nach der Tabelle der t 2 -Verteilung anzunähern). 56/86
Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Vergleich C gegen B Hemmt Saccharose (C) genauso gut wie ABS (B)? Zweiseitiger ungepaarter t-test bei unterschiedlichen Varianzen (Welch Test) zum Niveau α = 1%. 57/86 Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Vergleich C gegen B, Daten t-statistik Freiheitsgrade x C = 44.67, x B = 82.333. s C = 0.57735, s B = 6.4291. T (x) = x C x B s 2 C Beidseitiger Test verwirft, falls n C + s2 B n B f = 2.032. = 10.1. T (x) > t 2.032;0.995 t 2;0.995 = 9.92. Wegen T (x) = 10.1 verwirft der Test zum Niveau 1%. p-wert 2(1 t 2.032 (10.1)) 2(1 t 2 (10.1)) = 0.0097 0.01. 58/86
Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Vergleich C gegen B, Ergebnis Der zweiseitige ungepaarte t-test bei unterschiedlicher Varianz (Welch Test) verwirft die Nullhypothese (Saccharose hemmt Keimung gleich gut wie ABS) gegen die beidseitige Alternative zum Niveau 1%. Der p-wert ist etwa 0.01. 59/86 Vergleich zweier Stichproben Vergleich: Gepaarter vs ungepaarter t-test Vergleich: Gepaarter vs ungepaarter t-test Wenn die Stichprobenlänge unterschiedlich ist, ergibt gepaart keinen Sinn. Wenn die Stichprobenlänge gleich ist: Sind die Stichproben unabhängig voneinander? Falls ja, dann ungepaart testen. Ein gepaarter Test würde sinnlose Abhängigkeiten unterstellen und hätte auch eine geringere Schärfe. Sind die Stichproben voneinander abhängig? (z.b. Messungen von denselben Individuen bzw. Objekten) Falls ja, dann ist ein gepaarter Test sinnvoll. Bei starker Abhängigkeitsstruktur hat der gepaarte t-test größere Schärfe (da der Test von Variabilität zwischen den Individuen bereinigt ist) 60/86
Nichtparametrische Lagetests Der Mediantest Beispiel: Medikamententest Bei der Behandlung mit dem etablierten Herzmedikament XY lebt die Hälfte der Patienten noch acht Jahre oder länger. Bei einem neuen Medikament wurde in einer Langzeitstudie an 20 Patienten festgestellt, wie lange die Patienten noch leben: Patient Nr. 1 2 3 4 5 6 7 8 9 10 Lebensdauer x i 45 0 8 28 4 2 6 23 35 7 Patient Nr. 11 12 13 14 15 16 17 18 19 20 Lebensdauer x i 27 1 4 12 2 24 10 3 27 24 Ist das neue Medikament besser als das etablierte? 61/86 Nichtparametrische Lagetests Der Mediantest Beispiel: Medikamententest Nullhypothese H 0 : Alternative H 1 : Beide gleich gut. Neues Medikament besser. Formal: Nullhypothese H 0 : Lebensdauer des neuen Medikaments hat einen Median von höchstens 8 Jahren. Alternative H 1 : Lebensdauer des neuen Medikaments hat einen Median von mehr als 8 Jahren. 62/86
Nichtparametrische Lagetests Der Mediantest Beispiel: Medikamenentest Sei T (x) die Anzahl der Werte x i mit x i 8. Unter H 0 ist für jedes i: Also ist T (x) b 20,0.5. P[x i 8] = 1 2. Gilt H 1, so ist T (x) b 20,p mit p > 0.5. Große Werte von T (x) stützen H 1. Der p-wert ist p = 20 k=t (x) b 20,0.5 (k). 63/86 Nichtparametrische Lagetests Der Mediantest Beispiel: Medikamententest Patient Nr. 1 2 3 4 5 6 7 8 9 10 Lebensdauer x i 45 0 8 28 4 2 6 23 35 7 Patient Nr. 11 12 13 14 15 16 17 18 19 20 Lebensdauer x i 27 1 4 12 2 24 10 3 27 24 Wir haben also und p = 20 k=11 T (x) = 11 b 20,0.5 (k) = 0.411. Die Ergebnisse geben also keinen Hinweis darauf, dass das neue Medikament besser als das etablierte wäre. 64/86
Nichtparametrische Lagetests Theorie: Mediantest Formale Problemstellung Der Mediantest Sei m P der bekannte Median einer gewissen Verteilung P (altes Medikament) und m Q der Median der Verteilung Q (neues Medikament). Daten: x 1,..., x n gezogen nach der Verteilung Q. T (x) =Anzahl der Werte x i mit x i > m P. Nullhypothese H 0 : Alternative H 1 : m P = m Q m P > m Q (linksseitig) m P < m Q (rechtsseitig) m P m Q (beidseitig). 65/86 Nichtparametrische Lagetests Theorie: Mediantest Linksseitige Alternative m P > m Q Der Mediantest p-wert ( ) T (x) n 1 T (x) 2 p = b n,0.5 (k) 1 Φ. n/4 k=0 Verwerfungsregel H 0 wird zum Niveau α verworfen, falls p α. 66/86
Nichtparametrische Lagetests Theorie: Mediantest Rechtsseitige Alternative: m P < m Q Der Mediantest p-wert p = n k=t (x) b n,0.5 (k) 1 Φ ( ) T (x) n+1 2. n/4 Verwerfungsregel H 0 wird zum Niveau α verworfen, falls p α. 67/86 Nichtparametrische Lagetests Theorie: Mediantest Beidseitige Alternative: m P m Q Der Mediantest p-wert und T (x) p = 2 b n,0.5 (k) falls T (x) < n/2 p = 2 k=0 n k=t (x) b n,0.5 (k) falls T (x) > n/2. [ ( )] T (x) n 2 1 2 In beiden Fällen gilt p 2 1 Φ. n/4 Verwerfungsregel H 0 wird zum Niveau α verworfen, falls p α. 68/86
Nichtparametrische Lagetests Wilcoxon Rangsummentest Beispiel: Hipparion Reloaded Niemand sagt Ihnen, dass die Größen der Backenzähne normalverteilt sind. Was kann man ohne diese Annahme noch rechnen? 69/86 Rangsummen Nichtparametrische Lagetests Wilcoxon Rangsummentest Gegeben zwei Stichproben x 1, x 2,..., x m und y 1, y 2,..., y n. Setze U i = Rang von x i in den y 1,..., y n = Anzahl der j mit y j < x i m und definiere die Rangsumme U(x, y) = U i. Beispiel mit m = 4 und n = 7 x i 4 1.3 5.1 2 i=1 y j 11 3 5 4.2 6.1 2.5 14 Wert 1.3 2 2.5 3 4 4.2 5 5.1 6.1 11 14 Rang U i 0 0 2 4 Rangsumme U(x, y) = 0 + 0 + 2 + 4 = 6. 70/86
Rangsummen Nichtparametrische Lagetests Wilcoxon Rangsummentest Idee Entstammen die x i und y j der gleichen Verteilung (H 0 ), so sollte U i n/2 sein und U mn 2. U(x, y) groß zeigt an, dass (x i ) tendenziell größer ist als (y j ). U(x, y) klein zeigt an, dass (x i ) tendenziell kleiner ist als (y j ). 71/86 Rangsummen Nichtparametrische Lagetests Wilcoxon Rangsummentest Die Verteilung U m,n von U(x, y) unter H 0 ist tabelliert und heißt Wilcoxon-U-Verteilung mit Parametern m und n. Für große m, n ist U(x, y) mn 2 approx. N 0,1. mn(m+n+1) 12 Also können wir das Quantil u m,n;α durch das Quantil z α approximativ ausrechnen: u m,n;α mn 2 + mn(m + n + 1) 12 z α. 72/86
Nichtparametrische Lagetests Wilcoxon Rangsummentest Wilcoxon Rangsummentest Die Theorie Formale Problemstellung Die Werte der Stichprobe x 1,..., x m sind unabhängig und nach der Verteilung P gezogen. Die Werte der Stichprobe y 1,..., y n sind unabhängig und nach der Verteilung Q gezogen. Nullhypothese H 0 : Alternative H 1 : P = Q P tendenziell größer als Q (linksseitig) P tendenziell kleiner als Q (rechtsseitig) P Q (beidseitig) 73/86 Nichtparametrische Lagetests Wilcoxon Rangsummentest Wilcoxon Rangsummentest Linksseitige Alternative: P größer als Q Verwerfungsregel Verwirf H 0 zugunsten von H 1, falls U(x, y) > u m,n;1 α mn 2 + mn(m + n + 1) 12 z 1 α. p-wert mn U(x, y) p 1 Φ 2. mn(m+n+1) 12 74/86
Nichtparametrische Lagetests Wilcoxon Rangsummentest Wilcoxon Rangsummentest Rechtsseitige Alternative: P kleiner als Q Verwerfungsregel Verwirf H 0 zugunsten von H 1, falls U(x, y) < u m,n;α mn 2 + mn(m + n + 1) 12 z α. p-wert p 1 Φ U(x, y) mn 2. mn(m+n+1) 12 75/86 Nichtparametrische Lagetests Wilcoxon Rangsummentest Wilcoxon Rangsummentest Beidseitige Alternative: P Q Verwerfungsregel Verwirf H 0 zugunsten von H 1, falls U(x, y) > u m,n;1 α/2 mn 2 + mn(m + n + 1) 12 z 1 α/2. oder U(x, y) < u m,n;α/2 mn mn(m + n + 1) 2 + z α/2. 12 p-wert p 2 1 Φ U(x, y) mn 2 mn(m+n+1) 12. 76/86
Nichtparametrische Lagetests Wilcoxon Rangsummentest Beispiel: Hipparion Reloaded Die Daten Libycum 23 25 30 26 28.5 28.5 25.5 24 35 23 25 27 26 26 40 32 33 30 26 35 24 32.5 25 26 27 30 36 25 34 29 22 26 37 25.5 29 30.5 26.5 27 Africanum 30 24 26 23 23 23 29 29 26.5 24 24.5 23 27 27 27 27 27 25 24.5 26 27 26 25 23 23.5 24 25 27 25 24 26.5 24 28.5 31 28 31 27.5 24 25 77/86 Nichtparametrische Lagetests Wilcoxon Rangsummentest Beispiel: Hipparion Reloaded Die Daten, U-Statistik Libycum: m = 38 Zähne, Africanum: n = 39 Zähne. Durch mühseliges Ausrechnen von Hand (oder mit dem Computer) erhält man U(Lib, Afr) = 990. Wir verwerfen die Nullhypothese Libycum=Africanum zum Niveau 1% zugunsten der beidseitigen Alternative, falls U > u 38,39;0.995 = 992 oder U < u 38,39;0.005 = 490 (Tabelle: A.8). Beides ist nicht der Fall, also wird die Nullhypothese zum Niveau 1% nicht verworfen. 78/86
Nichtparametrische Lagetests Wilcoxon Rangsummentest Beispiel: Hipparion Reloaded Die Daten, U-Statistik m = 38, n = 39, U(Lib, Afr) = 990. p-wert: p 2 1 Φ [ = 2 1 Φ U(Lib, Afr) mn 2 mn(m+n+1) 12 ( )] 990 741 9633 = 2(1 Φ(2.537)) 2(1 0.9943) = 0.0114. 79/86 Nichtparametrische Lagetests Wilcoxon Rangsummentest Beispiel: Hipparion Reloaded Fazit Der zweiseitige Wilcoxon Rangsummentest verwirft die Hypothese, dass Hipparion Africanum und Libycum unterschiedliche mesiodistale Zahnlänge haben zum Niveau 1% nicht. Der p-wert beträgt p = 0.0114 80/86
χ 2 -Test Das Grundproblem χ 2 -Test χ 2 -Test Wir beobachten ein Merkmal in endlich vielen Ausprägungen i = 1,..., k mit Häufigkeiten x 1,..., x k. Gesamtzahl n = x 1 +... + x k. Nach einer Theorie sollte der Anteil von Typ i gleich p i sein, also die absolute Häufigkeit etwa E i = p i n. Es soll ein Test zum Niveau α entwickelt werden, der diese Theorie prüft. 81/86 χ 2 -Test Teststatistik χ 2 -Test χ 2 -Test Beobachtungen x 1,..., x k. Gesamtzahl n = x 1 +... + x k. Erwartete Häufigkeiten E i = p i n. Gewichtete quadratische Abweichungen als Teststatistik T (x) = k i=1 (x i E i ) 2 E i. Ist χ 2 (x) zu groß, so wird die Hypothese verworfen. 82/86
χ 2 -Test Verwerfungsregel χ 2 -Test χ 2 -Test Unter H 0 ist T (x) chiquadrat-verteilt (χ 2 f ) mit f = k 1 Freiheitsgraden. Ist T (x) > χ 2 f ;1 α, so wird die Nullhypothese zum Niveau α verworfen. Der p-wert ist p = 1 χ 2 f (T (x)). 83/86 χ 2 -Test χ 2 -Test Beispiel: Hardy-Weinberg Gesetz Fragestellung In einer sehr großen Population tritt an einem Locus das Gen A mit Wahrscheinlichkeit p = 0.53 auf, das Gen a mit Wahrscheinlichkeit 1 p = 0.47. Nach dem Hardy-Weinberg Gesetz sind die Anteile AA Aa aa p 2 = 0.2809 2p(1 p) = 0.4982 (1 p) 2 = 0.2209 In einer Teilpopulation der Größe n soll die Gültigkeit des Hardy-Weinberg Gesetzes geprüft werden. 84/86
χ 2 -Test χ 2 -Test Beispiel: Hardy-Weinberg Gesetz Der Test Die Hypothese HW Gesetz gilt soll zum Niveau 1% geprüft werden. Es werden die Daten x AA, x Aa und x aa mit Gesamtumfang n = 10 000 erhoben. Teststatistik T (x) = (x AA 2809 n) 2 2809 2 + (x Aa 4982) 2 4982 2 + (x aa 2209) 2 2209 2. Der Test verwirft, falls T (x) > χ 2;0.99 = 9.21 (Tabelle A.5). 85/86 χ 2 -Test χ 2 -Test Beispiel: Hardy-Weinberg Gesetz Der Test, Daten und Durchführung Teststatistik AA Aa aa 2701 4852 2447 (2701 2809 n)2 T (x) = + 2809 2 = 33.187. (4852 4982)2 (2447 2209)2 + 4982 2 2209 2 Der Test verwirft die Nullhypothese zum Niveau 1%, weil T (x) = 33.187 > χ 2;0.99 = 9.21. p-wert p(x) = 1 χ 2 2(33.187) = 6.2 10 8. 86/86