Biostatistik, Winter 2011/12



Ähnliche Dokumente
Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

Biostatistik, Sommer 2017

Biostatistik, WS 2017/18 Der zwei-stichproben-t-test

9. Schätzen und Testen bei unbekannter Varianz

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Statistik II für Betriebswirte Vorlesung 2

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen

Willkommen zur Vorlesung Statistik (Master)

Biostatistik, Sommer Nichtparametrische Statistik: Mediantest, Rangsummentest, χ 2 -Test. Prof. Dr. Achim Klenke.

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50, ,5 51,7 48,8

Willkommen zur Vorlesung Statistik

Einfache Varianzanalyse für abhängige

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = ,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Eine Einführung in R: Statistische Tests

Überblick über die Verfahren für Ordinaldaten

Einfache statistische Testverfahren

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Biostatistik, Winter 2011/12

Grundlagen der Inferenzstatistik

Statistische Thermodynamik I Lösungen zur Serie 1

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Tutorial: Homogenitätstest

q = 1 p = k k k = 0, 1,..., = [ ] = 0.678

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln

Messung von Veränderungen. Dr. Julia Kneer Universität des Saarlandes

Statistik im Versicherungs- und Finanzwesen

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Klausur zur Vorlesung Multivariate Verfahren, SS Kreditpunkte, 90 min

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Zeichen bei Zahlen entschlüsseln

Business Value Launch 2006

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

Überblick über die Tests

Stichprobenauslegung. für stetige und binäre Datentypen

Professionelle Seminare im Bereich MS-Office

Statistik II für Betriebswirte Vorlesung 3

15.3 Bedingte Wahrscheinlichkeit und Unabhängigkeit

Zahlen und das Hüten von Geheimnissen (G. Wiese, 23. April 2009)

Die Post hat eine Umfrage gemacht

Primzahlen und RSA-Verschlüsselung

Statistik I für Betriebswirte Vorlesung 11

Statistische Analyse von Ereigniszeiten

PCD Europe, Krefeld, Jan Auswertung von Haemoccult

Theoretische Grundlagen der Informatik WS 09/10

Beispiel Zusammengesetzte Zufallsvariablen

Informationsblatt Induktionsbeweis

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Ohne Fehler geht es nicht Doch wie viele Fehler sind erlaubt?

Kapitalerhöhung - Verbuchung

Was meinen die Leute eigentlich mit: Grexit?

i x k k=1 i u i x i v i 1 0, ,08 2 0, ,18 3 0, ,36 4 0, ,60 5 1, ,00 2,22 G = n 2 n i=1

Kugel-Fächer-Modell. 1fach. 3fach. Für die Einzelkugel gibt es 3 Möglichkeiten. 6fach. 3! Möglichkeiten

Statistik II. Statistik II, SS 2001, Seite 1 von 5

Abschlussprüfung Realschule Bayern II / III: 2009 Haupttermin B 1.0 B 1.1

Der Provider möchte möglichst vermeiden, dass die Werbekampagne auf Grund des Testergebnisses irrtümlich unterlassen wird.

Bei vielen Zufallsexperimenten interessiert man sich lediglich für das Eintreten bzw. das Nichteintreten eines bestimmten Ereignisses.

3. LINEARE GLEICHUNGSSYSTEME

Statistische Auswertung:

Prozentrechnung. Wir können nun eine Formel für die Berechnung des Prozentwertes aufstellen:

Einfache statistische Auswertungen mit dem Programm SPSS

4. Erstellen von Klassen

Das RSA-Verschlüsselungsverfahren 1 Christian Vollmer

Ein möglicher Unterrichtsgang

Statistik für Studenten der Sportwissenschaften SS 2008

Studie Windkraft und Tourismus 2003 bis 2009

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

W-Rechnung und Statistik für Ingenieure Übung 11

Klausur Nr. 1. Wahrscheinlichkeitsrechnung. Keine Hilfsmittel gestattet, bitte alle Lösungen auf dieses Blatt.

QM: Prüfen -1- KN

Varianzanalyse (ANOVA: analysis of variance)

R ist freie Software und kann von der Website.

Die neue Aufgabe von der Monitoring-Stelle. Das ist die Monitoring-Stelle:

Stochastische Eingangsprüfung,

Was ist clevere Altersvorsorge?

Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR)

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

9. StatistischeTests. 9.1 Konzeption

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis:

a n auf Konvergenz. Berechnen der ersten paar Folgenglieder liefert:


Etwas positive Tendenz ist beim Wechsel der Temperatur von 120 auf 170 zu erkennen.

Praktikum Physik. Protokoll zum Versuch: Geometrische Optik. Durchgeführt am

Wichtige Forderungen für ein Bundes-Teilhabe-Gesetz

Forschungsstatistik I

Simplex-Umformung für Dummies

Transkript:

Biostatistik, Winter 2011/12 Vergleich zweier Stichproben, nichtparametrische Tests Prof. Dr. Achim Klenke http://www.aklenke.de 11. Vorlesung: 27.01.2012 1/86 Inhalt 1 Tests t-test 2 Vergleich zweier Stichproben Gepaarter t-test Ungepaarter t-test Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Vergleich: Gepaarter vs ungepaarter t-test 3 Nichtparametrische Lagetests Der Mediantest Wilcoxon Rangsummentest 4 χ 2 -Test χ 2 -Test 2/86

Tests t-test, Problemstellung t-test Merkmal (Messgröße) zufällig und normalverteilt. Erwartungswert µ R unbekannt. Varianz σ 2 > 0 unbekannt. Hypothese H 0 = {µ 0 } für ein µ 0 R (Lehrmeinung). Alternative H 1. H 1 : H 1 : H 1 : µ < µ 0 linksseitig, µ > µ 0 rechtsseitig, µ µ 0 beidseitig. Problem Entwickle Test zum Niveau α (0, 1). 3/86 Vergleich mit Gaußtest Gemeinsam Messwerte normalverteilt, µ unbekannt. Stichprobe x 1,..., x n H 0 verwerfen, wenn Teststatistik T (x) groß (rechtsseitige Alternative). Anders bei t-test Varianz σ 2 unbekannt, schätzen durch sn 1 2 = 1 n (x i x) 2 n 1 i=1 Teststatistik T (x) = x µ 0 s n 1 / n. t-quantile t n 1;1 α statt Normal-Quantile z α. Keine Fallzahlplanung möglich, da σ 2 unbekannt.

Tests Linksseitige Alternative t-test Verwerfungsregel Alternative H 1 (, µ 0 ). Stichprobe x 1,..., x n.teststatistik T (x) = x µ 0 s n 1 / n. Verwirf H 0 zugunsten von H 1, falls T (x) t n 1;1 α. p-wert p(x) = t n 1 (T (x)) = 1 t n 1 ( T (x)). t n 1 Verteilungsfunktion der t n 1 -Verteilung (Tabelle A.4). 5/86 Tests t-test Rechtsseitige Alternative Verwerfungsregel Alternative H 1 (µ 0, ). Stichprobe x 1,..., x n. Teststatistik T (x) = x µ 0 s n 1 / n. Verwirf H 0 zugunsten von H 1, falls T (x) t n 1;1 α. p-wert p(x) = t n 1 ( T (x)) = 1 t n 1 (T (x)). t n 1 Verteilungsfunktion der t n 1 -Verteilung (Tabelle A.4). 6/86

Tests Beidseitige Alternative t-test Verwerfungsregel Alternative H 1 R \ {µ 0 }. Stichprobe x 1,..., x n. Teststatistik T (x) = x µ 0 s n 1 / n. Verwirf H 0 zugunsten von H 1, falls T (x) t n 1;1 α/2. p-wert p(x) = 2(1 t n 1 ( T (x) )). t n 1 Verteilungsfunktion der t n 1 -Verteilung (Tabelle A.4). 7/86 Tests Beispiel: Straußeneier t-test Straußeneier, Gewicht µ unbekannt, normalverteilt. Konservative Hypothese: µ = µ 0 = 110. Alternative H 1 : µ 110. Beidseitiger t-test zum Niveau α = 0.05 mit Stichprobengröße n verwirft H 0, falls T (x) = x 110 s n 1 / 10 t 9;1 α/2 = t 9; 0.975 = 2.2622. 8/86

Tests t-test Gesammelte Daten Test verwirft H 0, falls x 110 s n 1 / 10 t 9; 0.975 = 2.2622. i 1 2 3 4 5 6 7 8 9 10 x i 106 110 100 103 109 101 97 103 111 99 Wir berechnen x = 103.9, s n 1 = 4.886 und T (x) = 103.9 110 4.886/ 10 = 3.9476. Fazit Wegen T (x) = 3.9476 > 2.2622 verwirft der Test H 0 gegen H 1 zum Niveau 5% 9/86 Straußeneier, p-wert Tests t-test Allgemeine Formel Hier T (x) = 3.9476 Tabelle: p(x) = 2(1 t n 1 ( T (x) )). p-wert ist t 9 (3.9) = 0.99819. p(x) = 2(1 t 9 ( T (x) )) = 2(1 t 9 (3.90)) = 0.00362 = 0.362%. Der beidseitige t-test verwirft zu jedem Niveau α > 0.362%. 10/86

Tests t-test Anstieg des Niveaus beim Ersetzen t n 1 durch z Für große n können die Quantile von t n 1 durch die von N 0,1 ersetzt werden. Fehler im Niveau: n Fehler einseitiger Test Fehler zweiseitiger Test 5 0.04 0.08 10 0.016 0.032 20 0.008 0.016 30 0.006 0.011 40 0.004 0.008 50 0.004 0.007 100 0.002 0.004 200 0.001 0.002 11/86 Grundproblem Vergleich zweier Stichproben Gepaarter t-test Bei n Individuen soll eine Messgröße x unter zwei Versuchsbedingungen gemessen werden. Unterscheiden sich die Mittelwerte der Messungen? 12/86

Modellierung Vergleich zweier Stichproben Gepaarter t-test Unter Versuchsbedingung 1 sind die Messwerte x (1) 1,..., x (1) n unabhängig mit Erwartungswerte µ 1. Unter Versuchsbedingung 2 sind die Messwerte x (2) 1,..., x (2) n unabhängig mit Erwartungswerte µ 2. Annahme (Hoffnung!!!): Die Differenzen x (2) 1 x (1) 1,..., x (2) n x (1) n sind (ungefähr) normalverteilt mit unbekannter Varianz σ 2 (und Erwartungswert µ 2 µ 1 ). Nullhypothese (H 0 ): µ 1 = µ 2. Alternative (H 1 ): µ 1 µ 2 (beidseitig) µ 1 < µ 2 (rechtsseitig) µ 1 > µ 2 (linksseitig). 13/86 Verfahren Vergleich zweier Stichproben Gepaarter t-test Unter der Nullhypothese sind die Differenzen x k = x (2) k x (1) k unabhängig normalverteilt mit unbekannter Varianz σ 2 und Erwartungswert µ = µ 2 µ 1 = 0. Also verfahren wir jetzt wie im bekannten t-test: Teststatistik T (x) = x s n 1 / n, wobei ist und x = 1 n n x k = 1 n k=1 s 2 n 1 = 1 n 1 n k=1 (x (2) k x (1) k ) n (x i x) 2. k=1 14/86

Vergleich zweier Stichproben Linksseitige Alternative Gepaarter t-test Verwerfungsregel Nullhypothese (H 0 ): µ 2 = µ 1 Alternative (H 1 ): µ 2 < µ 1. Verwirf H 0 zugunsten von H 1, falls T (x) t n 1;1 α. p-wert p(x) = t n 1 (T (x)) = 1 t n 1 ( T (x)). t n 1 Verteilungsfunktion der t n 1 -Verteilung (Tabelle A.4). 15/86 Vergleich zweier Stichproben Rechtsseitige Alternative Gepaarter t-test Verwerfungsregel Nullhypothese (H 0 ): µ 2 = µ 1 Alternative (H 1 ): µ 2 > µ 1. Verwirf H 0 zugunsten von H 1, falls T (x) t n 1;1 α. p-wert p(x) = t n 1 ( T (x)) = 1 t n 1 (T (x)). t n 1 Verteilungsfunktion der t n 1 -Verteilung (Tabelle A.4). 16/86

Vergleich zweier Stichproben Beidseitige Alternative Gepaarter t-test Verwerfungsregel Nullhypothese (H 0 ): µ 2 = µ 1 Alternative (H 1 ): µ 2 µ 1. Verwirf H 0 zugunsten von H 1, falls T (x) t n 1;1 α/2. p-wert p(x) = 2(1 t n 1 ( T (x) )). t n 1 Verteilungsfunktion der t n 1 -Verteilung (Tabelle A.4). 17/86 Vergleich zweier Stichproben Gepaarter t-test Beispiel: Orientierung von Zugvögeln Zugvögel werden einer Beleuchtung mit bestimmter Farbe (grün oder blau) ausgesetzt. Ist das Orientierungsverhalten (magnetischer Kompass) abhängig von der Farbe? 18/86

Vergleich zweier Stichproben Gepaarter t-test Beispiel: Orientierung von Zugvögeln Zugvögel werden einer Beleuchtung mit bestimmter Farbe (grün oder blau) ausgesetzt. Ist die Genauigkeit der Orientierung (magnetischer Kompass) abhängig von der Farbe? Nullhypothese: Nein. Alternative: Doch. 19/86 Vergleich zweier Stichproben Gepaarter t-test Beispiel: Orientierung von Zugvögeln Versuchsanordnung Es werden n = 17 Trauerschnäpper in Käfigen einer Beleuchtung mit blauem Licht ausgesetzt (Versuchsbedingung 1) und jeweils in mehreren Durchgängen ihre Flugrichtung ermittelt. Die Flugrichtung wird als Punkt auf einem Kreis dargestellt. Aus allen Punkten auf dem Kreis wird der Schwerpunktvektor ermittelt. Danach der gleiche Versuch mit grünem Licht (Bedingung 2). 20/86

Vergleich zweier Stichproben Gepaarter t-test Beispiel: Orientierung von Zugvögeln Bestimmung des Schwerpunktvektors Je variabler die Richtungen, desto kürzer der Pfeil! 21/86 Vergleich zweier Stichproben Gepaarter t-test Beispiel: Orientierung von Zugvögeln Ansatz des Tests Für jeden Vogel i = 1,..., 17 bezeichnen wir mit x (1) i die Länge des Schwerpunktvektors bei blauem Licht und mit x (2) i die Länge des Schwerpunktvektors bei grünem Licht. x i = x (2) i x (1) i. Festlegung des Niveaus: α = 5%. Schwerpunktvektoren sind Mittelwerte vieler zufälliger Beobachtungen, also etwa normalverteilt (zentraler Grenzwertsatz). Also: Gepaarter t-test mit beidseitiger Alternative und Niveau 5%. Verwerfe H 0, falls T (x) > t n 1;1 α/2 = t 16;0.975 = 2.12. 22/86

Vergleich zweier Stichproben Gepaarter t-test Beispiel: Orientierung von Zugvögeln Daten und Durchführung Differenzen x i : Mittelwert und Streuung: 0.05 0.00 0.05 0.10 0.15 0.20 x = 0.0518 s n 1 = 0.0912. x t-statistik T (x) = s n 1 / n = 0.0518 0.0912/ 17 2.34. Also ist T (x) = 2.34 > 2.12 = t 16;0.975. p-wert: p(x) = 2(1 t n 1 ( T (x) )) = 2(1 t 16 (2.34)) = 2(1 0.983) = 0.034. 23/86 Vergleich zweier Stichproben Gepaarter t-test Beispiel: Orientierung von Zugvögeln Fazit Wir können die Hypothese, dass die Farbe des Lichtes keine Rolle für die Orientierungsgenauigkeit der Trauerschnäpper spielt, zum Niveau 5% verwerfen. 24/86

Vergleich zweier Stichproben Ungepaarter t-test Beispiel: Backenzähne von Hipparions (c): public domain 25/86 Vergleich zweier Stichproben Ungepaarter t-test Beispiel: Backenzähne von Hipparions Die Daten 77 Backenzähne gefunden in den Chiwondo Beds, Malawi, jetzt in den Sammlungen des Hessischen Landesmuseums, Darmstadt 26/86

Vergleich zweier Stichproben Ungepaarter t-test Beispiel: Backenzähne von Hipparions Zuordnung Die Zähne wurden zwei Arten zugeordnet: Hipparion africanum 4 Mio. Jahre, 39 Zähne Hipparion libycum 2,5 Mio. Jahre, 38 Zähne 27/86 Vergleich zweier Stichproben Ungepaarter t-test Beispiel: Backenzähne von Hipparions Geologischer Hintergrund Vor 2,8 Mio. Jahren kühlte sich das Klima weltweit ab. Das Klima in Ostafrika: warm-feucht kühl-trocken Hipparion: Laubfresser Grasfresser 28/86

Vergleich zweier Stichproben Ungepaarter t-test Beispiel: Backenzähne von Hipparions Frage Hipparion: Laubfresser Grasfresser andere Nahrung andere Zähne? Messungen: mesiodistale Länge Lässt sich die Nullhypothese, dass die Zähne gleich sind, zum Niveau 1% verwerfen? 29/86 Die Theorie Vergleich zweier Stichproben Ungepaarter t-test Annahme: Wir haben zwei unabhängige Stichproben x 1,1,..., x 1,n1 und x 2,1,..., x 2,n2. Die x 1,i stammen aus einer Normalverteilung mit (unbekanntem) Mittelwert µ 1 und unbekannter Varianz σ 2 > 0, die x 2,i aus einer Normalverteilung mit (unbekanntem) Mittelwert µ 2 und derselben Varianz σ 2. 30/86

Die Theorie Vergleich zweier Stichproben Ungepaarter t-test Seien x 1 = 1 n 1 x 1,i, x 2 = 1 n 2 n 1 n 2 i=1 i=1 die jeweiligen Stichprobenmittelwerte, s 1 = 1 n 1 (x 1,i x 1 ) n 1 1 2, i=1 s 2 = 1 n 2 (x 2,i x 2 ) n 2 1 2, i=1 die (korrigierten) Stichprobenstreuungen. x 2,i 31/86 Die Theorie Vergleich zweier Stichproben Ungepaarter t-test Wir möchten die Hypothese H 0 : µ 1 = µ 2 prüfen. Wenn µ 1 = µ 2 gilt, so sollte x 1 = x 2 bis auf Zufallsschwankungen gelten, denn E[x 1 ] = µ 1, E[x 2 ] = µ 2. Was ist die Skala der typischen Schwankungen von x 2 x 1? Var(x 1 x 2 ) = σ 2( 1 n 1 + 1 n 2 ) Problem (wie bereits im ein-stichproben-fall): Wir kennen σ 2 nicht. Wir schätzen es im zwei-stichproben-fall durch die gepoolte Stichprobenvarianz s 2 = (n 1 1)s 2 1 + (n 2 1)s 2 2 n 1 + n 2 2 und bilden die Teststatistik T (x) = x 2 x 1. 1 s n 1 + 1 n 2 32/86

Die Theorie Vergleich zweier Stichproben Ungepaarter t-test Es gilt dann: Wenn µ 1 = µ 2 gilt, so ist T (x) = x 2 x 1. 1 s n 1 + 1 n 2 t-verteilt mit n 1 + n 2 2 Freiheitsgraden. 33/86 Die Theorie Linksseitige Alternative Vergleich zweier Stichproben Ungepaarter t-test Verwerfungsregel Nullhypothese (H 0 ): µ 2 = µ 1 Alternative (H 1 ): µ 2 < µ 1. Verwirf H 0 zugunsten von H 1, falls T (x) t n1 +n 2 2;1 α. p-wert p(x) = t n1 +n 2 2(T (x)) = 1 t n1 +n 2 2( T (x)). t n1 +n 2 2 Verteilungsfunktion der t n1 +n 2 2-Verteilung (Tabelle A.4). 34/86

Die Theorie Rechtsseitige Alternative Vergleich zweier Stichproben Ungepaarter t-test Verwerfungsregel Nullhypothese (H 0 ): µ 2 = µ 1 Alternative (H 1 ): µ 2 > µ 1. Verwirf H 0 zugunsten von H 1, falls T (x) t n1 +n 2 2;1 α. p-wert p(x) = t n1 +n 2 2( T (x)) = 1 t n1 +n 2 2(T (x)). t n1 +n 2 2 Verteilungsfunktion der t n1 +n 2 2-Verteilung (Tabelle A.4). 35/86 Die Theorie Beidseitige Alternative Vergleich zweier Stichproben Ungepaarter t-test Verwerfungsregel Nullhypothese (H 0 ): µ 2 = µ 1 Alternative (H 1 ): µ 2 µ 1. Verwirf H 0 zugunsten von H 1, falls T (x) t n1 +n 2 2;1 α/2. p-wert p(x) = 2(1 t n1 +n 2 2( T (x) )). t n1 +n 2 2 Verteilungsfunktion der t n1 +n 2 2-Verteilung (Tabelle A.4). 36/86

Vergleich zweier Stichproben Ungepaarter t-test Beispiel: Backenzähne von Hipparions Die Daten H. libycum H. africanum x A = 25.9, s A = 2.2 x A s A x A + s A x L = 28.4, s L = 4.3 x L s L x L + s L 25 30 35 40 mesiodistale Länge [mm] 37/86 Vergleich zweier Stichproben Ungepaarter t-test Beispiel: Backenzähne von Hipparions Die Daten n A = 39, x A = 25.9, s A = 2.2 n L = 38, x L = 28.4, s L = 4.3 Gepoolte Stichprobenstreuung (n A 1)sA 2 s = + (n L 1)sL 2 n A + n L 2 38 2.22 + 37 4.3 = 2 = 3.402. 39 + 38 2 Es folgt T (x) = x L x A 28.4 25.9 = 1 s n A + 1 3.402 1/39 + 1/38 = 3.22. n L 38/86

Vergleich zweier Stichproben Ungepaarter t-test Beispiel: Backenzähne von Hipparions Durchführung des Tests Nullhypothese µ 1 = µ 2, Alternative µ 1 µ 2 (beidseitig). Test verwirft zum Niveau α = 1%, wenn T (x) > t na +n L 2;1 α/2 = t 75;0.995 2.65. Tatsächliche Daten: T (x) = 3.22 > 2.65. p-wert p(x) = 2(1 t na +n L 2( T (x) )) = 2(1 t 75 (3.22)) = 2(1 0.998) = 0.002. Diesen p-wert sollte man nicht glauben, weil die Modellanahmen zu optimistisch waren. 39/86 Vergleich zweier Stichproben Ungepaarter t-test Beispiel: Backenzähne von Hipparions Fazit Der ungepaarte Zweistichproben-t-Test verwirft die Nullhypothese, dass die mesiodistale Länge der Backenzähne bei Hipparion africanum und Hipparion libycum gleich Erwartungswert hätten, zu Gunsten der zweiseitigen Alternative zum Niveau 1%. 40/86

Vergleich zweier Stichproben Die Theorie (Welch Test) Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Annahme: Wir haben zwei unabhängige Stichproben x 1,1,..., x 1,n1 und x 2,1,..., x 2,n2. Die x 1,i stammen aus einer Normalverteilung mit (unbekanntem) Mittelwert µ 1 und unbekannter Varianz σ 2 1 > 0, die x 2,i aus einer Normalverteilung mit (unbekanntem) Mittelwert µ 2 und möglicherweise anderer Varianz σ 2 2. 41/86 Vergleich zweier Stichproben Die Theorie (Welch Test) Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Seien s 1 = 1 n 1 (x 1,i x 1 ) n 1 1 2, i=1 s 2 = 1 n 2 (x 2,i x 2 ) n 2 1 2, i=1 die (korrigierten) Stichprobenstreuungen. 42/86

Vergleich zweier Stichproben Die Theorie (Welch Test) Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Unter der Hypothese µ 1 = µ 2 ist die Teststatistik T (x) = x 2 x 1 s 2 1 n 1 + s2 2 n 2 ungefähr t-verteilt mit f Freiheitsgraden, wobei f aus den Daten geschätzt wird: ( ) s 2 2 1 n 1 + s2 2 n 2 f =. s 4 1 n 2 1 (n 1 1) + s4 2 n 2 2 (n 2 1) 43/86 Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Die Theorie (Welch Test) Linksseitige Alternative Verwerfungsregel Nullhypothese (H 0 ): µ 2 = µ 1 Alternative (H 1 ): µ 2 < µ 1. Verwirf H 0 zugunsten von H 1, falls T (x) t f ;1 α. p-wert p(x) = t f (T (x)) = 1 t f ( T (x)). t f Verteilungsfunktion der t f -Verteilung (Tabelle A.4). 44/86

Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Die Theorie (Welch Test) Rechtsseitige Alternative Verwerfungsregel Nullhypothese (H 0 ): µ 2 = µ 1 Alternative (H 1 ): µ 2 > µ 1. Verwirf H 0 zugunsten von H 1, falls T (x) t f ;1 α. p-wert p(x) = t f ( T (x)) = 1 t f (T (x)). t f Verteilungsfunktion der t f -Verteilung (Tabelle A.4). 45/86 Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Die Theorie (Welch Test) Beidseitige Alternative Verwerfungsregel Nullhypothese (H 0 ): µ 2 = µ 1 Alternative (H 1 ): µ 2 µ 1. Verwirf H 0 zugunsten von H 1, falls T (x) t f ;1 α/2. p-wert p(x) = 2(1 t f ( T (x) )). t f Verteilungsfunktion der t f -Verteilung (Tabelle A.4). 46/86

Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Versuchsaufbau im Pflanzenphysiologischen Praktikum In vier Petrischalen werden jeweils exakt 100 Samen Gartenkresse ausgebracht. Gewässert wird mit (A) Aqua dest. (zur Kontrolle) (B) ABS Lösung (C) Saccharose-Lösung (D) Saccharose-ABS-Lösung Nach zwei Tagen wird gezählt, wie viele Samen gekeimt haben. 47/86 Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Im Praktikum wird jeder Versuch dreimal durchgeführt. Versuch A B C D Keime Schale 1 90 85 45 25 Keime Schale 2 88 87 44 27 Keime Schale 3 91 75 45 29 0 20 60 100 A B C D 48/86

Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung 0 20 60 100 A B C D (A) Aqua dest. (B) ABS (C) Saccharose (D) Saccharose- ABS Fragen Ist die Hemmung bei B schon vorhanden? Hemmt Saccharose (C)? Hemmt Saccharose mit ABS (D) stärker als Saccharose? Ist die Wirkung von Saccharose und ABS gleich? 49/86 Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Vergleich C gegen D Vermutung: Hemmung bei ABS+Saccharose (D) stärker als bei Saccharose (C). Test zum Niveau α = 1% soll Klarheit schaffen. Nullhypothese: (D) genauso wie (C) Alternative: (D) hemmt stärker. 50/86

Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Vergleich C gegen D, Welch Test Daten x C,1 = 45, x C,2 = 44, x C,3 = 45 x D,1 = 25, x D,2 = 27, x D,3 = 29 Idee: Daten etwa normalverteilt mit unbekannten Mittelwerten µ C und µ D und unbekannten Varianzen σ 2 C, σ2 D. Nullhypothese (H 0 ) µ C = µ D Alternative (H 1 ) µ C > µ D. Linksseitiger Zwei-Stichproben t-test mit unterschiedlichen Varianzen (Welch Test). 51/86 Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Vergleich C gegen D, Welch Test x C,1 = 45, x C,2 = 44, x C,3 = 45 x D,1 = 25, x D,2 = 27, x D,3 = 29 x C = 44.67, x D = 27. s C = 1 3 (x C,i x C ) 2 2 i=1 1 = 2 ((45 44.67)2 + (44 44.67) 2 + (45 44.67) 2 ) = 0.57735. 52/86

Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Vergleich C gegen D, Welch Test x C,1 = 45, x C,2 = 44, x C,3 = 45 x D,1 = 25, x D,2 = 27, x D,3 = 29 x C = 44.67, x D = 27. s D = 1 3 (x D,i x D ) 2 2 i=1 1 = 2 ((25 27)2 + (27 27) 2 + (29 27) 2 ) = 2. 53/86 Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Vergleich C gegen D, Welch Test t-statistik T (x) = Freiheitsgrade f = x C = 44.67, x D = 27. s C = 0.57735, s D = 2. x D x C = + s2 D nd s 2 C n C ( s 2 C n C + s2 D nd ) 2 sc 4 + s4 nc 2 D (n C 1) nd 2 (n D 1) 27 44.67 0.5735 2 + 22 3 3 = 14.7. =... = 2.331. 54/86

Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Vergleich C gegen D, Welch Test t-statistik Freiheitsgrade T (x) = 14.7. f = 2.331. Der linksseitige Test zum Niveau α = 0.01 verwirft H 0, falls T (x) < t f,1 α = t 2.331;0.99 5.77. (Alternativ: Tabellenwert t 2;0.99 = 6.96) Wegen T (x) = 14.7 < 5.77 verwirft der Test zum Niveau 1% die Nullhypothese. p-wert p(x) = t 2.331 ( 14.7) = 0.0012. Alternativ: Tabellenwert p(x) t 2 ( 14.7) = 0.0023. 55/86 Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Vergleich C gegen D, Ergebnis Mit Hilfe eines ungepaarten einseitigen t-tests bei unterschiedlichen Varianzen (Welch Test) wird die Nullhypothese (Saccharose hemmt die Keimung gleich gut wie ein Lösung mit Saccharose und ABS) auf dem Niveau 1% gegen die Alternative (S hemmt nicht so gut wie S+ABS) verworfen. Der p-wert beträgt p 0.0023 (bzw. p = 0.0012, wenn man exakt mit dem Computer rechnet, statt den p-wert nach der Tabelle der t 2 -Verteilung anzunähern). 56/86

Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Vergleich C gegen B Hemmt Saccharose (C) genauso gut wie ABS (B)? Zweiseitiger ungepaarter t-test bei unterschiedlichen Varianzen (Welch Test) zum Niveau α = 1%. 57/86 Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Vergleich C gegen B, Daten t-statistik Freiheitsgrade x C = 44.67, x B = 82.333. s C = 0.57735, s B = 6.4291. T (x) = x C x B s 2 C Beidseitiger Test verwirft, falls n C + s2 B n B f = 2.032. = 10.1. T (x) > t 2.032;0.995 t 2;0.995 = 9.92. Wegen T (x) = 10.1 verwirft der Test zum Niveau 1%. p-wert 2(1 t 2.032 (10.1)) 2(1 t 2 (10.1)) = 0.0097 0.01. 58/86

Vergleich zweier Stichproben Ungepaarter t-test bei unterschiedlicher Varianz, Welch Test Beispiel: Versuch zur Keimhemmung Vergleich C gegen B, Ergebnis Der zweiseitige ungepaarte t-test bei unterschiedlicher Varianz (Welch Test) verwirft die Nullhypothese (Saccharose hemmt Keimung gleich gut wie ABS) gegen die beidseitige Alternative zum Niveau 1%. Der p-wert ist etwa 0.01. 59/86 Vergleich zweier Stichproben Vergleich: Gepaarter vs ungepaarter t-test Vergleich: Gepaarter vs ungepaarter t-test Wenn die Stichprobenlänge unterschiedlich ist, ergibt gepaart keinen Sinn. Wenn die Stichprobenlänge gleich ist: Sind die Stichproben unabhängig voneinander? Falls ja, dann ungepaart testen. Ein gepaarter Test würde sinnlose Abhängigkeiten unterstellen und hätte auch eine geringere Schärfe. Sind die Stichproben voneinander abhängig? (z.b. Messungen von denselben Individuen bzw. Objekten) Falls ja, dann ist ein gepaarter Test sinnvoll. Bei starker Abhängigkeitsstruktur hat der gepaarte t-test größere Schärfe (da der Test von Variabilität zwischen den Individuen bereinigt ist) 60/86

Nichtparametrische Lagetests Der Mediantest Beispiel: Medikamententest Bei der Behandlung mit dem etablierten Herzmedikament XY lebt die Hälfte der Patienten noch acht Jahre oder länger. Bei einem neuen Medikament wurde in einer Langzeitstudie an 20 Patienten festgestellt, wie lange die Patienten noch leben: Patient Nr. 1 2 3 4 5 6 7 8 9 10 Lebensdauer x i 45 0 8 28 4 2 6 23 35 7 Patient Nr. 11 12 13 14 15 16 17 18 19 20 Lebensdauer x i 27 1 4 12 2 24 10 3 27 24 Ist das neue Medikament besser als das etablierte? 61/86 Nichtparametrische Lagetests Der Mediantest Beispiel: Medikamententest Nullhypothese H 0 : Alternative H 1 : Beide gleich gut. Neues Medikament besser. Formal: Nullhypothese H 0 : Lebensdauer des neuen Medikaments hat einen Median von höchstens 8 Jahren. Alternative H 1 : Lebensdauer des neuen Medikaments hat einen Median von mehr als 8 Jahren. 62/86

Nichtparametrische Lagetests Der Mediantest Beispiel: Medikamenentest Sei T (x) die Anzahl der Werte x i mit x i 8. Unter H 0 ist für jedes i: Also ist T (x) b 20,0.5. P[x i 8] = 1 2. Gilt H 1, so ist T (x) b 20,p mit p > 0.5. Große Werte von T (x) stützen H 1. Der p-wert ist p = 20 k=t (x) b 20,0.5 (k). 63/86 Nichtparametrische Lagetests Der Mediantest Beispiel: Medikamententest Patient Nr. 1 2 3 4 5 6 7 8 9 10 Lebensdauer x i 45 0 8 28 4 2 6 23 35 7 Patient Nr. 11 12 13 14 15 16 17 18 19 20 Lebensdauer x i 27 1 4 12 2 24 10 3 27 24 Wir haben also und p = 20 k=11 T (x) = 11 b 20,0.5 (k) = 0.411. Die Ergebnisse geben also keinen Hinweis darauf, dass das neue Medikament besser als das etablierte wäre. 64/86

Nichtparametrische Lagetests Theorie: Mediantest Formale Problemstellung Der Mediantest Sei m P der bekannte Median einer gewissen Verteilung P (altes Medikament) und m Q der Median der Verteilung Q (neues Medikament). Daten: x 1,..., x n gezogen nach der Verteilung Q. T (x) =Anzahl der Werte x i mit x i > m P. Nullhypothese H 0 : Alternative H 1 : m P = m Q m P > m Q (linksseitig) m P < m Q (rechtsseitig) m P m Q (beidseitig). 65/86 Nichtparametrische Lagetests Theorie: Mediantest Linksseitige Alternative m P > m Q Der Mediantest p-wert ( ) T (x) n 1 T (x) 2 p = b n,0.5 (k) 1 Φ. n/4 k=0 Verwerfungsregel H 0 wird zum Niveau α verworfen, falls p α. 66/86

Nichtparametrische Lagetests Theorie: Mediantest Rechtsseitige Alternative: m P < m Q Der Mediantest p-wert p = n k=t (x) b n,0.5 (k) 1 Φ ( ) T (x) n+1 2. n/4 Verwerfungsregel H 0 wird zum Niveau α verworfen, falls p α. 67/86 Nichtparametrische Lagetests Theorie: Mediantest Beidseitige Alternative: m P m Q Der Mediantest p-wert und T (x) p = 2 b n,0.5 (k) falls T (x) < n/2 p = 2 k=0 n k=t (x) b n,0.5 (k) falls T (x) > n/2. [ ( )] T (x) n 2 1 2 In beiden Fällen gilt p 2 1 Φ. n/4 Verwerfungsregel H 0 wird zum Niveau α verworfen, falls p α. 68/86

Nichtparametrische Lagetests Wilcoxon Rangsummentest Beispiel: Hipparion Reloaded Niemand sagt Ihnen, dass die Größen der Backenzähne normalverteilt sind. Was kann man ohne diese Annahme noch rechnen? 69/86 Rangsummen Nichtparametrische Lagetests Wilcoxon Rangsummentest Gegeben zwei Stichproben x 1, x 2,..., x m und y 1, y 2,..., y n. Setze U i = Rang von x i in den y 1,..., y n = Anzahl der j mit y j < x i m und definiere die Rangsumme U(x, y) = U i. Beispiel mit m = 4 und n = 7 x i 4 1.3 5.1 2 i=1 y j 11 3 5 4.2 6.1 2.5 14 Wert 1.3 2 2.5 3 4 4.2 5 5.1 6.1 11 14 Rang U i 0 0 2 4 Rangsumme U(x, y) = 0 + 0 + 2 + 4 = 6. 70/86

Rangsummen Nichtparametrische Lagetests Wilcoxon Rangsummentest Idee Entstammen die x i und y j der gleichen Verteilung (H 0 ), so sollte U i n/2 sein und U mn 2. U(x, y) groß zeigt an, dass (x i ) tendenziell größer ist als (y j ). U(x, y) klein zeigt an, dass (x i ) tendenziell kleiner ist als (y j ). 71/86 Rangsummen Nichtparametrische Lagetests Wilcoxon Rangsummentest Die Verteilung U m,n von U(x, y) unter H 0 ist tabelliert und heißt Wilcoxon-U-Verteilung mit Parametern m und n. Für große m, n ist U(x, y) mn 2 approx. N 0,1. mn(m+n+1) 12 Also können wir das Quantil u m,n;α durch das Quantil z α approximativ ausrechnen: u m,n;α mn 2 + mn(m + n + 1) 12 z α. 72/86

Nichtparametrische Lagetests Wilcoxon Rangsummentest Wilcoxon Rangsummentest Die Theorie Formale Problemstellung Die Werte der Stichprobe x 1,..., x m sind unabhängig und nach der Verteilung P gezogen. Die Werte der Stichprobe y 1,..., y n sind unabhängig und nach der Verteilung Q gezogen. Nullhypothese H 0 : Alternative H 1 : P = Q P tendenziell größer als Q (linksseitig) P tendenziell kleiner als Q (rechtsseitig) P Q (beidseitig) 73/86 Nichtparametrische Lagetests Wilcoxon Rangsummentest Wilcoxon Rangsummentest Linksseitige Alternative: P größer als Q Verwerfungsregel Verwirf H 0 zugunsten von H 1, falls U(x, y) > u m,n;1 α mn 2 + mn(m + n + 1) 12 z 1 α. p-wert mn U(x, y) p 1 Φ 2. mn(m+n+1) 12 74/86

Nichtparametrische Lagetests Wilcoxon Rangsummentest Wilcoxon Rangsummentest Rechtsseitige Alternative: P kleiner als Q Verwerfungsregel Verwirf H 0 zugunsten von H 1, falls U(x, y) < u m,n;α mn 2 + mn(m + n + 1) 12 z α. p-wert p 1 Φ U(x, y) mn 2. mn(m+n+1) 12 75/86 Nichtparametrische Lagetests Wilcoxon Rangsummentest Wilcoxon Rangsummentest Beidseitige Alternative: P Q Verwerfungsregel Verwirf H 0 zugunsten von H 1, falls U(x, y) > u m,n;1 α/2 mn 2 + mn(m + n + 1) 12 z 1 α/2. oder U(x, y) < u m,n;α/2 mn mn(m + n + 1) 2 + z α/2. 12 p-wert p 2 1 Φ U(x, y) mn 2 mn(m+n+1) 12. 76/86

Nichtparametrische Lagetests Wilcoxon Rangsummentest Beispiel: Hipparion Reloaded Die Daten Libycum 23 25 30 26 28.5 28.5 25.5 24 35 23 25 27 26 26 40 32 33 30 26 35 24 32.5 25 26 27 30 36 25 34 29 22 26 37 25.5 29 30.5 26.5 27 Africanum 30 24 26 23 23 23 29 29 26.5 24 24.5 23 27 27 27 27 27 25 24.5 26 27 26 25 23 23.5 24 25 27 25 24 26.5 24 28.5 31 28 31 27.5 24 25 77/86 Nichtparametrische Lagetests Wilcoxon Rangsummentest Beispiel: Hipparion Reloaded Die Daten, U-Statistik Libycum: m = 38 Zähne, Africanum: n = 39 Zähne. Durch mühseliges Ausrechnen von Hand (oder mit dem Computer) erhält man U(Lib, Afr) = 990. Wir verwerfen die Nullhypothese Libycum=Africanum zum Niveau 1% zugunsten der beidseitigen Alternative, falls U > u 38,39;0.995 = 992 oder U < u 38,39;0.005 = 490 (Tabelle: A.8). Beides ist nicht der Fall, also wird die Nullhypothese zum Niveau 1% nicht verworfen. 78/86

Nichtparametrische Lagetests Wilcoxon Rangsummentest Beispiel: Hipparion Reloaded Die Daten, U-Statistik m = 38, n = 39, U(Lib, Afr) = 990. p-wert: p 2 1 Φ [ = 2 1 Φ U(Lib, Afr) mn 2 mn(m+n+1) 12 ( )] 990 741 9633 = 2(1 Φ(2.537)) 2(1 0.9943) = 0.0114. 79/86 Nichtparametrische Lagetests Wilcoxon Rangsummentest Beispiel: Hipparion Reloaded Fazit Der zweiseitige Wilcoxon Rangsummentest verwirft die Hypothese, dass Hipparion Africanum und Libycum unterschiedliche mesiodistale Zahnlänge haben zum Niveau 1% nicht. Der p-wert beträgt p = 0.0114 80/86

χ 2 -Test Das Grundproblem χ 2 -Test χ 2 -Test Wir beobachten ein Merkmal in endlich vielen Ausprägungen i = 1,..., k mit Häufigkeiten x 1,..., x k. Gesamtzahl n = x 1 +... + x k. Nach einer Theorie sollte der Anteil von Typ i gleich p i sein, also die absolute Häufigkeit etwa E i = p i n. Es soll ein Test zum Niveau α entwickelt werden, der diese Theorie prüft. 81/86 χ 2 -Test Teststatistik χ 2 -Test χ 2 -Test Beobachtungen x 1,..., x k. Gesamtzahl n = x 1 +... + x k. Erwartete Häufigkeiten E i = p i n. Gewichtete quadratische Abweichungen als Teststatistik T (x) = k i=1 (x i E i ) 2 E i. Ist χ 2 (x) zu groß, so wird die Hypothese verworfen. 82/86

χ 2 -Test Verwerfungsregel χ 2 -Test χ 2 -Test Unter H 0 ist T (x) chiquadrat-verteilt (χ 2 f ) mit f = k 1 Freiheitsgraden. Ist T (x) > χ 2 f ;1 α, so wird die Nullhypothese zum Niveau α verworfen. Der p-wert ist p = 1 χ 2 f (T (x)). 83/86 χ 2 -Test χ 2 -Test Beispiel: Hardy-Weinberg Gesetz Fragestellung In einer sehr großen Population tritt an einem Locus das Gen A mit Wahrscheinlichkeit p = 0.53 auf, das Gen a mit Wahrscheinlichkeit 1 p = 0.47. Nach dem Hardy-Weinberg Gesetz sind die Anteile AA Aa aa p 2 = 0.2809 2p(1 p) = 0.4982 (1 p) 2 = 0.2209 In einer Teilpopulation der Größe n soll die Gültigkeit des Hardy-Weinberg Gesetzes geprüft werden. 84/86

χ 2 -Test χ 2 -Test Beispiel: Hardy-Weinberg Gesetz Der Test Die Hypothese HW Gesetz gilt soll zum Niveau 1% geprüft werden. Es werden die Daten x AA, x Aa und x aa mit Gesamtumfang n = 10 000 erhoben. Teststatistik T (x) = (x AA 2809 n) 2 2809 2 + (x Aa 4982) 2 4982 2 + (x aa 2209) 2 2209 2. Der Test verwirft, falls T (x) > χ 2;0.99 = 9.21 (Tabelle A.5). 85/86 χ 2 -Test χ 2 -Test Beispiel: Hardy-Weinberg Gesetz Der Test, Daten und Durchführung Teststatistik AA Aa aa 2701 4852 2447 (2701 2809 n)2 T (x) = + 2809 2 = 33.187. (4852 4982)2 (2447 2209)2 + 4982 2 2209 2 Der Test verwirft die Nullhypothese zum Niveau 1%, weil T (x) = 33.187 > χ 2;0.99 = 9.21. p-wert p(x) = 1 χ 2 2(33.187) = 6.2 10 8. 86/86