Gepaarter und ungepaarter t-test. Statistik (Biol./Pharm./HST) FS 2014

Ähnliche Dokumente
Gepaarter und ungepaarter t-test. Statistik (Biol./Pharm.) Herbst 2012

Gepaarter und ungepaarter t-test. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015

Hypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Mathematik IV: Statistik

Zusammenfassung PVK Statistik

Auswertung und Lösung

Statistik II. IV. Hypothesentests. Martin Huber

Teil XI. Hypothesentests für zwei Stichproben. Woche 9: Hypothesentests für zwei Stichproben. Lernziele. Beispiel: Monoaminooxidase und Schizophrenie

Tests für Erwartungswert & Median

Teil VIII Hypothesentests für zwei Stichproben

Schriftliche Prüfung (1 Stunde)

Kategoriale und metrische Daten

Bemerkungen zu statistischen Tests

Nachgefragte Aufgaben über spezifische Themen

Online-Aufgaben Statistik (BIOL, CHAB) Auswertung und Lösung

Musterlösung zu Serie 8

Mathematik für Biologen

Wahrscheinlichkeit und Statistik BSc D-INFK

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Schriftliche Prüfung (90 Minuten)

Auswertung und Lösung

Mathematik für Biologen

das Kleingedruckte...

Biostatistik, Winter 2011/12

Statistisches Testen

3 Randomisierungs-Tests

Musterlösung. Kind Blume (beredet) Blume (nicht beredet)

Dr. M. Kalisch. Statistik (für Biol./Pharm. Wiss.) Winter Musterlösung

ANalysis Of VAriance (ANOVA) 2/2

Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Schriftliche Prüfung (2 Stunden)

Wahrscheinlichkeit und Statistik BSc D-INFK

Schriftliche Prüfung (90 Minuten)

Auswertung und Lösung

Eine Einführung in R: Statistische Tests

PVK Statistik Tag Carlos Mora

Aufgaben. d) Seien X und Y Poissonverteilt mit Parameter µ, X, Y P(µ). 2. Dann ist die Summe auch Poissonverteilt mit (X + Y ) P(2µ).

3 Grundlagen statistischer Tests (Kap. 8 IS)

Stochastik Praktikum Testtheorie

Bachelorprüfung: Statistik (1 Stunde)

5. Seminar Statistik

Prüfung. Wahrscheinlichkeit und Statistik. ETH Zürich HS 2015 Prof. Dr. P. Embrechts Januar Nachname. Vorname. Legi Nummer

Teil X. Hypothesentests für eine Stichprobe. Woche 8: Hypothesentests für eine Stichprobe. Lernziele. Statistische Hypothesentests

Grundlagen der schließenden Statistik

ANalysis Of VAriance (ANOVA) 1/2

Marcel Dettling. GdM 2: LinAlg & Statistik FS 2017 Woche 12. Winterthur, 17. Mai Institut für Datenanalyse und Prozessdesign

Statistische Methoden in den Umweltwissenschaften

Eine Einführung in R: Statistische Tests

Konfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt

Schriftliche Prüfung (2 Stunden)

Mathematik IV: Statistik

Biostatistik. Lösung

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

Bemerkungen bzgl statistichen Tests. (basierend auf Slides von Lukas Meier)

11. Nichtparametrische Tests

Statistik II für Betriebswirte Vorlesung 1

Teil VII Hypothesentests für eine Stichprobe

Permutationstests II.

Zusammenfassung 11. Sara dos Reis.

Vorlesung: Statistik II für Wirtschaftswissenschaft

Schriftliche Prüfung (90 Minuten)

Klassifikation von Signifikanztests

Klausur zur Vorlesung

Multiple Vergleiche. Werner Brannath. VO Biostatistik im WS 2006/2007

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Mathematik für Biologen

Fragestellungen. Ist das Gewicht von Männern und Frauen signifikant unterschiedlich? (2-sample test)

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Einführung in Quantitative Methoden

Wahrscheinlichkeit und Statistik BSc D-INFK

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

7.2 Mittelwert einer Stichprobe

BIOMETRIE I - KLINISCHE EPIDEMIOLOGIE

Biostatistik, WS 2013/2014 Wilcoxons Rangsummen-Test

Stochastik Serie 11. ETH Zürich HS 2018

Software oder Tabellen (nicht Thema dieser Veranstaltung).

Mathematische und statistische Methoden II

Schriftliche Prüfung (90 Minuten)

Einführung in die Induktive Statistik: Testen von Hypothesen

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

T-Test für unabhängige Stichproben

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Statistik II. Statistische Tests. Statistik II

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden

Mathematik für Biologen

Schließende Statistik: Hypothesentests (Forts.)

Prüfung. Wahrscheinlichkeit und Statistik. ETH Zürich SS 2016 Prof. Dr. P. Embrechts August BSc INFK. Nachname. Vorname.

Lösungen zu den Übungsaufgaben in Kapitel 10

Deskriptive Beschreibung linearer Zusammenhänge

PVK Statistik Carlos Mora

7. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17

Sitzung 4: Übungsaufgaben für Statistik 1

Schriftliche Prüfung (90 Minuten)

Schriftliche Prüfung (120 Minuten)

Transkript:

Gepaarter und ungepaarter t-test Statistik (Biol./Pharm./HST) FS 2014

Wdh: t-test für eine Stichprobe 1. Modell: X i ist eine kontinuierliche MessgrÄosse; X 1 ; : : : ; X n iid N (¹; ¾ 2 X ); ¾ X wird durch c¾ X geschäatzt 2. Nullhypothese: H 0 : ¹ = ¹ 0, Alternative: H A : ¹ 6= ¹ 0 (oder \<" oder \>") 3. Teststatistik: T = (X n ¹ 0 ) d¾ Xn = p n(xn ¹ 0 ) c¾ X = beobachtet erwartet geschäatzter Standardfehler : Verteilung der Teststatistik unter H 0 : T» t n 1 4. Signi kanzniveau: 5. Verwerfungsbereich fr die Teststatistik: K = ( 1; t n 1;1 2 ] [ [t n 1;1 2 ; 1) bei H A : ¹ 6= ¹ 0 ; K = ( 1; t n 1;1 ] bei H A : ¹ < ¹ 0 ; K = [t n 1;1 ; 1) bei H A : ¹ > ¹ 0 : 6. Testentscheid: Ä UberprÄufe, ob der beobachtete Wert der Teststatistik im Verwerfungsbereich liegt. 1

Mr. X Krebs

Zwei Krebstypen 1 Typ 1: Mild Chemotherapie nicht nötig 2 Typ 2: Schwer Chemotherapie nötig

Problem: Typ erst nach langer Zeit erkennbar?? 1 2 Jetzt Chemotherapie oder nicht?

Wie kann man verschiedene Arten von Krebs frühzeitig unterscheiden?

Typ 1 Typ 2 Vergleiche Krebszellen

Idee: Vergleiche Aktivität innerhalb der Zelle

Zentrales Dogma der Molekularbiologie Zelle GEN DNA mrna Protein

Entnehme mrna

Entnehme mrna

Nehme einen Microarray

Microarray: Zoom In

mrna auf Microarray

mrna auf Microarray

Auf dem Microarray

Voila: Ein Feuerwerk!

Helligkeit = Aktivität des Gens Gen 5 sehr aktiv

Helligkeit = Aktivität des Gens Gen 6 nicht aktiv

Für jeden Patienten ein Microarray Typ 1 Typ 2

Microarray: Aktivität aller Gene in der Zelle Typ 1 Typ 2 Gen Pat. 1 Pat. 2 Pat. 3 Pat. 4 Pat. 5 1 2.1 1.3 1.9 1.2 1.4 2 2.4 2.3 2.5 2.1 2.0 50000 Gen Pat. 1 Pat. 2 Pat. 3 Pat. 4 1 1.9 2.5 2.4 2.9 2 2.3 2.2 2.4 2.1 50000

Microarray: Aktivität aller Gene in der Zelle Typ 1 Typ 2 Gen Pat. 1 Pat. 2 Pat. 3 Pat. 4 Pat. 5 1 2.1 1.3 1.9 1.2 1.4 2 2.4 2.3 2.5 2.1 2.0 50000 Gen Pat. 1 Pat. 2 Pat. 3 Pat. 4 1 1.9 2.5 2.4 2.9 2 2.3 2.2 2.4 2.1 50000

Microarray: Aktivität aller Gene in der Zelle Typ 1 Typ 2 Gen Pat. 1 Pat. 2 Pat. 3 Pat. 4 Pat. 5 1 2.1 1.3 1.9 1.2 1.4 2 2.4 2.3 2.5 2.1 2.0 50000 Gen Pat. 1 Pat. 2 Pat. 3 Pat. 4 1 1.9 2.5 2.4 2.9 2 2.3 2.2 2.4 2.1 50000 Ist Gen 1 bei Typ 2-Tumorzellen signifikant aktiver? Falls ja: Gen 1 kann Typ1-Tumor und Typ-2 Tumor unterscheiden!

Falls ja: Gen 1 nicht aktiv Gen 1 aktiv Typ 1 Typ 2 Chemotherapie Chemotherapie

Microarray: Aktivität aller Gene in der Zelle Typ 1 Typ 2 Gen Pat. 1 Pat. 2 Pat. 3 Pat. 4 Pat. 5 1 2.1 1.3 1.9 1.2 1.4 2 2.4 2.3 2.5 2.1 2.0 50000 Gen Pat. 1 Pat. 2 Pat. 3 Pat. 4 1 1.9 2.5 2.4 2.9 2 2.3 2.2 2.4 2.1 50000 Ist Gen 1 bei Typ 2-Tumorzellen signifikant aktiver? Ungepaarter t-test

Ungepaarter t-test: 1/3 1. Modell: X 1 ; : : : ; X n iid» N (¹ X ; ¾ 2 ); Y 1 ; : : : ; Y m iid» N (¹ Y ; ¾ 2 ): 2. Nullhypothese: H 0 : ¹ X = ¹ Y : Alternative: H A : ¹ X 6= ¹ Y (zweiseitig) oder H A : ¹ X > ¹ Y (einseitig) oder H A : ¹ X < ¹ Y (einseitig) 25

Ungepaarter t-test: 2/3 3. Teststatistik: x = 1 n x i T = X n Y m S pool p 1=n + 1=m wobei S 2 pool = = 1 n + m 2 1 n + m 2 Ã X n (X i X n ) 2 + i=1! mx (Y i Y m ) 2 = i=1 (n 1)^¾ 2 x + (m 1)^¾ y 2 : Verteilung der Teststatistik unter H 0 : T» t n+m 2. 1 n 1 x i x 2 26

Ungepaarter t-test: 3/3 4. Signi kanzniveau: 5. Verwerfungsbereich fäur die Teststatistik: ( 1; t n+m 2;1 =2 ] [ [t n+m 2;1 =2 ; 1) bei Alternative H A : ¹ X 6= ¹ Y ; [t n+m 2;1 ; 1) bei Alternative H A : ¹ X > ¹ Y ; ( 1; t n+m 2;1 ] bei Alternative H A : ¹ X < ¹ Y : 6. Testentscheid: Entscheide, ob der beobachtete Wert der Teststatistik im Verwerfungsbereich der Teststatistik liegt. 27

Microarray: Aktivität aller Gene in der Zelle Typ 1 Typ 2 Gen Pat. 1 Pat. 2 Pat. 3 Pat. 4 Pat. 5 1 2.1 1.3 1.9 1.2 1.4 2 2.4 2.3 2.5 2.1 2.0 50000 Gen Pat. 1 Pat. 2 Pat. 3 Pat. 4 1 1.9 2.5 2.4 2.9 2 2.3 2.2 2.4 2.1 50000 n = 5, m = 4, x = 1.58, y = 2.43, σ x = 0.40, σ y = 0.41 Ungepaarter t-test

Happy End!

Happy End!

Gepaart vs. Ungepaart Bsp: Augeninnendruck; ein Auge behandelt, das andere nicht (gepaarter Test ist angebracht) Gemäss Vorraussetzungen dürfte auch ein ungepaarter Test angewendet werden Augendruck Ungepaart: Intuition Teststatistik: T = X Y σ X H 0 : μ X = μ Y Gepaart: Differenz D i = X i Y i Teststatistik T = D σ D links rechts 31

Gepaart vs. Ungepaart: Simulationsstudie H 0 : μ D = 0 bzw. H 0 : μ X = μ Y ; n=m=10 X~N 100, σ X 2, D~N 2, 1, Y = X + D ~ N(102, 1 + σ x 2 ) gepaarte Situation Der gepaarte t-test hat mehr Macht, wenn die Daten verrauscht sind. gepaart ungepaart X~N(100, 1) Y~N(102, 2) D~N(2, 1) X~N(100, 49) Y~N(102, 50) D~N(2, 1) 32

t-test falls Varianz in Gruppen unterschiedlich (aka Welch-Test) Grundidee identisch Teststatistik und Verteilung falls H 0 stimmt ist komplizierter Computer: Dieser Test ist meist der default t-test Praxis: Man sollte immer annehmen, dass die Varianz der Gruppen unterschiedlich ist; d.h., Welch-Test verwenden Prüfung: Um einfacher rechnen zu können, werden wir beim t-test gleiche Varianzen in den beiden Gruppen annehmen 33

Wa.dichte 0.0 0.3 Mann-Whitney U-Test (aka Wilcoxon Rank-sum Test) Falls Daten nicht normalverteilt X i ~F, i = 1,, n; Y j ~G, j = 1,, m H 0 : F = G H A : F = G + δ (δ 0) (oder einseitig) -2 0 2 4 (d.h., Verteilungen sind verschoben, haben aber gleiche From) Teststatistik: - Bilde Ränge über beide Gruppen hinweg - Falls Gruppen gleich gross sind, sollten Rangsummen etwa gleich sein - Falls Gruppen ungleich, sollten Rangsummen in einem gewissen Verhältnis stehen x 34

Bsp: Mann-Whitney U-Test Behandlung (B) und Kontrolle (K) je 2 Patienten Beobachtung: B: 1.2, 3.1; K: 5.9, 4.4 Gesamtrang: B: 1, 2; K: 4, 3 Rangsumme R in K: 4 + 3 = 7 Falls H 0 stimmt sind alle Ränge in K gleich wahrscheinlich Ränge 1,2 1,3 1,4 2,3 2,4 3,4 R 3 4 5 5 6 7 Z.B. für einseitigen Test: P R 7 = P R = 7 = 1 6 0.167 P-Wert H 0 kann auf dem 5% Niveau nicht verworfen werden Praxis: Computer verwenden 35

Übersicht: Tests für ungepaarte Stichproben Test Annahmen n min (falls n = m) bei α = 0. 05 Macht für ein Beispiel (1) t (σ X = σ Y ) t (σ X σ Y ) MW U-Test σ X = σ Y X i ~N Y i ~N F, G haben gleiche Form iid pro Gruppe x x x x 2 57 % x x 2 56 % x x x 4 53 % (1): X i ~N μ X, σ 2, Y i ~N μ Y, σ 2, n = m = 10; H 0 : μ X = μ Y ; H A : μ X μ Y ; α = 0.05 Macht berechnet für konkrete Alternative: X i ~N 0,1, Y i ~N(1,1) 36

Multiples Testen Microarray Test mit m=1000 Genen 1000 t-tests auf dem 5% Sign.niveau Angenommen, kein Gen hat einen Effekt: Ca. 50 Tests (5% von 1000) werden trotzdem ein signifikantes Ergebnis liefern! 50 Gene werden als wichtig angegeben, obwohl sie gar nicht wichtig sind. Wie erzeugt man eine Liste von wirklich wichtigen Genen? 37

Multiples Testen: Bonferroni Korrektur Wollen eine konservative Liste mit der Eigenschaft: P(mind. ein Fehler 1. Art) α Bonferroni Korrektur: Teste jedes Gen mit Sign.niveau α m, statt α; m ist die Anzahl Gene Begründung: F i : Fehler 1. Art bei Gen i F 2 F 3 F 1 union bound : Gesamtfläche ist sicher kleiner als Summe der Einzelflächen m P F i i=1 m i=1 P F i = m i=1 α m = α Nachteil: Liste ist evtl. extrem konservativ (z.b. gar kein Gen enthalten) 38

Wiederholung: Hypothesentests Für Prüfung Eine Aufgabe: Binomialtest Eine Aufgabe: t-test und Vorzeichentest Test Was wird getestet Bsp Binomialtest t-test: Eine Stichprobe t-test: 2 gepaarte Stichproben Vorzeichentest t-test: 2 ungepaarte Stichproben Ist Anteil in Gruppe gleich π 0? Ist Erwartungswert in Gruppe gleich μ 0? Ist Erwartungswert in beiden Gruppen gleich? Ist Median in Gruppe gleich μ 0? Ist Erwartungswert in beiden Gruppen gleich? Wirksamkeit von Medikament Füllmenge in Getränkeflaschen Reaktionszeit von Hauptund Nebenhand Wie oben Aktivität von Gen XY bei Gesunden und Kranken 39