Eine Einführung in R: Statistische Tests

Ähnliche Dokumente
Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests

Statistisches Testen

das Kleingedruckte...

Biostatistik. Lösung

Teil XI. Hypothesentests für zwei Stichproben. Woche 9: Hypothesentests für zwei Stichproben. Lernziele. Beispiel: Monoaminooxidase und Schizophrenie

Fragestellungen. Ist das Gewicht von Männern und Frauen signifikant unterschiedlich? (2-sample test)

W-Rechnung und Statistik für Ingenieure Übung 13

Teil VIII Hypothesentests für zwei Stichproben

Eine Einführung in R: Deskriptive Statistiken und Graphiken

Eine Einführung in R: Deskriptive Statistiken und Graphiken

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Statistische Tests (Signifikanztests)

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Eine Einführung in R: Varianzanalyse

Eine Einführung in R: Deskriptive Statistiken und Graphiken

Eine Einführung in R: Deskriptive Statistiken und Graphiken

Statistisches Testen

14.3 Das Einstichprobenproblem in R

Blockpraktikum zur Statistik mit R

Statistische Überlegungen: Eine kleine Einführung in das 1 x 1

Statistik für Ingenieure Vorlesung 12

Statistik II für Betriebswirte Vorlesung 1

Vergleich von Gruppen I

Empirische Wirtschaftsforschung

Stochastik Praktikum Testtheorie

Vorlesung: Statistik II für Wirtschaftswissenschaft

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

Bachelorprüfung: Statistik (1 Stunde)

Teil X. Hypothesentests für eine Stichprobe. Woche 8: Hypothesentests für eine Stichprobe. Lernziele. Statistische Hypothesentests

Klassifikation von Signifikanztests

Eine Einführung in R: Varianzanalyse

Biostatistik, WS 2017/18 Der zwei-stichproben-t-test

Biostatistik, WS 2013/2014 Wilcoxons Rangsummen-Test

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

5. Seminar Statistik

3 Grundlagen statistischer Tests (Kap. 8 IS)

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.

Dipl.-Volksw. Markus Pullen Wintersemester 2012/13

Hypothesentests mit R Ashkan Taassob Andreas Reisch

Teil VII Hypothesentests für eine Stichprobe

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Mathematik für Biologen

Klassifikation von Signifikanztests

Eine Einführung in R: Varianzanalyse

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

BIOMETRIE I - KLINISCHE EPIDEMIOLOGIE

Eine Einführung in R: Dichten und Verteilungsfunktionen

Beispiel für Gütefunktionen Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = 0.10

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Fragestellungen. Ist das Gewicht von Männern und Frauen signifiant unterschiedlich? (2-sample test)

Statistik II. IV. Hypothesentests. Martin Huber

Gepaarter und ungepaarter t-test. Statistik (Biol./Pharm.) Herbst 2012

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:

Eine Einführung in R: Dichten und Verteilungsfunktionen

10 Der statistische Test

2 Wiederholung statistischer Grundlagen Schließende Statistik empirischen Information aus Stichprobenrealisation x von X

Übung zur Vorlesung Statistik I WS Übungsblatt 9

Softwaretechnik. Prof. Dr. Rainer Koschke. Fachbereich Mathematik und Informatik Arbeitsgruppe Softwaretechnik Universität Bremen

Statistik II. Statistische Tests. Statistik II

Eine Einführung in R: Dichten und Verteilungsfunktionen

Güteanalyse. Nochmal zur Erinnerung: Hypothesentest. Binominalverteilung für n=20 und p=0,5. Münzwurf-Beispiel genauer

Auswertung und Lösung

Gesamtcholesterin Region A Region B <170 (optimal) 80 >=170 (Risiko)

Klassifikation von Signifikanztests

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015

3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft

Mathematik für Biologen

Mathematik für Biologen

Konfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt

Gesamtcholesterin Region A Region B <170 (optimal) 80 >=170 (Risiko)

Bereiche der Statistik

1. Nennen Sie den für das Merkmal X geeigneten Skalentyp und begründen Sie Ihre Antwort.

> read.table("d:\\reifen.txt",header=t) > Reifen

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Tests für Erwartungswert & Median

3) Testvariable: T = X µ 0

Gepaarter und ungepaarter t-test. Statistik (Biol./Pharm./HST) FS 2014

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Statistik II. IV. Hypothesentests. Martin Huber

Hypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Mathematik für Biologen

Zusammenfassung PVK Statistik

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Einfaktorielle Varianzanalyse

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

Biostatistik, Sommer 2017

Einführung in die Induktive Statistik: Testen von Hypothesen

So berechnen Sie einen Schätzer für einen Punkt

Klassifikation von Signifikanztests

Statistische Tests Version 1.2

Die Familie der χ 2 (n)-verteilungen

Transkript:

I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 25. November 2010 Bernd Klaus, Verena Zuber Statistische Tests 1/38

I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R I. Einführungsbeispiel II. Theorie: Statistische Tests Hypothesen aufstellen Betrachtung der Daten Aufstellen der Prüfgröÿe Durchführen des Tests Testentscheidung III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test t-test - EW einer Population t-test - EW zweier Populationen t-test - EW gepaarter Populationen Der Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R Bernd Klaus, Verena Zuber Statistische Tests 2/38

I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R I. Einführungsbeispiel: Trinkt die Jugend in Europa mehr Alkohol als im Rest der Welt? Untersucht wird die Variable Alkohol im oecd-datensatz: Der Anteil an 13-15 jährigen Jugendlichen, die mindestens zweimal betrunken waren Bernd Klaus, Verena Zuber Statistische Tests 3/38

I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R Erster Schritt: Deskriptive Analyse 1. Graphisch mit dem Boxplot boxplot(alkohol Geo) Boxplot für Europa und Nicht Europa 10 15 20 25 Nicht Europa Europa Bernd Klaus, Verena Zuber Statistische Tests 4/38

I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R 2. Kennzahlen, wie Mittelwert mu<-tapply(alkohol, Geo, FUN=mean, na.rm=true) Nicht-Europa Europa 13.700 15.443 Standardabweichung sigma<-tapply(alkohol, Geo, FUN=sd, na.rm=true) Nicht-Europa Europa 4.518 4.341 Es ist zu erkennen, dass in Europa im Mittel ein höherer Anteil an Jugendlichen schon mindestens zweimal betrunken war als in nicht-europäischen Staaten. Doch dies könnte auch ein Zufall sein! Denn die Beobachtungen beruhen auf Stichproben, sie sind Realisierungen einer Zufallsvariable. Bernd Klaus, Verena Zuber Statistische Tests 5/38

I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R Eigentliches Ziel: Überprüfung von Annahmen über das Verhalten des interessierenden Merkmales in der Grundgesamtheit mittels Stichproben. Annahme: Jugendliche in Europa trinken mehr Alkohol als im Rest der Welt Merkmal: Alkoholkonsum der Jugend Grundgesamtheit: Jugendliche in Europa und im Rest der Welt Stichprobe: Die oecd-daten Für solche Fragestellungen mit gleichzeitiger Kontrolle der Fehlerwahrscheinlichkeit sind statistische Tests geeignet! Bernd Klaus, Verena Zuber Statistische Tests 6/38

I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R Statistisches Testen I 1. Aufstellen von zwei komplementären Hypothesen: Testhypothese (H 0 ): Der Anteil in Europa ist kleiner dem im Rest der Welt µ E µ NE Alternativhypothese (H 1 ): Der Anteil in Europa gröÿer als der im Rest der Welt µ E > µ NE 2. Fehlerwahrscheinlichkeit festlegen: H 0 soll mit einer W'keit von weniger als 5% abgelehnt werden, wenn H 0 wahr ist. Also: wenn der Anteil in Wahrheit kleiner oder gleich ist, soll der Test nur mit einer W'keit von weniger als 5% zu dem (falschen) Ergebnis kommen, dass der Anteil gröÿer ist. Bernd Klaus, Verena Zuber Statistische Tests 7/38

I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R Statistisches Testen II 3. Beobachtete Daten: 2 Gruppen ˆµ ˆσ n Nicht-Europa 13.700 4.518 3 Europa 15.443 4.341 21 4. (Weitere Annahmen: Normalverteilung, Varianzgleichheit) 5. Berechnen der Prüfgröÿe T, einer Kennzahl, die zeigt, wie stark die Gruppenmittel voneinander abweichen: (a) Mittelwertsdierenz der beiden Gruppen (b) Standardisieren mit der entsprechenden Standardabweichung T = (ˆµ E ˆµ NE )/ ( 1 ne + 1 E 1)ˆσ 2 nne )(n E + (n NE 1)ˆσ NE 2 ne + nne 2 (c) (Hypothetische Verteilung der Prüfgröÿe festlegen, hier t-verteilung mit 3 + 21 2 = 22 Freiheitsgraden) Bernd Klaus, Verena Zuber Statistische Tests 8/38

I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R Statistisches Testen III 6. Berechnung der Prüfgröÿe T in R: (a) Mittelwertsdierenz der beiden Gruppen m.diff<-mu[2]-mu[1] (b) Standardisieren mit der entsprechenden Standardabweichung diff.std2 <- sqrt((1/21+1/3)* (20*sigma[2]ˆ2+2*sigma[1]ˆ2)/(21+3-2)) (c) Prüfgröÿe: pg.t <-m.diff/diff.std 0.648 7. Wie wahrscheinlich ist es (unter der Nullhypothese), eine Prüfgröÿe T zu beobachten, die gröÿer oder gleich 0.648 ist? 1-pt(pg.T, df=22) 0.262 Bernd Klaus, Verena Zuber Statistische Tests 9/38

I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R Statistisches Testen IV y 0.0 0.1 0.2 0.3 0.4 0.738 pg.t 0.262 4 2 0 2 4 x Mit hoher W'keit (26.2%) kann eine solche Prüfgröÿe pg.t beobachtet werden, wenn der Mittelwert in Europa und kleiner als der in Nicht-Europa ist. Bernd Klaus, Verena Zuber Statistische Tests 10/38

I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R Statistisches Testen V 8. Entscheidung: Aus diesen Daten kann nicht geschlossen werden, dass in Europa Jugendliche mehr Alkohol trinken als im Rest der Welt. 9. Grund: Zu geringe Fallzahl! Mit n E = n NE = 101 ergibt sich (b) Standardisieren mit der entsprechenden Standardabweichung diff.std <- sqrt((1/101+1/101)* (100*sigma[2]ˆ2+100*sigma[1]ˆ2)/(101+101-2)) (c) Prüfgröÿe: pg.t2 <-m.diff/diff.std2 2.796 (d) Vergleich mit der t-verteilung: 1-pt(pg.T2, df=200) 0.003 Bernd Klaus, Verena Zuber Statistische Tests 11/38

I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R Statistisches Testen IV y 0.0 0.1 0.2 0.3 0.4 0.997 pg.t2 0.003 4 2 0 2 4 Mit nur sehr geringer W'keit (0.003%) kann eine solche Prüfgröÿe pg.t2 beobachtet werden, wenn wenn der Mittelwert in Europa und kleiner als der in Nicht-Europa ist. x Bernd Klaus, Verena Zuber Statistische Tests 12/38

I. Einführungsbeispiel Hypothesen aufstellen II. Theorie: Statistische Tests Betrachtung der Daten III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen Aufstellen -der Test Prüfgröÿe IV. t-test und Wilcoxon-Rangsummen - TestTestentscheidung in R II. Der Baukasten für statistische Test: Wie geht man vor? Bernd Klaus, Verena Zuber Statistische Tests 13/38

I. Einführungsbeispiel Hypothesen aufstellen II. Theorie: Statistische Tests Betrachtung der Daten III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen Aufstellen -der Test Prüfgröÿe IV. t-test und Wilcoxon-Rangsummen - TestTestentscheidung in R Fünf Schritte zum Testergebniss I. Hypothesen aufstellen II. Betrachtung der Daten III. Aufstellen der Prüfgröÿe IV. Durchführen des Tests V. Testentscheidung Bernd Klaus, Verena Zuber Statistische Tests 14/38

I. Einführungsbeispiel Hypothesen aufstellen II. Theorie: Statistische Tests Betrachtung der Daten III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen Aufstellen -der Test Prüfgröÿe IV. t-test und Wilcoxon-Rangsummen - TestTestentscheidung in R I. Hypothesen aufstellen Was soll verglichen werden? Gegen einen festen Wert Zwei Gruppen (t-test) Messwiederholungen Einseitige oder zweiseitige Fragestellung? Beispiel: Einseitige Fragestellung : H 0 : µ 1 µ 2 gegen H 1 : µ 1 > µ 2 Zweiseitige Fragestellung : H 0 : µ 1 = µ 2 gegen H 1 : µ 1 µ 2 Aufstellen der eigentlich interessierenden Alternativhypothese H 1 und der Nullhypothese H 0. Signikanzniveau α festlegen. Bernd Klaus, Verena Zuber Statistische Tests 15/38

I. Einführungsbeispiel Hypothesen aufstellen II. Theorie: Statistische Tests Betrachtung der Daten III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen Aufstellen -der Test Prüfgröÿe IV. t-test und Wilcoxon-Rangsummen - TestTestentscheidung in R Welche Fehler kann man beim Testen machen? Entscheidung: H 0 Entscheidung: H 1 H 0 wahr richtig Fehler 1. Art (α) H 1 wahr Fehler 2. Art (β) richtig Fehler erster Art (α-fehler): Obwohl H 0 wahr ist, entscheidet man sich für H 1 (False Positiv) Fehler zweiter Art (β-fehler): Obwohl H 1 wahr ist, entscheidet man sich für H 0 (False Negativ) Bernd Klaus, Verena Zuber Statistische Tests 16/38

I. Einführungsbeispiel Hypothesen aufstellen II. Theorie: Statistische Tests Betrachtung der Daten III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen Aufstellen -der Test Prüfgröÿe IV. t-test und Wilcoxon-Rangsummen - TestTestentscheidung in R II. Betrachtung der Daten Können Verteilungsannahmen getroen werden? Ja: Parametrische Tests Nein: Nonparametrische Tests Weitere Annahmen wie z.b. Varianzgleichheit in den Gruppen... Aus Schritt I. und II. folgen alle weiteren Schritte! Bernd Klaus, Verena Zuber Statistische Tests 17/38

I. Einführungsbeispiel Hypothesen aufstellen II. Theorie: Statistische Tests Betrachtung der Daten III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen Aufstellen -der Test Prüfgröÿe IV. t-test und Wilcoxon-Rangsummen - TestTestentscheidung in R III. Aufstellen der Prüfgröÿe Aus den Hypothesen ergibt sich die Form der Prüfgröÿe, z.b. die Mittelwertsdierenz Standardisieren mit unter H 0 gültigen Erwartungswert unter H 0 gültigen Standardabweichung Festlegen der Verteilung, die unter H 0 gültig ist. Bernd Klaus, Verena Zuber Statistische Tests 18/38

I. Einführungsbeispiel Hypothesen aufstellen II. Theorie: Statistische Tests Betrachtung der Daten III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen Aufstellen -der Test Prüfgröÿe IV. t-test und Wilcoxon-Rangsummen - TestTestentscheidung in R IV. Durchführen des Tests und V. Testentscheidung Hier sind zwei Werte entscheidend: Kritischer Wert κ: Welchen Wert darf die Prüfgröÿe maximal annehmen, wenn H 0 tatsächlich gültig ist. p-wert: Wahrscheinlichkeit, die vorliegenden Daten zu beobachten, wenn H 0 gültig ist. Entscheidung: H 0 ablehnen, falls die Prüfgröÿe gröÿer als der kritische Wert ist (Vorsicht bei nonparametrischen Tests: hier kleiner als der kritische Wert). falls der p-wert kleiner dem vorher festgelegten Signikanzniveau α ist. Bernd Klaus, Verena Zuber Statistische Tests 19/38

I. Einführungsbeispiel t-test - EW einer Population II. Theorie: Statistische Tests t-test - EW zweier Populationen III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen t-test - EW- Test gepaarter Populationen IV. t-test und Wilcoxon-Rangsummen - TestDer in RWilcoxon-Rangsummen - Test III. Zwei Klassiker t-test und Wilcoxon-Rangsummen - Test... ein bisschen Theorie Bernd Klaus, Verena Zuber Statistische Tests 20/38

I. Einführungsbeispiel t-test - EW einer Population II. Theorie: Statistische Tests t-test - EW zweier Populationen III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen t-test - EW- Test gepaarter Populationen IV. t-test und Wilcoxon-Rangsummen - TestDer in RWilcoxon-Rangsummen - Test 1. Ziel, Hypothesen und Voraussetzungen Vergleich das emp. Populationsmittel x mit einem hypothetischen Mittelwert µ 0. benötigt eine Normalverteilung der Stichprobe Varianz wird als unbekannt angenommen Varianten für die Hypothesen: (a) Einseitige Fragestellung 1 : H 0 : x µ 0 gegen H 1 : x > µ 0 (b) Einseitige Fragestellung 2 : H 0 : x µ 0 gegen H 1 : x < µ 0 (c) Zweiseitige Fragestellung : H 0 : x = µ 0 gegen H 1 : x µ 0 Bernd Klaus, Verena Zuber Statistische Tests 21/38

I. Einführungsbeispiel t-test - EW einer Population II. Theorie: Statistische Tests t-test - EW zweier Populationen III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen t-test - EW- Test gepaarter Populationen IV. t-test und Wilcoxon-Rangsummen - TestDer in RWilcoxon-Rangsummen - Test 2. Teststatistik Teststatistik T = x µ 0 s n Schätzung der Standardabweichung σ durch: s = [ n i=1 ( x x i) 2 n 1 ] 0.5 Bernd Klaus, Verena Zuber Statistische Tests 22/38

I. Einführungsbeispiel t-test - EW einer Population II. Theorie: Statistische Tests t-test - EW zweier Populationen III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen t-test - EW- Test gepaarter Populationen IV. t-test und Wilcoxon-Rangsummen - TestDer in RWilcoxon-Rangsummen - Test 3. Kritische Bereiche Kritische Bereiche: (a) Einseitige Fragestellung 1 : T > t 1 α (n 1) (b) Einseitige Fragestellung 2 : T < t α (n 1) (c) Zweiseitige Fragestellung : T > t 1 α/2 (n 1) Bernd Klaus, Verena Zuber Statistische Tests 23/38

I. Einführungsbeispiel t-test - EW einer Population II. Theorie: Statistische Tests t-test - EW zweier Populationen III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen t-test - EW- Test gepaarter Populationen IV. t-test und Wilcoxon-Rangsummen - TestDer in RWilcoxon-Rangsummen - Test 1. Ziel, Hypothesen und Voraussetzungen Vergleiche die emp. Populationsmittel x 1 und x 2 miteinander benötigt eine Normalverteilung der Stichprobe Varianz der Populationen unbekannt 2 Varianten: Varianzen der Populationen gleich oder ungleich Varianten für die Hypothesen: (a) Einseitige Fragestellung 1 : H 0 : x 1 x 2 gegen H 1 : x 1 > x 2 (b) Einseitige Fragestellung 2 : H 0 : x 1 x 2 gegen H 1 : x 1 < x 2 (c) Zweiseitige Fragestellung : H 0 : x 1 = x 2 gegen H 1 : x 1 x 2 Bernd Klaus, Verena Zuber Statistische Tests 24/38

I. Einführungsbeispiel t-test - EW einer Population II. Theorie: Statistische Tests t-test - EW zweier Populationen III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen t-test - EW- Test gepaarter Populationen IV. t-test und Wilcoxon-Rangsummen - TestDer in RWilcoxon-Rangsummen - Test 2. Teststatistik Teststatistik T = x 1 x 2 s n Schätzung der Standardabweichung σ durch: s = [( 1 n 1 + 1 n 2 ) ] (n 1 1)s 1 + (n 2 0.5 1)s 2 n 1 + n 2 1 wobei s 1 und s 2 die Standardvarianzschätzer für die Populationen sind Bernd Klaus, Verena Zuber Statistische Tests 25/38

I. Einführungsbeispiel t-test - EW einer Population II. Theorie: Statistische Tests t-test - EW zweier Populationen III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen t-test - EW- Test gepaarter Populationen IV. t-test und Wilcoxon-Rangsummen - TestDer in RWilcoxon-Rangsummen - Test 3. Kritische Bereiche Kritische Bereiche: (a) Einseitige Fragestellung 1 : T > t 1 α (n 1 + n 2 2) (b) Einseitige Fragestellung 2 : T < t α (n 1 + n 2 2) (c) Zweiseitige Fragestellung : T > t 1 α/2 (n 1 + n 2 2) Bernd Klaus, Verena Zuber Statistische Tests 26/38

I. Einführungsbeispiel t-test - EW einer Population II. Theorie: Statistische Tests t-test - EW zweier Populationen III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen t-test - EW- Test gepaarter Populationen IV. t-test und Wilcoxon-Rangsummen - TestDer in RWilcoxon-Rangsummen - Test 1. Ziel, Hypothesen und Voraussetzungen Teste die Dierenz d := n i=1 d i miteinander gepaarter Stichproben (x 1i, x 2i ) typisches Bsp.: Messen eines Blutwertes vor und nach einer med. Behandlung benötigt eine Normalverteilung der Stichprobe Varianten für die Hypothesen: (a) Einseitige Fragestellung 1 : H 0 : d 0 gegen H 1 : d > 0 (b) Einseitige Fragestellung 2 : H 0 : d 0 gegen H 1 : d < 0 (c) Zweiseitige Fragestellung : H 0 : d = 0 gegen H 1 : d 0 Bernd Klaus, Verena Zuber Statistische Tests 27/38

I. Einführungsbeispiel t-test - EW einer Population II. Theorie: Statistische Tests t-test - EW zweier Populationen III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen t-test - EW- Test gepaarter Populationen IV. t-test und Wilcoxon-Rangsummen - TestDer in RWilcoxon-Rangsummen - Test 2. Teststatistik Teststatistik T = d s n Schätzung der Standardabweichung σ durch: s = [ n i=1 ( d d i ) 2 n 1 ] 0.5 Bernd Klaus, Verena Zuber Statistische Tests 28/38

I. Einführungsbeispiel t-test - EW einer Population II. Theorie: Statistische Tests t-test - EW zweier Populationen III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen t-test - EW- Test gepaarter Populationen IV. t-test und Wilcoxon-Rangsummen - TestDer in RWilcoxon-Rangsummen - Test 3. Kritische Bereiche Kritische Bereiche: (a) Einseitige Fragestellung 1 : T > t 1 α (n 1) (b) Einseitige Fragestellung 2 : T < t α (n 1) (c) Zweiseitige Fragestellung : T > t 1 α/2 (n 1) Bernd Klaus, Verena Zuber Statistische Tests 29/38

I. Einführungsbeispiel t-test - EW einer Population II. Theorie: Statistische Tests t-test - EW zweier Populationen III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen t-test - EW- Test gepaarter Populationen IV. t-test und Wilcoxon-Rangsummen - TestDer in RWilcoxon-Rangsummen - Test 1. Ziel, Hypothesen und Voraussetzungen Teste nicht-parametrisch, ob zwei Population den gleichen Median besitzen. Zu verwenden, wenn Vor. für den t-test nicht erfüllt sind benötigt KEINE konkrete Verteilungsannahme t-test-ersatz Varianten für die Hypothesen: (a) Einseitige Fragestellung 1 : H 0 : x 1,med x 2,med gegen H 1 : x 1,med > x 2,med (b) Einseitige Fragestellung 2 : H 0 : x 1,med x 2,med gegen H 1 : x 1,med < x 2,med (c) Zweiseitige Fragestellung : H 0 : x 1,med = x 2,med gegen H 1 : x 1,med x 2,med Bernd Klaus, Verena Zuber Statistische Tests 30/38

I. Einführungsbeispiel t-test - EW einer Population II. Theorie: Statistische Tests t-test - EW zweier Populationen III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen t-test - EW- Test gepaarter Populationen IV. t-test und Wilcoxon-Rangsummen - TestDer in RWilcoxon-Rangsummen - Test 2. Teststatistik Bilde für sämtlichen Beobachtungen x 11,... x 1n1, x 21,... x 2n2 Ränge rg (x 11 ),... rg (x 1n1 ), rg (x 21 ),... rg (x 2n2 ) Teststatistik n1 R = i=1 rg (x 1i ) Wertebereich: n 1(n1+1) < R < (n 1+n2)(n1+n2+1) n 1(n1+1) 2 2 2 Nullverteilung von R liegt tabelliert vor Approximation durch die Normalverteilung ab einer Stichprobengröÿe von ca. 20 möglich Bernd Klaus, Verena Zuber Statistische Tests 31/38

I. Einführungsbeispiel t-test - EW einer Population II. Theorie: Statistische Tests t-test - EW zweier Populationen III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen t-test - EW- Test gepaarter Populationen IV. t-test und Wilcoxon-Rangsummen - TestDer in RWilcoxon-Rangsummen - Test 3. Kritische Bereiche Kritische Bereiche: (a) Einseitige Fragestellung 1 : R > w 1 α (n 1, n 2 ) (b) Einseitige Fragestellung 2 : R < w α (n 1, n 2 ) (c) Zweiseitige Fragestellung : R > w 1 α/2 ((n 1, n 2 )) oder R < w α/2 (n 1, n 2 ) Bernd Klaus, Verena Zuber Statistische Tests 32/38

I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R IV. t-test und Wilcoxon-Rangsummen - Test in R - Praktische Durchführung Bernd Klaus, Verena Zuber Statistische Tests 33/38

I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R t-test in R t.test(x, y, alternative, paired, var.equal) Erklärung der Parameter x,y = NULL: Die Daten, beim t-test für eine Population genügt es, x anzugeben. alternative = c(two.sided, less, greater): Varianten für die Alternativhypothese var.equal = TRUE: Gibt an, ob Varianzgleichheit bei den Populationen vorliegt paired: Gibt an, ob x und y als gepaarte Stichprobe anzusehen sind Bernd Klaus, Verena Zuber Statistische Tests 34/38

I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R Wilcoxon-Rangsummen - Test in R wilcox.test(x, y, alternative, paired, exact) Erklärung der Parameter Parameter fast wie beim t-test... exact : Soll die Teststatistik exakt bestimmt werden, oder per Approximation an die Normalverteilung? Bernd Klaus, Verena Zuber Statistische Tests 35/38

I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R Beispiel Nettokaltmieten pro m 2 für 1 (X ) und 2-Raum (Y ) Wohnungen Gibt es einen Unterschied zwischen beiden Gruppen? Wir untersuchen diese Frage per Wilcoxon- und t-test. 1 2 3 4 5 X 8.70 11.28 13.24 8.37 12.16 Y 3.36 18.35 5.19 8.35 13.10 6 7 8 9 10 X 11.04 10.47 11.16 4.28 19.54 Y 15.65 4.29 11.36 9.09 Bernd Klaus, Verena Zuber Statistische Tests 36/38

I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R t-test miete <- read.csv(miete.csv) attach(miete) t.test(x,y, var.equal = FALSE, paired = FALSE) R-Ausgabe: data: X and Y Welch Two Sample t-test t = 0.5471, df = 14.788, p-value = 0.5925 alternative hypothesis: true difference in means is not equal to 0 => p > 0.05, kein signikanter Unterschied Bernd Klaus, Verena Zuber Statistische Tests 37/38

I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R Wilcoxon-Rangsummen - Test in R wilcox.test(x,y, exact = TRUE) R-Ausgabe: data: X and Y W = 51, p-value = 0.6607 Wilcoxon rank sum test alternative hypothesis: true location shift is not equal to 0 => p > 0.05, kein signikanter Unterschied Bernd Klaus, Verena Zuber Statistische Tests 38/38