Kategoriale und metrische Daten Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/14
Übersicht Abhängig von der Anzahl der Ausprägung der kategorialen Variablen unterscheidet man die folgenden Szenarien: Unterschiedshypothese mit zwei Stichproben Zweistichproben t-test für unabhängige Stichproben Wilcoxon-Rangsummentest Unterschiedshypothese mit mehr als zwei Stichproben Einfaktorielle Varianzanalyse (siehe Handbuch) Kruskal-Wallis-Test (siehe Handbuch) 2/14
Normalverteilte Daten Voraussetzungen Es liegen zwei Teilstichproben X 1,...,X m N(µ X,σ 2 X ) und Y 1,...,Y n N(µ Y,σ 2 Y ) vor. Es liegt Varianzhomogenität vor: σ 2 X = σ2 Y. Die beiden Teilstichproben sind unabhängig voneinander erhoben worden. Beispiel: Der Einfluss von Kalkung auf den ph-wert des Bodens soll untersucht werden. Dazu wurden Teile eines Waldbodens zusätzlich bekalkt, andere Teile hingegen nicht. Danach wurden jeweils 48 Bodenproben entnommen und der ph-wert bestimmt. 3/14
Der t-test für unabhängige Stichproben Die Nullhypothese beim Zweistichproben t-test für unabhängige Stichproben lautet: H 0 : µ X = µ Y. In Worten bedeutet dies, dass die Mittelwerte der beiden Zufallsvariablen X und Y gleich sind. Bezogen auf das Beispiel also, dass der ph-wert in beiden Gruppen gleich hoch ist. Grundlegender Gedanke: Hat die zusätzliche Kalkung keine Wirkung auf den Waldboden, so sollten die Mittelwerte der beiden Stichproben in etwa gleich sein. Je größer also die Differenz von X m und Ȳn ist, desto eher wird man H 0 anzweifeln. Wird die Differenz zu groß, muss die Nullhypothese verworfen werden. 4/14
Der t-test für unabhängige Stichproben Um eine Aussage über die Gültigkeit von H 0 machen zu können schaut man auf die Statistik T := X m Ȳn, 1 m + 1 n S p die t-verteilt mit (m+n 2) Freiheitsgraden, wobei Sp 2 := (m 1)S2 X,m +(n 1)S2 Y,n. m+n 2 Bei der Gültigkeit von H 0 sollte T nahe bei Null liegen. Je größer, desto eher wird H 0 in Zweifel gezogen. 5/14
Überprüfung der Varianzhomogenität Ist die Voraussetzung der Varianzhomogenität nicht erfüllt, kann der t-test nicht mehr angewendet werden. Man spricht hier vom sog. Behrens-Fisher-Problem. Um die Gleichheit der Varianzen zu überprüfen kann man verschiedene Tests anwenden, einer davon ist der F-Test. Die Nullhypothese zu diesem Test lautet: H 0 : Die beiden Stichproben besitzen die gleiche Varianz. Die Teststatistik hat die folgende Gestalt: Q = max{s2 X,n,S2 Y,m } min{s 2 X,n,S2 Y,m } 6/14
Überprüfung der Varianzhomogenität Wird H 0 nicht verworfen, wird der normale t-test durchgeführt. Unterschieden sich die beiden Varianzen aber signifikant, darf der normale t-test nicht verwendet werden. Für dieses Problem gibt es keinen exakten Test, sondern nur einen approximativen Test, den Welch-Test (auch Satterthwaite-Test genannt). Für diesen Test kann die Voraussetzung der Varianzhomogenität fallen gelassen werden (aber auch nur diese!). Die Teststatistik ist in diesem Fall nur approxmiativ t-verteilt. Der F-Test muss also immer vor dem t-test durchgeführt werden! 7/14
Der t-test für unabhängige Stichproben Der t-test für ungepaarte Stichproben in R # Datenimport und gruppenweise Zusammenfassung ph.daten <- read.csv2("c:/r/rohdaten/ph.csv") tapply(ph.daten$ph, ph.daten$kalkung, summary) # Boxplot der Daten plot(ph.daten$kalkung, ph.daten$ph) # Test auf Normalverteilung tapply(ph.daten$ph, ph.daten$kalkung, shapiro.test) # Test auf Varianzhomogenität var.test(ph.daten$ph ~ ph.daten$kalkung) # t-test (gleiche Varianzen) t.test(ph.daten$ph ~ ph.daten$kalkung, var.equal = T) # Welch-Test (ungleiche Varianzen) t.test(ph.daten$ph ~ ph.daten$kalkung) 8/14
Nicht normalverteilte Daten Voraussetzungen Gegeben sind zwei jeweils identisch verteilte Teilstichproben, die unabhängig voneinander erhoben wurden. Es soll nun die folgende Nullhypothese untersucht werden: H 0 : Die beiden Stichproben entstammen der gleichen Grundgesamtheit Diese Nullhypothese ist quasi die gleiche wie beim t-test für unabhängige Stichproben. Dies wird mit dem Wilcoxon-Rangsummentest oder auch nur Wilcoxon-Test überprüft. 9/14
Der Wilcoxon-Rangsummentest Für den Wilcoxon-Test werden beide Stichproben zunächst zusammengefasst und jedem Wert wird ein Rang zugeordnet, d.h. die kleinste Beobachtung bekommt den Rang 1, die größte Beobachtung den Rang m + n zugewiesen. Hat man die Ränge bestimmt, wird von jeder Gruppe die jeweilige Rangsumme R x und R y berechnet, sowie die beiden folgenden Größen bestimmt: U x = mn+ m(m +1) 2 R x und U y = mn+ n(n+1) 2 R y. Grundlegender Gedanke: Bei Gültigkeit von H 0, sollten die beiden Gruppen in der zu Beginn gebildeten Reihenfolge in etwa gleichmäßig verteilt sein, die Rangsummen R x und R y sollten also ungefähr die gleiche Größe haben. 10/14
Der Wilcoxon-Rangsummentest Für die Teststatistik gilt dann: U := min{u x,u y } U ist unter H 0 approximativ N( mn 12 )-verteilt, d.h. für hinreichend große m und n liefert der Test brauchbare Ergebnisse. Faustregel für den U-Test 2, mn(m+n+1) Damit die Ergebnisse des Der Wilcoxon-Rangsummentests genau genug sind, müssen gelten: n 4 und m 4 n+m 20 R berechnet im Fall keinerer Stichproben die exakte Teststatistik. Die Gewichtung des Ergebnisses sollte bei so kleinen Stichproben natürlich nicht hoch sein. 11/14
Der Wilcoxon-Rangsummentest Der Wilcoxon-Rangsummentest in R # Der Wilcoxon-Rangsummentest: wilcox.test(ph$ph~ph$kalkung) 12/14
Aufgaben zur Vertiefung I Aufgabe zum Datensatz kino Überprüfe die beiden folgenden Nullhypothesen mit einem geeigneten Signifikanztest: H 0 : Männer und Frauen sind gleich alt H 0 : Männer und Frauen gehen gleich häufig ins Kino Aufgabe zum Datensatz gerinnung Der Datensatz enthält die Gerinnungszeiten von zwei Patientengruppen mit der selben Verletzung. Gibt es einen Unterschied in der Gerinnungszeit der beiden Medikamente? 13/14
Aufgaben zur Vertiefung II Aufgabe zum Datensatz urin Der Datensatz enthält die im Urin gemessenen ph-werte und Calcium-Konzentrationen der beobachteten Patienten. Gibt es für eine der beiden Messungen einen Unterschied zwischen Patienten mit und Patienten ohne Kristall im Urin (Variable kristalle)? 14/14