Prüfen von Unterschiedshypothesen für ordinale Variablen: Mann-Whitney Test und Ko Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 1 / 22
Agenda Mann-Whitney-U-Test Anwendungsbeispiel Weitere Test-Verfahren S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 2 / 22
Mann-Whitney-U-Test Outline Mann-Whitney-U-Test Verfahren für Ordinaldaten Vorgehen Bestimmung der Prüfgröße U bzw. U Umrechnung von U in einen z-wert S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 3 / 22
Mann-Whitney-U-Test Verfahren für Ordinaldaten Verfahren für Ordinaldaten Kann nicht vorrausgesetzt werden, dass das untersuchte Merkmal normalverteilt bzw. intervallskaliert ist, können Verfahren eingesetzt werden, die auf Basis von Ranginformationen arbeiten. Das Merkmal muss mindestens ordinalskaliert sein. Empfehlen sich auch bei kleinen Stichproben (N < 10). Verfahren vergleichen die Rangplätze von zwei Stichproben: Unabhängige Stichproben; Mann-Whitney-U-Test. Abhängige Stichproben: Wilcoxon-Test. Nachteil: Berücksichtigen nur Ranginformationen, die eigentlichen Messwerte spielen keine Rolle. S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 4 / 22
Mann-Whitney-U-Test Vorgehen Vorgehen 1 Hypothesen: H 0 : Die Rangplätze zwischen den Gruppen unterscheiden sich nicht. H 1 : Die Rangplätze zwischen den Gruppen unterscheiden sich. 2 Die Messwerte beider Gruppen werden in gemeinsame Rängplätze überführt. 3 Die Prüfgröße U berechnet sich aus den Rangplatzüber- bzw. Unterschreitungen zwischen den beiden Gruppen. Also: wie oft wird ein Rangplatz aus Gruppe 1 in der Gruppe 2 über- bzw. unterschritten? 4 Die Prüfgröße U wird in einen z-wert umgerechnet. Hierzu wird der erwartete Mittelwert von U und dessen Standardfehler benötigt. 5 Für den z-wert kann anhand der Standard-Normalverteilung eine Wahrscheinlichkeit angegeben werden. Ist diese <5% H 1. S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 5 / 22
Mann-Whitney-U-Test Vorgehen Weitere Möglichkeiten der Signifikanzprüfung Es gibt weitere Methoden, den U Wert auf Signifikanz zu prüfen, vgl. Bortz und Schuster (2010, S. 130ff). Diese eignen sich vor allem bei kleinen Stichproben n 1 8 und n 2 8. Wir besprechen hier nur die Approximation über die Standardnormalverteilung mittels z-werte. S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 6 / 22
Mann-Whitney-U-Test Bestimmung der Prüfgröße U bzw. U Bestimmung der Prüfgröße U bzw. U Prüfgröße U bzw. U Zunächst müssen für beide Gruppen die Rangplatzsummen T 1 und T 2 berechnet werden. Die Prüfgröße ist die Anzahl der Rangplatzüber- U bzw. Rangplatzunterschreitungen U : U = n 1 n 2 + n 1 (n 1 + 1) T 1, 2 bzw. (1) U = n 1 n 2 + n 2 (n 2 + 1) T 2, 2 wobei (2) U = n 1 n 2 U (3) S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 7 / 22
Mann-Whitney-U-Test Umrechnung von U in einen z-wert Umrechnung von U in einen z-wert Umrechnung von U in einen z-wert Wenn n 1 oder n 2 > 10, so kann das Signifikanzniveau von U durch die Standardnormalverteilung approximiert werden. Dazu wird U in einen z-wert umgerechnet: Der z-wert ist dann µ U = n 1 n 2 2 n1 n 2 (n 1 + n 2 + 1) σ U = 12 (4) (5) z = U µ U σ U. (6) S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 8 / 22
Anwendungsbeispiel Outline Anwendungsbeispiel Fragestellung Ergebnisse der Reaktionszeitmessung Rechengang Boxplot der Reaktionszeiten S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 9 / 22
Anwendungsbeispiel Fragestellung Fragestellung Aus Bortz und Schuster (2010, S. 130ff): Kann die Beeinträchtigung der Reaktionszeit unter Alkoholeinfluss durch ein Präparat aufgehoben werden? Zwei Gruppen: Nur Alkohol; Anzahl der Probanden: N = 12. Alkohol plus Präparat; Anzahl der Probanden: N = 15. Messung der Reaktionszeit mittels Reaktionszeitgerät. Da Reaktionszeiten nicht normalverteilt sind und unabhängige Gruppen vorliegen: Entscheidung für Mann-Whitney-U-Test. Hat die Gruppe Alkohol & Präparat niedrigere Reaktionszeiten als die Gruppe Alkohol ohne Präparat? S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 10 / 22
Anwendungsbeispiel Ergebnisse der Reaktionszeitmessung Ergebnisse der Reaktionszeitmessung Die Reaktionszeiten (RT) werden in Rangplätze transformiert. Dazu wird eine aufsteigende (von niedrigen zu hohen RTs) Reihe gemeinsamer Rangplätze gebildet. Gruppe 1 mit Alkohohl, N=12: RT 85 106 118 81 138 90 112 119 107 95 88 103 Rang (R) 4 17 22 2 27 8 21 23 18 9 7 14 Summe der Rangplätze T 1 = 172. Gruppe 2 mit Alkohohl & Präparat, N=15: RT 96 105 104 108 86 84 99 101 78 124 121 97 129 87 109 R 10 16 15 19 5 3 12 13 1 25 24 11 26 6 20 Summe der Rangplätze T 2 = 206. S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 11 / 22
Anwendungsbeispiel Rechengang Rechengang Hypothesen: H 0 : Die Rangplätze der Gruppe mit Präparat sind größer oder gleich als die als die der Gruppe ohne Präparat. H 1 : Die Rangplätze der Gruppe mit Präparat sind kleiner als die als die der Gruppe ohne Präparat. Berechnung der Prüfgröße U: U = n 1 n 2 + n 1 (n 1 + 1) T 1 2 12 13 = 12 15 + 172 2 = 86 S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 12 / 22
Anwendungsbeispiel Rechengang Rechengang (Forts. 2) bzw. U = n 1 n 2 + n 2 (n 2 + 1) T 2 2 15 16 = 12 15 + 206 2 = 94 Überprüfung: U = n 1 n 2 U = 12 15 94 = 86. Berechnung von µ U und σ U : µ U = n 1 n 2 2 = 12 15 2 = 90 und n1 n 2 (n 1 + n 2 + 1) 12 15 (12 + 15 + 1) σ U = = = 20.49 12 12 S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 13 / 22
Anwendungsbeispiel Rechengang Rechengang (Forts. 3) z-transformation: z = U µ U 86 90 = σ U 20.49 = -0.20 Aufgrund der Symmetrie von U und U um µ U gilt: z = 94 90 20.49 = 0.20. Gemäß der einseitigen Fragestellung entspricht z krit dem Wert z 5% = 1.65. Damit 1.65 < 0.20, die H 0 ist beizubehalten. Bzw. wenn U verwendet wurde: z 95% = 1.65, damit 0.20 < 1.65, damit Beibehaltung der H 0. S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 14 / 22
Anwendungsbeispiel Boxplot der Reaktionszeiten Boxplot der Reaktionszeiten 140 120 Reaktionszeit [ms] 100 80 60 40 20 0 ohne Präparat mit S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 15 / 22
Weitere Test-Verfahren Outline Weitere Test-Verfahren Wilcoxon-Test Kruskal-Wallis und Friedman Test S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 16 / 22
Weitere Test-Verfahren Wilcoxon-Test Wilcoxon-Test Wenn eine abhängige Stichprobe bei ordinal skalierter AV vorliegt, so kommt der Wilcoxon-Test zu Anwendung. Auf Basis der Rangplatzdifferenzen für jedes Beobachtungspaar wird die Prüfgröße T bzw. W berechnet. Für diese Prüfgröße stehen in vielen Statistik-Büchern Tabellen mit kritischen Werten zur Verfügung. Zur Berechnung z. B. Bortz und Schuster (2010, S. 133ff). S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 17 / 22
Weitere Test-Verfahren Kruskal-Wallis und Friedman Test Kruskal-Wallis und Friedman Test Kruskal-Wallis: Eine Erweiterung des Mann-Whitney Test auf k-kategorien ist der Kruskal Wallis H Test. Friedman Test: Eine Erweiterung des Wilcoxon-Test für mehr als zwei gepaarte Messungen. S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 18 / 22
Weitere Test-Verfahren Kruskal-Wallis und Friedman Test Beispiel Kruskal-Wallis Test Sie möchten prüfen, ob Vorab-Informationen über einen Wein bei der Bewertung von Weinen eine Rolle spielen. Dazu bilden Sie drei Gruppen mit Amateur-Weinexperten. Aus organisatorischen Gründen sind die Gruppen nicht gleich groß: Gruppe A: N = 8, Gruppe B: N = 6; Gruppe C: N = 6. Jede Gruppe bekommt unterschiedliche Informationen über den zu testenden Wein. Das Rating erfolgt auf einer Skala von 0 bis 10 Punkten in 0.1 Schritten. Je mehr Punkte vergeben werden, desto höher die Bewertung. S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 19 / 22
Weitere Test-Verfahren Kruskal-Wallis und Friedman Test Boxplot der Ratings Rating 2 4 6 8 10 A B C Gruppe S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 20 / 22
Weitere Test-Verfahren Kruskal-Wallis und Friedman Test Ausgabe mit Kruskal - Wallis rank sum test data: Rating by Gruppe Kruskal - Wallis chi - squared = 9.8491, df = 2, p- value = 0.007266 Bedeutung: Die Art der Instruktion hat einen signifikanten Einfluss auf die Beurteilung des Weines [W(2) = 9.85; p < 0.01]. Gruppe A bewertet den Wein signifikant besser als die Gruppen B und C. S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 21 / 22
Weitere Test-Verfahren Kruskal-Wallis und Friedman Test Literaturverzeichnis Bortz, J. & Schuster, C. (2010). Statistik für Human- und Sozialwissenschaftler (7. Auflage). Berlin: Springer. S. Garbade (SRH Heidelberg) Tests für ordinale Daten Statistik 1 22 / 22