Einführung in die statistische Testtheorie Statistische Tests zu ausgewählten Problemen Teil 4: Nichtparametrische Tests Statistische Testtheorie IV Einführung Beschränkung auf nichtparametrische Testverfahren Beschränkung auf Tests für Lageunterschiede, Anpassungstests Beschränkung auf Tests im Ein- oder Zwei-Stichprobenfall 2 Statistische Testtheorie IV Kolmogorov- Smirnov- Anpassungstest Mann-Whitney- U-Test Vorzeichenrangtest nach Wilcoxon 3
Nichtparametrische Tests Nichtparametrische Tests Allgemeine Bemerkungen setzen keine speziellen Verteilungsannahmen (z.b. Normalverteilung) voraus lassen sich auch für ordinale und/oder nominale Daten anwenden Voraussetzungen sollten jedoch jeweils überprüft werden (z.b. Symmetrie) aber: schwächere Voraussetzungen = weniger trennscharfe Ergebnisse 4 Kolmogorov-Smirnov-Anpassungstest Voraussetzungen es liegt eine eindimensionale metrische Stichprobe vor x,, x n x,,x n stammen aus einer (unbekannten) stetigen Verteilung ist auch bei kleinen Stichproben anwendbar es existiert auch ein Zweistichprobentest, der überprüft, ob zwei unabhängige Stichproben derselben Verteilung entstammen 5 Kolmogorov-Smirnov-Anpassungstest Voraussetzungen Getestet werden ypothesen bzgl. der unbekannten theoretischen Verteilung F 0 (x) ypothese: 0 : F( x) F0 ( x) : F( x) F0 ( x) für alle x für wenigstens ein x F 0 (x) kann z.b. eine Normalverteilung sein 6 2
Kolmogorov-Smirnov-Anpassungstest Als Schätzer für die Gleichheit der Verteilungsfunktionen verwenden wir den größten vertikalen Abstand zwischen hypothetischer und empirischer Verteilungsfunktion Wir vergleichen beobachtete und unter 0 erwartete Verteilungsfunktion und erhalten als Teststatistik T nd n mit D F ( x) F ( x) n sup 0 x n (F n (x) ist die empirische Verteilungsfunktion) 7 Kolmogorov-Smirnov-Anpassungstest Quelle: artung/elpelt/klösener (985): Statistik. Oldenbourg, S.84 8 Kolmogorov-Smirnov-Anpassungstest Bei der Durchführung des Tests vergleichen wir nun die Realisation dieser Teststatistik t nd n mit Quantilen einer d n;-α -Verteilung. ( ist in gängigen Statistik-Lehrbüchern vertafelt). Die (Null-)ypothese wird zum Niveau abgelehnt, falls t d n ; 9 3
Kolmogorov-Smirnov-Anpassungstest Quelle: artung/elpelt/klösener (985): Statistik. Oldenbourg, S.86ff Bei einem ersteller von Schrauben für chirurgische Eingriffe wird im Rahmen einer Qualitätskontrolle der Durchmesser der Schrauben überprüft. Es werden n=20 Stück zufällig ausgewählt und der jeweilige Durchmesser in mm gemessen: Zum Niveau =5% soll überprüft werden, ob der Durchmesser der gemessenen Schrauben einer Normalverteilung mit den Parametern μ=0,75 und σ 2 =0,00 entstammt? 0 Kolmogorov-Smirnov-Anpassungstest (Fortsetzung) Kolmogorov-Smirnov-Anpassungstest (Fortsetzung) 2 4
Kolmogorov-Smirnov-Anpassungstest (Fortsetzung) 3 Kolmogorov-Smirnov-Anpassungstest (Fortsetzung) Die Annahme, dass der Durchmesser der gemessenen Schrauben einer Normalverteilung mit den Parametern μ=0,75 und σ 2 =0,00 entstammt, kann zum Niveau =5% nicht verworfen werden.. 4 Voraussetzungen es liegt eine eindimensionale ordinale Stichprobe vor x,, x n bei Vorliegen (einer) metrischskalierten Beobachtungsreihe kann zu Rangdaten übergegangen werden nichtparametrische Alternative zum Einstichproben-t-Test (auch für verbundene Stichproben) 5 5
Voraussetzungen Getestet werden (ein- und zweiseitige) ypothesen 0 : F0 ist symmetrisch um einen Wert 0 Die (exakte) Teststatistik T berechnet sich aus der Summe der (positiven) Rangzahlen, im Falle von Bindungen werden gemittelte Rangzahlen vergeben (Midranks) Im Falle größerer Stichproben (n>50) kann eine approximativ normalverteilte Teststatistik verwendet werden 6. Bilde die transformierten Werte x i * = x i μ 0 (Ist x i *= 0 so wird dieser Wert nicht berücksichtigt). Vergebe Rangzahlen für die Werte x i * ohne Berücksichtigung des Vorzeichens (ggf. bei Bindungen gemittelte Rangzahlen) 2. Weise den Rangzahlen das Vorzeichen der zugehörigen Originalbeobachtung zu (signed ranks) 3. Berechne T = T + = die Summe aller positiven Rangzahlen 7 Im Falle großer Stichproben errechne T als T T n( n ) / 4 T n( n )(2n ) / 24 E( T Var( T ) ) keine Bindungen bzw. als T 24 T n( n ) / 4 n( n )(2n ) 2 g t ( )( j j t j t j ) mit Bindungen g= Anzahl der gebundene Gruppen; t j = Anzahl Elemente in dieser Gruppe 8 6
Bei der Durchführung des Tests vergleichen wir nun die Realisation dieser Teststatistik n 50 T mit den kritischen Werten w n;α des Tests n > 50 T mit Quantilen der Standardnormalverteilung. ( sind in gängigen Statistik-Lehrbüchern vertafelt). 9 0 : F0 ist symmetrisch um einen Wert 0 0 verwerfen, falls T + > w n;-α bzw. falls T > u -α/2 02 : F 0 ist symmetrisch um einen Wert 0 02 verwerfen, falls T + < w n;α bzw. falls T < u α/2 03 : F0 ist symmetrisch um einen Wert 0 03 verwerfen, falls T + > w n;-α/2 oder T + < w n;α/2 bzw. falls T > u -α/2 20 Quelle: artung/elpelt/klösener (985): Statistik. Oldenbourg, S.246ff Es wird bei n= Probanden ein psychologischer Test durchgeführt und die erzielten Punktzahlen der Ergebnisbewertung in einer Tabelle notiert. Zum Niveau =5% soll überprüft werden, ob die gemessenen Werte symmetrisch ti um μ 0 =6 Punkte liegen ( 03 ) Es müssen also zunächst die transformierten Werte x i * = x i μ 0 = x i 6 berechnet und dann die entsprechenden Rangzahlen vergeben werden 2 7
Damit ist T + = Summe aller positiven Ränge = 53 22 03 : F0 ist symmetrisch um einen Wert 0 03 verwerfen, falls T + > w n;-α/2 oder T + < w n;α/2 bzw. falls T > u -α/2 d.h. die Nullhypothese (Symmetrie um μ 0 = 6 Punkte) kann bei α = 5% = 0,05 nicht verworfen werden. 23 approximative Lösung 24 8
approximative Lösung 25 Quelle: Rasch et al.(2006 )Quantitative Methoden 2, Springer, S.63 Ein Therapeut überprüft die Wirksamkeit einer Entspannungstechnik. Vor und nach der Übung geben die Patient(inn)en auf einer Skala von bis 9 an, wie (zunehmend) entspannt sie sich fühlen. Zum Niveau =% soll überprüft werden, ob die gemessenen Werte symmetrisch um μ 0 0 liegen ( 0 ) ier liegt der Fall verbundener Stichproben (Vorher-Nachher- Messungen) vor. Es müssen also zunächst die Differenzen der beiden Messreihen berechnet und dann die die transformierten Werte x i * = x i μ 0 = x i 0 bestimmt sowie die entsprechenden Rangzahlen vergeben werden. 26 Damit ist T + = Summe aller positiven Ränge = 34,5 27 9
0 : F0 ist symmetrisch um einen Wert 0 0 verwerfen, falls T + > w n;-α bzw. falls T > u -α/2 w 8;0,99 = 33 < 34,5 = T + d.h. die Nullhypothese (Symmetrie um μ 0 0 Punkte) kann bei α = % = 0,0 verworfen werden. 28 Allgemeine Bemerkungen Es liegt zwei Stichprobe vom Umfang n bzw. n 2 vor, bei der zwei (mindestens) ordinale Merkmale X und Y beobachtet werden. bei Vorliegen (einer) metrischskalierten Beobachtungsreihe kann zu Rangdaten übergegangen werden Man interessiert sich dafür, ob die beiden Merkmale einen Lageunterschied aufweisen nichtparametrische Alternative zum Zweistichproben-t-Test (für unabhängige Stichproben) 29 Voraussetzungen Getestet werden (ein- und zweiseitige) ypothesen : F F2 (bzw. F F2 oderf F2 ) 0 Den Stichprobenwerten aus beiden Stichproben werden insgesamt Ränge zugeordnet, im Falle von Bindungen werden gemittelte Rangzahlen vergeben (Midranks) Die Teststatistik T berechnet sich aus der Summe der Rangzahlen, die in der ersten Stichprobe vergeben werden Wilcoxon-Rangsummen-Test 30 0
. Vergebe (gemeinsame) Rangzahlen für die Werte x i und y i (ggf. bei Bindungen gemittelte Rangzahlen) 2. Summiere die Rangzahlen der ersten Stichprobe auf n T r r i i 3. Falls n,n 2 > 20: berechne T approx T approax T / 2 n ( n n /2n n ( n n 2 2 2 ) ) 3 Alternative Berechne U = Anzahl aller Paare (x i,x 2i ) mit x i < x 2i U heißt Mann-Whitney-Statistik. Es ist T n n2 n ( n ) U 2 32 Bei der Durchführung des Tests vergleichen wir nun die Realisation dieser Teststatistik n 20 T mit den kritischen Werten w nn2;α des Tests n > 20 T approx mit Quantilen der Standardnormalverteilung. ( sind in gängigen Statistik-Lehrbüchern vertafelt). 33
: F ( x) F2 (x) 0 0 verwerfen, falls T < w n,n2;α/2 oder T > w n,n2;-α/2 bzw. falls T approx > u -α/2 : F ( x ) F 2(x) () 02 02 verwerfen, falls T > w n,n2;-α bzw. falls T approx > u -α : F ( x) F2 (x) 03 03 verwerfen, falls T < w n,n2;α oder T approx < u α 34 Quelle: artung/elpelt/klösener (985): Statistik. Oldenbourg, S.53ff Um die Wirkung von Vitamin B auf die Wachstumsförderung von Pilzen festzustellen, wurden von 24 Pilzen 3 (Stichprobe ) zufällig ausgewählt Pilze mit Vitamin B behandelt. Die restlichen Pilze (Stichprobe 2) blieben ohne Behandlung (Kontrolle). Zum Niveau =5% soll überprüft werden, ob die Behandlung mit Vitamin B zu (signifikant) höherem Gewicht führt. : F ( x) F2 (x) 02 35 Quelle: artung/elpelt/klösener (985): Statistik. Oldenbourg, S.53ff Es müssen nun zunächst alle Werte sortiert und dann die entsprechenden Rangzahlen vergeben werden 36 2
Quelle: artung/elpelt/klösener (985): Statistik. Oldenbourg, S.246ff T= Summe Ränge Behandlung = 220 37 02 verwerfen, falls T > w n,n2;-α w n,n2;-α = 9 Tabelle Quelle: artung/elpelt/klösener (985): Statistik. Oldenbourg, S.246ff T=220 > 9= w n,n2;-α 02 α = 0,05 zu verwerfen. Die Behandlung mit B führt zu signifikanten Ergebnissen, d.h. zu höherem Gewicht. 38 Statistische Testtheorie IV Im Mehrstichprobenfall (> 2): Kruskal-Wallis-Test für Lageunterschiede bei unabhängigen Stichproben Friedman-Test für Lageunterschiede bei abhängigen Stichproben 39 3
Statistische Testtheorie IV Literatur: artung J, Elpelt B & Klösener K (2002) :Statistik. 3. Aufl. Oldenbourg, München Ostermann R & Wolf-Ostermann K (2005): Statistik. 3. Aufl. Oldenbourg, München Rasch B, Friese M, ofmann W & Naumann E (2006): Quantitative Methoden 2. 2. Aufl. Springer, eidelberg. 40 4