Prof. Dr. G. Meinhardt. Stock, Taubertsberg R. 0-0 (Persike) R. 0-1 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet0.sowi.uni-mainz.de/ SS 009 Fachbereich Sozialwissenschaften Psychologisches Institut Johannes Gutenberg Universität Mainz
Vorzeichentest für abhängige Stichproben Oft ist man bei einem ordinalskalierten Merkmal bei abhängigen Stichproben lediglich an einem höher/niedriger Urteil interessiert. Beispiele: Verringert sich eine Zwangsstörung nach einer Therapie? Verbessert sich Führungsverhalten infolge eines Outdoor-Selbstfindungstraining? Hier findet der Vorzeichentest Anwendung, der aufgrund seiner Einfachheit sehr rasch zu berechnen ist.
Vorzeichentest für abhängige Stichproben Datenlage: Bei abhängigen Stichproben liegen zwei Messungen vor, für die eine Höher/Niedriger/Gleich Beziehung formuliert werden kann. Beispiel: Bei N = 1 Probanden urbaner Herkunft wird ein Rhetoriktraining für mündliche Prüfungsleistungen angewandt und die Verbesserung gemessen. Verbesserungen werden mit kodiert, Verschlechterungen mit -, konstante Konzentrastionsleistungen mit =. Daten: -,,, -, =, -,,,,,,,
Vorzeichentest für abhängige Stichproben Sei n die Anzahl von Beobachtungen und n - die Anzahl von - Beobachtungen, so sollte unter der H 0 gelten, dass n = n = N n N = N m= n n m mit (m = Anzahl = ) Gleiche Beobachtungen ( = ) werden beim Vorzeichentest ignoriert, da sie ohnehin die H 0 (kein Unterschied) unterstützen
Vorzeichentest für abhängige Stichproben Die Wahrscheinlichkeit für (ebenso wie die für - ) sollte nun binomialverteilt sein mit p=0. und n = N* Man könnte nun einen Binomialtest durchführen, um folgende Hypothesen zu prüfen: H : n = n ; H : n n H : n n ; H : n > n H : n n ; H : n < n 0 1 0 1 0 1 Der Vorzeichentest nimmt an, dass wegen der Symmetrie von p und q unter H 0 praktisch immer die Normalverteilungsapproximation verwendet werden kann.
Vorzeichentest für abhängige Stichproben Der Erwartungswert der Summe positiver (bzw. negativer) Vorzeichen ist ( ) = ( ) = = En En N* p N * Die Standardabweichung ist σ ( ) = = n N* p q N *
Vorzeichentest für abhängige Stichproben Man gelangt zu der Prüfgröße (mit Yates-Korrektur): z = n N N 0. mit n = n oder n - z ist standardnormalverteilt mit μ=0 und σ=1. Es gelten also zur Bewertung der Prüfgröße beim Vorzeichentest die üblichen kritischen Werte
Ziel: Test, ob sich zwei abhängige Stichproben in ihrer Ausprägung auf einem ordinalskalierten Merkmal unterscheiden Beispiele: Verbessert sich die Leistung in mündlichen Prüfungen nach einem Rhetorik-Training? Sinkt das subjektive Laustärke-Empfinden von Bewohnern in der Einflugschneise des Frankfurter Flughafens nach einem Einführungskurs Zen-Meditation? Voraussetzungen: Die Merkmalsträger in den Stichproben müssen paarweise zuordenbar sein. Die dem Merkmal tatsächlich zugrunde liegende Verteilungsfunktion soll stetig sein.
Datenlage: Man hat an zwei abhängigen Stichproben der Größe N ein ordinalskaliertes Merkmal erhoben. Es werden die Leistungen von N=1 Schülern in zwei äquivalenten Mathematiktests beurteilt (von einem Prüfer). Vor der Korrektur des zweiten Tests erhält der Prüfer die Information, die Schüler stammten aus einer Hochbegabtenklasse. X1:,, 0,,, 1, 8, 1, 18,, 1 X: 1, 1,,,, 1, 18, 1, 0, 19, Frage: Werden die Leistungen im. Test besser beurteilt?
Testidee: Für jede Beobachtungseinheit können Differenzen zwischen den beiden Stichproben berechnet werden (d i = y i x i ). Zwar ist der absolute Betrag dieser Differenzen nicht interpretierbar, die Differenzen sind aber ordinalskaliert. Größere Differenzen bedeuten also größere Veränderungen zwischen den Stichproben. Unter der H 0, d.h. bei gleichen Wahrscheinlichkeitsverteilungen in beiden Stichproben, sollten nun die Verbundwahrscheinlichkeiten, dass eine gegebene Differenz ein positives bzw. negatives Vorzeichen hat, identisch sein (p(d=d d>0) = 0.)
Methode: Zur Durchführung des Wilcoxon Vorzeichenrang Tests werden nun zunächst die Differenzen d i zwischen beiden Stichproben gebildet. Nr. t1 t d 1 8-9 - 0 1-18 9 1 8 9 9 1 0 18 1 1 9 1 1
Dann werden die Absolutwerte d i dieser Differenzen gebildet. Nr. t1 t d d 1 8-9 - 0 0 1-18 9 1 1 8 9 9 1 0 0 18 1 1 9 9 1 1
Nun erhalten diesen Absolutwerte Rangplätze rg( d i ). Achtung: Der Vorzeichenrang Test erfordert, dass die kleinste Differenz den kleinsten Rang erhält! Nr. t1 t d d rg(d) 1 8-9 - 0 0 1-18 9 1 1 1 8 9 8. 9 1 0 0 1 18 1 1 9 9 1 1 8.
Schließlich werden die Vorzeichen der Differenzen festgestellt. Diese werden für die Berechnung der Prüfgröße Nr. t1 t d d rg(d) - = 1 8 - - - 9 - - - 0 0 0 = 1 - - 18 9 1 1 1-8 9 8. 9 1 0 0 1 18 1 1 9 9-1 1 8.
Nulldifferenzen (Anzahl: m) werden a priori von der Rangplatzvergabe ausgeschlossen. Damit reduziert sich die Anzahl zu berücksichtigender Differenzen auf N* = N m Sei T die Rangsumme der Differenzen mit positivem Vorzeichen und T - die Rangsumme der d i mit negativem Vorzeichen, so gilt für die Summe aller Ränge R R = T T = N ( N 1) * * Der kleinere der beiden T-Werte ist bereits die Prüfgröße. Die Verteilung ist tabelliert für kleine N.
Bei größeren Stichproben (N>) ist die Prüfgröße T approximativ normalverteilt. Der Erwartungswert ist die Hälfte aller möglichen Vergleiche (dies ist der Wert, wenn T = T - ) μ Der Standardfehler lautet σ T = T = N ( N ) * * 1 ( 1) ( 1) * * * N N N
Damit ergibt sich die Prüfgröße (mit Yates-Korrektur) z = T μ T σ T 0. T = T oder T -. Sie ist standardnormalverteilt mit μ=0 und σ=1. Bei Ties berechnet sich der korrigierte Standardfehler als 1 N N N t t ( 1) ( 1) k * * * i i= 1 σ U, Korr = mit t i = Personen, die sich Rang i teilen (Länge der Rangbindung) k = Anzahl der Gruppen mit Rangbindungen i