Mathematische und statistische Methoden II

Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/methods/ SS 2010 Fachbereich Sozialwissenschaften Psychologisches Institut Johannes Gutenberg Universität Mainz

Das klassische Hypothesentesten Beim klassischen Signifikanztest geht es um eine Wahrscheinlichkeitsaussage h hk i über eine Prüfgröße unter der Annahme, dass die H 0 gilt. Grundlage für die Prüfgröße sind ein oder mehrere beobachtete Werte. Dann können im allgemeinen Fall folgende Hypothesen geprüft werden: a) H : y = c; H : y c 0 1 b) H : y c; H : y > c 0 1 c) H : y c; H : y < c 0 1 mit y = Prüfgröße; c = Erwartungswert unter H 0

Das klassische Hypothesentesten Der Test gilt dann als signifkant, wenn die Wahrscheinlichkeit für den konkreten Wert der Prüfgröße unter der H 0 zu niedrig ist. In diesem Fall wird die H 0 verworfen und angenommen, dass die H 1 gilt. Die Prüfgröße bzw. die ihr zugrunde liegenden Beobachtungen stammen dann nicht aus der Population, die mit der H 0 beschrieben wird. Problem: Aus welcher Population stammen sie dann? Oder auch: Gibt es überhaupt die Population für die H 0?

Das klassische Hypothesentesten Die Annahminer feststehenden Population ist eine Idealisierung und praktisch nicht zu halten. Gründe: Mortalität, Fluktuation, Maturation (i.e. Veränderungen der Merkmalsträger zwischen Zeitpunkten). Damit ist der Erwartungswert (kleinsten) Schwankungen unterworfen, die sich auch in den Stichprobenbeobachtungen niederschlagen werden. Mit genügend hohem Stichprobenumfang werden solch kleinste Schwankungen zu Signifikanzen führen. Mit großen n kann jede H 0 verworfen werden.

Die Damit stellt sich die Frage nach der praktischen Bedeutsamkeit signifikanter Ergebnisse. Beispiel: Mit genügend hohem n wird sich ein IQ- Unterschied von 0.05 Punkten zwischen farbigen und weißen Personen signifikant testen lassen. Hat aber dieser Unterschied irgend eine praktische Bedeutung? Cohen (1988) schlägt daher das Konzept der als Ergänzung zum Signifikanztest vor. Die soll die Größines Unterschiedes oder Zusammenhangs relativ zur Streuung von Daten wiedergeben und nicht zur Streuung von Mittelwerten oder anderer von n abhängiger Maße.

Die Cohen s d Cohen s d drückt einen Unterschied zwischen Erwartungswerten (bzw. beobachteten Mittelwerten) in Einheiten der Streuung der beobachteten Zufallsvariablen aus. Je größer die Varianz der Zufallsvariablen, desto kleiner wird die, unabhängig von der Stichprobengröße. Cohen gibt verschiedene Daumenregeln für die Interpretation von d an: d.2 kleiner Effekt d.5 mittlerer Effekt d.8 großer Effekt

Die Cohen s d Cohen s d drückt einen Unterschied zwischen Erwartungswerten (bzw. beobachteten Mittelwerten) in Einheiten der Streuung der beobachteten Zufallsvariablen aus. Je größer die Varianz der Zufallsvariablen, desto kleiner wird die, unabhängig von der Stichprobengröße. Wolf (1986) vereinfachte diese Regeln noch weiter: d.25 akademisch relevant ("something was learned") d.50 praktisch/klinisch relevant ("something happened")

Die Cohen s d Die mathematische Definition der nach Cohen ist sehr allgemein, je nach Anwendungsfall existieren verschiedene konkrete Formeln. Für den 1-Stichproben t-test: d ˆ μ c x c = = ˆ σ n s n 1 2

Die Cohen s d Die mathematische Definition der nach Cohen ist sehr allgemein, je nach Anwendungsfall existieren verschiedene konkrete Formeln. Für den 2-Stichproben t-test für unabhängige Stichproben: d ˆ μ ˆ X μy = = ˆ σ Δ XY x y n s + n s n + n 2 2 2 X X Y Y X Y

Die Cohen s d Die mathematische Definition der nach Cohen ist sehr allgemein, je nach Anwendungsfall existieren verschiedene konkrete Formeln. Für den 2-Stichproben t-test für abhängige Stichproben: d ˆ μ ˆ X μy = = ˆ σ Δ XY x y n + n 1 2 2 ( s s 2 s ) X Y XY