t-test Einführung in die Statistik Professur E-Learning und Neue Medien Institut für Medienforschung Philosophische Fakultät

Professr E-Learning nd Nee Medien Institt für Medienforschng Philosophische Fakltät Einführng in die Statistik t-test

Überblick Zfallsstichproben generieren Zentrale Verteilng abtragen Kritischen nd empirischen t-wert bestimmen Inferenzstatistische Entscheidng treffen Nonzentrale Verteilng abtragen Beta nd Teststärke Vorassetzngen nd Arten von t-tests Schritte bei der Drchführng eines t-tests Praktische Bedetsamkeit 2

Inferenzstatistik (z. B. Bortz & Schster, 2010) Statistik als Sche nach Mstern in Zahlen Deskriptivstatistik: Zahlenmster werden dargestellt nd beschrieben Inferenzstatistik: Zahlenmster werden gegen den Zfall nd zr Generalisierng (af die Poplation) abgesichert Nllhypothese ( ) vs. Alternativhypothese ( ) Statistische Signifikanz: Wahrscheinlichkeit, dass das gefndene Ergebnis oder extremere Ergebnisse bei Gültigkeit der Nllhypothese eintreten Beispiel: Wahrscheinlichkeit ermitteln, dass die Aswirkngen eines Medikaments drch einen Placeboeffekt zstande gekommen sind Weiteres Beispiel: Wahrscheinlichkeit ermitteln, dass die Beachtng der Leserichtng in interaktiven Visalisierngen die Lernleistngen erhöht 3

Inferenzstatistik (Rey, 2012) Beispiel: Leserichtngseffekt in Comptersimlationen (Rey, 2009) Transferleistng 4

Zfallsstichproben generieren (Rey, 2012) Häfigkeit Mittelwertsdifferenz 5

Zentrale Verteilng abtragen (Rey, 2012) Wahrscheinlichkeitsdichte 0,5 0,4 0,3 0,2 0,1 0-4 -3-2 -1 0 1 2 3 4 t-wert 6

Kritischen nd empirischen t-wert bestimmen (Rey, 2012) Wahrscheinlichkeitsdichte 0,5 0,4 0,3 0,2 0,1 0-4 -3-2 -1 0 1 2 3 4 t-wert 7

Kritischen nd empirischen t-wert bestimmen (Rey, 2012) Wahrscheinlichkeitsdichte 0,5 0,4 0,3 0,2 0,1 Empirischen t-wert berechnen: t = t = t = 2.77 n m n + m Kritischer t-wert x y s 56 57 5.71 4.75 56 + 57 1.83 Empirischer t-wert 0-4 -3-2 -1 0 1 2 3 4 t-wert 8

Inferenzstatistische Entscheidng treffen (Rey, 2012) Wahrscheinlichkeitsdichte 0,5 0,4 0,3 0,2 0,1 V e r m t n g Kritischer t-wert Alpha Wirklichkeit Empirischer t-wert 0-4 -3-2 -1 0 1 2 3 4 t-wert 9

Inferenzstatistische Entscheidng treffen (Rey, 2012) Wahrscheinlichkeitsdichte 0,5 0,4 0,3 0,2 0,1 V e r m t n g Kritischer t-wert Empirischer t-wert 1 Alpha Alpha Wirklichkeit 0-4 -3-2 -1 0 1 2 3 4 t-wert 10

Nonzentrale Verteilng abtragen (Rey, 2012) Wahrscheinlichkeitsdichte 0,5 0,4 0,3 0,2 0,1 V e r m t n g Kritischer t-wert Empirischer t-wert 1 Alpha Alpha Wirklichkeit 0-4 -3-2 -1 0 1 2 3 4 t-wert 11

Beta nd Power (Rey, 2012) Wahrscheinlichkeitsdichte 0,5 0,4 0,3 0,2 0,1 V e r m t n g Kritischer t-wert Empirischer t-wert 1 Alpha Beta Alpha Wirklichkeit 0-4 -3-2 -1 0 1 2 3 4 t-wert 12

Beta nd Power (Rey, 2012) Wahrscheinlichkeitsdichte 0,5 0,4 0,3 0,2 0,1 V e r m t n g 1 Alpha Beta Alpha Power Wirklichkeit Kritischer t-wert Empirischer t-wert 0-4 -3-2 -1 0 1 2 3 4 t-wert 13

Vier Entscheidngen & dazgehörige Wahrscheinlichkeiten (Rey, 2012) Wahrscheinlichkeitsdichte 0,5 0,4 0,3 0,2 V e r m t n g Kritischer t-wert 1 Alpha Beta Alpha Power Wirklichkeit 0,1 0-4 -3-2 -1 0 1 2 3 4 t-wert 14

Vier Entscheidngen & dazgehörige Wahrscheinlichkeiten (Rey, 2012) Alphafehler: Irrtümliche Entscheidng zgnsten der Alpha: Wahrscheinlichkeit zm Alphafehler 1 Alpha: Gegenwahrscheinlichkeit zr Alphafehlerwahrscheinlichkeit; inhaltlich: die korrekte Entscheidng zgnsten der Betafehler: Irrtümliche Entscheidng zgnsten der Beta: Wahrscheinlichkeit zm Betafehler Teststärke (Power bzw. 1 Beta): Gegenwahrscheinlichkeit zr Betafehlerwahrscheinlichkeit; inhaltlich: die korrekte Entscheidng zgnsten der V e r m t n g 1 Alpha Beta Alpha Power Wirklichkeit 15

Signifikanznivea Statistische Signifikanz: Wahrscheinlichkeit, dass das gefndene Ergebnis oder extremere Ergebnisse bei Gültigkeit der Nllhypothese eintreten Konventionen für die Entscheidngsfindng af Basis der berechneten Wahrscheinlichkeit (p-wert) Nicht signifikant Signifikant Sehr signifikant Hoch signifikant p-wert > 5% 5% 1% 0.1% Abkürzng n.s. * ** *** 16

Vorassetzngen des t-tests (z. B. Rasch, Friese, Hofmann & Namann, 2014) Intervallskalennivea der abhängigen Variable: Überprüfng afwändig nd schwierig Normalverteilng der abhängigen Variable in der Poplation: Überprüfng mittels Kolmogorow-Smirnow-Anpassngstest (K-S-A) Varianzhomogenität als Gleichheit der Poplationsvarianzen, as denen die beiden Stichproben stammen: Überprüfng mittels Levene- Test Überprüfng der drei Vorassetzngen in der Forschngspraxis (leider) eher nüblich 17

Vorassetzngen des t-tests (z. B. Rasch, Friese, Hofmann & Namann, 2014) Bei Verletzngen einer der drei genannten Vorassetzngen kann statt des t-tests (parametrisches Verfahren) ein non-parametrisches Verfahren verwendet werden Allerdings reagiert der t-test nter folgenden Bedingngen relativ robst gegenüber Verletzngen der Vorassetzngen Ungefähr gleichgroße Stichproben der beiden Grppen Hinreichend große Stichproben (n 1 = n 2 > 30) In der Praxis wird selten af non-parametrische Verfahren zrückgegriffen 18

Arten von t-tests (z. B. Rasch, Friese, Hofmann & Namann, 2014) Einseitige vs. zweiseitige Testng Einseitige Testng bei gerichteten, zweiseitige Testng bei ngerichteten Hypothesen Höhere Teststärke bei einseitiger Testng Unabhängige vs. abhängige Stichproben U.a. bei Messwiederholngen liegen abhängige Stichproben vor In diesem Fall Berechnng des t-wertes über die Differenzen der Messwerte t-test für eine Stichprobe (Einstichprobentest; engl. one-sample t- test) Überprüfng, ob Stichprobe as einer bestimmten Poplation stammt 19

Beispiele für t-tests in Fachzeitschriften Qelle: Hff, Bahoff nd Schwan (2012) Qelle: Mayer, Mathias nd Wetzell (2002) Qelle: Hff, Bahoff nd Schwan (2012) 20

Arten von t-tests In einer Stdie werden 200 Ehepaare jeweils gemeinsam befragt. Es soll überprüft werden, ob sich die Lerngewohnheiten von Fraen nd Männern nterscheiden. Welche Art von t-test kann hier eingesetzt werden? A: Unabhängiger t-test mit einseitiger Testng B: Unabhängiger t-test mit zweiseitiger Testng C: Abhängiger t-test mit einseitiger Testng D: Abhängiger t-test mit zweiseitiger Testng E: Einstichprobentest Rey.participoll.com A B C D E 0 21

Schritte bei der Drchführng eines t-tests (z. B. Rasch et al., 2014) Afstellen einer Hypothese Prüfng der inferenzstatistischen Vorassetzngen Festlegng eines Poplationseffekts Festlegng des Signifikanzniveas Stichprobenmfangsplanng Bestimmng von t krit Prüfng des t emp af Signifikanz Interpretation des Ergebnisses 22

Praktische Bedetsamkeit (z. B. Cohen, 1988) Neben der statistischen Signifikanz bzw. Bedetsamkeit ist die praktische Bedetsamkeit von zentraler Bedetng Bezieht sich af die Angabe einer Effektgröße bzw. Effektstärke Beispiel: Medikament beseitigt selbst starke Kopfschmerzen Konventionen für Effektgrößen (Cohen, 1988) Effektgröße Kleiner Effekt Mittlerer Effekt Großer Effekt d 0.20 0.50 0.80 η p ² 0.01 0.06 0.14 r 0.10 0.30 0.50 23

Zsammenfassng Wahrscheinlichkeitsdichte 0,5 0,4 0,3 0,2 V e r m t n g Kritischer t-wert 1 Alpha Beta Alpha Power Wirklichkeit 0,1 0-4 -3-2 -1 0 1 2 3 4 t-wert 24

Prüfngsliteratr Rey, G. D. (2012). Methoden der Entwicklngspsychologie. Datenerhebng nd Datenaswertng. Norderstedt bei Hambrg: BoD. Hypothesenüberprüfng (S. 113-126) Rasch, B., Friese, M., Hofmann, W., & Namann, E. (2014). Qantitative Methoden 1: Einführng in die Statistik für Psychologen nd Sozialwissenschaftler (4. Afl.). Heidelberg: Springer. Inferenzstatistik (S. 21-30) Der t-test (S. 33-75) 25

Weiterführende Literatr I Bortz, J., & Schster, C. (2010). Statistik für Hman- nd Sozialwissenschaftler (7. Afl.). Berlin: Springer. Hypothesentesten (S. 97-115) Tests zr Überprüfng von Unterschiedshypothesen (S. 117-136) Eid, M., Gollwitzer, M., & Schmitt, M. (2015). Statistik nd Forschngsmethoden (4. Afl.). Weinheim: Beltz. Grndlagen der Inferenzstatistik (Zweistichprobentests) (S. 217-277) Vergleich zweier Stichprobenmittelwerte (S. 331-343) Leonhart, R. (2013). Lehrbch Statistik. Einstieg nd Vertiefng (3. Afl.). Bern: Hber. Einführng in die inferenzstatistische Hypothesenprüfng (S. 175-201) Parametrische Testverfahren (S. 203-228) 26

Weiterführende Literatr II Sedlmeier, P., & Renkewitz, F. (2013). Forschngsmethoden nd Statistik: Ein Lehrbch für Psychologen nd Sozialwissenschaftler (2. Afl.). München: Pearson. Inferenzstatistik (S. 297-416) Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2. ed.). Hillsdale, NJ: Erlbam. Richardson, J. T. E. (2011). Eta sqared and partial eta sqared as measres of effect size in edcational research. Edcational Research Review, 6, 135-147. 27