Prüfen von Mittelwertsunterschieden: t-test



Ähnliche Dokumente
Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen

Einfache statistische Auswertungen mit dem Programm SPSS

Eine Einführung in R: Statistische Tests

Willkommen zur Vorlesung Statistik

Tutorial: Homogenitätstest

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

9. Schätzen und Testen bei unbekannter Varianz

Überblick über die Verfahren für Ordinaldaten

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen der Inferenzstatistik

Einfache Varianzanalyse für abhängige

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Statistische Auswertung:

Business Value Launch 2006

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Statistik II für Betriebswirte Vorlesung 2

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Statistische Auswertung der Daten von Blatt 13

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

Statistik für Studenten der Sportwissenschaften SS 2008

Auswertung mit dem Statistikprogramm SPSS:

Messung von Veränderungen. Dr. Julia Kneer Universität des Saarlandes

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50, ,5 51,7 48,8

Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

Zeichen bei Zahlen entschlüsseln

Webergänzung zu Kapitel 10

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Lösung zu Kapitel 11: Beispiel 1

Varianzanalyse (ANOVA: analysis of variance)

DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler

Abitur 2007 Mathematik GK Stochastik Aufgabe C1

Informationsblatt Induktionsbeweis

Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen. Standardisierung von Daten

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift:

Willkommen zur Vorlesung Statistik (Master)

Professionelle Seminare im Bereich MS-Office

Lineare Funktionen. 1 Proportionale Funktionen Definition Eigenschaften Steigungsdreieck 3

Klausur Nr. 1. Wahrscheinlichkeitsrechnung. Keine Hilfsmittel gestattet, bitte alle Lösungen auf dieses Blatt.

Prüfen von Unterschiedshypothesen für ordinale Variablen: Mann-Whitney Test und Ko

einfache Rendite

Etwas positive Tendenz ist beim Wechsel der Temperatur von 120 auf 170 zu erkennen.

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester Juli 2005

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Überblick über die Tests

3. Der t-test. Der t-test

Leseprobe. Wilhelm Kleppmann. Versuchsplanung. Produkte und Prozesse optimieren ISBN: Weitere Informationen oder Bestellungen unter

W-Rechnung und Statistik für Ingenieure Übung 11

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Korrelation (II) Korrelation und Kausalität

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = ,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Klausur zur Vorlesung Multivariate Verfahren, SS Kreditpunkte, 90 min

y P (Y = y) 1/6 1/6 1/6 1/6 1/6 1/6

Bewertung des Blattes

3. Der t-test. Der t-test

Statistische Thermodynamik I Lösungen zur Serie 1

Nicht über uns ohne uns

Die neue Aufgabe von der Monitoring-Stelle. Das ist die Monitoring-Stelle:

Statistik im Versicherungs- und Finanzwesen

(Repeated-measures ANOVA) path = "Verzeichnis wo Sie anova1 gespeichert haben" attach(paste(path, "anova1", sep="/"))

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Zahlenmauern. Dr. Maria Koth. Ausgehend von dieser einfachen Bauvorschrift ergibt sich eine Vielzahl an möglichen Aufgabenstellungen.

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Übungen zur Veranstaltung Statistik 2 mit SPSS

Stichprobenauslegung. für stetige und binäre Datentypen

Welche Lagen können zwei Geraden (im Raum) zueinander haben? Welche Lagen kann eine Gerade bezüglich einer Ebene im Raum einnehmen?

B 2. " Zeigen Sie, dass die Wahrscheinlichkeit, dass eine Leiterplatte akzeptiert wird, 0,93 beträgt. (genauerer Wert: 0,933).!:!!

i x k k=1 i u i x i v i 1 0, ,08 2 0, ,18 3 0, ,36 4 0, ,60 5 1, ,00 2,22 G = n 2 n i=1

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln

Primzahlen und RSA-Verschlüsselung

Daten sammeln, darstellen, auswerten

Varianzanalyse ANOVA

Funktion Erläuterung Beispiel

Ein möglicher Unterrichtsgang

Korrelation. Übungsbeispiel 1. Übungsbeispiel 4. Übungsbeispiel 2. Übungsbeispiel 3. Korrel.dtp Seite 1

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis:

Zusammenhänge zwischen metrischen Merkmalen

Berechnung der Erhöhung der Durchschnittsprämien

Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung: Test nach McNemar

12.1 Wie funktioniert ein Signifikanztest?

Aufgaben zur Flächenberechnung mit der Integralrechung

Studieren- Erklärungen und Tipps

2 Terme 2.1 Einführung

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus:

Tangentengleichung. Wie lautet die Geradengleichung für die Tangente, y T =? Antwort:

Inhaltsverzeichnis. Regressionsanalyse. - Stand vom:

HIER GEHT ES UM IHR GUTES GELD ZINSRECHNUNG IM UNTERNEHMEN

QM: Prüfen -1- KN

Dieses erste Kreisdiagramm, bezieht sich auf das gesamte Testergebnis der kompletten 182 getesteten Personen. Ergebnis

Transkript:

Prüfen von Mittelwertsunterschieden: t-test Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) t-test Statistik 1 1 / 59

Agenda Prüfen von Mittelwertsunterschieden t-verteilung t-test für unabhängige Stichproben und homogene Varianzen Einseitige Testung t-test bei Varianzheterogenität t-test für abhängige Stichproben S. Garbade (SRH Heidelberg) t-test Statistik 1 2 / 59

Prüfen von Mittelwertsunterschieden Outline Prüfen von Mittelwertsunterschieden Beispiele für Fragestellungen Logik eines Signifikanztests Ausgewählte Testverfahren Freiheitsgrade S. Garbade (SRH Heidelberg) t-test Statistik 1 3 / 59

Prüfen von Mittelwertsunterschieden Beispiele für Fragestellungen Beispiele für Fragestellungen In einer vorher nachher Untersuchung soll geklärt werden, ob ein Training zur Leistungssteigerung erfolgreich war. Es soll untersucht werden, ob Führungskräfte in verschiedenen Positionen eine unterschiedlich hohe Motivation haben. Verändert sich die Mitarbeiterzufriedenheit bei Veränderungen auf Vorstandsebene? S. Garbade (SRH Heidelberg) t-test Statistik 1 4 / 59

Prüfen von Mittelwertsunterschieden Logik eines Signifikanztests Logik eines Signifikanztests Auf Basis der Daten wird eine Prüfgröße berechnet. Die Prüfgröße wird auch als empirische Prüfgröße bezeichnet. Die Prüfgrößen folgen einer bekannten Verteilung. Die Dichte dieser Verteilung ist damit auch bekannt, und es können Flächenanteile berechnet werden, die einer Wahrscheinlichkeit entsprechen. Ist die Wahrscheinlichkeit des Auftretens der Prüfgröße kleiner als das festgesetzte Signifikanzniveau, in der Regel α = 0.05 bzw. 5%, spricht man von einem statistisch bedeutsamen, signifikanten Ergebnis, die Alternativhypothese H 1 wird akzeptiert. Der Einfluss des Zufalls ist damit genügend klein. Wichtig: Da es sich bei dem Signifikanzniveau um eine Irrtumswahrscheinlichkeit handelt, können die Ergebnisse natürlich nach wie vor auf zufälliger Basis entstanden sein. S. Garbade (SRH Heidelberg) t-test Statistik 1 5 / 59

Prüfen von Mittelwertsunterschieden Ausgewählte Testverfahren Ausgewählte Testverfahren Datenniveau Stichproben Nominal Ordinal Intervall Mannunabhängig χ 2 -Test Whitney-U- t-test, F-Test, Test, Kruskal- Varianzanalyse Wallis t-test für abhängige abhängig McNemar-Test Wilcoxon-Test Stich- proben Nominal: Häufigkeiten in Klassen. Ordinal: Rangreihen. Intervall: Äquidistant, normalverteilt. S. Garbade (SRH Heidelberg) t-test Statistik 1 6 / 59

Prüfen von Mittelwertsunterschieden Freiheitsgrade Freiheitsgrade Die Anzahl der bei einer Berechnung frei variierbaren Werte. Z. B.: 10 Bewerber sind haben ein durchschnittliches Alter (arithmetisches Mittel) von 30 Jahren. Neun Alterswerte können nun frei bzw. zufällig gewählt werden, der letzte ist dann vorgegeben. Im obigen Beispiel gibt es also 9 Freiheitsgrade. Abkürzung der Freiheitsgrade mit df (degrees of freedom). S. Garbade (SRH Heidelberg) t-test Statistik 1 7 / 59

t-verteilung Outline t-verteilung Dichteverteilung der t-verteilung Eigenschaften der t-verteilung Ausschnitt der t-werte Flächenanteile einer t-verteilung Auswahl eines kritischen t-werts S. Garbade (SRH Heidelberg) t-test Statistik 1 8 / 59

t-verteilung Dichteverteilung der t-verteilung Dichteverteilung der t-verteilung Gauss mit µ = 0, σ = 1 t mit df = 1 t mit df = 4 t mit df = 6 0.4 0.3 0.2 0.1 4 3 2 1 0 1 2 3 4 S. Garbade (SRH Heidelberg) t-test Statistik 1 9 / 59

t-verteilung Eigenschaften der t-verteilung Eigenschaften der t-verteilung Die t-verteilung ist symmetrisch. Der Mittelwert der t-verteilung ist Null. Die Werte der t-verteilung sind für verschiedene Freiheitsgrade und α tabelliert. Mit df geht die t-verteilung in eine Standardnormalverteilung über. Aus praktischer Sicht: ab 120 Freiheitsgraden können Flächenanteile der z-werte Tabelle genutzt werden. S. Garbade (SRH Heidelberg) t-test Statistik 1 10 / 59

t-verteilung Ausschnitt der t-werte Ausschnitt der t-werte Tabelliert ist der Flächenanteil links vom angegeben t-wert: Flächenanteil df.95.975.99 1 6.314 12.706 31.821 2 2.920 4.303 6.965 3 2.353 3.182 4.541 4 2.132 2.776 3.747 5 2.015 2.571 3.365 6 1.943 2.447 3.143 7 1.895 2.365 2.998 8 1.860 2.306 2.896 9 1.833 2.262 2.821 10 1.812 2.228 2.764 11 1.796 2.201 2.718 > 120 1.654 1.96 2.326 S. Garbade (SRH Heidelberg) t-test Statistik 1 11 / 59

t-verteilung Flächenanteile einer t-verteilung 95% Flächenanteil der t-verteilung mit df = 3 0.4 0.3 0.2 0.1 4 3 2 1 0 1 2 3 4 S. Garbade (SRH Heidelberg) t-test Statistik 1 12 / 59

t-verteilung Flächenanteile einer t-verteilung 95% Flächenanteil der t-verteilung mit df = 3 0.4 0.3 0.2 0.1 t = 2.353 schneidet rechts 5% ab 4 3 2 1 0 1 2 3 4 t = 2.353 schneidet links 95% der Fläche ab S. Garbade (SRH Heidelberg) t-test Statistik 1 12 / 59

t-verteilung Flächenanteile einer t-verteilung 95% Flächenanteil der t-verteilung mit df = 3 t = 3.182 schneidet links 2.5% ab 0.4 0.3 0.2 0.1 95% der Fläche t = 3.182 schneidet rechts 2.5% ab 4 3 2 1 0 1 2 3 4 S. Garbade (SRH Heidelberg) t-test Statistik 1 12 / 59

t-verteilung Auswahl eines kritischen t-werts Auswahl eines kritischen t-werts Die t-werte sind für einseitige Testungen tabelliert. Da die Verteilung symmetrisch ist, ist der kritische Wert auf der linken Seite vom Betrag her gleich dem auf der rechten Seite der Verteilung. Allerdings schneiden natürlich der linke und rechte Wert jeweils andere Flächenanteile links vom t-wert ab. Bei zweiseitiger Testung ist der Wert für α/2 zu verwenden, bei einseitiger der Wert für α. Beispiel α = 0.05, damit sollen 95% der Verteilung abgeschnitten werden: Zweiseitige Testung, jeweils 2.5% links und rechts, Wert für 97.5%: t krit;df=22;zweiseitig = 2.074. Einseitige Testung, 5% auf einer Seite, Wert für 95%: t krit;df=22;einseitig = 1.717. S. Garbade (SRH Heidelberg) t-test Statistik 1 13 / 59

t-test für unabhängige Stichproben und homogene Varianzen Outline t-test für unabhängige Stichproben und homogene Varianzen Fragestellung Duchführung des t-tests Prüfgröße t-emp Berechnung t-emp im Beispiel Vergleich t emp mit t krit Ausgabe mit Dokumentation der Teststatistik S. Garbade (SRH Heidelberg) t-test Statistik 1 14 / 59

t-test für unabhängige Stichproben und homogene Varianzen Fragestellung Fragestellung Es soll überprüft werden, ob ein Lerntraining die Leistung in einem Lerntest beeinflusst. Zwei Gruppen: Kontrolle: Kontrollgruppe, ohne Training. Training: Treatmentgruppe, erhält Lerntraining. Ungerichtete Hypothesen: H 0 : Die mittlere Leistung beider Gruppen unterscheidet sich im Lerntest nicht. H 1 : Die mittlere Leistung beider Gruppen unterscheidet sich im Lerntest. Mathematisch ausgedrückt: H 0 : µ Kontrolle = µ Training H 1 : µ Kontrolle µ Training Erreichte Punkte (je mehr, desto besser): S. Garbade (SRH Heidelberg) t-test Statistik 1 15 / 59

t-test für unabhängige Stichproben und homogene Varianzen Fragestellung Fragestellung (Forts. 2) Kontrolle Training 13 16 16 13 14 14 10 16 13 18 14 17 9 11 15 16 11 12 13 15 15 17 17 13 Unterscheiden sich die beiden Gruppen hinsichtlich ihrer durchschnittlichen Punktzahl auf einem Signifikanzniveau von 5%? S. Garbade (SRH Heidelberg) t-test Statistik 1 16 / 59

t-test für unabhängige Stichproben und homogene Varianzen Fragestellung Boxplot der Daten Punkte 10 12 14 16 18 Kontrolle Gruppe Training S. Garbade (SRH Heidelberg) t-test Statistik 1 17 / 59

t-test für unabhängige Stichproben und homogene Varianzen Duchführung des t-tests Duchführung des t-tests Keine Messwiederholung, daher unabhängiger t-test. Wir gehen von Varianzhomogenität aus. Deskriptive Kennwerte (s = Standardabweichung): Kontrolle: Mw = 13, s = 2.19, n = 11. Training: Mw = 15, s = 2.20, n = 13. Als nächstes muss die Prüfgröße t emp berechnet werden. S. Garbade (SRH Heidelberg) t-test Statistik 1 18 / 59

t-test für unabhängige Stichproben und homogene Varianzen Prüfgröße t-emp Prüfgröße t emp bei unabhängigen Stichproben Berechnung der Prüfgröße t emp Darf Varianzhomogenität vorrausgesetzt werden, berechnet sich die Prüfgröße t emp wie folgt: t emp = x 1 x 2 s x1 x 2 = ; wobei (1) s x1 x 2 (n 1 1) s 2 1 + (n 2 1) s 2 ( 2 1 + 1 ) (2) n 1 + n 2 2 n 1 n 2 t emp ist t-verteilt mit df = n 1 + n 2 2 Freiheitsgraden. Bei gleich großen ( ) s Gruppen vereinfacht sich s x1 x 2 zu 2 1 +s2 2 2 1 n + 1 1 n 2. vgl. Bortz und Schuster (2010, S. 120ff). S. Garbade (SRH Heidelberg) t-test Statistik 1 19 / 59

t-test für unabhängige Stichproben und homogene Varianzen Berechnung t-emp im Beispiel Berechnung t emp im Beispiel Deskriptive Kennwerte (s = Standardabweichung): Kontrolle: Mw = 13, s = 2.19, n = 11. Training: Mw = 15, s = 2.20, n = 13. Damit s x1 x 2 : s x1 x 2 = = (n 1 1) s 2 1 + (n 2 1) s 2 2 n 1 + n 2 2 ( 1 (11 1) 2.19 2 + (13 1) 2.20 2 = 0.9 11 + 13 2 n 1 + 1 n 2 ) ( 1 11 + 1 ) 13 S. Garbade (SRH Heidelberg) t-test Statistik 1 20 / 59

t-test für unabhängige Stichproben und homogene Varianzen Berechnung t-emp im Beispiel Berechnung t emp im Beispiel (Forts. 2) t emp ist damit: 13 15 t emp = 0.9 = 2.22 Bei zweiseitiger Testung ist das Vorzeichen von t emp egal. Daher ist es ohne Bedeutung, ob x Kontrolle x Training oder x Training x Kontrolle gerechnet wird. Wie wahrscheinlich ist das Auftreten dieses t-werts? S. Garbade (SRH Heidelberg) t-test Statistik 1 21 / 59

t-test für unabhängige Stichproben und homogene Varianzen Vergleich t emp mit t krit Vergleich t emp mit t krit Kritischer t-wert bei zweiseitiger Testung mit df = 11 + 13 2 = 22: t krit;df=22;α=5%;zweiseitig = 2.074. t emp = 2.22, damit t emp > t krit H 1! Antwortsatz: Mit einer Irrtumswahrscheinlichkeit von 5% unterscheiden sich die durchschnittlichen Ergebnisse im Wissenstest. Die Gruppe mit Lerntraining erzielt signifikant bessere Leistungen als die Kontrollgruppe. S. Garbade (SRH Heidelberg) t-test Statistik 1 22 / 59

t-test für unabhängige Stichproben und homogene Varianzen Vergleich t emp mit t krit Zweiseitige Testung mit t emp (22) = 2.22 0.4 0.3 0.2 Ablehnungsbereich: 2.5% t emp = 2.22 4 3 2 1 0.1 Ablehnungsbereich: 2.5% 0 1 2 3 4 Ist t emp > t krit, tritt t emp in weniger als 5% der Fälle auf. Aus statistischer Sicht ist das ein bedeutsames, signifikantes Ereignis. S. Garbade (SRH Heidelberg) t-test Statistik 1 23 / 59

t-test für unabhängige Stichproben und homogene Varianzen Ausgabe mit Ausgabe mit % Two Sample t- test data: Kontrolle and Training t = -2.2241, df = 22, p- value = 0.03672 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -3.864925-0.135075 sample estimates: mean of x mean of y 13 15 Die Ausgabe p-value gibt die Wahrscheinlichkeit an, einen Betrag des t-werts größer als p-value zu erhalten. t-werte mit t < 2.22 bzw. t > 2.22 treten in etwa 3.7% aller Fälle auf. Diese Wahrscheinlichkeit ist kleiner als 5% und daher aus statistischer Sicht bedeutsam, signifikant. S. Garbade (SRH Heidelberg) t-test Statistik 1 24 / 59

t-test für unabhängige Stichproben und homogene Varianzen Dokumentation der Teststatistik Dokumentation der Teststatistik In wissenschaftlichen Arbeiten oder Publikationen gibt es Standards, wie das Ergebnis eines statistischen Tests zu berichten ist. Im Falle des t-tests ist das allgemein: t(df) = t-wert; p = p-wert. Ist ein Test nicht signifikant, wird oft t(df) = t-wert; n. s. geschrieben, wobei n. s für nicht signifikant steht. Beispiel: Der Vergleich zwischen Kontroll- und Experimentalgruppe mittels eines t-test für unabhängige Stichproben ergab einen signifikanten Unterschied bezüglich der Testleistung auf dem 5% Niveau [t(22) = 2.22; p = 0.038]. S. Garbade (SRH Heidelberg) t-test Statistik 1 25 / 59

Einseitige Testung Outline Einseitige Testung Hypothesen Berechnung der Prüfgröße S. Garbade (SRH Heidelberg) t-test Statistik 1 26 / 59

Einseitige Testung Hypothesen Hypothesen Bei gerichteten Hypothesen wird ein Effekt in einer bestimmten Richtung vermutet. Beispiel: H 0 : Die durchschnittliche Punktzahl im Wissenstest in der Treatmentgruppe ist kleiner oder gleich der durchschnittlichen Punktzahl in der Kontrollgruppe. H 1 : Die durchschnittliche Punktzahl im Wissenstest in der Treatmentgruppe ist größer als in der Kontrollgruppe. Es geht hier also um einen Größenvergleich: H 0 : µ Training µ Kontrolle H 1 : µ Training > µ Kontrolle In diesem Fall reicht es, wenn bei der t-verteilung nur ein Segment abgeschnitten wird einseitige Testung. S. Garbade (SRH Heidelberg) t-test Statistik 1 27 / 59

Einseitige Testung Berechnung der Prüfgröße Berechnung der Prüfgröße Bei einer gerichteten Fragestellung ist das Vorzeichen von t emp von großer Bedeutung. Die Mittelwertsdifferenz bei Berechnung von t emp muss den gerichteten Hypothesen entsprechen. In unserem Fall gilt in der H 1 µ Training > µ Kontrolle, damit sollte t emp bei Gültigkeit der H 1 positiv sein. Damit: t emp = x Training x Kontrolle 0.9 15 13 = 0.9 = 2.22 S. Garbade (SRH Heidelberg) t-test Statistik 1 28 / 59

Einseitige Testung Berechnung der Prüfgröße Einseitige Testung t emp (22) = 2.22 0.4 0.3 0.2 0.1 Ablehnungsbereich 5% t emp = 2.22 4 3 2 1 0 1 2 3 4 Bei einseitiger Testung kann t emp etwas kleiner werden, das Ergebnis kann trotzdem eher signifikant werden. Einseitige Testungen haben eine etwas größere Teststärke. S. Garbade (SRH Heidelberg) t-test Statistik 1 29 / 59

Einseitige Testung Berechnung der Prüfgröße Anmerkung In dem Beispiel wurde die H 1 so formuliert, dass die Gruppe mit Training einen höheren Punktewert erreicht als die Kontrollgruppe. Natürlich kann man die H 1 auch so formulieren, dass die Kontrollgruppe einen niedrigeren Punktewert als die Gruppe mit Training erreicht. In diesem Fall sollte t emp negativ sein. S. Garbade (SRH Heidelberg) t-test Statistik 1 30 / 59

Einseitige Testung Berechnung der Prüfgröße Beispiel für einseitige Testung t emp (22) = 2.22 0.4 Ablehnungsbereich 5% t emp = 2.22 4 3 2 0.3 0.2 0.1 1 0 1 2 3 4 Bei einseitiger Testung mit negativer Prüfgröße muss t emp < t krit sein, damit t emp signifikant wird. Da die t-verteilung symmetrisch, ist die Fläche links von t krit = 1 P(t krit ), wobei P(t krit ) die tabellierte Fläche für t krit ist. S. Garbade (SRH Heidelberg) t-test Statistik 1 31 / 59

t-test bei Varianzheterogenität Outline t-test bei Varianzheterogenität Varianzheterogenität F-Test Dichte der F-Verteilung Prüfung auf Varianzhomogenität Welch Korrektur Datenbeispiel S. Garbade (SRH Heidelberg) t-test Statistik 1 32 / 59

t-test bei Varianzheterogenität Varianzheterogenität Varianzheterogenität Der t-test setzt vorraus, dass die beiden zu vergleichenden Gruppen die gleiche Varianz haben. Ist dies nicht der Fall, ist die Schätzung der gemeinsamen Varianz verzerrt. s x1 x 2 Es sind verschiedene Varianten des t-tests bei Varianzheterogenität entwickelt worden. Die heute gebräuchlichste ist eine Korrektur über die Freiheitsgrade: die Welch-Korrektur. S. Garbade (SRH Heidelberg) t-test Statistik 1 33 / 59

t-test bei Varianzheterogenität F-Test F-Test Der F-Test prüft, ob sich zwei Stichprobenvarianzen bedeutsam unterscheiden. Die einseitigen Hypothesen für s 2 1 s2 2 lauten: H 0 : σ2 1 σ 2 2 H 1 : σ2 1 σ 2 2 = 1 > 1 Eine Alternative zum F-Test ist der Levene-Test. Prüfgröße F emp F emp = s2 1 s 2, wobei s 2 1 s 2 2 (3) 2 F emp ist F-verteilt mit df 1 = n 1 1 und df 2 = n 2 1 Freiheitsgraden. S. Garbade (SRH Heidelberg) t-test Statistik 1 34 / 59

t-test bei Varianzheterogenität Dichte der F-Verteilung Dichte der F-Verteilung 0.7 0.6 df 1 = 1, df 2 = 5 df 1 = 5, df 2 = 10 df 1 = 10, df 2 = 10 0.5 0.4 0.3 0.2 0.1 0 0 1 2 3 4 S. Garbade (SRH Heidelberg) t-test Statistik 1 35 / 59

t-test bei Varianzheterogenität Dichte der F-Verteilung Tabellierte F-Werte Zähler-df Nenner-df Fläche 1 2 3 4 5 6 7 8 1 0.95 161 200 216 225 230 234 237 239 0.99 4052 4999 5403 5625 5764 5859 5928 5981 2 0.95 18.5 19 19.2 19.2 19.3 19.3 19.4 19.4 0.99 98.5 99 99.2 99.2 99.3 99.3 99.4 99.4 3 0.95 10.1 9.55 9.28 9.12 9.1 8.94 8.89 8.85 0.99 34.1 30.8 29.5 28.7 28.2 27.9 27.7 27.5 4 0.95 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 0.99 21.2 18 16.7 16 15.5 15.2 15 14.8 5 0.95 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 0.99 16.3 13.3 12.1 11.4 11 10.7 10.5 10.3 6 0.95 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 0.99 13.7 10.9 9.78 9.15 8.75 8.47 8.26 8.1 7 0.95 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 0.99 12.2 9.55 8.45 7.85 7.46 7.19 6.99 6.84 8 0.95 5.32 4.46 4.07 3.84 3.69 3.58 3.5 3.44 0.99 11.3 8.65 7.59 7.01 6.63 6.37 6.18 6.03 S. Garbade (SRH Heidelberg) t-test Statistik 1 36 / 59

t-test bei Varianzheterogenität Prüfung auf Varianzhomogenität Prüfung auf Varianzhomogenität Deskriptive Kennwerte: Kontrolle: Mw = 13, s = 2.19, n = 11. Training: Mw = 15, s = 2.20, n = 13. F-Tests: F emp = 2.202 2.19 2 1.01 Kritischer F-Wert: F df1 =12;df 2 =10;α=5%;einseitig = 2.91. Damit: F emp < F krit H 0! Schlusssatz: Mit einer Irrtumswahrscheinlichkeit von 5% sind die beiden Varianzen aus der Kontrollgruppe und der Treatmentgruppe gleich. Wir können also den t-test für homogene Varianzen verwenden. S. Garbade (SRH Heidelberg) t-test Statistik 1 37 / 59

t-test bei Varianzheterogenität Prüfung auf Varianzhomogenität Ausgabe mit F test to compare two variances data: Training and Kontrolle F = 1.0069, num df = 12, denom df = 10, p- value = 0.9941 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.2780888 3.3969803 sample estimates: ratio of variances 1.006944 Satz: Der F-Test auf Varianzhomogenität ist auf dem 5% Niveau nicht signifikant [F(12, 10) = 1.01; n.s.]. S. Garbade (SRH Heidelberg) t-test Statistik 1 38 / 59

t-test bei Varianzheterogenität Welch Korrektur Welch Korrektur Bei der Welch Korrektur wird der Standardfehler des Mittels für die Prüfgröße anders berechnet. Da die so resultierende Prüfgröße nicht mehr exakt t-verteilt ist, wird eine Korrektur der Freiheitsgrade vorgenommen. Welch Korrektur s x1 x 2 = df korr = s 2 1 + s2 2 (4) n 1 n 2 ( ) s 2 2 1 n 1 + s2 2 n 2 s 4 1 n 2 1 (n 1 1) + s 4 2 n 2 2 (n 2 1) (5) S. Garbade (SRH Heidelberg) t-test Statistik 1 39 / 59

t-test bei Varianzheterogenität Datenbeispiel Datenbeispiel Kontrolle: Mw = 13, s = 2.19, n = 11. Die Treatmentgruppe (n = 4) erzielt nun folgende Werte: 17, 20, 25, 30. Treatmentgruppe: Mw: 23, s = 5.72, n = 4. S. Garbade (SRH Heidelberg) t-test Statistik 1 40 / 59

t-test bei Varianzheterogenität Datenbeispiel Boxplot der Ergebnisse Punkte 10 15 20 25 30 Kontrolle Gruppe Treatment S. Garbade (SRH Heidelberg) t-test Statistik 1 41 / 59

t-test bei Varianzheterogenität Datenbeispiel Prüfung auf Varianzhomogenität Varianzen: Kontrolle (n=11) = 2.19 2, Treatment (n=4) = 5.72 2. F-Test: F emp = 5.722 2.19 2 = 6.82 mit df 1 = 3 und df 2 = 10 Freiheitsgraden. Kritischer F-Wert: F krit,df1 =3,df 2 =10,α=5%,einseitig = 3.71 Damit: F emp > F krit H 1! Schlusssatz: Mit einer Irrtumswahrscheinlichkeit von 5% sind die beiden Varianzen verschieden. S. Garbade (SRH Heidelberg) t-test Statistik 1 42 / 59

t-test bei Varianzheterogenität Datenbeispiel Berechnung der Prüfgröße Kontrolle: Mw = 13, s = 2.19, n=11. Treatmentgruppe: Mw: 23, s = 5.72, n=4. Prüfgröße: t emp = x 1 x 2 Wir prüfen ungerichtet: s x1 x 2, wobei s x1 x 2 = 13 23 t emp = 2.19 2 11 + 5.722 4 10 = 0.44 + 8.18 = 3.41 s 2 1 n 1 + s2 2 n 2 S. Garbade (SRH Heidelberg) t-test Statistik 1 43 / 59

t-test bei Varianzheterogenität Datenbeispiel Bestimmung der Freiheitsgrade Kontrolle: Mw = 13, s = 2.19, n=11. Treatmentgruppe: Mw: 23, s = 5.72, n=4. Berechnung: df korr = ( s 2 1 n 1 + s2 2 n 2 ) 2 s 4 1 n 2 1 (n 1 1) + s 4 2 n 2 2 (n 2 1) ) 2 ( 2.19 2 11 + 5.722 4 = 2.19 4 5.724 + 112 (11 1) 4 2 (4 1) = 74.228 22.321 = 3.325 S. Garbade (SRH Heidelberg) t-test Statistik 1 44 / 59

t-test bei Varianzheterogenität Datenbeispiel Vergleich t emp mit t krit Die Prüfgröße t emp = 3.41 muss nun mit t krit mit 3.325 Freiheitsgraden verglichen werden. Da dieser Wert nicht tabelliert ist, würde man df korr = 3.325 auf 3 abrunden. Mit einem Statistik Programm kann der exakte t-wert berechnet werden: t krit,df=3.325,α=5%,zweiseitig = 3.014. Damit: t emp > t krit H 1! Schlusssatz: Mit einer Irrtumswahrscheinlichkeit von 5% erreicht die Treatmentgruppe signifikant mehr Punkte im Lerntest als die Kontrollgruppe. S. Garbade (SRH Heidelberg) t-test Statistik 1 45 / 59

t-test bei Varianzheterogenität Datenbeispiel Ausgabe mit Welch Two Sample t- test data: Kontrolle and Treatment t = -3.4094, df = 3.326, p- value = 0.03601 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -18.837164-1.162836 sample estimates: mean of x mean of y 13 23 S. Garbade (SRH Heidelberg) t-test Statistik 1 46 / 59

t-test bei Varianzheterogenität Datenbeispiel Ausgabe mit anderen Systemen Beim System muss explizit angegeben werden, ob ein t-test mit Varianzhomogenität oder Heterogenität gerechnet werden soll. Einige Statistikprogramme wie SPSS oder rechnen einen F bzw. Levene Test und beide t-tests, der Anwender kann dann den gewünschten Test auswählen. S. Garbade (SRH Heidelberg) t-test Statistik 1 47 / 59

t-test bei Varianzheterogenität Datenbeispiel Ausgabe mit S. Garbade (SRH Heidelberg) t-test Statistik 1 48 / 59

t-test für abhängige Stichproben Outline t-test für abhängige Stichproben Abhängige Stichproben Prüfgröße t emp Beispiel Weitsprung Rechengänge Ausgabe mit Ausgabe mit S. Garbade (SRH Heidelberg) t-test Statistik 1 49 / 59

t-test für abhängige Stichproben Abhängige Stichproben Abhängige Stichproben Bei abhängigen Messungen muss man davon ausgehen, dass die einzelnen Messungen korrelieren. Durch korrelierte Messungen können Verzerrungen bei der Berechnung der Prüfgrößen entstehen, i. d. R. werden diese unterschätzt. Typischerweise handelt es sich um Vorher-Nachher-Untersuchungen. Einige Autoren gehen davon aus, dass Messwerte unter vielen Umständen korreliert sein können, z. B. Bortz und Schuster (2010, S. 124ff): Zwillingsuntersuchungen. Vergleich von Ehepartnern. Versuchspläne mit Matched-Pairs. Diese eher heuristischen Diskussionen können statistisch gelöst werden, in dem man Annahmen über möglicher Korrelationen explizit mit modelliert. So lassen sich auch verschiedene Arten von möglichen Korrelationen prüfen. S. Garbade (SRH Heidelberg) t-test Statistik 1 50 / 59

t-test für abhängige Stichproben Prüfgröße t emp Prüfgröße t emp t emp bei verbundenen Stichproben Die Prüfgröße t emp bei verbundenen Stichproben mit n Messwertpaaren berechnet sich zu t emp = ( ) d n (6) s d mit df = n 1 Freiheitsgraden. d ist der Mittelwert der Differenzen der Messwertpaare x i1 x i2, s d ist die Standardabweichung der Differenzen. S. Garbade (SRH Heidelberg) t-test Statistik 1 51 / 59

t-test für abhängige Stichproben Beispiel Weitsprung Fragestellung & Daten Ein Sportlehrer will wissen, ob sich die Leistung seiner Schüler im Weitsprung verändert. Dazu führt er zwei Tests durch: Einen zu Beginn des Schulhalbjahres, einen am Ende. Sprungleistung in cm pro Schüler: Schüler Messung 1 Messung 2 1 180 185 2 210 215 3 165 173 4 155 150 5 178 188 6 192 190 7 170 175 8 196 205 9 184 196 10 160 166 S. Garbade (SRH Heidelberg) t-test Statistik 1 52 / 59

t-test für abhängige Stichproben Beispiel Weitsprung Hypothesen Hypothesen: H 0 : Die Sprungleistung hat sich über das Schulhalbjahr nicht verändert. H 1 : Die Sprungleistung hat sich über das Schulhalbjahr verändert. bzw. H 0 : µ Messung 1 = µ Messung 2 H 1 : µ Messung 1 µ Messung 2 Da Differenzen geprüft werden: H 0 : Messung 1 Messung 2 = 0 H 1 : Messung 1 Messung 2 0 S. Garbade (SRH Heidelberg) t-test Statistik 1 53 / 59

t-test für abhängige Stichproben Beispiel Weitsprung Boxplot der Ergebnisse Sprungleistung in cm 150 160 170 180 190 200 210 Messung 1 Messung 2 Zeitpunkt S. Garbade (SRH Heidelberg) t-test Statistik 1 54 / 59

t-test für abhängige Stichproben Rechengänge Rechengänge Hilfstabelle: Schüler Messung 1 Messung 2 Differenz d 1 180 185-5 2 210 215-5 3 165 173-8 4 155 150 5 5 178 188-10 6 192 190 2 7 170 175-5 8 196 205-9 9 184 196-12 10 160 166-6 = 53 Mittelwert: d = 5.3, Streuung: s = 5.25. S. Garbade (SRH Heidelberg) t-test Statistik 1 55 / 59

t-test für abhängige Stichproben Rechengänge Rechengänge (Forts. 2) Prüfgröße: t emp = n d s d = 10 5.3 5.25 = 3.19 Kritischer Wert: t tkrit;α=0.05;df=9 = 2.262. Damit: t emp > t krit H 1! Schlusssatz: Auf einem Signifikanzniveau von 5% unterscheidet sich die Sprungleistung von der ersten zur zweiten Messung: Die Sprungleistung verbessert sich signifikant. S. Garbade (SRH Heidelberg) t-test Statistik 1 56 / 59

t-test für abhängige Stichproben Ausgabe mit Ausgabe mit Paired t- test data: Vorher and Nachher t = -3.1922, df = 9, p- value = 0.01097 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -9.055908-1.544092 sample estimates: mean of the differences -5.3 S. Garbade (SRH Heidelberg) t-test Statistik 1 57 / 59

t-test für abhängige Stichproben Ausgabe mit Ausgabe mit S. Garbade (SRH Heidelberg) t-test Statistik 1 58 / 59

t-test für abhängige Stichproben Ausgabe mit Literaturverzeichnis Bortz, J. & Schuster, C. (2010). Statistik für Human- und Sozialwissenschaftler (7. Auflage). Berlin: Springer. S. Garbade (SRH Heidelberg) t-test Statistik 1 59 / 59