Mittelwertvergleiche, Teil I: Zwei Gruppen

FB W. Ludwig-Mayerhofer Statistik II Mittelwertvergleiche Herzlich willkommen zur Vorlesung Mittelwertvergleiche, Teil I: Zwei Gruppen

FB W. Ludwig-Mayerhofer Statistik II Mittelwertvergleiche Mittelwertvergleiche: Übersicht Zwei Gruppen:. Unabhängige, gleiche bzw. ungleiche Varianzen. Mehr als zwei Gruppen:. Einfache (einfaktorielle) Globaltest und Einzelvergleiche. Zweifaktorielle Lehrmaterialien: Bücher von Bortz (Statistik) oder Ramsey & Schafer; Vorlesungsunterlagen

FB W. Ludwig-Mayerhofer Statistik II Mittelwertvergleiche 3 Zwei Gruppen: der Gruppen () abhängig oder unabhängig? Entscheidung nach inhaltlichem Wissen über Daten und ihre Entstehung. Abhängigkeit besteht vor allem, wenn Daten zwei Mal an gleichen Personen erhoben wurden oder wenn zweite Gruppe in Abhängigkeit von erster ausgewählt wurde (z.b. Einkommen von Ehepartnern). Varianz gleich oder ungleich? Entscheidung nach Dateninspektion und Tests. Daten normalverteilt? (Wenn nein, evtl. Alternativen anwenden.)

FB W. Ludwig-Mayerhofer Statistik II Mittelwertvergleiche 4 für unabhängige : Vollzeiterwerbstätige Männer (n7) und Frauen (n8) Beispiel : Altersunterschied? Männer: Frauen: Männer: Frauen: σ ˆ x 4,6 9,5 x 40,6 σ 36,4 Beispiel : Einkommensunterschied? ˆ σ ˆ x 5588 5 8479 ˆ x 3898 σ 386506

FB W. Ludwig-Mayerhofer Statistik II Mittelwertvergleiche 5 Alter 70 60 50 40 30 0 0 N 7 Geschlecht Maennlich Inspektion der Daten Bruttolohn 000 0000 8000 6000 4000 000 0 8 N 7 Weiblich Maennlich Geschlecht 8 87 Weiblich

FB W. Ludwig-Mayerhofer Statistik II Mittelwertvergleiche 6 Test auf Varianzgleichheit Häufig verwendet: Der Levene-Test (wird hier nicht besprochen; siehe ILMES). Wenn Test nicht signifikant, heißt das, dass Nullhypothese gleicher Varianzen nicht abgelehnt werden kann für gleiche Varianzen. Wenn Test signifikant, wird Nullhypothese gleicher Varianzen abgelehnt für ungleiche Varianzen.

FB W. Ludwig-Mayerhofer Statistik II Mittelwertvergleiche 7 Test auf Varianzgleichheit Ergebnisse des Levene-Tests: Alter: F0,93, p0,337 Varianzen gleich Einkommen: F 8,6, p0,004 Varianzen ungleich. Problem bei Einkommen außerdem: Normalverteilung fraglich. (Mögliche Lösung: Variable transformieren; oder nicht-parametrischer Test. Problem ist möglicherweise angesichts unterschiedlich großer Gruppen besonders gravierend.)

FB W. Ludwig-Mayerhofer Statistik II Mittelwertvergleiche 8 Formulieren der Hypothese, Festlegen der Irrtumswahrscheinlichkeit (hier: 0,05) und des kritischen Wertes Zahl der Freiheitsgrade (bei gleichen Varianzen): n-, hier also: 98 H : μ μ ; H : μ μ ; 0 X Y X Y Kritischer Wert: t <,98 oder t >+,98 H : μ μ ; H : μ >μ ; 0 X Y X Y Kritischer Wert: t >,66 H : μ μ ; H : μ <μ ; 0 X Y X Y Kritischer Wert: t <,66

FB W. Ludwig-Mayerhofer Statistik II Mittelwertvergleiche 9 T T Berechnung der T-Statistik (Bsp: Alter, also gleiche Varianzen) n 7 + n + ( x x ) μ ( n ) ˆ σ + ( n ) n ( 4,6 40,6) 8 + n 0 ˆ σ 7 9,5 + 7 36,4 7 + 8 0,806 Gleichgültig, welche H 0 formuliert wurde die Teststatistik liegt nicht im Ablehnungsbereich.

FB W. Ludwig-Mayerhofer Statistik II Mittelwertvergleiche 0 T für unabhängige, ungleiche Varianzen (Einkommen) ( x x ) ˆ σ n ˆ σ + n μ ( 5 588 3 898) 584 79 7 ˆ σ ˆ σ + n n k ˆ σ ˆ σ + n n n n 4 769057 90,4 90 73034 6+ 9086 74 0 386505 + 8 4,85 Freiheitsgrade müssen nach dieser komplexen Formel berechnet werden!

FB W. Ludwig-Mayerhofer Statistik II Mittelwertvergleiche Bruttolohn Problem: Varianzungleichheit und Abweichung von Normalverteilung Lösung: Logarithmieren? 000 0000 8000 6000 4000 000 0 N Geschlecht 7 Maennlich Vorher Nachher 8 87 Weiblich Ln Einkommen 0,0 9,5 9,0 8,5 8,0 7,5 95 N Geschlecht 7 36 Maennlich 8 Weiblich

FB W. Ludwig-Mayerhofer Statistik II Mittelwertvergleiche Varianzungleichheit und Abweichung von Normalverteilung: für logarithmierte Werte Männer Frauen : Test auf t Test : : x x 8,54, 8,4, ˆ σ ˆ σ 0,009 0,84 Varianzhomogenität : t 3,468 98 d. f. F 0,68, Alternative: Nicht-parametrischer Test; wird später vorgestellt. p 0,4

FB W. Ludwig-Mayerhofer Statistik II Mittelwertvergleiche 3 bei bekannten Varianzen Wenn die Varianz des untersuchten Merkmals in den Gruppen bekannt ist, so folgt die Testgröße einer Standardnormalverteilung (siehe unten). Beispiel: Geeichte Tests. z ( x x ) σ n μ σ + n

FB W. Ludwig-Mayerhofer Statistik II Mittelwertvergleiche 4 T für abhängige xd s d x sd n d μ d das arithmetische Mittel der Differenzen n i ( d x ) i n d mit n- Freiheitsgraden (n Zahl der Fälle, nicht Zahl der Messwerte) Standardabweichung der Differenzen d i

FB W. Ludwig-Mayerhofer Statistik II Mittelwertvergleiche 5 s d für abhängige,66667 T 7,906 0,564,449 4 6 6 8 7 9 0,3333 5 0,564 Fiktives Beispiel: Punkte in Mathe-Test mit alter und neuer Unterrichtsmethode (Rundungen!)

FB W. Ludwig-Mayerhofer Statistik II Mittelwertvergleiche 6 für abhängige Fiktives Beispiel: Punkte in Mathe-Test mit alter und neuer Unterrichtsmethode. Die gleiche Datenkonstellation bei unabhängigen bringt ein T von -0,378 nicht im geringsten signifikant. Die Veränderung ist relativ gering im Vergleich zur Unterschiedlichkeit (Varianz) der Untersuchungsobjekte aber diese Unterschiedlichkeit interessiert hier nicht, sondern nur die (geringe) Änderung aufgrund der Wirkung der neuen Unterrichtsmethode.

FB W. Ludwig-Mayerhofer Statistik II Mittelwertvergleiche 7 Wichtigste des t- Tests Der funktioniert am besten bei gleich großen Gruppen mit gleicher Varianz und einer normalverteilten Variablen. Bei gleichen Varianzen sind auch unterschiedlich große Gruppen wenig problematisch. Wenn sowohl umfänge als auch Varianzen deutlich verschieden sind, dann ist mit mehr Fehlentscheidungen rechnen. Das gleiche gilt (auch bei gleich großen ), wenn Daten nicht normal verteilt sind und ungleiche Varianzen besitzen.