Einführung in die Varianzanalyse mit SPSS SPSS-Benutzertreffen am URZ Carina Ortseifen 6. Mai 00 Inhalt. Varianzanalyse. Prozedur ONEWAY. Vergleich von k Gruppen 4. Multiple Vergleiche 5. Modellvoraussetzungen 6. Weiterführende Themen 7. Literatur. Varianzanalyse kann nach zwei Methoden gerechnet werden: Klassische Methode nach Fisher (Zerlegung der Gesamtvarianz in Quadratsummen innerhalb und zwischen den Gruppen) Allgemeines lineares Modell (Korrelations- und Regressionsrechnung). Beobachtungen und Modell Beobachtungen yij, i=,..,ni, j=,..,k Beispiel: Iris-Daten, ni=50, k=, yij=sw Einfaktorielles Modell mit festen Effekten: Y ij =µ i +ε ij (i=,...,n i, N=n +..+n k ) µ i unbekannte Erwartungswerte der k Gruppen ε ij unabhängige N(0,σ )-verteilte Zufallsvariablen mit σ =...=σ k (Homoskedastizität). Hypothesen / Fragen F-Test: H 0 : Alle Mittelwerte µ i sind gleich. Multiple Mittelwertvergleiche: Welche µ i unterscheiden sich? Siehe Kapitel 4.. Varianzzerlegung (Anova-Tafel) Streuung FG SS(*) MS=SS/FG ---------------------------------------------------- Unterschiede zwischen k- Y i. -Y.. MS T Gruppen F= MS T / MS E Zufälliger N-k Y ij -Y i. MS E Fehler Gesamt N- Y ij -Y.. (*) Summe von Quadraten
.4 F-Test H 0 wird verworfen, wenn MS T sehr viel größer als MS E ist, d.h. die Variation zwischen den Meßreihen ist wesentlich größer als die Variation innerhalb der Meßreihen. F=MS T /MS E ist unter H 0 F-verteilt mit k- und N-k Freiheitsgraden.. Prozedur ONEWAY Bestandteil des SPSS Basismoduls Menüpunkt: > Mittelwerte vergleichen > Einfaktorielle ANOVA Lehne H 0 ab, wenn F>F k-,n-k,-α. F-Test mit ONEWAY. Prozedur ONEWAY - Ausgabe Nullhypothese H 0 : µ = µ =... = µ k ONEWAY ANOVA Zwischen den Gruppen Innerhalb der Gruppen Gesamt Quadrats Mittel der umme df Quadrate F Signifikanz,45 5,67 49,60,000 6,96 47,5 8,07 49. ONEWAY - Optionen Deskriptive Statistiken liefert für die gesamte Stichprobe und die Gruppen Mittelwert, Standardabweichung, Standardfehler, 95%- Konfidenzintervall für Mittelwert, Minimum und Maximum 4. Multiple Mittelwertvergleiche F-Test ist ein globaler Test auf Unterschied in den k Mittelwerten Um zu sehen, welche Gruppen sich unterscheiden, rechnet man multiple Mittelwertvergleiche. ONEWAY Post Hoc.. (= Post-Hoc-Mehrfachvergleiche)
4. Post Hoc Mehrfachvergleiche SPSS unterscheidet Post Hoc-Spannweitentests (ermitteln homogene Untergruppen, deren Mittelwerte nicht voneinander abweichen) und Paarweise multiple Vergleiche (testen die Differenz zwischen gepaarten Mittelwerten) in der Ergebnisdarstellung. (Details in der Hilfe) 4. Bonferroni t-test berechnet Zweistichproben t-tests für die Paarvergleiche und testet diese auf dem Niveau α/m (m = Anzahl der Paarvergleiche) Anzahl aller möglichen Vergleiche: k(k-)/ Abhängige Variable: Bonferroni (I) BLUME (J) BLUME Mehrfachvergleiche Mittlere Standardf 95%-Konfidenzintervall Differenz (I-J) ehler Signifikanz Untergrenze Obergrenze,6580*,06794,000,495,85,4540*,06794,000,895,685 -,6580*,06794,000 -,85 -,495 -,040*,06794,009 -,685 -,095 -,4540*,06794,000 -,685 -,895,040*,06794,009,095,685 *. Die mittlere Differenz ist auf der Stufe.05 signifikant. 4. Tukey Test Tukey-HSD a BLUME Signifikanz Untergruppe für Alpha =.05. N 50,7700 50,9740 50,480,000,000,000 Die Mittelwerte für die in homogenen Untergruppen befindlichen Gruppen werden angezeigt. a. Verwendet ein harmonisches Mittel für Stichprobengröße = 50,000. 4. Weiteres Beispiel: Hyper.sav Koerpergroesse Untergruppe für Alpha =.05. Altersklassen N Tukey-HSD a,b 66-75 Jahre 47 6,47 > 75 Jahre 4 6,67 56-65 Jahre 5 64,8 64,8 bis 55 Jahre 5 69,0 Signifikanz,55,068 Die Mittelwerte für die in homogenen Untergruppen befindlichen Gruppen werden angezeigt. a. Verwendet ein harmonisches Mittel für Stichprobengröße = 9,00. b. Die Gruppengrößen sind nicht identisch. Es wird das harmonische Mittel der Gruppengrößen verwendet. Fehlerniveaus des Typs I sind nicht garantiert. 4.4 Weitere multiple Vergleiche Scheffé Kritische Differenz mit F-Verteilung Tukey neben NV wird balanciertes Design vorausgesetzt kritische Differenz mit studentisierter Spannweitenverteilung Dunnett Vergleiche mit einer Kontrolle (many one) Sequentielle Tests F nach REGW, Q nach REGW
4.5 Empfehlungen (nach DJS) paarweise Vergleiche bei balanciertem Design TUKEY oder Q-REGW paarweise Vergleiche bei unbalanciertem Design SCHEFFE oder SIDAK Lineare Kontraste SCHEFFE, manchmal auch SIDAK oder TUKEY 5. Modellvoraussetzungen. Normalverteilung der Fehler. Homoskedastizität (=Gleichheit der Gruppenvarianzen) und deren Überprüfung:. Berechnung der Residuen und Normalverteilungscheck mittels Explorativer Datenanalyse. Optionen Statistik - Test auf Varianzhomogenität 5. Normalverteilte Fehler Untersuchung nicht mit ONEWAY möglich aber mit GLM: > Allgemeines lineares Modell > Univariat. Nach Festlegung der Modellparameter Speichern Residuen Nicht standardisiert auswählen.. > Deskriptive Statistiken > Explorative Datenanalyse Diagramme Normalverteilungsdiagramm mit Test 5. Homoskedastizität = Gleichheit der Gruppenvarianzen Levene-Test setzt keine Normalverteilung, nur Stetigkeit voraus Test der Homogenität der Varianzen Levene-St atistik df df Signifikanz,60 47,550 5. Alternativen zum F-Test Sind die Varianzen nicht homogen, bietet ONEWAY folgende robusten Tests (über Optionen Statistik) an:. Brown-Forsythe. Welch-Test Robuste Testverfahren zur Prüfung auf Gleichheit der Mittelwerte Welch-Test Brown-Forsythe a. Asymptotisch F-verteilt Statistik a df df Sig. 45,0 97,40,000 49,60 4,654,000 6. Weiterführende Themen. Mehrfaktorielle Modelle Multivariate Varianzanalysen. Zufällige Effekte. Messwiederholung 4. Nichtparametrische Alternativen
6. Zweifaktorielle Varianzanalyse = Untersuchung des gemeinsamen Effekts von zwei Einflußfaktoren A und B vollständig kreuzklassifiziert hierarchisch klassifiziert Untersuchung von Haupteffekten und Wechselwirkungen 6.. Beispiel: Fütterungsversuch Abhängigkeit des Gewichtszuwachses von Futtermischungen Faktor A: Vitaminzusatz (,, ) Faktor B: Darrreichungsform (pelettiert, gemahlen) N= Ratten, d.h. n= Ratten pro Faktorkombination 6.. Datenmaterial 6.. GLM Ergebnis Variablen a, b, gewicht: 5 4 8 5 7 9 4 8 5 Prozedur GLM, Modul Advanced Statistics > Allgemeines lineares Modell > Multivariat Tests der Zwischensubjekteffekte Abhängige Variable: GEWICHT Quelle Quadratsum me vom Typ III df Mittel der Quadrate F Signifikanz Korrigiertes Modell 400,000 a 5 80,000 8,57,0 Konstanter Term 4800,000 4800,000 54,86,000 A 5,000 76,000 8,4,00 B 9,000 9,000 0,57,004 A * B 56,000 8,000,000,5 Fehler 56,000 6 9, Gesamt 556,000 Korrigierte Gesamtvariation 456,000 a. R-Quadrat =,877 (korrigiertes R-Quadrat =,775) 6. Zufällige Effekte Stufen des Einflussfaktors werden nicht systematisch und bewusst festgelegt oder vorgegeben, sondern zufällig ausgewählt. Beispiel: Von vielen vorhandenen Sorten werden drei zufällig ausgewählt. > Gemischte Modelle > Linear 6. Messwiederholung (GLM) > Allgemeines lineares Modell > Messwiederholung
6.4 Nichtparametrische VA Unabhängige Gruppen Kruskal-Wallis Test Prozedur NPAR aus Basismodul > Nichtparametrische Tests > k unabhängige Stichproben Aber: Keine direkten multiplen Vergleiche Abhängige Gruppen Friedman Test > Nichtparametrische Tests > k verbundene Stichproben 7. Literatur SPSS Online Hilfe A. Bühl, P. Zöfel: SPSS Version 0, Addison Wesley Dufner, J., Jensen, U. Schumacher, E.: Statistik mit SAS. Teubner Verlag, 00.