SPSS III Mittelwerte vergleichen A Zwei Gruppen ------------ Zwei-Stichproben t-test Beispieldatei: Seegräser Fragestellung: Unterscheidet sich die Anzahl der Seegräser in Gebieten mit und ohne Seeigelvorkommen signifikant voneinander? H0: Die mittlere Anzahl der Seegräser (µ) hängt nicht vom Seeigelvorkommen ab. µ ohne Seeigel = µ mit Seeigel Vorbereitung Zunächst gilt es, die Voraussetzungen für die Anwendung des t-tests zu überprüfen, welche sind: 1. Die Stichproben müssen voneinander unabhängig sein 2. Die Verteilung der einzelnen Stichproben müssen einer Normalverteilung folgen (K-S- Test oder Shapiro Wiks Test) 3. Die Varianzen der beiden Stichproben müssen gleich sein (Levene-Test) 1. 2. Shapiro Wilks Test, da kleine Gruppengröße (Faustregel n<50, also eigentlich immer) Auswahl über Explorative Datenanalyse In die Faktorenliste wird die Gruppenvariable eingetragen, also Seeigel ja/ nein Wenn nur der Test auf Normalverteilung gewünscht wird, reicht die Auswahl Diagramme 1
*. Dies ist eine untere Grenze der echten Signifikanz. a. Signifikanzkorrektur nach Lilliefors Tests auf Normalverteilung Seeigel vorhanden? Kolmogorov-Smirnov a Shapiro-Wilk Statistik df Signifikanz Statistik df Signifikanz ja,232 11,101,901 11,188 nein,130 14,200 *,960 14,721 Da p > 0.05, wird die Nullhypothese, dass die Anzahl der Seegräser normalverteilt ist, nicht verworfen. Bedingung 2 ist erfüllt. 3. Varianzhomogenität wird geprüft mit Hilfe des Levene Tests Die Varianzhomogenität ist eine nicht ganz so wichtige Voraussetzung, denn es gibt einen in SPSS implementierten Test, der ungleiche Varianzen berücksichtigt. Der Levene-Test wird bei Auswahl des T-Tests frei Haus mitgeliefert. Also zur Ausführung des Tests: Testausführung Ausgabe: Anzahl der Seegräser pro m2 Gruppenstatistiken Seeigel vorhanden? N Mittelwert Standard abweichung Standardfehler des Mittelwertes ja 11 52,09 7,739 2,333 nein 14 35,71 8,757 2,340 2
Anzahl der Seegräser pro m2 Varianzen sind gleich Varianzen sind nicht gleich Levene-Test der Varianzgleichheit Test bei unabhängigen Stichproben F Signifikanz T df Sig. (2- seitig) T-Test für die Mittelwertgleichheit Mittlere Differenz Standardfehler der Differenz 95% Konfidenzintervall der Differenz Untere Obere,385,541 4,880 23,000 16,377 3,356 9,434 23,319 4,955 22,626,000 16,377 3,305 9,534 23,219 Da p>0.05, wird die Nullhypothese, dass die Varianzen in den Gruppen gleich sind, nicht verworfen. Bedingung 3 erfüllt. Hier nun das eigentliche Ergebnis des t- Tests. Da p<0.05, wird die Nullhypothese abgelehnt. Die Anzahl der Seegräser unterscheidet sich signifikant zwischen Gebieten mit und ohne Seeigel (t-test, p<0.01). B Drei Gruppen und mehr Im Falle, dass mehr als zwei Gruppen vorliegen, wird bei Erfüllen der Bedingungen wie beim T- Test eine ANOVA durchgeführt. Datei Seeigel_ANOVA Das Vorhandensein von Seeigeln wird eingeteilt in die Kategorien viel, wenig und keine. Somit liegen drei unabhängige Gruppen vor. H0: Die mittlere Anzahl der Seegräser (µ) hängt nicht von der Seeigel menge ab. µ ohne Seeigel = µ wenig Seeigel = µ mit viele Seeigel 1. Test auf Normalverteilung. S. oben, der Faktor ist wiederum Seeigelvorhandensein, nun aber eben mit mehr als zwei Kategorien. Tests auf Normalverteilung Seeigel Kolmogorov-Smirnov a Shapiro-Wilk menge Statistik df Signifikanz Statistik df Signifikanz Viele,232 11,101,901 11,188 keine,130 14,200 *,960 14,721 wenig,135 11,200 *,962 11,801 *. Dies ist eine untere Grenze der echten Signifikanz. a. Signifikanzkorrektur nach Lilliefors 2. Test auf Varianzhomogenität wird ebenfalls bei der Testausführung angewählt 3
Ausführung der ANOVA Nach Auswahl der ANOVA wird die Variable Anzahl der Seegräser eingefügt, die Seeigelmenge in das Faktorenfeld (entspricht der Gruppenvariable). Bei Optionen kann ein Test auf Homogenität der Varianzen angefordert werden (ist nicht default). Die Ausgabe ist dann: Test der Homogenität der Varianzen Levene-Statistik df1 df2 Signifikanz,785 2 33,465 4
Einfaktorielle ANOVA Quadratsumme df Mittel der Quadrate F Signifikanz Zwischen den Gruppen 1653,024 2 826,512 10,450,000 Innerhalb der Gruppen 2609,948 33 79,089 Gesamt 4262,972 35 Zwischen den Gruppen bestehen signifikante Unterschiede bezüglich der Anzahl der Seeigel. Aber zwischen welchen Gruppen? Hierfür gibt es die sogenannten post hoc-tests, die entweder paarweise alle Gruppen miteinander vergleichen oder sequenziell (also immer die größte mit der kleinsten). Die Adjustierung des Signifikanzniveaus (es liegen ja keine unabhängigen Vergleiche mehr vor) kann auf verschiedenste Arten erfolgen (am bekanntesten: Bonferroni; auch am einfachsten) Bonferroni-Adjustierung: neues α = altes α/anzahl paarweiser Vergleiche Z.B. bei drei Gruppen gibt es drei paarweise Vergleiche (keine-wenig/ keine-viel/ wenig-viel),.damit ist α neu_nach_bonferroni = 0.05/3 = 0.0167. In SPSS sind diverseste post hoc-tests implementiert: Häufig verwendet: Bonferroni Empfehlenswert: Scheffé Auch für die ANOVA gibt es Tests, die Varianzheterogenität berücksichtigen können 5
Ergebnis des Scheffé post hoc-tests: Homogene Untergruppen Scheffé-Prozedur a,b Seeigelmenge N Untergruppe für Alpha = 0.05. keine 14 35,71 1 2 wenig 11 43,27 43,27 viele 11 52,09 Signifikanz,134,068 Die Mittelwerte für die in homogenen Untergruppen befindlichen Gruppen werden angezeigt. a. Verwendet ein harmonisches Mittel für Stichprobengröße = 11,846. b. Die Gruppengrößen sind nicht identisch. Es wird das harmonische Mittel der Gruppengrößen verwendet. Fehlerniveaus des Typs I sind nicht garantiert. Ergebnis: Zwischen den Gruppen keine Seeigel und viele Seeigel gibt es signifikante Unterschiede. Jedoch unterscheiden sich keine und wenig nicht in der mittleren Seegrasanzahl. Auch gibt es keine signifikanten Unterschiede zwischen wenig und vielen Seeigeln. Post hoc-tests können auch manuell durchgeführt werden, indem alle paarweisen Gruppenunterschiede mit dem t-test durchgeführt werden, dann muss das Signifikanzniveau angepasst werden. 6