Einführung in die Varianzanalyse mit SPSS

Ähnliche Dokumente
SozialwissenschaftlerInnen II

Kapitel 5: Einfaktorielle Varianzanalyse

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben

SPSS IV Gruppenvergleiche (>2 Gruppen) A priori & post hoc-tests. H0: Die mittlere Anzahl der Seegräser (µ) hängt nicht von der Seeigel menge ab.

Hypothesentests mit SPSS

Statistik II Übung 3: Hypothesentests

Prüfungsliteratur: Rudolf & Müller S

SPSS III Mittelwerte vergleichen

Einfaktorielle Varianzanalyse

Statistische Methoden in den Umweltwissenschaften

Hypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav

Statistik II Übung 3: Hypothesentests Aktualisiert am

Inhaltsverzeichnis Einführung und deskriptive Statistik Grundlagen der Inferenzstatistik 1: Zufallsvariablen

Kapitel 5 - Einfaktorielle Experimente mit festen und zufälligen Effekten

Mathematische und statistische Methoden II

Beispiel 1: Zweifache Varianzanalyse für unabhängige Stichproben

Mehrfaktorielle Varianzanalyse

Inhaltsverzeichnis. Über die Autoren Einleitung... 21

Kapitel 5 - Einfaktorielle Experimente mit festen und zufälligen Effekten

Anhang A: Fragebögen und sonstige Unterlagen

Etwas positive Tendenz ist beim Wechsel der Temperatur von 120 auf 170 zu erkennen.

Wahrscheinlichkeitsrechnung und Statistik für Biologen Faktorielle Varianzanalyse

Statistische Methoden in den Umweltwissenschaften

Statistik II. IV. Hypothesentests. Martin Huber

Nichtparametrische Varianzanalysen - praktische Anwendung

UE Angewandte Statistik Termin 4 Gruppenvergleichstests

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 7 a)

Hypothesentests mit SPSS

Musterlösung. Modulklausur Multivariate Verfahren

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

22. Oktober Ruhr-Universität Bochum. Methodenlehre II, SS Prof. Dr. Holger Dette

Aufgaben zu Kapitel 7:

Aufgaben zu Kapitel 5:

Aufgaben zu Kapitel 7:

Im Modell der Varianzanalyse (mit festen Effekten) ist das. aus dem Durchschnittsmesswert für y plus dem Effekt des.

Eigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist

Signifikanzprüfung. Peter Wilhelm Herbstsemester 2014

B. Regressionsanalyse [progdat.sav]

Einfaktorielle Varianzanalyse

Lösung Übungsblatt 5

Vergleich von Gruppen I

Teilklausur des Moduls Kurs 42221: Vertiefung der Statistik

Methodenlehre II, SoSe 2015

Formelsammlung für das Modul. Statistik 2. Bachelor. Sven Garbade

Webergänzung zu Kapitel 10

Einführung in Quantitative Methoden

1. Inhaltsverzeichnis. 2. Abbildungsverzeichnis

23. Mai Ruhr-Universität Bochum. Methodenlehre II, SS Prof. Dr. Holger Dette

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse

Kategoriale und metrische Daten

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

5. Lektion: Einfache Signifikanztests

Statistisches Testen

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

30. März Ruhr-Universität Bochum. Methodenlehre II, SS Prof. Dr. Holger Dette

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen

Statistik-Team. Tobias Kley: Übung: Freitag, Uhr, HGA 10 Tutorium (SPSS) - ab

Mathematische und statistische Methoden I

Biostatistik 7. Zweistichproben-t-Test, F-Test

Einführung in Quantitative Methoden

Willkommen zur Vorlesung Statistik (Master)

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

Einleitung. Statistik. Bsp: Ertrag Weizen. 6.1 Einfache Varianzanalyse

Statistik II. IV. Hypothesentests. Martin Huber

SigmaStat Nina Becker, Christoph. Rothenwöhrer. Copyright 2004 Systat Software, Inc.

SPSS-Ausgabe 1: Univariate Varianzanalyse. Profildiagramm. [DatenSet1] D:\Sozialwiss2006_7\STAT2\Daten\mathsalaries.sav. Seite 1

1. Es sind einfach zu viele! Varianzanalytische Verfahren.

Testen von Unterschiedshypothesen mit parametrischen Verfahren Der t-test

Online Statistik-Coaching

Varianzanalytische Methoden Zweifaktorielle Versuchspläne 4/13. Durchführung in SPSS (File Trait Angst.sav)

Kapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen.

Klassifikation von Signifikanztests

Regression und Korrelation

Varianzanalyse ANOVA

Statistik in der Praxis

Multivariate Verfahren

Messwiederholungen und abhängige Messungen

Methodenlehre. Vorlesung 11. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Anwendungsaufgaben. Effektgröße bei df Zähler = df A = 1 und N = 40 (zu berechnen aus df Nenner ): Der aufgedeckte Effekt beträgt also etwa 23 %.

Zusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen

Grundlagen sportwissenschaftlicher Forschung Inferenzstatistik 2

Mathematische und statistische Methoden I

Statistische Messdatenauswertung

Einfache Varianzanalyse für unabhängige Stichproben

Skript zur Vorlesung Statistik 2

Stichwortverzeichnis. Ausgleichsgerade 177 Ausreißer 13, 40

Vorlesung: Statistik II für Wirtschaftswissenschaft

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Bereiche der Statistik

Methodenlehre II, SoSe 2015

Ergebnisse VitA und VitVM

methodenlehre ll ALM und Mehrfaktorielle ANOVA Mehrfaktorielle ANOVA methodenlehre ll ALM und Mehrfaktorielle ANOVA

VS PLUS

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

Transkript:

Einführung in die Varianzanalyse mit SPSS SPSS-Benutzertreffen am URZ Carina Ortseifen 6. Mai 00 Inhalt. Varianzanalyse. Prozedur ONEWAY. Vergleich von k Gruppen 4. Multiple Vergleiche 5. Modellvoraussetzungen 6. Weiterführende Themen 7. Literatur. Varianzanalyse kann nach zwei Methoden gerechnet werden: Klassische Methode nach Fisher (Zerlegung der Gesamtvarianz in Quadratsummen innerhalb und zwischen den Gruppen) Allgemeines lineares Modell (Korrelations- und Regressionsrechnung). Beobachtungen und Modell Beobachtungen yij, i=,..,ni, j=,..,k Beispiel: Iris-Daten, ni=50, k=, yij=sw Einfaktorielles Modell mit festen Effekten: Y ij =µ i +ε ij (i=,...,n i, N=n +..+n k ) µ i unbekannte Erwartungswerte der k Gruppen ε ij unabhängige N(0,σ )-verteilte Zufallsvariablen mit σ =...=σ k (Homoskedastizität). Hypothesen / Fragen F-Test: H 0 : Alle Mittelwerte µ i sind gleich. Multiple Mittelwertvergleiche: Welche µ i unterscheiden sich? Siehe Kapitel 4.. Varianzzerlegung (Anova-Tafel) Streuung FG SS(*) MS=SS/FG ---------------------------------------------------- Unterschiede zwischen k- Y i. -Y.. MS T Gruppen F= MS T / MS E Zufälliger N-k Y ij -Y i. MS E Fehler Gesamt N- Y ij -Y.. (*) Summe von Quadraten

.4 F-Test H 0 wird verworfen, wenn MS T sehr viel größer als MS E ist, d.h. die Variation zwischen den Meßreihen ist wesentlich größer als die Variation innerhalb der Meßreihen. F=MS T /MS E ist unter H 0 F-verteilt mit k- und N-k Freiheitsgraden.. Prozedur ONEWAY Bestandteil des SPSS Basismoduls Menüpunkt: > Mittelwerte vergleichen > Einfaktorielle ANOVA Lehne H 0 ab, wenn F>F k-,n-k,-α. F-Test mit ONEWAY. Prozedur ONEWAY - Ausgabe Nullhypothese H 0 : µ = µ =... = µ k ONEWAY ANOVA Zwischen den Gruppen Innerhalb der Gruppen Gesamt Quadrats Mittel der umme df Quadrate F Signifikanz,45 5,67 49,60,000 6,96 47,5 8,07 49. ONEWAY - Optionen Deskriptive Statistiken liefert für die gesamte Stichprobe und die Gruppen Mittelwert, Standardabweichung, Standardfehler, 95%- Konfidenzintervall für Mittelwert, Minimum und Maximum 4. Multiple Mittelwertvergleiche F-Test ist ein globaler Test auf Unterschied in den k Mittelwerten Um zu sehen, welche Gruppen sich unterscheiden, rechnet man multiple Mittelwertvergleiche. ONEWAY Post Hoc.. (= Post-Hoc-Mehrfachvergleiche)

4. Post Hoc Mehrfachvergleiche SPSS unterscheidet Post Hoc-Spannweitentests (ermitteln homogene Untergruppen, deren Mittelwerte nicht voneinander abweichen) und Paarweise multiple Vergleiche (testen die Differenz zwischen gepaarten Mittelwerten) in der Ergebnisdarstellung. (Details in der Hilfe) 4. Bonferroni t-test berechnet Zweistichproben t-tests für die Paarvergleiche und testet diese auf dem Niveau α/m (m = Anzahl der Paarvergleiche) Anzahl aller möglichen Vergleiche: k(k-)/ Abhängige Variable: Bonferroni (I) BLUME (J) BLUME Mehrfachvergleiche Mittlere Standardf 95%-Konfidenzintervall Differenz (I-J) ehler Signifikanz Untergrenze Obergrenze,6580*,06794,000,495,85,4540*,06794,000,895,685 -,6580*,06794,000 -,85 -,495 -,040*,06794,009 -,685 -,095 -,4540*,06794,000 -,685 -,895,040*,06794,009,095,685 *. Die mittlere Differenz ist auf der Stufe.05 signifikant. 4. Tukey Test Tukey-HSD a BLUME Signifikanz Untergruppe für Alpha =.05. N 50,7700 50,9740 50,480,000,000,000 Die Mittelwerte für die in homogenen Untergruppen befindlichen Gruppen werden angezeigt. a. Verwendet ein harmonisches Mittel für Stichprobengröße = 50,000. 4. Weiteres Beispiel: Hyper.sav Koerpergroesse Untergruppe für Alpha =.05. Altersklassen N Tukey-HSD a,b 66-75 Jahre 47 6,47 > 75 Jahre 4 6,67 56-65 Jahre 5 64,8 64,8 bis 55 Jahre 5 69,0 Signifikanz,55,068 Die Mittelwerte für die in homogenen Untergruppen befindlichen Gruppen werden angezeigt. a. Verwendet ein harmonisches Mittel für Stichprobengröße = 9,00. b. Die Gruppengrößen sind nicht identisch. Es wird das harmonische Mittel der Gruppengrößen verwendet. Fehlerniveaus des Typs I sind nicht garantiert. 4.4 Weitere multiple Vergleiche Scheffé Kritische Differenz mit F-Verteilung Tukey neben NV wird balanciertes Design vorausgesetzt kritische Differenz mit studentisierter Spannweitenverteilung Dunnett Vergleiche mit einer Kontrolle (many one) Sequentielle Tests F nach REGW, Q nach REGW

4.5 Empfehlungen (nach DJS) paarweise Vergleiche bei balanciertem Design TUKEY oder Q-REGW paarweise Vergleiche bei unbalanciertem Design SCHEFFE oder SIDAK Lineare Kontraste SCHEFFE, manchmal auch SIDAK oder TUKEY 5. Modellvoraussetzungen. Normalverteilung der Fehler. Homoskedastizität (=Gleichheit der Gruppenvarianzen) und deren Überprüfung:. Berechnung der Residuen und Normalverteilungscheck mittels Explorativer Datenanalyse. Optionen Statistik - Test auf Varianzhomogenität 5. Normalverteilte Fehler Untersuchung nicht mit ONEWAY möglich aber mit GLM: > Allgemeines lineares Modell > Univariat. Nach Festlegung der Modellparameter Speichern Residuen Nicht standardisiert auswählen.. > Deskriptive Statistiken > Explorative Datenanalyse Diagramme Normalverteilungsdiagramm mit Test 5. Homoskedastizität = Gleichheit der Gruppenvarianzen Levene-Test setzt keine Normalverteilung, nur Stetigkeit voraus Test der Homogenität der Varianzen Levene-St atistik df df Signifikanz,60 47,550 5. Alternativen zum F-Test Sind die Varianzen nicht homogen, bietet ONEWAY folgende robusten Tests (über Optionen Statistik) an:. Brown-Forsythe. Welch-Test Robuste Testverfahren zur Prüfung auf Gleichheit der Mittelwerte Welch-Test Brown-Forsythe a. Asymptotisch F-verteilt Statistik a df df Sig. 45,0 97,40,000 49,60 4,654,000 6. Weiterführende Themen. Mehrfaktorielle Modelle Multivariate Varianzanalysen. Zufällige Effekte. Messwiederholung 4. Nichtparametrische Alternativen

6. Zweifaktorielle Varianzanalyse = Untersuchung des gemeinsamen Effekts von zwei Einflußfaktoren A und B vollständig kreuzklassifiziert hierarchisch klassifiziert Untersuchung von Haupteffekten und Wechselwirkungen 6.. Beispiel: Fütterungsversuch Abhängigkeit des Gewichtszuwachses von Futtermischungen Faktor A: Vitaminzusatz (,, ) Faktor B: Darrreichungsform (pelettiert, gemahlen) N= Ratten, d.h. n= Ratten pro Faktorkombination 6.. Datenmaterial 6.. GLM Ergebnis Variablen a, b, gewicht: 5 4 8 5 7 9 4 8 5 Prozedur GLM, Modul Advanced Statistics > Allgemeines lineares Modell > Multivariat Tests der Zwischensubjekteffekte Abhängige Variable: GEWICHT Quelle Quadratsum me vom Typ III df Mittel der Quadrate F Signifikanz Korrigiertes Modell 400,000 a 5 80,000 8,57,0 Konstanter Term 4800,000 4800,000 54,86,000 A 5,000 76,000 8,4,00 B 9,000 9,000 0,57,004 A * B 56,000 8,000,000,5 Fehler 56,000 6 9, Gesamt 556,000 Korrigierte Gesamtvariation 456,000 a. R-Quadrat =,877 (korrigiertes R-Quadrat =,775) 6. Zufällige Effekte Stufen des Einflussfaktors werden nicht systematisch und bewusst festgelegt oder vorgegeben, sondern zufällig ausgewählt. Beispiel: Von vielen vorhandenen Sorten werden drei zufällig ausgewählt. > Gemischte Modelle > Linear 6. Messwiederholung (GLM) > Allgemeines lineares Modell > Messwiederholung

6.4 Nichtparametrische VA Unabhängige Gruppen Kruskal-Wallis Test Prozedur NPAR aus Basismodul > Nichtparametrische Tests > k unabhängige Stichproben Aber: Keine direkten multiplen Vergleiche Abhängige Gruppen Friedman Test > Nichtparametrische Tests > k verbundene Stichproben 7. Literatur SPSS Online Hilfe A. Bühl, P. Zöfel: SPSS Version 0, Addison Wesley Dufner, J., Jensen, U. Schumacher, E.: Statistik mit SAS. Teubner Verlag, 00.