Vorlesung: Multivariate Statistik für Psychologen

Ähnliche Dokumente
Vorlesung: Multivariate Statistik für Psychologen

Vorlesung: Multivariate Statistik für Psychologen

Vorlesung: Multivariate Statistik für Psychologen

Vorlesung: Multivariate Statistik für Psychologen

Vorlesung: Multivariate Statistik für Psychologen

Vorlesung: Multivariate Statistik für Psychologen

Statistik II. IV. Hypothesentests. Martin Huber

Inhaltsverzeichnis Einführung und deskriptive Statistik Grundlagen der Inferenzstatistik 1: Zufallsvariablen

Inferenzstatistik verstehen

Vorlesung: Multivariate Statistik für Psychologen

Vorlesung: Multivariate Statistik für Psychologen

I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03

Teil: lineare Regression

Prüfungsliteratur: Rudolf & Müller S

Statistik für. von. Prof. Dr. Josef Bleymüller. und. Prof. Dr. Rafael Weißbach. sowie. Dr. Günther Gehlert. und. Prof. Dr.

Instrument zur Untersuchung eines linearen Zusammenhangs zwischen zwei (oder mehr) Merkmalen.

Einführung in die Varianzanalyse mit SPSS

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk

Informationen zur KLAUSUR am

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Eigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist

Lehrinhalte Statistik (Sozialwissenschaften)

Hypothesentests mit SPSS

I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03

VS PLUS

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Inhalt. I Einführung. Kapitel 1 Konzept des Buches Kapitel 2 Messen in der Psychologie... 27

Statistik II Übung 3: Hypothesentests

Die Regressionsanalyse

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

SigmaStat Nina Becker, Christoph. Rothenwöhrer. Copyright 2004 Systat Software, Inc.

Schweizer Statistiktage, Aarau, 18. Nov. 2004

Korrelation Regression. Wenn Daten nicht ohne einander können Korrelation

Kapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen.

Statistik II (Sozialwissenschaften)

Statistik II Übung 3: Hypothesentests Aktualisiert am

Übungsblätter zu Methoden der Empirischen Sozialforschung IV: Regressionsanalyse. Lösungsblatt zu Nr. 2

Interaktion unter Berücksichtigung des Skalenniveaus der Prädiktoren Dr. Markus Stöcklin, Universität Basel, Fakultät für Psychologie

Inhalt. Vorwort Univariate Verteilungen Verteilungen Die Normalverteilung... 47

Uwe Hassler. Statistik im. Bachelor-Studium. Eine Einführung. für Wirtschaftswissenschaftler. ^ Springer Gabler

Analyse von Querschnittsdaten. Signifikanztests I Basics

I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03

Skript zur Vorlesung Statistik 2

Inhaltsverzeichnis. Vorwort

FH- Management & IT. Constantin von Craushaar FH-Management & IT Statistik Angewandte Statistik (Übungen)

Methodenlehre. Vorlesung 11. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Statistik. Für Sozialwissenschaftler. Dritte, neu bearbeitete Auflage Mit 71 Abbildungen und 224 Tabellen

30. März Ruhr-Universität Bochum. Methodenlehre II, SS Prof. Dr. Holger Dette

Inhaltsverzeichnis. Über die Autoren Einleitung... 21

Glossar. den man als mindesten oder interessanten Effekt für die Population annimmt. Anpassungstest; 148 f., 151: Der Anpassungstest

Kapitel 4: Merkmalszusammenhänge

Musterlösung. Modulklausur Multivariate Verfahren

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.

Kapitel 4: Merkmalszusammenhänge

Lösung Aufgabe 1 (Regression) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die

Wolfgang Kohn Riza Öztürk. Statistik für Ökonomen. Datenanalyse mit R und SPSS. 3., überarbeitete Auflage. 4^ Springer Gabler

Analyse von Querschnittsdaten. Spezifikation der Regressionsfunktion

Drittvariablenkontrolle in der linearen Regression: Trivariate Regression

Arbeitsbuch zur deskriptiven und induktiven Statistik

Statistische Methoden in den Umweltwissenschaften

Seminar: Multivariate Verfahren g Dr. Thomas Schäfer Referenten: Wiebke Hoffmann, Claudia Günther

Bonus-Lektion: Prüfung der Voraussetzungen und Transformationen

2.5 Lineare Regressionsmodelle

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Multivariate Statistische Methoden

simple lineare Regression kurvilineare Regression Bestimmtheitsmaß und Konfidenzintervall

Vorlesung: Statistik II für Wirtschaftswissenschaft

Multiple Regressionsanalyse - Kurzabriss

1 Beispiele multivariater Datensätze... 3

Einführung in die Statistik für Politikwissenschaftler Wintersemester 2011/2012

Prognoseintervalle für y 0 gegeben x 0

Statistik für Human- und Sozialwissenschaftler

UE Angewandte Statistik Termin 4 Gruppenvergleichstests

SozialwissenschaftlerInnen II

Multivariate Statistische Methoden und ihre Anwendung

Biostatistik. 4y Springer. Wolfgang Köhler Gabriel Schachtel Peter Voleske. Vierte, aktualisierte und erweiterte Auflage

Mathematische und statistische Methoden I

Lehrbuch der Statistik

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien

Statistik für das Psychologiestudium

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

1 Übungsaufgaben zur Regressionsanalyse

Varianzkomponentenschätzung

Biostatistik 101 Korrelation - Regressionsanalysen

6. Tutoriumsserie Statistik II

Forschungsstatistik I

Zusammenfassung 11. Sara dos Reis.

Statistik für Ökonomen

Prüfung aus Statistik 2 für SoziologInnen

Einführung in die Statistik

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

Mathematische und statistische Methoden I

Übung V Lineares Regressionsmodell

Inhaltsverzeichnis. Vorwort

STATISTIK FÜR DIE SOZIALWISSENSCHAFTEN

Transkript:

Vorlesung: Multivariate Statistik für Psychologen 7. Vorlesung: 05.05.2003 Agenda 2. Multiple Regression i. Grundlagen ii. iii. iv. Statistisches Modell Verallgemeinerung des Stichprobenmodells auf Populationsebene Verallgemeinerung der multiplen Regression auf k Prädiktoren v. Techniken der multiplen Regression vi. Interaktionseffekte bei multiplen Prädiktoren vii. Annahmen und Voraussetzungen der multiplen Regression 2

Zusammenfassung der letzten Sitzungen Multiple Regression Ziele und Grundlagen der multiplen Regression Beispiele zur multiplen Regression Statistisches Modell, Modellgleichung Schätzung und Interpretation der Modellparameter Varianzzerlegung, Modellgüte, Determinationskoeffizient Verallgemeinerung des Stichprobenmodells auf Populationsebene Techniken der Modellschätzung bei multipler Regression 3 Techniken/Typen der multiplen Regression: Zusammenfassung I Varianzzerlegung zur Beurteilung der einzelnen Prädiktoren Gesamtvarianzaufklärung der Prädiktoren X1, X2, X3 entspricht a+b+c+d+e Varianzaufklärung der einzelnen Prädiktoren abhängig von Regressionstechnik Standard Multiple Regression vs. Hierarchische (Sequentielle) Regression vs. Statistische (Schrittweise) Regression X 2 X 1 X3 a b c d e Y 4

Techniken/Typen der multiplen Regression: Zusammenfassung II Hinweise zur Interpretation der Ergebnisse Regressionsmodelle und Bewertung einzelner Prädiktoren mit denselben Daten teilweise sehr unterschiedlich, abhängig von gewählter Regressionstechnik Kriterien zur Aufnahme/Löschung einzelner Prädiktoren im Modell berücksichtigte Prädiktoren Grundsatz: Testen inhaltlicher Theorien oder exploratives Vorgehen zur Bewertung des Einflusses der Prädiktoren Angabe der: Parameterschätzungen der Standard Multiplen Regression mit den ausgewählten Prädiktoren Parameterschätzungen der Einfachen Regression (z.b. in Form der Korrelationsmatrix) 5 Interaktionseffekte bei multipler Regression I Grundidee Zusammenhang zwischen Merkmal 1 und abhängiger Variable unterschiedlich je nach Ausprägung eines dritten Merkmals statistisch: Einfluss des Prädiktors X 1 auf Y abhängig von Ausprägung des Prädiktors X 2 unterschiedliche Regressionskoeffizienten für X 1 je nach Ausprägung von X 2 Beispiel Zusammenhang zwischen Lernaufwand, Vorwissen (Prädiktoren) und Klausurergebnis geringes Vorwissen: starker (positiver) Einfluss des Lernaufwands auf Klasuurergebnis hohes Vorwissen: geringerer Einfluss des Lernaufwands 6

Interaktionseffekte bei multipler Regression II Veranschaulichung eines Interaktionseffekts am Beispiels kein Vorwissen: starker Effekte Lernen b 2 = 0,7 viel Vorwissen: kaum Effekte Lernen b 2 = 0,1 7 Interaktionseffekte bei multipler Regression III Regressionsmodell der multiplen Regression mit Interaktion der Prädiktoren Stichprobenmodell für zwei Prädiktoren: Yˆ = a+ bx + bx + bx X i 1 1i 2 2i 3 1i 2i bzw. Y = a+ bx + bx + bx X + e i 1 1i 2 2i 3 1i 2i i Stichprobenmodell für k Prädiktoren vollständiges Modell: Berücksichtigung aller Einzelprädiktoren und alle Kombinationen einzelner Prädiktoren (Permutation) eingeschränktes Modell: gezielte Berücksichtigung einzelner Interaktionsterme Test des Interaktionseffektes siehe multiple Regression: Interaktionsterm als ein zusätzlicher Prädiktor 8

Interaktionseffekte bei multipler Regression IV Test des Interaktionseffektes (Fortsetzung) Vorhersagekraft im Modell Test der zusätzlich erklärten Varianz im Modell (R 2 -Differenz) gegen Null R 2 -Differenzentest (siehe multiple Regression) Durchführung in SPSS: hierarchische Regression mit späterer Aufnahme des Interaktionsterms Test des Interaktionsterms als einzelnen Prädiktor Test des Regressionskoeffizienten für Interaktionsterm gegen Null (siehe multiple Regression) Abhängigkeit des Tests von Regressionstechnik Interpretation eines Interaktionseffekts Einfluss des Prädiktors X 1 auf abhängige Variable abhängig von Ausprägung des Prädiktors X 2 (bzw. unterschiedlich für verschiedene Ausprägungen) Richtung des Effekts bzw. Größe des Koeffizienten abhängig von Einheiten 9 Interaktionseffekte bei multipler Regression V Praktische Hinweise Berechnung eines Interaktionsterms per Hand in SPSS: Interaktionsterm für Prädiktoren X 1 und X 2 als Produkt beider Variablen in Varianzanalyse: automatische Berücksichtigung der Interaktionen aller Faktoren Interpretierbarkeit Veranschaulichung Richtung der Interaktion und Größe graphisch veranschaulichen 3-D-Streudiagramm Scatterplot getrennt für mehrere Stufen des einen Prädiktors Grenzen der Interpretierbarkeit Zwei-Wege-Interaktionen (zwei Prädiktoren) meist inhaltlich sinnvoll interpretier Drei-Wege-Interaktionen und höhere theoretisch möglich, aber kaum interpretierbar 10

Annahmen und Voraussetzungen der multiplen Regression I Grund der Annahmen und Voraussetzungen des Testverfahrens Grundlage für Gültigkeit des Testmodells und der Prüfgröße Konsequenzen der Verletzungen der Annahmen und Voraussetzungen potentiell fehlerhafte Parameterschätzung potentiell unbekannte Verteilung der Prüfgröße Annahmen und Voraussetzungen der multiplen Regression Annahmen zu Residuen / zur Fehlervariable εi (bzw. ei ) Erwartungswert/theoretischer Mittelwert des Fehlers ist Null Erwartungswert des Fehlers ist Null für jede Kombination von Ausprägungen der Prädiktoren X 1,, X k Unabhängigkeit der Fehler (Kovarianz/Korrelation der Fehler ist Null) Normalverteilung der Residuen für jede Kombination von Ausprägungen der Prädiktoren X 1,, X k Varianzgleichheit der Residuen für jede Kombination von Ausprägungen der Prädiktoren X 1,, X k (Homoskedastizität) 11 Annahmen und Voraussetzungen der multiplen Regression II Annahmen und Voraussetzungen der multiplen Regression (Fortsetzung) weitere Annahmen: siehe einfache Regression Annahmen zur abhängigen Variablen Y Annahmen über das Stichprobenmodell Annahmen zum Regressionsmodell Annahmen zu den Prädiktoren 12

Test der Annahmen und Voraussetzungen zur multiplen Regression I Test der Annahmen über Residuen Erwartungswert des Fehlers ist Null: gegeben durch Least Square Schätzung Erwartungswert des Fehlers ist Null für jede Kombination von Ausprägungen der Prädiktoren X 1,, X k graphisch (für einzelne Prädiktoren): Residuenplot Prädiktor X i Residuen e i rechnerisch: mehrfaktorielle ANOVA sinnvolle Kategorisierung der Prädiktorvariablen Anzahl der Kategorien abhängig von Stichprobengröße und Streuung Bildung von Kategorien mit gleicher Anzahl Personen pro Kategorie kategorisierte Prädiktoren als Faktoren in Varianzanalyse (abhängige Variable: unstandardisierte Residuen der multiplen Regression) Nullhypothese (=Wunschhypothese) inhaltlich: gleicher Mittelwert der Residuen für alle Gruppen statistisch: keine signifikanten Haupteffekte und Interaktionseffekte Verletzung der Annahme potentiell nicht-lineare Zusammenhänge 13 Test der Annahmen und Voraussetzungen zur multiplen Regression II Test der Annahmen über Residuen (Fortsetzung) Unabhängigkeit der Fehler im Untersuchungsdesign über Unabhängigkeit der Beobachtungseinheiten Normalverteilung der Fehler für jede Kombination von Ausprägungen der Prädiktoren X 1,, X k graphisch: P-P-Plot der Residuen e i (pro Kombination von Prädiktorstufen) rechnerisch: Kolmogorov-Smirnov-Test (pro Kombination von Prädiktorstufen) sinnvolle Kategorisierung der Prädiktorvariablen in SPSS: "Daten aufteilen" nach den kategorisierten Prädiktorvariablen Kolmogorov-Smirnov-Test Nullhypothese: Normalverteilung minimale Stichprobengröße für theoretisch mögliche Verwerfung der Nullhypothese: n > 15 Verletzung: Prüfgröße (F-Wert) nicht F-verteilt Modelltest auf unbekanntem Alpha-Niveau 14

Test der Annahmen und Voraussetzungen zur multiplen Regression III Test der Annahmen über Residuen (Fortsetzung) Homoskedastizität der Fehler für jede Kombination von Ausprägungen der Prädiktoren X 1,, X k graphisch (für einzelne Prädiktoren): Residuenplot Prädiktor X i Residuen e i rechnerisch: Levene-Test zur Varianzgleichheit (mit kategorisiertem Prädiktor) sinnvolle Kategorisierung der Prädiktorvariablen kategorisierte Prädiktoren als Faktoren in Varianzanalyse (abhängige Variable: unstandardisierte Residuen der multiplen Regression) in SPSS im ANOVA-Menü unter "Optionen": Homogenitätstest Levene-Test Nullhypothese: Varianzgleichheit Verletzung: potentiell verfälschte Prüfgröße bzw. Fehlinterpretation Verrechnung der durchschnittlichen Streuung der Personen innerhalb einer Stufe des Prädiktors wenn diese sehr unterschiedlich potentiell falsche Interpretation der (nicht-)vorhandenen Effekte 15 Test der Annahmen und Voraussetzungen zur multiplen Regression IV Test der Annahmen über abhängige Variable theoretisch über Messmodell Test der Annahmen über Stichprobenmodell theoretisch über Untersuchungsdesign / Daumenregeln Annahmen zum Regressionsmodell Eignung des Regressionsmodells zur Beschreibung des linearen Zusammenhangs (siehe einfache Regression) Modellvergleich gegen höherdimensionale Modelle (z.b. quadratisch) Test gegen das saturiertes Modell (Varianzanalyse) 16

Ausblick Varianzanalyse (ANOVA) Grundlagen und statistisches Modell Hypothesentestung und Varianzzerlegung Varianzanalyse als Spezialfall der Regression Annahmen und Voraussetzungen der Varianzanalyse Multivariate Varianzanalyse (MANOVA) 17