Explorative Faktorenanalyse

Ähnliche Dokumente
Exploratorische Faktorenanalyse. Exploratorische Faktorenanalyse. Exploratorische Faktorenanalyse

Die Faktorenanalyse. Anwendung dann, wenn zwischen beobachtbaren und nicht direkt beobachtbaren Variablen ein kausales Verhältnis vermutet wird

METHODENPRAKTIKUM II Kurs 1. Prof. Dr. Beat Fux SUZ Frühlingssemester 2009

6. Faktorenanalyse (FA) von Tests

Eigene MC-Fragen Kap. 4 Faktorenanalyse, Aggregation, Normierung. 1. Welche Aussage zu den Prinzipien der Faktorenanalyse ist zutreffend?

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduktion. Interpretation des SPSS-Output s

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduzierung. Interpretation des SPSS-Output s

6-Variablen-Fall. Dipl.-Ök. John Yun Bergische Universität Wuppertal Gaußstraße Wuppertal

Statistische Methoden in der Wirtschaftsund Sozialgeographie

Grundzüge der Faktorenanalyse

6-Variablen-Fall. Dipl.-Ök. John Yun Bergische Universität Wuppertal Gaußstraße Wuppertal

Prof. Dr. Gabriele Helga Franke TESTTHEORIE UND TESTKONSTRUKTION

Einführung in SPSS. Sitzung 5: Faktoranalyse und Mittelwertsvergleiche. Knut Wenzig. 22. Januar 2007

Faktoren- und Hauptkomponentenanalyse

Faktorenanalyse. 1. Grundlegende Verfahren. Bacher, SoSe2007

Holger Dette. 30. Oktober 2015

GHF SoSe 2011 HS MD-SDL

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 13 a.

Statistik II: Klassifikation und Segmentierung

Name Vorname Matrikelnummer Unterschrift

Zur Erklärung menschlicher Verhaltensweisen oder allgemeiner sozialer Phänomene ist häufig eine Vielzahl von Einflussfaktoren zu berücksichtigen.

Faktorenanalyse. Fakultät für Human und Sozialwissenschaften Professur für Forschungsmethodik und Evaluation in der Psychologie

4. Skalenbildung: Faktorenanalyse, Aggregation von Items & Normierung

Ziel der linearen Regression

Hauptkomponentenanalyse. Die Schritte bei einer Hauptkomponentenanalyse

9 Faktorenanalyse. Wir gehen zunächst von dem folgenden Modell aus (Modell der Hauptkomponentenanalyse): Z = F L T

Skript Einführung in SPSS

Die Rücktransformation: Z = A t (Y µ) = Y = AZ + µ

Explorative Faktorenanalyse

17. Januar Ruhr-Universität Bochum. Methodenlehre III, WS 2010/2011. Prof. Dr. Holger Dette. 1. Matrizenrechnung. 2.

Einer Reihe von Merkmalen zugrunde liegende, gemeinsame Faktoren ermitteln.

Multivariate Analysemethoden, Dozent: Dr. Thomas Schäfer Alexander Allnoch, Markus Burkhardt & Vivien Röder

explorative Faktorenanalyse Spickzettel

11.2 Ergebnisse der Faktorenanalysen

5.Tutorium Multivariate Verfahren

Sind mehrere Merkmale untereinander hoch korreliert, so kann man sie als zusammengehörig interpretieren, sie bilden einen Faktor.

2.5 Das Rotationsproblem

Messen im psychologischen Kontext II: Reliabilitätsüberprüfung und explorative Faktorenanalyse

Faktorenanalyse Beispiel

2.6 Bestimmung der Faktorwerte ( Matrizenmanipulation bei Hauptkomponentenmethode)

Faktorenanalyse und Hauptkomponentenanalyse

Klausur zur Vorlesung Analyse mehrdimensionaler Daten, Lösungen WS 2010/2011; 6 Kreditpunkte, 90 min

Einführung in die Hauptkomponentenanalyse und Faktorenanalyse mit SPSS. Datenanalyse HS09 Susan Kriete Dodds 18. November 2009

Konfirmatorische Faktorenanalyse. Regressionsmodelle für Politikwissenschaftler

Musterklausur im Fach Käuferverhalten und Marketingforschung. Prof. Dr. M. Kirchgeorg

Musterlösung. Modulklausur Multivariate Verfahren

Explorative Faktorenanalyse

Konfirmatorische Faktorenanalyse

SPSS-Ausgabe 1: Univariate Varianzanalyse. Profildiagramm. [DatenSet1] D:\Sozialwiss2006_7\STAT2\Daten\mathsalaries.sav. Seite 1

9. November Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. Matrizenrechnung. 2. Multiple Korrelationen

Explorative Faktorenanalyse

Objektivität und Validität. Testgütekriterien. Objektivität. Validität. Reliabilität. Objektivität

5. Arbeitsschritt: Skalenkonstruktion mit Hilfe der Faktorenanalyse

Veranschaulichung: Einführung in die Faktorenanalyse mit SAS. 1. Faktorenanalyse: Wie? Inhalt. 1. Faktorenanalyse: Wozu?

Aufgaben zur Multivariaten Statistik

Selbstständiges Lernen

Dimensionale Methoden: Hauptkomponentenanalyse (HKA) und Faktorenanalyse (FA)

Abb. 26: Antwortprofil zur Frage "Wie intensiv setzten sie die Methode ein?"

Hauptkomponenten-basierte Klassifikationsverfahren (PCA)

Die Datenerhebung erfolgte in Form einer voll standardisierten schriftlichen Befragung. [...]

Radar gesellschaftlicher Zusammenhalt messen was verbindet. Gesellschaftlicher Zusammenhalt in Deutschland Kurze Einführung in die Methode

Entwicklung der Faktorenanalyse Faktorenanalyse. Faktorenanalyse nach Spearman Variablen zur Beschreibung von Intelligenz

Clusteranalyse. Anwendungsorientierte Einführung. R. Oldenbourg Verlag München Wien. Von Dr. Johann Bacher

Statistik II im Wintersemester 2006/2007

Inhalt. Einführung in die Faktorenanalyse mit SPSS. 1. Faktorenanalyse: Wozu? 1. Faktorenanalyse: Wie?

Faktorenanalysen höherer Ordnung

Institut für Marketing und Handel Prof. Dr. W. Toporowski. SPSS Übung 5. Heutige Themen: Faktorenanalyse. Einführung in Amos

Multivariate Verfahren

Messen im psychologischem Kontext II: Reliabilität und explorative Faktorenanalyse

Modulklausur Multivariate Verfahren

Statistik-Quiz Sommersemester

Lösung zu Kapitel 11: Beispiel 2

Was heißt messen? Konzeptspezifikation Operationalisierung Qualität der Messung

Inhaltsverzeichnis 1. EINLEITUNG...1

Bestimmung der Zuverlässigkeit / Reliabilität einer additiven Itemskala. Cronbach s. 1 (k 1)r

Forschungspraktikum Gruppenbezogene Menschenfeindlichkeit

1 Beispiele multivariater Datensätze... 3

Multivariate Verfahren

11 Dimensionsreduktion

Faktorenanalyse Dr. Markus Stöcklin, Universität Basel, Fakultät für Psychologie

Vertiefungsrichtung Marktforschung

Überblick. GK C: Einführung in die Korpuslinguistik. Fragen. Sprachwandel/Sprachvariation. Fragen. NB: Register

Aufbau des Testberichts. 1. Problemstellung / inhaltliche Einführung. 2. Methode

Inhaltsverzeichnis. Vorwort zur 3. Auflage 11. Kapitel 1 Einführung 13. Kapitel 2 Testtheoretische Grundlagen 29

Überblick. Hauptseminar: Einführung in die Korpuslinguistik. Wiederholung Produktivität. Wiederholung Produktivität. Fragen

Korrelation Regression. Wenn Daten nicht ohne einander können Korrelation

Exploratorische Faktorenanalyse: Hauptachsenanalyse und Hauptkomponentenanalyse SPSS-Beispiel zu Kapitel 13 1

Inhalt. 1 Unvollständige Clusteranalyseverfahren 35

σ 2 (x) = σ 2 (τ) + σ 2 (ε) ( x) ( ) ( x) ( ) ( ) σ =σ τ +σ ε σ τ σ σ ε ( ) ( x) Varianzzerlegung Varianzzerlegung und Definition der Reliabilität

1 Übungsaufgaben zur Regressionsanalyse

Inhalt. Mathematik für Chemiker II Lineare Algebra. Vorlesung im Sommersemester Kurt Frischmuth. Rostock, April Juli 2015

Statistik, Datenanalyse und Simulation

Lineare Algebra. Mathematik II für Chemiker. Daniel Gerth

Least Absolute Shrinkage And Seletion Operator (LASSO)

Herleitung der Hauptkomponenten: Y t = (Y 1,..., Y m ) Erwartung:µ Kovarianz:Σ. Z j = a 1j Y 1 + a 2j Y a mj Y m = a t j Y

Multiple Regressionsanalyse - Kurzabriss

Rekodierung invertierter Items

Inhaltsverzeichnis. Vorwort zur 3. Auflage 11

Transkript:

Explorative Faktorenanalyse 1

Einsatz der Faktorenanalyse Verfahren zur Datenreduktion Analyse von Datenstrukturen 2

-Ich finde es langweilig, mich immer mit den selben Leuten zu treffen -In der Beziehung zu neuen Bekannten bin ich eher zurückhaltend -Es ist mir wichtig, im Leben möglichst viel aufregendes zu erleben -Es ist mir wichtig, einen Lebensstil zu führen, der sich von der Masse abhebt -Es ist mir wichtig mit meinem Lebensstil nicht immer "aus der Reihe zu tanzen" -Bei neuen Aufgabe habe ich oft die Befürchtung, dass ich sie nicht bewältigen kann -Ich gehe meistens Problemen aus dem Weg oder versuche sie zu vermeiden F2 +1.00 S2 aufregend abhebt selbeleute -1.00 vermeiden tanzen bew aeltigen F1 +1.00 S1 zurueckhaltend 3

Vorgehensweise 1 Durchführung einer Faktorenanalyse für eine bestimmte Itemmenge 2 Bestimmung der Zahl der relevanten Faktoren, Beurteilung der Modellanpassung 3 Wenn mehr als ein relevanter Faktor dann Faktorrotation 4 Interpretation 5 Eventuell Korrektur der Faktorzahl oder eliminieren von Items und erneute Berechnung 6 Indexberechnung: Additiver Index oder Faktorwerte 4

Wichtige Anwendungsvoraussetzungen metrisches Messniveau der Variablen Variablen stellen voneinander unabhängige Messungen dar 5

Logik des Verfahrens: - Wenn Variablen dieselbe Inhaltsdimension messen, dann sollten sie untereinander hoch korrelieren. - In diesem Fall sollte sich eine gemeinsame ( fiktive ) Variable erstellen lassen, welche das, was die Variablen gemeinsam messen abbildet. - Wenn alle Variablen fehlerfrei eine gemeinsame Dimension messen, dann korrelieren alle untereinander mit 1.0. Sie könnten dann auch ohne Fehler, d.h. vollständig durch eine stellvertretende Variable ersetzt werden. - Wenn die Variablen nicht nur eine gemeinsame Dimension messen, sondern jede Variable noch etwas anderes misst, dann reicht eine stellvertretende Variable nicht mehr aus. Z.b. die Variablen messen zwar grundsätzlich eine gemeinsame Zieldimension, aber jede mit einem Messfehler. Oder: Die Variablen messen zwei (oder mehr) unterschiedliche Inhaltsdimensionen (mit Meßfehlern). Unterschiedlich soll bedeuten miteinander (beinahe) unkorreliert. 6

Hauptkomponenten Methode weitere Bezeichnungen: Principle Component Analysis (PC oder PCA) Alle m Variablen lassen sich vollständig durch eine Linearkombination aus m Faktorvariablen beschreiben, wenn die Faktoren unkorreliert sind. D.h: X i =a i,1 *F 1 + a i,2 *F 2 +... + a i,q *F q Die Gewichte a ij heißen in der Faktorenanalyse Faktorladungen Die Variablen X i sind gemessene Variablen einer Person (standardisiert) F i : Ausprägung der (hypothetischen) Faktorvariable einer Person (standardisiert) 7

V29 V30 V31 V32 V33 V34 V35 V36 V37 V38 V39 V40 8

Motiv (V29)= 0.6911*F1 + 0.3137*F2-0.0248*F3 +. - 0.0238*F12 Alle Variablen sind standardisiert, d.h. Z i = X i S i X i 9

Eigenwerte Die Varianz, die der Faktor F j in allen X 1...X m Variablen aufklärt ist: λ j =a 2 1,j + a 2 2,j+...+a 2 m,j Dieser Varianzanteil wird in der Faktorenanalyse der Eigenwert eines Faktors genannt. Wie gut können die Variablen stellvertretend durch diese Inhaltsdimension (z.b. durch F1) beschrieben werden 10

Beispiel Eigenwert (Faktor 1)= 0.6911 2 + 0.6439 2 + 0.4591 2 + 0.7266 2 + 0.7183 2 + 0.6196 2 + 0.6266 2 + 0. 6173 2 + 0.4171 2 + 0.3438 2 + 0.5703 2 + 0.6355 2 =4.326 Faktor 1 klärt 4.326 der Gesamtvarianz auf. Gesamtvarianz=12 weil 12 standardisiserte Items d.h. Erklärte Varianz durch Faktor 1 = 100*4.326/12=36% 11

über Eigenwerte... Bei m Variablen und m Faktoren ist die Summe aller Eigenwerte = m. Bei m Variablen und weniger als m Faktoren ist die Summe aller Eigenwerte i.d.r. < m. Je größer der Eigenwert eines Faktors umso größer ist seine Bedeutung für die betrachteten Variablen. Eigenwert/Anzahl der Items = Anteil der Erklärten Varianz in allen Variablen durch einen gemeinsamen Faktor Faktoren mit Eigenwerten < 1 sind nicht sinnvoll: Sie erklären weniger als eine einzelne Variable 12

Festlegung der Anzahl relevanter Faktoren Ausgehend von der maximalen Lösung, d.h. von der maximal nötigen Anzahl an Faktoren (z.b. 12 Faktoren bei 12 Items): Wie viele dieser Faktoren sind relevant oder auf wie viele kann ich verzichten? D.h. auf wie viele Faktoren können wir verzichten ohne, dass die Reproduktion der Items durch die Faktoren zu ungenau wird, aber trotzdem eine maximale Reduktion der Information erreicht wird. 13

Festlegung der Anzahl der Faktoren Dazu sind mehrere Methoden möglich. Die wichtigsten sind: Inhaltliche Interpretierbarkeit Kaiser-Kriterium Scree-Test 14

Festlegung der Anzahl der Faktoren (1) Inhaltliche Interpretierbarkeit: Faktoren repräsentieren latente Dimensionen. Sie sind daher theoretische Konstrukte, die mit mathematischen Kalkülen ermittelt werden. Sie können daher auch methodische Artefakte sein. Es werden nur so viele Faktoren extrahiert, dass die Faktoren inhaltlich interpretierbar sind. 15

Festlegung der Anzahl der Faktoren (2) Kaiser-Kriterium: Es werden nur Faktoren mit Eigenwerten > 1 extrahiert. Grund: Faktoren mit Eigenwerten < 1 haben keine Aussagekraft Ein Eigenwert < 1 bedeutet, dass ein Faktor weniger Varianz aufklart wie eine Variable allein 16

Festlegung der Anzahl der Faktoren (3) Scree-Test Bei der FA werden Faktoren extrahiert, die sukzessive Varianz aufklären. Daher fällt mit zunehmender Faktorenzahl der Eigenwert des Faktors ab. Den Eigenwertabfall kann man als sogenanntes Scree-Diagramm darstellen: 17

Festlegung der Anzahl der Faktoren 18 Eigenwert 1 Eigenwert 2 Eigenwert 3 Eigenwert 4 Eigenwert 1 Eigenwert 2 Eigenwert 3 Eigenwert 4 Eigenwert 5 2.357555 1.981581 1.489104 1.026947 0.9202235 0.7622569 0.7218618 0.6181886 0.5067837 0.416706 0.1987924 Eigenwert 6 Eigenwert 7

Festlegung der Anzahl der Faktoren 4.325856 Kaiserkriterium: 3 Faktoren Screediagramm: 1 oder 3 Faktoren 1.208011 1.17371 0.868967 0.7377806 0.6697599 0.6424038 0.6004916 0.531346 0.4576434 0.4295032 0.3545263 Eigenwert 1 Eigenwert 2 Eigenwert 3 Eigenwert 4 Eigenwert 5 Eigenwert 6 Eigenwert 7 Eigenwert 8 Eigenwert 9 Eigenwert 10 Eigenwert 11 Eigenwert 12 19

3-Faktor-Lösung: 20

Grafische Veranschaulichung der Faktorladungen F2 +1.00 V2 V1-1.00 90 F1 +1.00 V4 V3 21

Achsenrotation 22

Achsenrotation Die Faktorladungen der ursprünglichen Faktorlösung sind nicht zur Interpretation der Achsen geeignet. Man kann jedoch die Achsen bei gleicher Distanz der Variablenpunkte drehen. Die Achsendrehung und Neuberechnung der Faktorladungen nennt man in der Faktorenanalyse die Rotation. 23

Varimax Rotation Bei der sogenannten Varimax-Rotation werden die Achsen so rotiert, dass der Winkel der Achsen von 90 beibehalten wird. = rechtwinkelige oder orthogonale Rotation Der Rechte Winkel der Achsen stellt sicher, dass die Faktoren weiterhin unkorreliert sind Varimax bedeutet, dass die Variablen auf je einem Faktor möglichst hoch, auf den anderen möglichst gering laden. Wenn in diesem Fall mehrere Variablen hoch auf dem einen und gering auf den anderen Faktoren laden, kann der Faktor interpretiert werden. 24

+1.00 +0.80 +0.60 +0.40 Beispiel: unrotiert +1.00 +0.80 +0.60 +0.40 +0.20 0-0.20-0.40-0.60-0.80-1.00 selbeleute F1 25 +0.20 0-0.20 vermeiden bew aeltigen zurueckhalt tanzen abhebt aufregend -0.40-0.60-0.80-1.00

Beispiel: rotiert (varimax) F2 +1.00 S2 selbeleute abhebt aufregend vermeiden bew aeltigen zurueckhalt tanzen F1 +1.00 S1-1.00 26

27

Kommunalitäten Erklärte Varianz (X i ) durch q Faktoren = K i qfaktoren = a 2 i,1+a 2 i,2+...+a 2 i,q Diese, durch die Faktoren Erklärte Varianz einer Variable wird in der Faktorenanalyse die Kommunalität genannt. 28

Beispiel Kommunalität K(V29, 12 Faktoren)= 0.6911 2 + 0.3137 2 + 0.0248 2 + 0.1658 2 + 0.2139 2 + 0.1061 2 + 0.0031 2 + 0.0719 2 + 0.3741 2 + 0.4282 2 + 0.0992 2 + 0.0238 2 =1 K(V29, 3 Faktoren)= 0.6911 2 + 0.3137 2 + 0.0248 2 = 0.5766 Interpretation: V29 (Motiv) kann zu rund 58% durch die 3-Faktorlösung reproduziert werden 29

Über Kommunalitäten Im Vollständigen Modell (=alle Faktoren werden extrahiert) ist die Kommunalität jeder Variable = 1 (d.h. jede Variable kann durch die Faktoren zu 100% erklärt werden) Bei weniger Faktoren (das ist das Ziel der FA) ist K i allerdings i.d.r < 1. Aus den Kommunailtäten ist daher abzulesen, wie gut eine bestimmte Faktorlösung für jedes einzelne Item passt. 30

31

32

Kaiserkriterium Manuelle Auswahl der Anzahl 33

Literaturempfehlung: Wolf, Ch., Best, H. (Hrsg.)(2010). Handbuch der sozialwissenschaftlichen Datenanalyse. Wiesebaden, VS-Verlag. Kapitel 15.