Explorative Faktorenanalyse 1
Einsatz der Faktorenanalyse Verfahren zur Datenreduktion Analyse von Datenstrukturen 2
-Ich finde es langweilig, mich immer mit den selben Leuten zu treffen -In der Beziehung zu neuen Bekannten bin ich eher zurückhaltend -Es ist mir wichtig, im Leben möglichst viel aufregendes zu erleben -Es ist mir wichtig, einen Lebensstil zu führen, der sich von der Masse abhebt -Es ist mir wichtig mit meinem Lebensstil nicht immer "aus der Reihe zu tanzen" -Bei neuen Aufgabe habe ich oft die Befürchtung, dass ich sie nicht bewältigen kann -Ich gehe meistens Problemen aus dem Weg oder versuche sie zu vermeiden F2 +1.00 S2 aufregend abhebt selbeleute -1.00 vermeiden tanzen bew aeltigen F1 +1.00 S1 zurueckhaltend 3
Vorgehensweise 1 Durchführung einer Faktorenanalyse für eine bestimmte Itemmenge 2 Bestimmung der Zahl der relevanten Faktoren, Beurteilung der Modellanpassung 3 Wenn mehr als ein relevanter Faktor dann Faktorrotation 4 Interpretation 5 Eventuell Korrektur der Faktorzahl oder eliminieren von Items und erneute Berechnung 6 Indexberechnung: Additiver Index oder Faktorwerte 4
Wichtige Anwendungsvoraussetzungen metrisches Messniveau der Variablen Variablen stellen voneinander unabhängige Messungen dar 5
Logik des Verfahrens: - Wenn Variablen dieselbe Inhaltsdimension messen, dann sollten sie untereinander hoch korrelieren. - In diesem Fall sollte sich eine gemeinsame ( fiktive ) Variable erstellen lassen, welche das, was die Variablen gemeinsam messen abbildet. - Wenn alle Variablen fehlerfrei eine gemeinsame Dimension messen, dann korrelieren alle untereinander mit 1.0. Sie könnten dann auch ohne Fehler, d.h. vollständig durch eine stellvertretende Variable ersetzt werden. - Wenn die Variablen nicht nur eine gemeinsame Dimension messen, sondern jede Variable noch etwas anderes misst, dann reicht eine stellvertretende Variable nicht mehr aus. Z.b. die Variablen messen zwar grundsätzlich eine gemeinsame Zieldimension, aber jede mit einem Messfehler. Oder: Die Variablen messen zwei (oder mehr) unterschiedliche Inhaltsdimensionen (mit Meßfehlern). Unterschiedlich soll bedeuten miteinander (beinahe) unkorreliert. 6
Hauptkomponenten Methode weitere Bezeichnungen: Principle Component Analysis (PC oder PCA) Alle m Variablen lassen sich vollständig durch eine Linearkombination aus m Faktorvariablen beschreiben, wenn die Faktoren unkorreliert sind. D.h: X i =a i,1 *F 1 + a i,2 *F 2 +... + a i,q *F q Die Gewichte a ij heißen in der Faktorenanalyse Faktorladungen Die Variablen X i sind gemessene Variablen einer Person (standardisiert) F i : Ausprägung der (hypothetischen) Faktorvariable einer Person (standardisiert) 7
V29 V30 V31 V32 V33 V34 V35 V36 V37 V38 V39 V40 8
Motiv (V29)= 0.6911*F1 + 0.3137*F2-0.0248*F3 +. - 0.0238*F12 Alle Variablen sind standardisiert, d.h. Z i = X i S i X i 9
Eigenwerte Die Varianz, die der Faktor F j in allen X 1...X m Variablen aufklärt ist: λ j =a 2 1,j + a 2 2,j+...+a 2 m,j Dieser Varianzanteil wird in der Faktorenanalyse der Eigenwert eines Faktors genannt. Wie gut können die Variablen stellvertretend durch diese Inhaltsdimension (z.b. durch F1) beschrieben werden 10
Beispiel Eigenwert (Faktor 1)= 0.6911 2 + 0.6439 2 + 0.4591 2 + 0.7266 2 + 0.7183 2 + 0.6196 2 + 0.6266 2 + 0. 6173 2 + 0.4171 2 + 0.3438 2 + 0.5703 2 + 0.6355 2 =4.326 Faktor 1 klärt 4.326 der Gesamtvarianz auf. Gesamtvarianz=12 weil 12 standardisiserte Items d.h. Erklärte Varianz durch Faktor 1 = 100*4.326/12=36% 11
über Eigenwerte... Bei m Variablen und m Faktoren ist die Summe aller Eigenwerte = m. Bei m Variablen und weniger als m Faktoren ist die Summe aller Eigenwerte i.d.r. < m. Je größer der Eigenwert eines Faktors umso größer ist seine Bedeutung für die betrachteten Variablen. Eigenwert/Anzahl der Items = Anteil der Erklärten Varianz in allen Variablen durch einen gemeinsamen Faktor Faktoren mit Eigenwerten < 1 sind nicht sinnvoll: Sie erklären weniger als eine einzelne Variable 12
Festlegung der Anzahl relevanter Faktoren Ausgehend von der maximalen Lösung, d.h. von der maximal nötigen Anzahl an Faktoren (z.b. 12 Faktoren bei 12 Items): Wie viele dieser Faktoren sind relevant oder auf wie viele kann ich verzichten? D.h. auf wie viele Faktoren können wir verzichten ohne, dass die Reproduktion der Items durch die Faktoren zu ungenau wird, aber trotzdem eine maximale Reduktion der Information erreicht wird. 13
Festlegung der Anzahl der Faktoren Dazu sind mehrere Methoden möglich. Die wichtigsten sind: Inhaltliche Interpretierbarkeit Kaiser-Kriterium Scree-Test 14
Festlegung der Anzahl der Faktoren (1) Inhaltliche Interpretierbarkeit: Faktoren repräsentieren latente Dimensionen. Sie sind daher theoretische Konstrukte, die mit mathematischen Kalkülen ermittelt werden. Sie können daher auch methodische Artefakte sein. Es werden nur so viele Faktoren extrahiert, dass die Faktoren inhaltlich interpretierbar sind. 15
Festlegung der Anzahl der Faktoren (2) Kaiser-Kriterium: Es werden nur Faktoren mit Eigenwerten > 1 extrahiert. Grund: Faktoren mit Eigenwerten < 1 haben keine Aussagekraft Ein Eigenwert < 1 bedeutet, dass ein Faktor weniger Varianz aufklart wie eine Variable allein 16
Festlegung der Anzahl der Faktoren (3) Scree-Test Bei der FA werden Faktoren extrahiert, die sukzessive Varianz aufklären. Daher fällt mit zunehmender Faktorenzahl der Eigenwert des Faktors ab. Den Eigenwertabfall kann man als sogenanntes Scree-Diagramm darstellen: 17
Festlegung der Anzahl der Faktoren 18 Eigenwert 1 Eigenwert 2 Eigenwert 3 Eigenwert 4 Eigenwert 1 Eigenwert 2 Eigenwert 3 Eigenwert 4 Eigenwert 5 2.357555 1.981581 1.489104 1.026947 0.9202235 0.7622569 0.7218618 0.6181886 0.5067837 0.416706 0.1987924 Eigenwert 6 Eigenwert 7
Festlegung der Anzahl der Faktoren 4.325856 Kaiserkriterium: 3 Faktoren Screediagramm: 1 oder 3 Faktoren 1.208011 1.17371 0.868967 0.7377806 0.6697599 0.6424038 0.6004916 0.531346 0.4576434 0.4295032 0.3545263 Eigenwert 1 Eigenwert 2 Eigenwert 3 Eigenwert 4 Eigenwert 5 Eigenwert 6 Eigenwert 7 Eigenwert 8 Eigenwert 9 Eigenwert 10 Eigenwert 11 Eigenwert 12 19
3-Faktor-Lösung: 20
Grafische Veranschaulichung der Faktorladungen F2 +1.00 V2 V1-1.00 90 F1 +1.00 V4 V3 21
Achsenrotation 22
Achsenrotation Die Faktorladungen der ursprünglichen Faktorlösung sind nicht zur Interpretation der Achsen geeignet. Man kann jedoch die Achsen bei gleicher Distanz der Variablenpunkte drehen. Die Achsendrehung und Neuberechnung der Faktorladungen nennt man in der Faktorenanalyse die Rotation. 23
Varimax Rotation Bei der sogenannten Varimax-Rotation werden die Achsen so rotiert, dass der Winkel der Achsen von 90 beibehalten wird. = rechtwinkelige oder orthogonale Rotation Der Rechte Winkel der Achsen stellt sicher, dass die Faktoren weiterhin unkorreliert sind Varimax bedeutet, dass die Variablen auf je einem Faktor möglichst hoch, auf den anderen möglichst gering laden. Wenn in diesem Fall mehrere Variablen hoch auf dem einen und gering auf den anderen Faktoren laden, kann der Faktor interpretiert werden. 24
+1.00 +0.80 +0.60 +0.40 Beispiel: unrotiert +1.00 +0.80 +0.60 +0.40 +0.20 0-0.20-0.40-0.60-0.80-1.00 selbeleute F1 25 +0.20 0-0.20 vermeiden bew aeltigen zurueckhalt tanzen abhebt aufregend -0.40-0.60-0.80-1.00
Beispiel: rotiert (varimax) F2 +1.00 S2 selbeleute abhebt aufregend vermeiden bew aeltigen zurueckhalt tanzen F1 +1.00 S1-1.00 26
27
Kommunalitäten Erklärte Varianz (X i ) durch q Faktoren = K i qfaktoren = a 2 i,1+a 2 i,2+...+a 2 i,q Diese, durch die Faktoren Erklärte Varianz einer Variable wird in der Faktorenanalyse die Kommunalität genannt. 28
Beispiel Kommunalität K(V29, 12 Faktoren)= 0.6911 2 + 0.3137 2 + 0.0248 2 + 0.1658 2 + 0.2139 2 + 0.1061 2 + 0.0031 2 + 0.0719 2 + 0.3741 2 + 0.4282 2 + 0.0992 2 + 0.0238 2 =1 K(V29, 3 Faktoren)= 0.6911 2 + 0.3137 2 + 0.0248 2 = 0.5766 Interpretation: V29 (Motiv) kann zu rund 58% durch die 3-Faktorlösung reproduziert werden 29
Über Kommunalitäten Im Vollständigen Modell (=alle Faktoren werden extrahiert) ist die Kommunalität jeder Variable = 1 (d.h. jede Variable kann durch die Faktoren zu 100% erklärt werden) Bei weniger Faktoren (das ist das Ziel der FA) ist K i allerdings i.d.r < 1. Aus den Kommunailtäten ist daher abzulesen, wie gut eine bestimmte Faktorlösung für jedes einzelne Item passt. 30
31
32
Kaiserkriterium Manuelle Auswahl der Anzahl 33
Literaturempfehlung: Wolf, Ch., Best, H. (Hrsg.)(2010). Handbuch der sozialwissenschaftlichen Datenanalyse. Wiesebaden, VS-Verlag. Kapitel 15.