Multivariate Analysemethoden

Ähnliche Dokumente
Musterklausur im Fach Käuferverhalten und Marketingforschung. Prof. Dr. M. Kirchgeorg

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduktion. Interpretation des SPSS-Output s

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduzierung. Interpretation des SPSS-Output s

Einer Reihe von Merkmalen zugrunde liegende, gemeinsame Faktoren ermitteln.

SPSS-Ausgabe 1: Univariate Varianzanalyse. Profildiagramm. [DatenSet1] D:\Sozialwiss2006_7\STAT2\Daten\mathsalaries.sav. Seite 1

Hauptkomponentenanalyse. Die Schritte bei einer Hauptkomponentenanalyse

Aufgaben zur Multivariaten Statistik

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 13 a.

Exploratorische Faktorenanalyse. Exploratorische Faktorenanalyse. Exploratorische Faktorenanalyse

Statistik II: Klassifikation und Segmentierung

Zur Erklärung menschlicher Verhaltensweisen oder allgemeiner sozialer Phänomene ist häufig eine Vielzahl von Einflussfaktoren zu berücksichtigen.

9 Faktorenanalyse. Wir gehen zunächst von dem folgenden Modell aus (Modell der Hauptkomponentenanalyse): Z = F L T

11.2 Ergebnisse der Faktorenanalysen

Musterlösung. Modulklausur Multivariate Verfahren

Die Faktorenanalyse. Anwendung dann, wenn zwischen beobachtbaren und nicht direkt beobachtbaren Variablen ein kausales Verhältnis vermutet wird

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

GHF SoSe 2011 HS MD-SDL

METHODENPRAKTIKUM II Kurs 1. Prof. Dr. Beat Fux SUZ Frühlingssemester 2009

Empirische Analysen mit dem SOEP

Lösung zu Kapitel 11: Beispiel 2

6-Variablen-Fall. Dipl.-Ök. John Yun Bergische Universität Wuppertal Gaußstraße Wuppertal

6-Variablen-Fall. Dipl.-Ök. John Yun Bergische Universität Wuppertal Gaußstraße Wuppertal

Skript Einführung in SPSS

Faktorenanalyse. Fakultät für Human und Sozialwissenschaften Professur für Forschungsmethodik und Evaluation in der Psychologie

Name Vorname Matrikelnummer Unterschrift

Multivariate Statistische Methoden

Grundzüge der Faktorenanalyse

Multivariate Statistische Methoden und ihre Anwendung

1 Beispiele multivariater Datensätze... 3

Multivariate Verfahren

Faktorenanalyse Beispiel

Eigene MC-Fragen Kap. 4 Faktorenanalyse, Aggregation, Normierung. 1. Welche Aussage zu den Prinzipien der Faktorenanalyse ist zutreffend?

Materialband. Marktforschung

Die Rücktransformation: Z = A t (Y µ) = Y = AZ + µ

Einführung in die Hauptkomponentenanalyse und Faktorenanalyse mit SPSS. Datenanalyse HS09 Susan Kriete Dodds 18. November 2009

Statistik-Quiz Sommersemester

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Soziale Faktoren und Arbeitssicherheit. Der Einfluss von Kolleg/innen auf das sicherheitsrelevante Verhalten. Eine empirische Studie

Multivariate Verfahren

Klausur zu Biometrische und Ökonometrische Methoden und Ökologische Statistik

Statistische Methoden in der Wirtschaftsund Sozialgeographie

Klausur zur Vorlesung Analyse mehrdimensionaler Daten, Lösungen WS 2010/2011; 6 Kreditpunkte, 90 min

der Datenauswertung (Übung)

Einführung in die Statistik für Politikwissenschaftler Wintersemester 2011/2012

Holger Dette. 30. Oktober 2015

Einführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005

Institut für Marketing und Handel Prof. Dr. W. Toporowski. SPSS Übung 5. Heutige Themen: Faktorenanalyse. Einführung in Amos

Multivariate Analysemethoden

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Multivariate Verfahren

1 Übungsaufgaben zur Regressionsanalyse

Kommentierter SPSS-Output für hierarchische log-lineare Modelle (Modul Modellauswahl) 3 Dimensionen

Multivariate Analysemethoden, Dozent: Dr. Thomas Schäfer Alexander Allnoch, Markus Burkhardt & Vivien Röder

Hypothesentests mit SPSS

Ausgangsmatrix. Wert. Wert. Wert. 18 erhobene Merkmale. 74 Raumordnungsregionen

Syntax. Ausgabe *Ü12. *1. corr it25 with alter li_re kontakt.

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Ausblick; Darstellung von Ergebnissen; Wiederholung

Explorative Faktorenanalyse

Ziel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X.

Inhalt. Einführung in die Faktorenanalyse mit SPSS. 1. Faktorenanalyse: Wozu? 1. Faktorenanalyse: Wie?

2.6 Bestimmung der Faktorwerte ( Matrizenmanipulation bei Hauptkomponentenmethode)

Statistik II im Wintersemester 2006/2007

6. Faktorenanalyse (FA) von Tests

Messen im psychologischen Kontext II: Reliabilitätsüberprüfung und explorative Faktorenanalyse

Modulklausur Multivariate Verfahren

Forschungspraktikum Gruppenbezogene Menschenfeindlichkeit

Bestimmung der Zuverlässigkeit / Reliabilität einer additiven Itemskala. Cronbach s. 1 (k 1)r

Faktoren- und Hauptkomponentenanalyse

Zusammenfassung der Prüfungsergebnisse. für IKK gesund plus. Prüfungsergebnisse für Zertifizierung: TÜV Service tested

AMOS/SPSS output. One-factor model (9-item version)

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen

entschieden hat, obwohl die Merkmalsausprägungen in der Grundgesamtheit voneinander abhängig sind.

Statistik II Übung 1: Einfache lineare Regression

Faktorenanalyse. 1. Grundlegende Verfahren. Bacher, SoSe2007

Multivariate Statistik

Exkurs: Eigenwertproblem

Zusammenfassung der Prüfungsergebnisse. für AOK NordWest Die Gesundheitskasse. Prüfungsergebnisse für Zertifizierung: TÜV Service tested

Aufgaben zu Kapitel 9

Beispiele für Faktorscores realer Marken sowie minimaler und maximaler Score in den fünf Dimensionen. 2 Sensorik

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Klausurvorbereitung Multivariate Statistik

Klausur zu Biometrische und Ökonometrische Methoden und Ökologische Statistik

Übungsblatt 10: Lineare Regression (Sitzung 11)

Einführung in SPSS. Sitzung 5: Faktoranalyse und Mittelwertsvergleiche. Knut Wenzig. 22. Januar 2007

Multivariate Analysemethoden

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression II

Analyse 1 Tierkreiszeichen (korrigiert für Bounces).docx Seite 1 von 7. Tierkreiszeichen * Crosstabulation

Master: Quantitative Methoden

Statistik II Übung 3: Hypothesentests

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20

Aufgaben zu Kapitel 8

Darstellung der Rotation 2,85 / 0,08 1 / 3,5 3,62 / 0,40. α = 67,76 -1 / -1 -2,08 / 0,23-1,30 / 0,55

Teilklausur des Moduls Kurs 42221: Vertiefung der Statistik

Zusammenfassung der Prüfungsergebnisse. für AOK NordWest Die Gesundheitskasse. Prüfungsergebnisse für Zertifizierung: TÜV Service tested

2.5 Das Rotationsproblem

B. Regressionsanalyse [progdat.sav]

Sommersemester Marktforschung

Multidimensionale Skalierung

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Transkript:

Multivariate Analysemethoden Dipl.-Volksw. Rafael Rucha Klausur erster Termin im Wintersemester 2006/2007 3. Januar 2007 Das Arbeitsministerium beauftragte ein sozialwissenschaftliches Institut, eine Studie zu den Einstellungen der Bevölkerung hinsichtlich der Frauenerwerbstätigkeit durchzuführen. Zu diesem Zweck führte dieses - nachdem alle relevanten Daten erhoben wurden - zunächst eine Faktorenanalyse, darauffolgend eine multidimensionale Skalierung durch..) Beurteilen Sie die Studienskizze, indem Sie Fehler der Skizze aufzeigen und kurz falsche Aussagen korrigieren. 2.) Nehmen Sie kurz zu folgenden Aussagen Stellung: a.) Der F-Test im linearen Regressionsmodell testet, ob der Koeffizient β der unabhängigen Variablen x gleich 0 ist, d.h. ob diese unabhängige Variable signifikant zur Erklärung der abhängigen Variablen beiträgt. b.) Die Interpretation der Ergebnisse im multinomialen logistischen Regressionsmodell erfolgt stets unter Berücksichtigung der Referenzkategorie J =. c.) Bei der exploratorischen Faktorenanalyse unter Verwendung der Hauptkomponentenmethode beträgt die Kommunalität 2 h i der i-ten Variable bei standardisierten Ausgangsvariablen nach Faktorenextraktion stets, und vor der Faktorenextraktion liegt dieser Wert immer zwischen 0 und. d.) Der Ähnlichkeitskoeffizient von Russel-Rao ist immer echt größer ( > ) als der Ähnlichkeitskoeffizient von Tanimoto (bzw. Jaccard) e.) Die kophenetische Matrix ist Basis für den Complete-Linkage-Fusionierungsalgorithmus. f.) Erfolgt bei der multidimensionalen Skalierung die Messung der (Un-)Ähnlichkeiten von n Objekten über die Ankerpunktmethode, so werden diese (Un-)Ähnlichkeiten auf einer Skala von bis bewertet. n

STUDIENSKIZZE Bei der Faktorenanalyse wurde als Extraktionsmethode die Hauptkomponentenmethode gewählt. Es bedurfte im Vorfeld allerdings der Überprüfung, ob diese überhaupt durchgeführt werden konnte, was zunächst anhand der Korrelationsmatrix bestimmt wurde. Hier ergaben sich zwischen allen betrachteten Variablen keine Signifikanzen, aber durchweg sehr hohe Korrelationen. Da dieses Kriterium zur Durchführung uneindeutig war, wurden anschließend noch weitere Kriterien zur Entscheidungsfindung herangezogen. Da die Determinante der inversen Korrelationsmatrix den Wert 0,048 annahm, sprach dies eher für eine Durchführung, wohingegen der Bartlett-Test und das Kaiser-Meyer-Olkin-Kriterium eher auf eine Unterlassung der Faktorenanalyse hinwiesen. Nichtsdestotrotz wurde am Institut die gewünschte Analyse fortgeführt. Die berechneten Werte bei der erklärten Gesamtvarianz verwunderten: Hinsichtlich der zweiten Komponente betrug die erklärte Varianz über 0 % (genau: 5,277 %), dennoch wurde diese nicht bei der Extraktion berücksichtigt. Zufriedenstellend war hingegen das Ergebnis des kumulierten prozentualen Anteils der Summen der quadrierten Faktorenladungen der Extraktion. Dieser Wert betrug mehr als 50 %, was schließlich die Mindestanforderung dieses Verfahrens ist. Unbeirrt wurde die Analyse fortgeführt, und es wurde der Scree-Plot zu Rate gezogen. Auch hier entdeckte man Widersprüchliches: Die Differenz zwischen dem ersten und dritten Faktor bezüglich der Eigenwerte war größer als die Differenz zwischen dem zweiten und vierten. Man hoffte schließlich, dass sich nach der Rotation der Faktoren wenigstens das Ergebnis gut interpretieren lassen würde. Schließlich blickten Sie zufrieden auf die Ergebnisse: Da die extrahierte Komponente nach einer Varimax-Rotation hoch und positiv auf alle zu Grunde liegenden Variablen lud, konnte man schließen, dass die Komponente einen positiven kausalen Einfluss auf die betrachteten Variablen hatte. Um die abgefragten Items im Wahrnehmungsraum der befragten Personen darzustellen, wurde anschließend eine multidimensionale Skalierung durchgeführt. Da alle Optionen bezüglich der Darstellung offen gehalten werden sollten, ist neben der ein- und zweidimensionalen Darstellung des Wahrnehmungsraums auch eine dreidimensionale Darstellungsmöglichkeit gegeben gewesen. Was den Algorithmus zur Auffindung einer Lösung im Wahrnehmungsraum anbelangte, entschied man sich, den Algorithmus entweder nach 33 Iterationsschritten, nach dem Kovergenzkriterium, das den Veränderungswert 0,0020 unterschreiten sollte, oder nach dem STRESS-Wert, der dann den Wert 0,0020 unterschreiten sollte, abzubrechen. Hinsichtlich der gefundenen eindimensionalen Lösung entschied man sich, diese als hervorragend zu beurteilen, da der STRESS-Wert nach 24 Iterationen kleiner war als 0,05.

ANHANG I. Variablen a. Namen und Variablenlabel (die Zustimmung zu den Items wurde abgefragt) v72 v73 v74 v75 v76 v77 BERUFST.FRAU: HERZL. VERHAELT. ZUM KIND IST WICHTIG FRAU, LIEBER MANN BEI D.KARRIERE HELFEN? FRAU, NICHT ARBEITEN, SONDERN BEI KLEINKIND? FRAU, ZU HAUSE BLEIBEN+KINDER VERSORGEN? FRAU, BESSERE MUTTER BEI BERUFSTAETIGK.? FRAU, NACH HEIRAT ARBEITSPL. FREIMACHEN? b. Wertelabels 2 3 4 8 9 STIMME VOLL ZU STIMME EHER ZU STIMME EHER NICHT ZU STIMME GAR NICHT ZU WEISS NICHT KEINE ANGABE

II. Ergebnisse Faktorenanalyse (SPSS-Output) Korrelationen(a,b) Spearman-Rho BE- RUFST.FRAU: HERZL. VERHAELT. ZUM KIND FRAU, LIE- BER MANN BEI D.KARRIERE HELFEN? FRAU, NICHT ARBEITEN BEI KLEINKIND? FRAU, ZU HAUSE BLEI- BEN+KIN DER VER- SORGEN? FRAU, BES- SERE MUT- TER BEI BERUFSTAE- TIGK.? FRAU, NACH HEIRAT AR- BEITSPL. FREIMA- CHEN? BERUFST.FRAU: HERZL. Korrelationskoeffizient,000 -,265(**) -,434(**) -,386(**),426(**) -,27(**) VERHAELT. ZUM KIND Sig. (2-seitig).,000,000,000,000,000 FRAU, LIEBER MANN BEI D.KARRIERE HELFEN? Korrelationskoeffizient -,265(**),000,367(**),553(**) -,307(**),458(**) Sig. (2-seitig),000.,000,000,000,000 FRAU, NICHT ARBEITEN Korrelationskoeffizient -,434(**),367(**),000,558(**) -,50(**),403(**) BEI KLEINKIND? Sig. (2-seitig),000,000.,000,000,000 FRAU, ZU HAUSE BLEI- Korrelationskoeffizient -,386(**),553(**),558(**),000 -,496(**),564(**) BEN+KINDER VERSOR- Sig. (2-seitig) GEN?,000,000,000.,000,000 FRAU, BESSERE MUT- Korrelationskoeffizient,426(**) -,307(**) -,50(**) -,496(**),000 -,340(**) TER BEI BERUFSTAE- Sig. (2-seitig) TIGK.?,000,000,000,000.,000 FRAU, NACH HEIRAT Korrelationskoeffizient -,27(**),458(**),403(**),564(**) -,340(**),000 ARBEITSPL. FREIMA- Sig. (2-seitig) CHEN?,000,000,000,000,000. ** Die Korrelation ist auf dem 0,0 Niveau signifikant (zweiseitig). a Listenweises N= 266 b Determinante =,048 KMO- und Bartlett-Test Maß der Stichprobeneignung nach Kaiser-Meyer-Olkin.,837 Bartlett-Test auf Sphärizität Ungefähres Chi-Quadrat 5084,395 df 5 Signifikanz nach Bartlett,000

Erklärte Gesamtvarianz Anfängliche Eigenwerte Summen von quadrierten Faktorladungen für Extraktion Komponente Gesamt % der Varianz Kumulierte % Gesamt % der Varianz Kumulierte % 3,44 52,403 52,403 3,44 52,403 52,403 2,97 5,277 67,680 3,577 9,64 77,294 4,540 8,994 86,288 5,480 8,00 94,289 6,343 5,7 00,000 Extraktionsmethode: Hauptkomponentenanalyse. Screeplot 3 Eigenwert 2 0 2 3 Faktor 4 5 6

Komponentenmatrix(a) Komponen te BERUFST.FRAU: HERZL. VERHAELT. ZUM KIND -,622 FRAU, LIEBER MANN BEI D.KARRIERE HELFEN?,675 FRAU, NICHT ARBEITEN BEI KLEINKIND?,767 FRAU, ZU HAUSE BLEI- BEN+KINDER VERSOR- GEN? FRAU, BESSERE MUT- TER BEI BERUFSTAE- TIGK.? FRAU, NACH HEIRAT ARBEITSPL. FREIMA- CHEN?,842 -,72,706 Extraktionsmethode: Hauptkomponentenanalyse. a Komponenten extrahiert III. Ergebnisse multidimensionale Skalierung (SPSS-Output) Alscal Procedure Options Data Options- Number of Rows (Observations/Matrix). 6 Number of Columns (Variables)... 6 Number of Matrices...... Measurement Level....... Ordinal Data Matrix Shape....... Symmetric Type........... Dissimilarity Approach to Ties....... Leave Tied Conditionality........ Matrix Data Cutoff at........,000000 Model Options- Model........... Euclid Maximum Dimensionality..... 2 Minimum Dimensionality..... Negative Weights....... Not Permitted Output Options- Job Option Header....... Data Matrices........ Configurations and Transformations. Output Dataset........ Initial Stimulus Coordinates... Printed Printed Plotted Not Created Computed

Algorithmic Options- Maximum Iterations...... 33 Convergence Criterion.....,00020 Minimum S-stress.......,00020 Missing Data Estimated by.... Ulbounds Tiestore.......... C 5 Optimally scaled data (disparities) for subject 2 3 4 5,000 2 3,277,000 3 2,864,478,000 4 3,277,34,7,000 5,7 2,470 2,606 2,606,000 6 3,72,34,7,34 2,470 6 6,000 Iteration history for the dimensional solution (in squared distances) Young's S-stress formula is used. Iteration S-stress Improvement,0565 2,0444,0200 3,0359,00823 4,0300,0058 5,0265,00394 6,02344,0027 7,0258,0086 8,0200,0056 9,0885,006 0,0796,00089,0725,0007 2,0667,00058 3,068,00049 4,0576,00042 5,0540,00036 6,0508,00032 7,0479,00029 8,0452,00027 9,0427,00025 20,0404,00023 2,0382,00022 22,036,0002 23,034,00020 24,0322,0009 Iterations stopped because S-stress improvement is less than,000200

Stress and squared correlation (RSQ) in distances RSQ values are the proportion of variance of the scaled data (disparities) in the partition (row, matrix, or entire data) which is accounted for by their corresponding distances. Stress values are Kruskal's stress formula. For matrix Stress =,06974 RSQ =,98992 Configuration derived in dimensions Stimulus Coordinates Dimension Stimulus Stimulus Number Name C v72,6305 2 v73 -,7020 3 v74 -,6996 4 v75 -,7034 5 v76,732 6 v77 -,6988 Konfiguration des abgeleiteten Stimulus Euklidisches Distanzmodell 2,0 v72,5 v76 Dimension,0 0,5 0,0-0,5 -,0 v75 v74 v73 v77 -,0-0,5 0,0 0,5,0 Eindimensionales Diagramm