Lösung zu Kapitel 11: Beispiel 2

Ähnliche Dokumente
Lösung zu Kapitel 11: Beispiel 1

11 Dimensionsreduktion

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 13 a.

Faktorenanalyse Dr. Markus Stöcklin, Universität Basel, Fakultät für Psychologie

Zur Erklärung menschlicher Verhaltensweisen oder allgemeiner sozialer Phänomene ist häufig eine Vielzahl von Einflussfaktoren zu berücksichtigen.

Statistik II: Klassifikation und Segmentierung

Einer Reihe von Merkmalen zugrunde liegende, gemeinsame Faktoren ermitteln.

METHODENPRAKTIKUM II Kurs 1. Prof. Dr. Beat Fux SUZ Frühlingssemester 2009

Exploratorische Faktorenanalyse. Exploratorische Faktorenanalyse. Exploratorische Faktorenanalyse

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Principal Component Analysis (PCA) (aka Hauptkomponentenanalyse)

Statistik, Datenanalyse und Simulation

Hauptkomponentenanalyse. Die Schritte bei einer Hauptkomponentenanalyse

Darstellung der Rotation 2,85 / 0,08 1 / 3,5 3,62 / 0,40. α = 67,76 -1 / -1 -2,08 / 0,23-1,30 / 0,55

Skript Einführung in SPSS

Faktoren- und Hauptkomponentenanalyse

9 Faktorenanalyse. Wir gehen zunächst von dem folgenden Modell aus (Modell der Hauptkomponentenanalyse): Z = F L T

Explorative Faktorenanalyse

Statistische Methoden in der Wirtschaftsund Sozialgeographie

Die Rücktransformation: Z = A t (Y µ) = Y = AZ + µ

Dimensionsreduktion mit PCA und EFA Oliver Gansser

GHF SoSe 2011 HS MD-SDL

Multivariate Analysemethoden

6. Faktorenanalyse (FA) von Tests

Selbstständiges Lernen

Musterklausur im Fach Käuferverhalten und Marketingforschung. Prof. Dr. M. Kirchgeorg

Partial-Least-Square PLS und Kennzahl VIP

Eigene MC-Fragen Kap. 4 Faktorenanalyse, Aggregation, Normierung. 1. Welche Aussage zu den Prinzipien der Faktorenanalyse ist zutreffend?

11.2 Ergebnisse der Faktorenanalysen

Faktorenanalyse. Fakultät für Human und Sozialwissenschaften Professur für Forschungsmethodik und Evaluation in der Psychologie

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduktion. Interpretation des SPSS-Output s

Forschungspraktikum Gruppenbezogene Menschenfeindlichkeit

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduzierung. Interpretation des SPSS-Output s

Syntax. Ausgabe *Ü12. *1. corr it25 with alter li_re kontakt.

Lineare Algebra und Datenwissenschaften in Ingenieur- und Informatikstudiengängen

Einführung in die Hauptkomponentenanalyse und Faktorenanalyse mit SPSS. Datenanalyse HS09 Susan Kriete Dodds 18. November 2009

13 Dimensionsreduktion

Die Faktorenanalyse. Anwendung dann, wenn zwischen beobachtbaren und nicht direkt beobachtbaren Variablen ein kausales Verhältnis vermutet wird

Faktoren- und Hauptkomponentenanalyse

Hauptkomponenten-basierte Klassifikationsverfahren (PCA)

Radar gesellschaftlicher Zusammenhalt messen was verbindet. Gesellschaftlicher Zusammenhalt in Deutschland Kurze Einführung in die Methode

Stellenausschreibung & Stellenbesetzungsverfahren

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

6-Variablen-Fall. Dipl.-Ök. John Yun Bergische Universität Wuppertal Gaußstraße Wuppertal

Herleitung der Hauptkomponenten: Y t = (Y 1,..., Y m ) Erwartung:µ Kovarianz:Σ. Z j = a 1j Y 1 + a 2j Y a mj Y m = a t j Y

Inhaltsverzeichnis. Vorwort. 1 Einführung in die multivariate Datenanalyse 1

Multivariate Verfahren

Multivariate Analysemethoden, Dozent: Dr. Thomas Schäfer Alexander Allnoch, Markus Burkhardt & Vivien Röder

Statistik-Quiz Sommersemester

R a i n e r N i e u w e n h u i z e n K a p e l l e n s t r G r e v e n T e l / F a x / e

F r e i t a g, 3. J u n i

L 3. L a 3. P a. L a m 3. P a l. L a m a 3. P a l m. P a l m e. P o 4. P o p 4. L a. P o p o 4. L a m. Agnes Klawatsch

S o n n t a g, 5. A u g u s t

S o n n t a g, 2 6. N o v e m b e r

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Mathematik. Juni 2015 AHS. Kompensationsprüfung Angabe für Kandidatinnen/Kandidaten

SPSS-Ausgabe 1: Univariate Varianzanalyse. Profildiagramm. [DatenSet1] D:\Sozialwiss2006_7\STAT2\Daten\mathsalaries.sav. Seite 1

Einführung in SPSS. Sitzung 5: Faktoranalyse und Mittelwertsvergleiche. Knut Wenzig. 22. Januar 2007

Holger Dette. 30. Oktober 2015

6. Tutoriumsserie Statistik II

Klausurvorbereitung Multivariate Statistik

Messen im psychologischen Kontext II: Reliabilitätsüberprüfung und explorative Faktorenanalyse

Klausur zu Biometrische und Ökonometrische Methoden und Ökologische Statistik

Demokurs. Modul Vertiefung der Wirtschaftsmathematik Vertiefung der Statistik

SPSS (20.0) Hilfe Version 1

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II

Wahrscheinlichkeitsrechnung und Statistik für Biologen Diskriminanzanalyse

σ 2 (x) = σ 2 (τ) + σ 2 (ε) ( x) ( ) ( x) ( ) ( ) σ =σ τ +σ ε σ τ σ σ ε ( ) ( x) Varianzzerlegung Varianzzerlegung und Definition der Reliabilität

Diplomprüfung Evaluation und Forschungsmethodik SS 2006

6-Variablen-Fall. Dipl.-Ök. John Yun Bergische Universität Wuppertal Gaußstraße Wuppertal

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen

13.0 Dimensionsreduktion Dimensionsreduktion. 13 Dimensionsreduktion Hauptkomponentenanalyse Dimensionsreduktion

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

13.1 Hauptkomponentenanalyse. 13 Dimensionsreduktion Hauptkomponentenanalyse Hauptkomponentenanalyse

Skript zum Kurz-Referat:

Institut für Marketing und Handel Prof. Dr. W. Toporowski. SPSS Übung 5. Heutige Themen: Faktorenanalyse. Einführung in Amos

1 Übungsaufgaben zur Regressionsanalyse

Grundzüge der Faktorenanalyse

Multivariate Verfahren

Teilklausur des Moduls Kurs 42221: Vertiefung der Statistik

Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester Aufgabe 1

Biometrische und Ökonometrische Methoden I! Lösungen 4

Biometrische und Ökonometrische Methoden I Lösungen 4

Auswahl und Einstellung neuer Mitarbeiter

Multivariate Verfahren

Überblick über die ProbabilistischeTesttheorie

4. Skalenbildung: Faktorenanalyse, Aggregation von Items & Normierung

Gemeinsam Ziele erreichen

Kapitel 5 : Eigenwerte und Eigenvektoren

Recommender Systeme mit Collaborative Filtering

you experienced? Würzburg,

Modul 1 ICS. Individualisierte Potenzialanalyse

1 Lineare Gleichungssysteme und Matrizen

Statistische Datenanalyse mit R, Korrelation und Regression. Dr. Andrea Denecke Leibniz Universität IT-Services

Faktorenanalyse Beispiel

Prof. Dr. Fred Böker

Statistik II Übung 1: Einfache lineare Regression

Varianzkomponentenschätzung

Transkript:

Lösung zu Kapitel 11: Beispiel 2 Die Daten beziehen sich auf 48 Bewerbungen um eine Position in einem Unternehmen. Diese Bewerbungen wurden anhand von 15 Variablen bewertet (Datenfile: bewerbung.csv). Form des Bewerbungsschreibens Erscheinung Akademische Fähigkeiten Sympathie Selbstvertrauen Klarheit Ehrlichkeit Geschäftstüchtigkeit Erfahrung Schwung Ambition Auffassungsgabe Potenzial Eifer Eignung (Je höher der Wert, desto stärker ist die Eigenschaft ausgeprägt.) Gibt es einige zugrunde liegende Komponenten, die mit den Haupteigenschaften der Bewerber korrespondieren? Falls ja, können die Bewerber leichter verglichen werden. Basierend auf den Ergebnissen der Hauptkomponentenanalyse: Welche Kandidaten würde man auswählen, wenn die zu besetzende Position im Verkauf, im Marketing oder aber in der Abteilungsleitung angesiedelt ist? > bewerbung <- read.csv2("bewerbung.csv", header = TUE) > itemnam <- c("id", "Form des Bewerbungsschreibens", "Erscheinung", + "Akademische Fähigkeiten", "Sympathie", "Selbstvertrauen", + "Klarheit", "Ehrlichkeit", "Geschäftstüchtigkeit", "Erfahrung", + "Schwung", "Ambition", "Auffassungsgabe", "Potenzial", "Eifer", + "Eignung") > colnames(bewerbung) <- itemnam > dat.b <- bewerbung[, -1] Ob die vorhandenen Daten für eine Hauptkomponentenanalyse geeignet sind, wurde vorweg mittels der Kaiser-Meyer-Olkin-Statistik überprüft. Diese berechnet das Maß der Korrelation, welches in den Daten steckt - unter Berücksichtigung des Ausmaßes an partieller Korrelation. > library("rela") > test.b <- paf(as.matrix(dat.b)) > cat("kmo Statistik:", test.b$kmo, " Bartlett-Statistik:", test.b$bartlett, + "\n")

KMO Statistik: 0.78378 Bartlett-Statistik: 645.32 > library("psych") > bart.b <- cortest.bartlett(cor(dat.b), n = nrow(dat.b)) > unlist(bart.b) chisq p.value df 6.4532e+02 1.2563e-78 1.0500e+02 Um die Vielzahl von Merkmalen auf einige wenige Faktoren zu reduzieren, wird eine Hauptkomponentenanalyse mit anschließender Varimax-otation durchgeführt, wobei die Faktoren auf Basis ihrer Korrelation erstellt werden. Werden jene Komponenten verwendet, deren Eigenwert mindestens 1 erreicht, können 81 % der Gesamtvarianz erklärt werden. > pca.b <- principal(dat.b, 4, rotate = "none") > pca.b$criteria <- NULL > pca.b Principal Components Analysis Call: principal(r = dat.b, nfactors = 4, rotate = "none") Standardized loadings based upon correlation matrix PC1 PC2 PC3 PC4 h2 u2 Form des Bewerbungsschreibens 0.45 0.61 0.38-0.10 0.73 0.27 Erscheinung 0.58-0.05-0.03 0.29 0.43 0.57 Akademische Fähigkeiten 0.11 0.34-0.52 0.70 0.88 0.12 Sympathie 0.62-0.19 0.56 0.38 0.87 0.13 Selbstvertrauen 0.80-0.36-0.29-0.19 0.88 0.12 Klarheit 0.86-0.19-0.18-0.08 0.82 0.18 Ehrlichkeit 0.43-0.58 0.34 0.46 0.85 0.15 Geschäftstüchtigkeit 0.89-0.04-0.22-0.22 0.89 0.11 Erfahrung 0.37 0.79 0.10 0.07 0.78 0.22 Schwung 0.86 0.07-0.10-0.17 0.79 0.21 Ambition 0.87-0.10-0.25-0.22 0.88 0.12 Auffassungsgabe 1-0.03-0.14 0.08 0.85 0.15 Potenzial 1 0.03-0.09 0.21 0.89 0.11 Eifer 0.71-0.12 0.56-0.22 0.89 0.11 Eignung 0.65 0.60 0.11-0.02 0.79 0.21 PC1 PC2 PC3 PC4 SS loadings 7.51 2.06 1.46 1.20 Proportion Var 0.50 0.14 0.10 0.08 Cumulative Var 0.50 0.64 0.74 0.81 > pca.b.rotate <- principal(dat.b, 4, scores = TUE) > pca.b.rotate$criteria <- NULL > print(pca.b.rotate, cut = 0.5, sort = TUE, digits = 2)

Principal Components Analysis Call: principal(r = dat.b, nfactors = 4, scores = TUE) Standardized loadings based upon correlation matrix item C1 C2 C3 C4 h2 u2 Ambition 11 2 0.88 0.12 Selbstvertrauen 5 2 0.88 0.12 Geschäftstüchtigkeit 8 1 0.89 0.11 Klarheit 6 0.86 0.82 0.18 Auffassungsgabe 12 0.81 0.85 0.15 Schwung 10 0.80 0.79 0.21 Potenzial 13 0.75 0.89 0.11 Erscheinung 2 0.43 0.57 Erfahrung 9 0.85 0.78 0.22 Form des Bewerbungsschreibens 1 0.83 0.73 0.27 Eignung 15 0.80 0.79 0.21 Sympathie 4 0.87 0.87 0.13 Ehrlichkeit 7 0.86 0.85 0.15 Eifer 14 0.53-0.52 0.89 0.11 Akademische Fähigkeiten 3 3 0.88 0.12 C1 C2 C3 C4 SS loadings 5.77 2.73 2.39 1.35 Proportion Var 0.38 0.18 0.16 0.09 Cumulative Var 0.38 0.57 0.73 0.81 Um die Hauptkomponenten inhaltlich sinnvoll interpretieren zu können, lässt man sich zudem einen Screeplot Abbildung 1 als grafische Unterstützung erstellen. In diesem Fall stimmt die Anzahl der Hauptkomponenten, deren Eigenwert größer als 1 ist, mit der Anzahl der Hauptkomponenten, welche im Scree-Plot links von der Knickstelle liegen, überein. > VSS.scree(dat.b) scree plot values 0 2 4 6 2 4 6 8 10 12 14 Index Abbildung 1: Screeplot > fa.diagram(pca.b.rotate, cut = 0.5, cex = 0.8, rsize = 0.5, main = "")

Ambition Selbstvertrauen Geschäftstüchtigkeit Klarheit Auffassungsgabe Schwung Potenzial Erscheinung Erfahrung Form des Bewerbungsschreibens Eignung Sympathie Ehrlichkeit Eifer Akademische Fähigkeiten 0.8 0.8 0.7 0.8 0.5 0.8 C1 C2 C3 C4 Nachdem die neu gewonnenen Variablen benannt wurden FAKTO 1... Softskills FAKTO 2... Fachliche Kompetenz FAKTO 3... Soziale Kompetenz FAKTO 4... Ausbildung wird mit diesen weitergerechnet. Im Folgenden soll nun mit Hilfe der Ergebnisse eine Auswahl der Kandidaten für eine zu besetzende Position 1. im Verkauf, 2. im Marketing oder 3. in der Abteilungsleitung erfolgen. Eine Möglichkeit, diese Auswahl zu treffen, besteht darin, die Eignung der Bewerber für die ausgeschriebenen Stellen anhand der wichtigsten Faktoren zu bestimmen. Dafür werden die jeweilige Positionen auf den beiden Achsen eines Streudiagrammes aufgetragen. Je weiter rechts oben die Werte der BewerberInnen liegen, desto besser eignen sich diese für die jeweilige Stelle. Welche Faktoren für die jeweilige Position als Grundlage zur Entscheidungsfindung herangezogen werden, ist eine subjektive Entscheidung. Unter den Annahmen, dass 1. für die Position im Verkauf die beiden Faktoren Softskills und Soziale Kompetenz, 2. für die Position im Marketing die beiden Faktoren Fachliche Kompetenz und Ausbildung und 3. für die Position in der Abteilungsleitung die beiden Faktoren Fachliche Kompetenz und Soziale Kompetenz am wichtigsten sind, können die BewerberInnen nun leichter miteinander verglichen werden. Wenn beispielsweise jemand im Verkauf eingestellt werden soll, werden die Faktoren 1 und 3 in einem Streudiagramm einander gegenüber gestellt. Somit gelangt man zu den folgenden Entscheidungen: Folgenden BewerberInnen sind für die jeweiligen Stellen am geeignetsten:

> pca.b.scores <- data.frame(pca.b.rotate$scores) > colnames(pca.b.scores) <- c("softskills", "Fachliche_Kompetenz", + "Soziale_Kompetenz", "Ausbildung") > attach(pca.b.scores) > plot(softskills, Soziale_Kompetenz) > abline(v = 0, h = 0, col = "blue", lty = "dotted") > text(softskills, Soziale_Kompetenz, labels = bewerbung$id, pos = 2) Soziale_Kompetenz 2 1 0 1 41 35 43 47 34 48 28 29 13 46 45 24 14 5 27 23 15 20 25 39 26 21 40 22 30 31 36 33 32 4 6 9 7 8 2 18 19 17 16 3 44 38 1 37 12 10 42 11 2 1 0 1 2 Softskills Abbildung 2: Empfehlung für die Position im Verkauf 1. Verkauf: 23 und 24 2. Marketing: 41 und 42 3. Abteilungsleitung: 39 und 40

> plot(fachliche_kompetenz, Ausbildung) > abline(v = 0, h = 0, col = "blue", lty = "dotted") > text(fachliche_kompetenz, Ausbildung, labels = bewerbung$id, + pos = 2) Ausbildung 2 1 0 1 47 48 37 38 33 32 27 30 12 34 11 10 19 21 18 25 26 20 44 35 28 31 29 46 45 36 15 43 4 13 14 5 23 1 22 24 3 6 16 17 2 8 7 40 39 9 41 42 2 1 0 1 2 Fachliche_Kompetenz Abbildung 3: Empfehlung für die Position im Marketing > plot(fachliche_kompetenz, Soziale_Kompetenz) > abline(v = 0, h = 0, col = "blue", lty = "dotted") > text(fachliche_kompetenz, Soziale_Kompetenz, labels = bewerbung$id, + pos = 2) > detach(pca.b.scores) Soziale_Kompetenz 2 1 0 1 47 48 37 33 38 27 30 32 46 13 45 24 23 14 20 25 15 21 26 22 31 36 4 6 35 2 34 3 44 18 1 12 19 28 10 29 43 1716 5 9 87 39 40 41 11 42 2 1 0 1 2 Fachliche_Kompetenz Abbildung 4: Empfehlung für die Position in der Abteilungsleitung