Selbstkontrollarbeit 2 Multivariate Verfahren Diese Selbstkontrollarbeit bezieht sich auf die Kapitel 5 bis 8 der Kurseinheit 1 (Multivariate Statistik) des Kurses Multivariate Verfahren (883). Hinweise: Die Selbstkontrollarbeit umfasst 4 Aufgaben. Insgesamt sind maximal 100 Punkte erreichbar. Bei jeder Aufgabe bzw. jeder Teilaufgabe ist die erreichbare Punktzahl vermerkt.
Aufgabe 1 (28 Punkte) Der Marketing-Leiter einer Lebensmittelherstellers möchte herausfinden, mit welchem Richtpreis eine neue Joghurt-Marke auf den Markt gebracht werden soll. Es stehen die 3 Strategien Niedrigpreis-Politik (unter dem Preis der Konkurrenzprodukte), Normalpreis-Politik und Hochpreis-Politik (über dem Preis der Konkurrenzprodukte) zur Auswahl. Es ergaben sich in 6 zufällig ausgewählten Supermärkten folgende Verkaufszahlen: niedrig 85 90 mittel 65 70 hoch 40 46 1.1 Prüfen Sie, ob sich die Verkaufszahlen in den 3 Bedingungen signifikant voneinander unterscheiden (α = 0.01). Tragen Sie die Werte in eine ANOVA-Tafel ein. (8 P.) 1.2 Geben Sie die Designmatrix in Effektkodierung explizit an. 1.3 Berechnen Sie die kleinste-quadrate-schätzer der Effekte α 1, α 2, α 3 des globalen Erwartungswerts µ. sowie 1.4 Prüfen Sie, welche der Preisbedingungen sich signifikant voneinander unterscheiden. Berechnen Sie dazu Konfidenzintervalle für Paarvergleiche nach Bonferroni und Scheffé (α = 0.01). (12 P.) 1
Aufgabe 2 (24 Punkte) Ein Unternehmen untersucht, wie die Mitarbeiter(innen) zum Arbeitsplatz kommen. Zu diesem Zweck wird die Entfernung zwischen Wohnung und Arbeitsplatz erhoben und ob der Weg motorisiert oder zu Fuß/mit dem Fahrrad zurückgelegt wird. Die erhobenen Daten finden Sie auf der dem Kurs beigelegten CD in der Datei Entfernung.sav oder hier zum Download. 2.1 Führen Sie mit SPSS eine logistische Regression durch. Kodieren Sie dafür zunächst die Variable Verkehrsart mit motorisiert (0) bzw. zu Fuß/Fahrrad (1), wählen dann einen geeigneten Menübefehl und führen die Analyse durch. 2.2 Geben Sie die Schätzwerte für das Intercept und β 1 an! Sind die Schätzwerte zum 5%-Niveau signifikant von 0 verschieden? 2.3 Geben Sie das 95%-Konfidenzinterwall für β 1 an. 2.4 Die Schätzung wurde von SPSS mit der Maximum-Likelihood-Methode vorgenommen. Geben Sie den Log-Likelihood-Wert an! (2 P.) 2.5 Nehmen Sie an, eine neue Mitarbeiterin wird eingestellt. Sie wohnt 5 km von ihrer neuen Arbeitsstelle entfernt. Wie hoch ist die Wahrscheinlichkeit, dass sie ihren Arbeitsweg motorisiert zurücklegt? 2.6 In Ihrem Output finden Sie die Wald-Statistiken für H 0 : β j = 0 gegen H 1 : β j 0 mit j = 0, 1. Testen Sie nun, ob β 1 = 0.6! (6 P.) 2
Abbildung 1: SPSS-Output zu Aufgabe 3 Aufgabe 3 (24 Punkte) Abb. 1, oben, zeigt den Natrium- und Kaliumgehalt von 6 Heilwasser-Sorten. 3.1 Berechnen Sie die euklidischen Abstände (Distanzen) der Sorten Adelheidquelle, Adelholzener und Hirschquelle (auf 3 Nachkommastellen genau). (6 P.) 3.2 Führen Sie mit Hilfe der Abstandsmatrix in Abb. 1, unten, eine hierarchische Klassifikation mit der Complete Linkage-Methode durch (ohne Nachkommastellen). (12 P.) 3.3 Zeichnen Sie ein Dendrogramm der Klassenbildung. Welche Clusterzahl halten Sie für sinnvoll? (6 P.) 3
Aufgabe 4 (24 Punkte) Es soll eine Faktorenanalyse durchgeführt werden, um festzustellen, welche Faktoren beim Fahrzeugkauf berücksichtigt werden. Dazu wird die Datei car sales.sav verwendet, die bei der Installation von SPSS mitgeliefert und standardmäßig unter C:\Program Files\IBM\SPSS\Statistics\22\Samples\German abgespeichert wird. Sie enthält hypothetische Verkaufsschätzungen, Listenpreise und physische Spezifikationen für verschiedene Fahrzeugfabrikate und -modelle. 4.1 Führen Sie eine Hauptkomponentenanalyse durch, bei der 3 Komponenten extrahiert werden. Verwenden Sie dabei die folgenden Variablen: Verkaufszahl in Tausend Wiederverkaufswert nach 4 Jahren Preis in Tausend Dollar Hubraum PS Radstand Breite Länge Gewicht Tankinhalt Kraftstoffverbrauch Rotieren Sie danach mit der Varimax-Methode. Lassen Sie folgende Informationen ausgeben: Anfangslösung, nicht rotierte Lösung, rotierte Lösung Ladungsdiagramme Univariate, deskriptive Statistiken Screeplot (8 P.) 4.2 Welcher Anteil der Varianz wird durch die 3 Komponenten erklärt? Wieviel trägt die dritte Komponente bei? (2 P.) 4.3 Was bezeichnet man als Kommunalität, und warum ist die anfängliche Kommunalitätenschätzung für alle Variablen gleich 1? (3 P.) 4
4.4 Auf welche Komponente lädt die Variable Preis in Tausend Dollar hauptsächlich? Geben Sie die Ladungen vor und nach der Rotation an. 4.5 Wieviele Komponenten müssen extrahiert werden, wenn man sich am Screeplot orientiert? (2 P.) 4.6 Angenommen, Sie führen mit den Daten eine Maximum-Likelihood- Faktorenanalyse durch. Können mit den vorhandenen Variablen 6 Faktoren geschätzt werden, ohne Restriktionen zu setzen? Und wie beantworten Sie diese Frage für die Hauptkomponentenanalyse? (5 P.) 5