Klausurvorbereitung Multivariate Statistik Aufgabe 1 (15 Punkte) Daten der Erdbeerernte für 20 Betriebe werden untersucht. Angegeben werden die Variablen Größe, Sonne und Ertrag, die die Gröÿe des Anbaugebietes für Erdbeeren in Hektar, die durchschnittliche Anzahl der täglichen Sonnenstunden am Ort und den Ertrag in Tonnen Erdbeeren beschreiben. (a) Eine lineare Regression liefert folgendes Ergebnis. Wie interpretieren Sie die erste, dritte, fünfte und letzte Spalte der Tabelle? (b) Mit welchem Ertrag kann ein Obstbauer rechnen, der über 100ha Anbauäche verfügt und der mit 5 täglichen Sonnenstunden rechnen kann. (c) Wie interpretieren Sie die Werte Korrigiertes R-Quadrat und Durbin-Watson-Statistik in der folgenden Tabelle? Aufgabe 2 (10 Punkte) Mit einer logistischen Regression soll der Zusammenhang zwischen Geschwindigkeit und der schwere von Unfällen untersucht werden. Dazu werden von 50 Unfällen die Variablen G (Geschwindigkeit km/h) und S (Unfall schwer? J/N) aufgezeichnet. (a) Interpretieren Sie folgende SPSS-Ausgabe (Spalten 1 und 5): (b) Geben Sie eine Prognose an für den Fall eines Unfalls mit 100 km/h. Präzisieren Sie genau, was Sie vorhersagen.
Aufgabe 3 (20 Punkte) Es werden die Daten von 26 chemischen Analysen altertümlicher Tonwaren analysiert. Dabei wurden folgende Merkmale erfasst: - Fundort der Tonware (AshleyRails, Caldicot, IsleThorns, Llanedyrn), - Al, Fe, Mg, Ca, Na: Anteile an Aluminium, Eisen, Magnesium, Kalzium und Natrium. Die Daten wurden einer einfaktoriellen Varianzanalyse unterzogen, die klären soll, ob die Anteile sich an den verschiedenen Fundorten signikant unterscheiden. (a) Welche Variable ist die abhängige, welche die unabhängige Variable? (b) Interpretieren Sie folgende Testergebnisse in Bezugnahme auf die ANOVA. (c) Was ist in der folgenden Grak dargestellt und was bedeutet das für die anschlieÿende Varianzanalyse? (d) Die Analyse ergibt folgenden Output. Wie interpretieren Sie ihn?
(e) Eine Post-Hoc-Analyse ergibt folgenden Output: Was wird getestet? Was ist das Ergebnis? Aufgabe 4 (9 Punkte) Für sieben Merkmale wird ein Streudiagramm gezeichnet. (a) Für welche der Variablen ist eine positive, bzw. negative Korrelation zu beobachten? (b) Welche Konsequenzen hätte das bei einer Anschlieÿenden linearen Regression (mit der zu erklärenden Variablen QMPreis)
Aufgabe 5 (15 Punkte) Es wird eine Diskriminanzanalyse mit Daten von Mitarbeitern einer Firma an den Standorten 1,2,3 und 4 durchgeführt. Folgende Merkmale spielen eine Rolle: - Brutto-Verdienst der Mitarbeiter, - Kinderzahl und - die Quadratmeteräche der Wohnung. (a) Was besagt folgender Test? Erläutern Sie auch, was der Wert 0:057 genau bedeutet. (b) Die Diskriminanzfunktionskoezienten sind: Es ergibt sich auÿerdem folgendes Diagramm: Klassizieren Sie einen Mitarbeiter mit 1000 Euro Bruttolohn, keinen Kindern und 100 qm Wohnäche.
Aufgabe 6 (12 Punkte) In einer hierarchischen Clusteranalyse werden folgende Merkmale von Theaterbesuchern untersucht: - Das Alter in Jahren. - Die Beurteilung Note einer Theaterauührung (auf einer Skala von 0 bis 100). Es wir die Entferntester-Nachbar-Methode mit Manhattan-Distanzmaÿ verwendet. (a) Berechnen Sie die fehlenden Einträge in der Distanzmatrix (Zeilen=Alter, Spalten=Note). (b) Zeichnen Sie den Schritt 4 in das Dendrogramm ein. (c) Welche Cluster würden Sie am Ende für die Clusteranalyse empfehlen?
Aufgabe 7 (10 Punkte) Die Einwohnerentwicklung einer Stadt wird seit 2015 aufgezeichnet. Eine Regression soll das Wachstum der Stadt erklären und eine Prognose ermöglichen. Es ergibt sich folgende SPSS-Ausgabe: (a) Welche der Varianten würden Sie bevorzugen? Begründen Sie ihre Entscheidung. (b) Geben Sie eine Einwohnerprognose für das Jahr 2025 ab.
Aufgabe 8 (20 Punkte) Dreiÿig Testkunden werden nach Probezeiten gebeten, bezüglich eines neuen PKWs Beurteilungen (0-9) für bestimmte Aspekte des Fahrzeugs abzugeben. Eine Hauptkomponentenanalyse soll eine Dimensionsreduktion ermöglichen. (a) Geben Sie die Eigenwerte und den kumulierten Eigenwertanteil der ersten beiden Hauptkomponenten an. (b) Was besagt die Tabelle der Kommunalitäten (bei zwei extrahierten Komponenten)? (c) Nach einer Varimax-Rotation erhalten wir folgendes Diagramm. Interpretieren Sie den Output und die beiden Hauptkomponenten im Zusammenhang mit dem PKW-Test.