Selbstkontrollarbeit 1 Multivariate Verfahren Diese Selbstkontrollarbeit bezieht sich auf die Kapitel 1 bis 4 der Kurseinheit 1 (Multivariate Statistik) des Kurses Multivariate Verfahren (883). Hinweise: Die Selbstkontrollarbeit umfasst 3 Aufgaben. Insgesamt sind maximal 100 Punkte erreichbar. Bei jeder Aufgabe bzw. jeder Teilaufgabe ist die erreichbare Punktzahl vermerkt.
Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie die Datei hier downloaden. 1.1 Lesen Sie die Datei in SPSS ein. Berücksichtigen Sie, dass in der Exceltabelle keine Variablennamen enthalten sind! (3 P.) 1.2 Lassen Sie sich die Mittelwerte, Kovarianzen und Korrelationen ausgeben! (3 P.) 1.3 Plotten Sie außerdem Histogramme der einzelnen Variablen mit Normalverteilungskurve. Sprechen die Grafiken für oder gegen eine univariate Normalverteilung der beiden Variablen? Begründen Sie Ihre Antwort. (4 P.) 1.4 Gehen Sie jetzt von einer univariaten Normalverteilung der Variablen aus. Welcher bivariaten Verteilung gehören die Daten an? Geben Sie die Maximum-Likelihood-Schätzer für die Verteilungsparameter an (gerundet auf zwei Nachkommastellen)! (6 P.) 1.5 Bestimmen Sie zur Erzeugung weiterer Zufallszahlen die Cholesky-Wurzel der Kovarianzmatrix. Nehmen Sie an, dass z 1 = 0.51 und z 2 = 0.23 zwei Realisierungen von unabhängigen, standard-normalverteilten Zufallszahlen sind, und generieren sie daraus eine bivariate Zufallszahl mit der von Ihnen in Teilaufgabe 1.4 bestimmten Verteilung! (12 P.) 1.6 Nehmen Sie an, dass die Daten, die Sie in SPSS eingelesen haben, eine Realisation des Zufallsvektors x sind, und verwenden Sie Ihre Ergebnisse aus Teilaufgabe 1.4. Bestimmen Sie den Erwartungswert und die Kovarianzmatrix der Transformation y = Ax + c mit A = [ 3 1 0 2 ] und c = [ 6 3 ]. (8 P.) 1.7 Ist die Korrelation zum 5%-Niveau signifikant von 0 verschieden? Begründen Sie Ihre Antwort. (2 P.) 1
1.8 Wenn die Variable 1 einen hohen Wert annimmt, ist dann die Variable 2 eher groß oder eher klein? Begründen Sie Ihre Antwort. (2 P.) Aufgabe 2 (26 Punkte) Betrachten Sie bitte den SPSS-Output in Abb. 1. 2.1 Wie lautet der Mittelwertsvektor x und die Stichproben-Kovarianzmatrix der Variablen Selfreportedhealth und LifeSatisfaction (gerundet auf 3 Kommastellen)? (2 P.) 2.2 Prüfen Sie die Nullhypothese µ = [7, 7] für die beiden Variablen (α = 0.05). (12 P.) 2.3 Betrachten Sie nun alle 3 Variablen. Welche der Korrelationen unterscheiden sich signifikant von 0 unter Einhaltung eines simultanen Signifikanzniveaus von α α = 0.01? Verwenden Sie ein adjustiertes Signifikanzniveau für die Einzeltests. (4 P.) 2.4 Führen Sie einen Test der Hypothese P = I durch, der das Signifikanzniveau α = α = 0.01 exakt einhält. Vergleichen Sie mit Teilaufgabe 2.3 und dem SPSS-Output. (8 P.) 2
Abbildung 1: SPSS-Output zu Aufgabe 2 3
Abbildung 2: SPSS-Output zu Aufgabe 3 Aufgabe 3 (34 Punkte) Prüfen Sie anhand eines linearen Prognosemodells, ob die Variablen Selfreportedhealth und Air pollution einen statistisch bedeutsamen Einfluß auf die Variable LifeSatisfaction ausüben. Hilfsgrößen: 0.5299 0.0192 0.0486 215.806 (X X) 1 = 0.0192 0.0052 0.0018, X y = 1544.22 0.0486 0.0018 0.0078 1714.57 Weitere Hilfsgrößen entnehmen Sie bitte den Outputs (Abb. 2). 3.1 Schätzen Sie die Parameter β und σ 2 eines multiplen Regressionsmodells. (6 P.) 4
3.2 Berechnen Sie die geschätzte Kovarianzmatrix von ˆβ und die Korrelation der Schätzer von β 0, β 1, β 2. (8 P.) 3.3 Prüfen Sie, ob die Regressoren zur Erklärung der abhängigen Variable beitragen (α = 0.05). (4 P.) 3.4 Prüfen Sie die einzelnen Regressions-Parameter auf Signifikanz (α = 0.05). Warum müssen dabei die einzelnen Signifikanz-Niveaus auf α/3 adjustiert werden? Was hat dies für das simultane Signifikanz-Niveau zur Folge? (8 P.) 3.5 Berechnen Sie den Determinationskoeffizienten und interpretieren Sie den Wert. (2 P.) 3.6 Ein Land hat auf den unabhängigen Variablen die Werte Selfreportedhealth = 6.1 und Air pollution = 7.0. Prognostizieren Sie die Variable LifeSatisfaction und berechnen Sie ein 95%-Prognoseintervall. (6 P.) 5