Multivariate Verfahren

Ähnliche Dokumente
Modulklausur Multivariate Verfahren

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik. 7. Februar 2008

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Tests einzelner linearer Hypothesen I

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

Multivariate Verfahren

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Mathematische und statistische Methoden II

8. Februar Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

I. Deskriptive Statistik 1

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Kapitel 10 Mittelwert-Tests Einstichproben-Mittelwert-Tests 10.2 Zweistichproben Mittelwert-Tests

Statistik. Jan Müller

Analyse von Querschnittsdaten. Signifikanztests I Basics

Drittvariablenkontrolle in der linearen Regression: Trivariate Regression

Mikro-Ökonometrie: Small Sample Inferenz mit OLS

Statistiken deuten und erstellen

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung

1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...

Statistik II Übung 2: Multivariate lineare Regression

1.6 Der Vorzeichentest

Seminar zur Energiewirtschaft:

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell

Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Multivariate Statistik

Einführung in die Induktive Statistik: Testen von Hypothesen

Statistik II Übung 2: Multivariate lineare Regression

Unterschiedshypothesen Vergleiche von Häufigkeiten bzw. Mittelwerten zwischen (mindestens) zwei Gruppen Zusammenhangshypothesen Korrelationsanalysen

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

1 Dichte- und Verteilungsfunktion

Nachhol-Klausur - Schätzen und Testen - Wintersemester 2013/14

Klausur zu Statistik II

Lösungen zu den Übungsaufgaben in Kapitel 10

Hypothesentests mit SPSS. Beispiel für einen t-test

THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ

Vorbereitung auf 3. Übungsblatt (Präsenzübungen) - Lösungen

Aufgaben zu Kapitel 5:

Kapitel 3. Inferenz bei OLS-Schätzung I (small sample, unter GM1,..., GM6)

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

1. Lösungen zu Kapitel 7

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Lineare Regression II

Mögliche Fehler beim Testen

Schließende Statistik

8. Keine Normalverteilung der Störgrößen (Verletzung der B4-Annahme)

Anpassungstests VORGEHENSWEISE

b) Bestimmen Sie die Varianz der beiden Schätzer. c) Ist ein oder sind beide Schätzer konsistent? Begründen Sie!

Übungsaufgaben zu Statistik II

Analyse von Querschnittsdaten. Spezifikation der unabhängigen Variablen

Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung

Bachelorprüfung SS MUSTERLÖSUNG

Glossar Statistik 2. Bivariate Verfahren: zwei nummerische Merkmale

Bachelorprüfung SS 2015

Fortgeschrittene Statistik Logistische Regression

Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2009/2010. Aufgabe 1

Zeit zum Kochen [in min] [10, 20[ [20, 30[ [30, 40[ [40, 50[ [50,60[ [60, 100] Hi

» S C H R I T T - F Ü R - S C H R I T T - A N L E I T U N G «M U L T I P L E L I N E A R E R E G R E S S I O N M I T S P S S / I B M Daniela Keller

Formelsammlung für das Modul. Statistik 2. Bachelor. Sven Garbade

Lösung Aufgabe 1 (Regression) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die

Übungsaufgaben zu Kapitel 5

Empirische Analysen mit dem SOEP

Biostatistik Erne Einfuhrung fur Biowissenschaftler

Jost Reinecke. 7. Juni 2005

3. Das einfache lineare Regressionsmodell

VS PLUS

Überblick Hypothesentests bei Binomialverteilungen (Ac)

Übungsklausur Lineare Modelle. Prof. Dr. H. Toutenburg

Statistische Methoden für Bauingenieure WS 13/14. Einführungsbeispiel

3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft

Quantitative Methoden (Vertretung für Prof. Th. Pechmann)

Teil: lineare Regression

Klausur Stochastik und Statistik 31. Juli 2012

Einführung in Quantitative Methoden

Kapitel 3 Schließende Statistik

Institut für Statistik und Mathematische Wirtschaftstheorie Universität Augsburg. PROGNOSE II - Vertiefung Aufgaben und Lösungen Sommersemester 2004

KATA LOGO Mathematik Statistik Roadmap: Von der Hypothese zum p-wert

Klausur zur Mathematik für Biologen

Zusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen

Einführung in die Maximum Likelihood Methodik

e) Beim klassischen Signifikanztest muß die Verteilung der Prüfgröße unter der Nullhypothese

Statistik II Übung 1: Einfache lineare Regression

Datenanalyse mit Excel und Gretl

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Sozialwissenschaftliche Datenanalyse mit R

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Klausur Statistik I. Dr. Andreas Voß Wintersemester 2005/06

2.1 Gemeinsame-, Rand- und bedingte Verteilungen

Kapitel 22 Partielle Korrelationen

4. Das multiple lineare Regressionsmodell

Forschungsmethodik II Mag.rer.nat. M. Kickmeier-Rust Karl-Franzens-Universität Graz. Lisza Gaiswinkler, Daniela Gusel, Tanja Schlosser

Kapitel 4: Merkmalszusammenhänge

Angewandte Statistik 3. Semester

Transkript:

Selbstkontrollarbeit 1 Multivariate Verfahren Diese Selbstkontrollarbeit bezieht sich auf die Kapitel 1 bis 4 der Kurseinheit 1 (Multivariate Statistik) des Kurses Multivariate Verfahren (883). Hinweise: Die Selbstkontrollarbeit umfasst 3 Aufgaben. Insgesamt sind maximal 100 Punkte erreichbar. Bei jeder Aufgabe bzw. jeder Teilaufgabe ist die erreichbare Punktzahl vermerkt.

Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie die Datei hier downloaden. 1.1 Lesen Sie die Datei in SPSS ein. Berücksichtigen Sie, dass in der Exceltabelle keine Variablennamen enthalten sind! (3 P.) 1.2 Lassen Sie sich die Mittelwerte, Kovarianzen und Korrelationen ausgeben! (3 P.) 1.3 Plotten Sie außerdem Histogramme der einzelnen Variablen mit Normalverteilungskurve. Sprechen die Grafiken für oder gegen eine univariate Normalverteilung der beiden Variablen? Begründen Sie Ihre Antwort. (4 P.) 1.4 Gehen Sie jetzt von einer univariaten Normalverteilung der Variablen aus. Welcher bivariaten Verteilung gehören die Daten an? Geben Sie die Maximum-Likelihood-Schätzer für die Verteilungsparameter an (gerundet auf zwei Nachkommastellen)! (6 P.) 1.5 Bestimmen Sie zur Erzeugung weiterer Zufallszahlen die Cholesky-Wurzel der Kovarianzmatrix. Nehmen Sie an, dass z 1 = 0.51 und z 2 = 0.23 zwei Realisierungen von unabhängigen, standard-normalverteilten Zufallszahlen sind, und generieren sie daraus eine bivariate Zufallszahl mit der von Ihnen in Teilaufgabe 1.4 bestimmten Verteilung! (12 P.) 1.6 Nehmen Sie an, dass die Daten, die Sie in SPSS eingelesen haben, eine Realisation des Zufallsvektors x sind, und verwenden Sie Ihre Ergebnisse aus Teilaufgabe 1.4. Bestimmen Sie den Erwartungswert und die Kovarianzmatrix der Transformation y = Ax + c mit A = [ 3 1 0 2 ] und c = [ 6 3 ]. (8 P.) 1.7 Ist die Korrelation zum 5%-Niveau signifikant von 0 verschieden? Begründen Sie Ihre Antwort. (2 P.) 1

1.8 Wenn die Variable 1 einen hohen Wert annimmt, ist dann die Variable 2 eher groß oder eher klein? Begründen Sie Ihre Antwort. (2 P.) Aufgabe 2 (26 Punkte) Betrachten Sie bitte den SPSS-Output in Abb. 1. 2.1 Wie lautet der Mittelwertsvektor x und die Stichproben-Kovarianzmatrix der Variablen Selfreportedhealth und LifeSatisfaction (gerundet auf 3 Kommastellen)? (2 P.) 2.2 Prüfen Sie die Nullhypothese µ = [7, 7] für die beiden Variablen (α = 0.05). (12 P.) 2.3 Betrachten Sie nun alle 3 Variablen. Welche der Korrelationen unterscheiden sich signifikant von 0 unter Einhaltung eines simultanen Signifikanzniveaus von α α = 0.01? Verwenden Sie ein adjustiertes Signifikanzniveau für die Einzeltests. (4 P.) 2.4 Führen Sie einen Test der Hypothese P = I durch, der das Signifikanzniveau α = α = 0.01 exakt einhält. Vergleichen Sie mit Teilaufgabe 2.3 und dem SPSS-Output. (8 P.) 2

Abbildung 1: SPSS-Output zu Aufgabe 2 3

Abbildung 2: SPSS-Output zu Aufgabe 3 Aufgabe 3 (34 Punkte) Prüfen Sie anhand eines linearen Prognosemodells, ob die Variablen Selfreportedhealth und Air pollution einen statistisch bedeutsamen Einfluß auf die Variable LifeSatisfaction ausüben. Hilfsgrößen: 0.5299 0.0192 0.0486 215.806 (X X) 1 = 0.0192 0.0052 0.0018, X y = 1544.22 0.0486 0.0018 0.0078 1714.57 Weitere Hilfsgrößen entnehmen Sie bitte den Outputs (Abb. 2). 3.1 Schätzen Sie die Parameter β und σ 2 eines multiplen Regressionsmodells. (6 P.) 4

3.2 Berechnen Sie die geschätzte Kovarianzmatrix von ˆβ und die Korrelation der Schätzer von β 0, β 1, β 2. (8 P.) 3.3 Prüfen Sie, ob die Regressoren zur Erklärung der abhängigen Variable beitragen (α = 0.05). (4 P.) 3.4 Prüfen Sie die einzelnen Regressions-Parameter auf Signifikanz (α = 0.05). Warum müssen dabei die einzelnen Signifikanz-Niveaus auf α/3 adjustiert werden? Was hat dies für das simultane Signifikanz-Niveau zur Folge? (8 P.) 3.5 Berechnen Sie den Determinationskoeffizienten und interpretieren Sie den Wert. (2 P.) 3.6 Ein Land hat auf den unabhängigen Variablen die Werte Selfreportedhealth = 6.1 und Air pollution = 7.0. Prognostizieren Sie die Variable LifeSatisfaction und berechnen Sie ein 95%-Prognoseintervall. (6 P.) 5