Datenanalyse mit Excel und Gretl

Größe: px
Ab Seite anzeigen:

Download "Datenanalyse mit Excel und Gretl"

Transkript

1 Dozent: Christoph Hindermann Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 1

2 Teil 2: Gretl Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 2

3 Modellannahmen Damit wir mit Hilfe der Kleinsten-Quadrate-Methode (OLS) konsistente und unverzerrte Schätzergebnisse erhalten, müssen folgende Modellannahmen erfüllt sein: A1. Erwartungstreue: Im Erwartungswert ist der Fehlerterm ε gleich null. E(ε) = 0 A2. Homoskedastie: Jeder Fehlerterm ε folgt einer Verteilung mit der Varianz σ 2. Var(ε) = σ 2 A3. Unkorrelierte Fehlerterme: Die Kovarianz der Fehlerterme beträgt null. Cov(ε i,ε j ) = 0 A4. Normalverteilung: Wir nehmen weiterhin an, dass die Fehlerterme normalverteilt sind. ε ~ N(0,σ 2 ) Weitere Annahmen: siehe auch Zusatzmaterial_Annahmen_Regression.pdf A5. Keine Multikollinearität: Die einzelnen unabhängigen Variablen dürfen keine linearen Funktionen darstellen (sprich es darf keine lineare Abhängigkeit vorliegen). Folglich muss in einem Modell Y = β 0 X 1 + β 2 X 2 + ε gelten, dass X 1 λx 2. A6. Keine Endogenität: Liegt vor, wenn eine exogene Variable mit dem Fehlerterm korreliert. Cov(ε i,x i ) 0 Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 3

4 Multiple Regression I Burger Eine Burger-Kette möchte herausfinden, welchen Einfluss ihre Preis- und Werbestrategie auf ihre Verkaufserlöse hat. Zu diesem Zweck hat sie die Verkaufserlöse, die Preise und die Werbeausgaben aus 75 verschiedenen Filialen zusammengetragen. Die beiden zentralen Fragen lauten: Führen niedrigere Preise zu höheren Verkaufserlösen? Führen zusätzliche Werbeausgaben zu zusätzlichen Erlösen, die höher als die Werbeausgaben sind? Nehmen Sie an, dass alle Standardannahmen der Kleinste-Quadrate Methode gegeben sind und dass sich der Zusammenhang zwischen Erlösen, Preisen und Werbeausgaben am besten durch folgendes Modell beschreiben lässt: SALES = β 0 PRICE + β 2 ADVERT + β 3 ADVERT 2 + ε (SALES = Erlöse in Tausend $, PRICE = Preis pro Burger in $, ADVERT = Werbeausgaben in Tausend $) 1. Öffnen Sie die Datei andy.gdt mit Gretl und schätzen zunächst die folgende Gleichung SALES = β 0 ADVERT + ε. 2. Interpretieren Sie die geschätzten Koeffizienten β 0 und β 1. Ist die Interpretation von β 0 ökonomisch sinnvoll? Wie können wir β 1 interpretieren? Was wäre zunächst die Schlussfolgerung für die optimalen Werbeausgaben? Welche Aussagen können Sie zur Signifikanz der Koeffizienten treffen? Was sind die zugrundeliegenden Hypothesen? 3. Nehmen Sie an, dass der Einfluss der Werbeausgaben mit zunehmenden Ausgaben sinkt (abnehmender Ertrag der Werbung). Schätzen Sie zu diesem Zweck die Koeffizienten des Modells SALES = β 0 ADVERT + β 2 ADVERT 2 + ε. 4. Interpretieren Sie das Ergebnis erneut. Wie hoch wären nun die umsatzmaximierenden Werbeausgaben? (Hinweis: Überführen Sie die Ergebnisse in eine Funktion und leiten Sie ab!) Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 4

5 Multiple Regression I Burger Eine Burger-Kette möchte herausfinden, welchen Einfluss ihre Preis- und Werbestrategie auf ihre Verkaufserlöse hat. Zu diesem Zweck hat sie die Verkaufserlöse, die Preise und die Werbeausgaben aus 75 verschiedenen Filialen zusammengetragen. Die beiden zentralen Fragen lauten: Führen niedrigere Preise zu höheren Verkaufserlösen? Führen zusätzliche Werbeausgaben zu zusätzlichen Erlösen, die höher als die Werbeausgaben sind? Nehmen Sie an, dass alle Standardannahmen der Kleinste-Quadrate Methode gegeben sind und dass sich der Zusammenhang zwischen Erlösen, Preisen und Werbeausgaben am besten durch folgendes Modell beschreiben lässt: SALES = β 0 PRICE + β 2 ADVERT + β 3 ADVERT 2 + ε (SALES = Erlöse in Tausend $, PRICE = Preis pro Burger in $, ADVERT = Werbeausgaben in Tausend $) 5. Schätzen Sie nun folgendes Modell: SALES = β 0 PRICE + ε. Wie können wir den Koeffizienten β 1 interpretieren? Finden Sie das Modell sinnvoll? 6. Definieren Sie nun eine neue Variable MENGE = SALES/PRICE. Schätzen Sie nun folgendes Modell: MENGE = β 0 PREIS + ε. Wie können wir den Koeffizienten β 1 interpretieren? Was für eine Funktion haben wir nun geschätzt? 7. Schätzen Sie nun das vorgeschlagene Gesamtmodell SALES = β 0 PRICE + β 2 ADVERT + β 3 ADVERT 2 + ε. Geben Sie eine abschließende Interpretation aller Koeffizienten! Schätzen Sie auch das Modell MENGE = β 0 PRICE + β 2 ADVERT + β 3 ADVERT 2 + ε. Welches Modell bevorzugen Sie? 8. Können Sie eine Aussage darüber treffen, ob der Fehlerterm normalverteilt ist? Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 5

6 Neben metrischen Variablen können wir auf nominale bzw. ordinale Variablen in unser Regressionsmodell (OLS) als unabhängige Variablen aufnehmen. (Hinweis: Die abhängige Variable darf jedoch nicht nominal oder ordinal sein. In diesem Fall müssten wir andere Modelle heranziehen!) Hierzu müssen wir diese Variablen jedoch zunächst binär kodieren. In diesem Fall spricht man auch von Dummy-Variablen ( ja-nein-variablen ). X = 1, wenn Ausprägung vorliegt (z.b. Student, Nicht Älter als 50 Jahre) 0, wenn Ausprägung nicht vorliegt (z.b. nicht Student, Älter als 50 Jahre) Falls eine Variable mit n sich ausschließenden Kategorien vorliegt (z.b. Student, Berufstätig, Rentner, Schüler), müssen zuvor n-1 Dummy-Variablen erstellt werden. In unserem Beispiel also: X 1 = 1, Student 0, sonst X 2 = 1, Berufstätig 0, sonst X 3 = 1, Rentner 0, sonst Die Auswirkung der letzten Kategorie (Schüler) drückt sich dann in der Konstanten der Regressionsgleichung aus (in dem Fall sind X 1 =0; X 2 =0 und X 3 =0). Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 6

7 Neben einfachen Dummy-Variablen können noch sogenannte Interaktionsterme in die Regressionsgleichung mit aufgenommen werden. Beispielsweise wollen wir den Einfluss von Geschlecht (männlich/weiblich) und Hautfarbe (schwarz/weiß) auf die Löhne ermitteln. Beide Variablen können zunächst als Dummy-Variable verstanden werden. X 1 = 1, weiblich 0, sonst X 2 = 1, schwarz 0, sonst Die Regressionsgleichung könnte zunächst wie folgt aussehen: WAGE = β 0 FEMALE + β 2 BLACK + ε Zudem können wir nun noch einen Interaktionsterm BLACK*FEMALE einfügen. Jener gibt uns an, welche Auswirkungen das gleichzeitige Auftreten beider Merkmale auf den Lohn hat. WAGE = β 0 FEMALE + β 2 BLACK + β 3 BLACK*FEMALE + ε Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 7

8 II Immobilien Eine Immobilienfirma möchte die Häuserpreise einer US-amerikanischen Universitätsstadt in Abhängigkeit von den Eigenschaften der Häuser erklären. Folgende erklärende Variablen werden verwendet: UTOWN: Ist das Haus weniger als 3 Meilen von der Universität entfernt? (1 ja; 0 nein) SQFT: Größe des Hauses in Hundert Quadratfuß AGE: Alter des Hauses POOL: Hat das Haus einen Pool? (1 ja; 0 nein) FPLACE: Hat das Haus einen Kamin? (1 ja; 0 nein) Nehmen Sie an, dass alle Standardannahmen der Kleinste-Quadrate Methode gegeben sind und dass sich der Hauspreis durch folgendes Modell beschreiben lässt: PRICE = β 0 UTOWN + β 2 SQFT + β 3 (SQFT x UTOWN) + β 4 AGE + β 5 POOL + β 6 FPLACE + ε 1. Öffnen Sie die Datei 2_Immobilien.gdt mit gretl und schätzen Sie zunächst mit Hilfe der Kleinste-Quadrate Methode den folgenden Zusammenhang: PRICE = β 0 UTOWN + β 2 SQFT + β 3 AGE + β 4 POOL + β 5 FPLACE + ε. Interpretieren sie die geschätzten Koeffizienten. Wie können die Dummy-Variablen interpretiert werden? Welche Merkmale müsste ein Haus aufweisen, damit es einen besonders hohen Preis hat? Welche Merkmale hingegen, damit es einen sehr geringen Wert hat? Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 8

9 II Immobilien Eine Immobilienfirma möchte die Häuserpreise einer US-amerikanischen Universitätsstadt in Abhängigkeit von den Eigenschaften der Häuser erklären. Folgende erklärende Variablen werden verwendet: UTOWN: Ist das Haus weniger als 3 Meilen von der Universität entfernt? (1 ja; 0 nein) SQFT: Größe des Hauses in Hundert Quadratfuß AGE: Alter des Hauses POOL: Hat das Haus einen Pool? (1 ja; 0 nein) FPLACE: Hat das Haus einen Kamin? (1 ja; 0 nein) Nehmen Sie an, dass alle Standardannahmen der Kleinste-Quadrate Methode gegeben sind und dass sich der Hauspreis durch folgendes Modell beschreiben lässt: PRICE = β 0 UTOWN + β 2 SQFT + β 3 (SQFT x UTOWN) + β 4 AGE + β 5 POOL + β 6 FPLACE + ε 2. Schätzen Sie nun mit Hilfe der Kleinste-Quadrate Methode den folgenden Zusammenhang: PRICE = β 0 UTOWN + β 2 SQFT + β 3 (SQFT x UTOWN) + β 4 AGE + β 5 POOL + β 6 FPLACE + ε Interpretieren sie die geschätzten Koeffizienten erneut. Wie können Sie den Interaktionsterm interpretieren? Ist die Annahme, dass die Fehlerterme normalverteilt sind, erfüllt? Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 9

10 III Lohn und Diskriminierung Sie möchten herausfinden, ob Menschen bei der Gehaltsfindung aufgrund ihrer Hautfarbe oder ihres Geschlechts benachteiligt werden. Zu diesem Zweck verwenden Sie das folgende Modell: WAGE = β 0 EDUC + β 2 BLACK + β 3 FEMALE + β 4 (BLACK x FEMALE) + ε (WAGE = Stundenlohn in $; EDUC = Ausbildungsjahre; BLACK = Dummy für Hautfarbe, 1 dunkelhäutig; FEMALE = Dummy für Geschlecht, 1 weiblich) 1. Öffnen Sie die Datei 3_Lohn_und_Diskriminierung.gdt mit gretl und schätzen Sie obigen Zusammenhang mit Hilfe der Kleinste- Quadrate Methode. Gehen Sie dabei insbesondere auf die Dummy-Variablen ein sowie auf den Interaktionsterm ein. Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 10

11 IV Ökonometrie Eine wirtschaftswissenschaftliche Fakultät möchte herausfinden, ob Studenten, die eine gute statistische Ausbildung haben und Ökonometrie-Kurse besucht haben, ein höheres Einstiegsgehalt bekommen als Studenten, die keine Ökonometrie-Kurse besucht haben. Hierzu soll zunächst folgende Schätzung durchgeführt werden: SAL = β 0 GPA + β 2 METRICS + ε (SALARY = Stundenlohn in $; GPA = Durchschnittsnote auf einer 4-Punkte Skala (je höher, desto besser); METRICS = Dummy für Besuch von Ökonometrie-Kursen, 1 Ökonometriekurse besucht) 1. Öffnen Sie die Datei 4_Ökonometrie.gdt mit gretl und schätzen Sie obigen Zusammenhang mit Hilfe der Kleinste- Quadrate Methode. Interpretieren Sie zunächst Ihr Ergebnis! 2. Wie kann die Gleichung verändert werden, um herauszufinden, ob Frauen einen geringeres Einstiegseinkommen als Männer haben? Schätzen Sie die Gleichung und interpretieren Sie das Ergebnis! 3. Wie kann die Gleichung abschließend verändert werden, um herauszufinden, ob der Wert für Ökonometrie auf das Einstiegsgehalt unabhängig vom Geschlecht ist? Schätzen Sie die Gleichung und interpretieren Sie das Ergebnis! Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 11

12 Interpretation von R 2 in einem Modell ohne Konstante Wenn wir die Konstante bei der Schätzung des Modells weglassen, führt dies tendenziell dazu, dass das Bestimmheitsmaß (R 2 ) ansteigt. Dies bedeutet jedoch nicht, dass unser Modell nun mehr Varianz erklärt. Dies ist bereits an der folgenden Grafik zu erkennen: Regressionsgerade ohne Konstante Regressionsgerade mit Konstante Die Begründung für den Anstieg von R 2 liegt in dessen Konstruktion, wonach das Weglassen der Konstante R 2 gegen den Wert 1 hin verzerrt. Für eine genauere und mathematischere Begründung sei auf folgenden Artikel verwiesen: Für uns ist zunächst nur wichtig: R 2 kann in einem Modell ohne Konstante nicht interpretiert werden, da es gegen den Wert 1 verzerrt ist. Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 12

Proxies, Endogenität, Instrumentvariablenschätzung

Proxies, Endogenität, Instrumentvariablenschätzung 1 4.2 Multivariate lineare Regression: Fehler in den Variablen, Proxies, Endogenität, Instrumentvariablenschätzung Literatur: Wooldridge, Kapitel 15, Appendix C.3 und Kapitel 9.4 Wahrscheinlichkeitslimes

Mehr

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften

Mehr

Teil: lineare Regression

Teil: lineare Regression Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge

Mehr

1. Lösungen zu Kapitel 7

1. Lösungen zu Kapitel 7 1. Lösungen zu Kapitel 7 Übungsaufgabe 7.1 Um zu testen ob die Störterme ε i eine konstante Varianz haben, sprich die Homogenitätsannahme erfüllt ist, sind der Breusch-Pagan-Test und der White- Test zwei

Mehr

Kurs Empirische Wirtschaftsforschung

Kurs Empirische Wirtschaftsforschung Kurs Empirische Wirtschaftsforschung 5. Bivariates Regressionsmodell 1 Martin Halla Institut für Volkswirtschaftslehre Johannes Kepler Universität Linz 1 Lehrbuch: Bauer/Fertig/Schmidt (2009), Empirische

Mehr

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests. 0 Einführung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung 5 Hypothesentests 6 Regression Lineare Regressionsmodelle Deskriptive Statistik:

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

Inferenz im multiplen Regressionsmodell

Inferenz im multiplen Regressionsmodell 1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall

Mehr

Die Regressionsanalyse

Die Regressionsanalyse Die Regressionsanalyse Zielsetzung: Untersuchung und Quantifizierung funktionaler Abhängigkeiten zwischen metrisch skalierten Variablen eine unabhängige Variable Einfachregression mehr als eine unabhängige

Mehr

Schweizer Statistiktage, Aarau, 18. Nov. 2004

Schweizer Statistiktage, Aarau, 18. Nov. 2004 Schweizer Statistiktage, Aarau, 18. Nov. 2004 Qualitative Überprüfung der Modellannahmen in der linearen Regressionsrechnung am Beispiel der Untersuchung der Alterssterblichkeit bei Hitzeperioden in der

Mehr

Seminar zur Energiewirtschaft:

Seminar zur Energiewirtschaft: Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable

Mehr

Statistik II. Regressionsrechnung+ Regressionsanalyse. Statistik II

Statistik II. Regressionsrechnung+ Regressionsanalyse. Statistik II Statistik II Regressionsrechnung+ Regressionsanalyse Statistik II - 16.06.2006 1 Regressionsrechnung Nichtlineare Ansätze In einigen Situation könnte man einen nichtlinearen Zusammenhang vermuten. Bekannte

Mehr

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden

Mehr

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm y Aufgabe 3 Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6 a) Zur Erstellung des Streudiagramms zeichnet man jeweils einen Punkt für jedes Datenpaar (x i, y i ) aus der zweidimensionalen

Mehr

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. . Studiengang.

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr.  . Studiengang. Lehrstuhl für Statistik und empirische Wirtschaftsforschung Fach: Prüfer: Bachelorprüfung Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname Matrikelnr. E-Mail Studiengang

Mehr

Kategorielle Zielgrössen

Kategorielle Zielgrössen Kategorielle Zielgrössen 27.11.2017 Motivation Bisher gesehen: Regressionsmodelle für diverse Arten von Zielgrössen Y. kontinuierliche Zielgrösse Lineare Regression Binäre/binomiale Zielgrösse Logistische

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

Übung V Lineares Regressionsmodell

Übung V Lineares Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

2 Anwendungen und Probleme

2 Anwendungen und Probleme Prof. Dr. Werner Smolny Sommersemester 2005 Abteilung Wirtschaftspolitik Helmholtzstr. 20, Raum E 05 Tel. 0731 50 24261 UNIVERSITÄT DOCENDO CURANDO ULM SCIENDO Fakultät für Mathematik und Wirtschaftswissenschaften

Mehr

Bachelorprüfung WS 2012/13 - MUSTERLÖSUNG

Bachelorprüfung WS 2012/13 - MUSTERLÖSUNG Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Bachelorprüfung WS 2012/13 - MUSTERLÖSUNG Fach: Praxis der empirischen Wirtschaftsforschung Prüfer: Prof. Regina

Mehr

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010

Mehr

Econometrics Übung 1. CLRM & Verletzung der Unabhängigkeitsannahme

Econometrics Übung 1. CLRM & Verletzung der Unabhängigkeitsannahme Econometrics Übung 1 CLRM & Verletzung der Unabhängigkeitsannahme CLRM 1. Repetition: Gauss-Markov-Annahmen 2. Beispiel: Income & Consumption Verletzung der Unabhängigkeitsannahme 3. Repetition: Was passiert,

Mehr

(1 Punkt) i) Bestimmen Sie formal den marginalen Effekt der Häufigkeit des Alkoholkonsums für männliche

(1 Punkt) i) Bestimmen Sie formal den marginalen Effekt der Häufigkeit des Alkoholkonsums für männliche Aufgabe 1 [14 Punkte] Sie möchten untersuchen, wovon die Abwesenheit der Studierenden in den Vorlesungen an einer Universität abhängt. Sie verfügen über einen Datensatz zu 282 Studierenden mit folgenden

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...

Mehr

Perfekte Multikollinearität III. Multikollinearität

Perfekte Multikollinearität III. Multikollinearität Multikollinearität Perfekte Multikollinearität I Erinnerung: Unter der (gemäß Modellannahmen ausgeschlossenen) perfekten Multikollinearität versteht man eine perfekte lineare Abhängigkeit unter den Regressoren

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen

Mehr

x t2 y t = 160, y = 8, y y = 3400 t=1

x t2 y t = 160, y = 8, y y = 3400 t=1 Aufgabe 1 (25 Punkte) 1. Eine Online Druckerei möchte die Abhängigkeit des Absatzes gedruckter Fotos vom Preis untersuchen. Dazu verwendet die Firma das folgende lineare Regressionsmodell: wobei y t =

Mehr

Prof. Dr. Marc Gürtler WS 2014/2015. Prof. Dr. Marc Gürtler. Klausur zur 10/12 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft

Prof. Dr. Marc Gürtler WS 2014/2015. Prof. Dr. Marc Gürtler. Klausur zur 10/12 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft Prof. Dr. Marc Gürtler WS 04/05 Prof. Dr. Marc Gürtler Klausur zur 0/ SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft Lösungsskizze Prof. Dr. Marc Gürtler WS 04/05 Aufgabe : (37 Punkte) ) Die

Mehr

Annahmen des linearen Modells

Annahmen des linearen Modells Annahmen des linearen Modells Annahmen des linearen Modells zusammengefasst A1: Linearer Zusammenhang: y = 0 + 1x 1 + 2x 2 + + kx k A2: Zufallsstichprobe, keine Korrelation zwischen Beobachtungen A3: Erwartungswert

Mehr

Pobeklausur: Einführung in die Ökonometrie. 1. (20 Punkte) Wir betrachten 2 (in den Koeffizienten) lineare Modelle mit folgenden Variablen:

Pobeklausur: Einführung in die Ökonometrie. 1. (20 Punkte) Wir betrachten 2 (in den Koeffizienten) lineare Modelle mit folgenden Variablen: Gesamtpunktzahl: 96 Pobeklausur: Einführung in die Ökonometrie 1. (20 Punkte) Wir betrachten 2 (in den Koeffizienten) lineare Modelle mit folgenden Variablen: cigs: gerauchte Zigaretten pro Tag educ: Bildung

Mehr

Bachelorprüfung WS 2014/15 - MUSTERLÖSUNG

Bachelorprüfung WS 2014/15 - MUSTERLÖSUNG Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Bachelorprüfung WS 2014/15 - MUSTERLÖSUNG Fach: Praxis der empirischen Wirtschaftsforschung Prüfer: Prof. Regina

Mehr

4 Multiple lineare Regression Multikollinearität 4.9

4 Multiple lineare Regression Multikollinearität 4.9 Multikollinearität Erinnerung: Unter der (gemäß Modellannahmen ausgeschlossenen) perfekten Multikollinearität versteht man eine perfekte lineare Abhängigkeit unter den Regressoren (einschließlich des Absolutglieds

Mehr

Empirische Analysen mit dem SOEP

Empirische Analysen mit dem SOEP Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael

Mehr

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im SS 2012

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im SS 2012 Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im SS 2012 Aufgabe 1 (20 Punkte) Sei y = Xβ + ε ein N 1 Vektor und X eine N K Matrix.

Mehr

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) 3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =

Mehr

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) 3 Einfache lineare Regression Einfache lineare Modelle mit R 3.6 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula

Mehr

1. Lösungen zu Kapitel 5

1. Lösungen zu Kapitel 5 . Lösungen zu Kapitel 5 Übungsaufgabe 5. a) Falsch! Die Varianz des geschätzten Koeffizienten ˆβ berechnet sich folgendermaßen: ) b) Falsch! Var(β ˆ ) = ˆσ2 ˆσ X 2 = = ( ˆεt 2 (K+) X 2 t X 2 5 5 2 0 8

Mehr

= 2 ( 3250,3 ( 3251,5)) = 1,1662 F(2,800) = 2,4 χ2

= 2 ( 3250,3 ( 3251,5)) = 1,1662 F(2,800) = 2,4 χ2 Pobeklausur: Einführung in die Ökonometrie (Lösung) Gesamtpunktzahl: 96 1. (20 Punkte) a) Anmerkung: statt im Durchschnitt kann auch der/die/das erwartete... stehen. educ : Wenn die Bildung um 1 Jahr steigt,

Mehr

1 Einführung Ökonometrie... 1

1 Einführung Ökonometrie... 1 Inhalt 1 Einführung... 1 1.1 Ökonometrie... 1 2 Vorüberlegungen und Grundbegriffe... 7 2.1 Statistik als Grundlage der Empirischen Ökonomie... 7 2.2 Abgrenzung und Parallelen zu den Naturwissenschaften...

Mehr

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers 4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis

Mehr

Statistik II Übung 1: Einfache lineare Regression

Statistik II Übung 1: Einfache lineare Regression Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der

Mehr

Kapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen.

Kapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen. Kapitel 3 Schließende lineare Regression 3.1. Einführung induktiv Fragestellungen Modell Statistisch bewerten, der vorher beschriebenen Zusammenhänge auf der Basis vorliegender Daten, ob die ermittelte

Mehr

Probeklausur - Statistik II, SoSe 2017

Probeklausur - Statistik II, SoSe 2017 Probeklausur - Statistik II, SoSe 2017 Aufgabe 1: Mehrdimensionale Zufallsvariablen (15 Punkte) Gegeben sei ein zweidimensionaler stetiger Zufallsvektor X = (X 1, X 2 ) T mit der gemeinsamen Dichtefunktion

Mehr

Instrumentvariablen und Instrumentvariablenschätzer

Instrumentvariablen und Instrumentvariablenschätzer Instrumentvariablen und Instrumentvariablenschätzer Ausgangspunkt der Überlegungen Es gibt endogene erklärende Variable. D. h. diese erklärenden Variablen werden selbst wieder durch das Modell erklärt.

Mehr

Empirische Wirtschaftsforschung

Empirische Wirtschaftsforschung Thomas K. Bauer Michael Fertig Christoph M. Schmidt Empirische Wirtschaftsforschung Eine Einführung ß 361738 4y Springer Inhaltsverzeichnis 1 Wichtige Konzepte der Statistik - Eine Einführung 1 1.1 Die

Mehr

Ziel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X.

Ziel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X. Lineare Regression Einfache Regression Beispieldatensatz: trinkgeld.sav Ziel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X. H0: Y lässt sich nicht durch X erklären, das heißt

Mehr

Analyse von Querschnittsdaten. Spezifikation der unabhängigen Variablen

Analyse von Querschnittsdaten. Spezifikation der unabhängigen Variablen Analyse von Querschnittsdaten Spezifikation der unabhängigen Variablen Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Annahmen gegeben? kategoriale Variablen Datum 3.0.004 0.0.004

Mehr

Beispiel: Multiples Modell/Omitted Variable Bias I

Beispiel: Multiples Modell/Omitted Variable Bias I 4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss

Mehr

1. Lösungen zu Kapitel 8

1. Lösungen zu Kapitel 8 1. Lösungen zu Kapitel 8 Übungsaufgabe 8.1 a) Falsch! Die Nichtberücksichtigung von unwichtigen Variablen für die Identifikation kausaler Effekte stellt kein Problem dar, sofern diese Variablen keinen

Mehr

John Komlos Bernd Süssmuth. Empirische Ökonomie. Eine Einführung in Methoden und Anwendungen. 4y Springer

John Komlos Bernd Süssmuth. Empirische Ökonomie. Eine Einführung in Methoden und Anwendungen. 4y Springer John Komlos Bernd Süssmuth Empirische Ökonomie Eine Einführung in Methoden und Anwendungen 4y Springer 1 Einführung 1 1.1 Ökonometrie 1 2 Vorüberlegungen und Grundbegriffe 7 2.1 Statistik als Grundlage

Mehr

Quantitative Methoden der Agrarmarktanalyse und des Agribusiness

Quantitative Methoden der Agrarmarktanalyse und des Agribusiness Quantitative Methoden der Agrarmarktanalyse und des Agribusiness Fragen zur Vorlesung Teil 2 SS 2001 Mai 19 Dr. Jens-Peter Loy, Institut für Agrarökonomie (Kommentare bitte per e-mail an [email protected])

Mehr

Drittvariablenkontrolle in der linearen Regression: Trivariate Regression

Drittvariablenkontrolle in der linearen Regression: Trivariate Regression Drittvariablenkontrolle in der linearen Regression: Trivariate Regression 14. Januar 2002 In der Tabellenanalyse wird bei der Drittvariablenkontrolle für jede Ausprägung der Kontrollvariablen eine Partialtabelle

Mehr

Statistik. R. Frühwirth. Statistik. VO Februar R. Frühwirth Statistik 1/536

Statistik. R. Frühwirth. Statistik. VO Februar R. Frühwirth Statistik 1/536 [email protected] VO 142.090 http://tinyurl.com/tu142090 Februar 2010 1/536 Übersicht über die Vorlesung Teil 1: Deskriptive Teil 2: Wahrscheinlichkeitsrechnung Teil 3: Zufallsvariable Teil 4: Parameterschätzung

Mehr

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird

Mehr

Analyse von Querschnittsdaten. Spezifikation der Regressionsfunktion

Analyse von Querschnittsdaten. Spezifikation der Regressionsfunktion Analse von Querschnittsdaten Spezifikation der Regressionsfunktion Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Annahmen gegeben? kategoriale Variablen Datum 9..5 6..5..5 9..5 6..5..5..5

Mehr

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

Teekonsum in den USA (in 1000 Tonnen), Nimmt den Wert 1 an für alle Perioden, Durchschnittlicher Preis des Tees in Periode t (in Tausend $/Tonne).

Teekonsum in den USA (in 1000 Tonnen), Nimmt den Wert 1 an für alle Perioden, Durchschnittlicher Preis des Tees in Periode t (in Tausend $/Tonne). Aufgabe 1 (5 Punkte) Gegeben sei ein lineares Regressionsmodell in der Form. Dabei ist y t = x t1 β 1 + x t β + e t, t = 1,..., 10 (1) y t : x t1 : x t : Teekonsum in den USA (in 1000 Tonnen), Nimmt den

Mehr

Lineare Regression 1 Seminar für Statistik

Lineare Regression 1 Seminar für Statistik Lineare Regression 1 Seminar für Statistik Markus Kalisch 17.09.2014 1 Statistik 2: Ziele Konzepte von einer breiten Auswahl von Methoden verstehen Umsetzung mit R: Daten einlesen, Daten analysieren, Grafiken

Mehr

Vorlesung 4: Spezifikation der unabhängigen Variablen

Vorlesung 4: Spezifikation der unabhängigen Variablen Vorlesung 4: Spezifikation der unabhängigen Variablen. Fehlspezifikation der unabhängigen Variablen. Auswirkungen einer Fehlspezifikation a. auf die Erwartungstreue der Schätzung b. auf die Effizienz der

Mehr

Institut für Soziologie Christian Ganser. Methoden 2. Regressionsanalyse II: Lineare multiple Regression

Institut für Soziologie Christian Ganser. Methoden 2. Regressionsanalyse II: Lineare multiple Regression Institut für Soziologie Christian Ganser Methoden 2 Regressionsanalyse II: Lineare multiple Regression Inhalt 1. Anwendungsbereich 2. Vorgehensweise bei multipler linearer Regression 3. Beispiel 4. Modellannahmen

Mehr

Statistik II (Sozialwissenschaften)

Statistik II (Sozialwissenschaften) Dr. Hans-Otfried Müller Institut für Mathematische Stochastik Fachrichtung Mathematik Technische Universität Dresden http://www.math.tu-dresden.de/sto/mueller/ Statistik II (Sozialwissenschaften) 2. Konsultationsübung,

Mehr

Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation

Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation PEΣO 12. November 2001 Von der Tabellenanalyse zur Regression Die bivariate Verteilung zweier metrischer Variablen kann konzeptionell

Mehr

Übungsblätter zu Methoden der Empirischen Sozialforschung IV: Regressionsanalyse. Lösungsblatt zu Nr. 2

Übungsblätter zu Methoden der Empirischen Sozialforschung IV: Regressionsanalyse. Lösungsblatt zu Nr. 2 Martin-Luther-Universität Halle-Wittenberg Institut für Soziologie Dr. Wolfgang Langer 1 Übungsblätter zu Methoden der Empirischen Sozialforschung IV: Regressionsanalyse Lösungsblatt zu Nr. 2 1. a) Je

Mehr

Kapitel 4. Zensierte (censored) und gestutzte (truncated) abhängige Variablen, Sample Selection

Kapitel 4. Zensierte (censored) und gestutzte (truncated) abhängige Variablen, Sample Selection Kapitel 4 Zensierte (censored) und gestutzte (truncated) abhängige Variablen, Sample Selection In den vorhergehenden Abschnitten haben wir uns mit Fällen beschäftigt, in denen die abhängige Variable y

Mehr

1. Lösungen zu Kapitel 6

1. Lösungen zu Kapitel 6 1. Lösungen zu Kapitel 6 Übungsaufgabe 6.1 Aus der Tatsache, dass die einzelnen Koeffizienten der Quartals-Dummies nicht statistisch signifikant von Null verschieden sind, lässt sich nicht die Aussage

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 1 Multivariate Verfahren Diese Selbstkontrollarbeit bezieht sich auf die Kapitel 1 bis 4 der Kurseinheit 1 (Multivariate Statistik) des Kurses Multivariate Verfahren (883). Hinweise:

Mehr

Ergänzungsmaterial zur Vorlesung. Statistik 2. Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen

Ergänzungsmaterial zur Vorlesung. Statistik 2. Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen Institut für Stochastik WS 2007/2008 Universität Karlsruhe JProf. Dr. H. Holzmann Dipl.-Math. oec. D. Engel Ergänzungsmaterial zur Vorlesung Statistik 2 Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen

Mehr

Aufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie WS 2017/18. ( = 58 Punkte)

Aufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie WS 2017/18. ( = 58 Punkte) Aufgabe 3 (14 + 2 + 7 + 7 + 3 + 5 + 9 + 11 = 58 Punkte) Hinweis: Beachten Sie die Tabellen mit Quantilen am Ende der Aufgabenstellung! Mit Hilfe der Statistiksoftware R soll der Datensatz HousePrices aus

Mehr

11. Übungsblatt zur Vorlesung Ökonometrie SS 2014

11. Übungsblatt zur Vorlesung Ökonometrie SS 2014 Universität des Saarlandes Lehrstab Statistik Dr. Martin Becker Dipl.-Kfm. Andreas Recktenwald 11. Übungsblatt zur Vorlesung Ökonometrie SS 2014 Aufgabe 45 Die in Aufgabe 43 getroffene Annahme heteroskedastischer

Mehr

Das multiple lineare Regressionsmodell

Das multiple lineare Regressionsmodell Das multiple lineare Regressionsmodell Worum geht es in diesem Lernmodul? Das Modell Schätzen der Koeffizienten Interpretation der Koeffizienten Testen der Koeffizienten Worum geht es in diesem Lernmodul?

Mehr

Einführung in die Statistik

Einführung in die Statistik Elmar Klemm Einführung in die Statistik Für die Sozialwissenschaften Westdeutscher Verlag INHALTSVERZEICHNIS 1. Einleitung und Begrifflichkeiten 11 1.1 Grundgesamtheit, Stichprobe 12 1.2 Untersuchungseinheit,

Mehr

2. Generieren Sie deskriptive Statistiken (Mittelwert, Standardabweichung) für earny3 und kidsunder6yr3 und kommentieren Sie diese kurz.

2. Generieren Sie deskriptive Statistiken (Mittelwert, Standardabweichung) für earny3 und kidsunder6yr3 und kommentieren Sie diese kurz. Statistik II Übung : Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (6-24 Jahre alt) und der Anzahl der unter

Mehr

Goethe-Universität Frankfurt

Goethe-Universität Frankfurt Goethe-Universität Frankfurt Fachbereich Wirtschaftswissenschaft PD Dr. Martin Biewen Dr. Ralf Wilke Sommersemester 2006 Klausur Statistik II 1. Alle Aufgaben sind zu beantworten. 2. Bitte runden Sie Ihre

Mehr