Kap. 8: Regression mit Paneldaten
|
|
|
- Georg Hauer
- vor 9 Jahren
- Abrufe
Transkript
1 Kap. 8: Regression mit Paneldaten Einführung Paneldaten für zwei Perioden Regression mit festen Effekten bzgl. Individuen Regression mit festen Effekten bzgl. Zeit Annahmen in der Paneldatenanalyse Empirisches Beispiel: Tödliche Unfälle und Alkohol
2 8.1 Einführung Gefahr für jede Regressionsanalyse: Verzerrung durch vergessene Variablen. Man kann aber bzgl. des Einflusses vergessener Variablen kontrollieren ohne diese überhaupt zu beobachten falls Paneldaten erhältlich sind. Trick: untersuche Änderungen der Variablen über die Zeit. Idee: Falls vergessene Variable im Zeitablauf unverändert bleibt, kann sie nicht für Änderungen von Y verantwortlich sein! Bedeutung von Paneldaten nimmt zu: mehr Datensätze verfügbar (Schweizer Haushaltspanel, Panel Study of Income Dynamics (U Michigan), Sozioökonomisches Panel (GSOEP),... ) in letzten 15 Jahren starker Aufschwung bei Panel Methoden Empirisches Beispiel: (aus C.J. Ruhm, J. Health Economics 1996) Effekt von Alkoholsteuer und Strafen bei Trunkenheit am Steuer auf Verkehrsunfälle C. Kleiber: Ökonometrie 1 Kap. 8-1 U Basel, HS 2008
3 8.1 Einführung Paneldaten (longitudinale Daten): n Beobachtungseinheiten zu T Zeitpunkten Notation: (X it, Y it), i = 1,..., n, t = 1,..., T. Terminologie: balanciertes Panel: Daten sind für alle Untersuchungseinheiten zu allen Zeitpunkten verfügbar unbalanciertes Panel: es gibt fehlende Werte für mindestens eine Untersuchungseinheit zu mindestenes einem Zeitpunkt Beispiel: n = 48 Bundesstaaten der USA über T = 7 Jahre (ohne Alaska und Hawaii) Datensatz enthält: Anzahl tödlicher Unfälle pro Jahr, Art der Strafgesetze, Biersteuer Konstruiere daraus Anzahl tödlicher Unfälle Y it = Einwohnerzahl des Staates und X it = Biersteuer (real, d.h. in Preisen von 1988). i = 1,..., 48 und t = 1,..., 7 (nämlich für die Jahre ) ergeben 48 7 = 336 Beobachtungen balanciertes Panel. C. Kleiber: Ökonometrie 1 Kap. 8-2 U Basel, HS 2008
4 8.1 Einführung R> data("fatalities", package = "AER") Wir beginnen mit Querschnittsregressionen: R> f1982 <- subset(fatalities, year == "1982") R> fm82 <- lm(i(fatal/pop * 10000) ~ beertax, data = f1982) R> f1988 <- subset(fatalities, year == "1988") R> fm88 <- lm(i(fatal/pop * 10000) ~ beertax, data = f1988) C. Kleiber: Ökonometrie 1 Kap. 8-3 U Basel, HS 2008
5 8.1 Einführung beertax fatality rate beertax fatality rate C. Kleiber: Ökonometrie 1 Kap. 8-4 U Basel, HS 2008
6 8.1 Einführung Irritierend: beide Geraden haben positive Steigung Verdacht auf vergessene Variablen: Verkehrsdichte, Zustand der Strassen, Stadt Land Verhältnis, soziale Akzeptanz des Alkoholkonsums? Beispiel: Verkehrsdichte beeinflusst Unfälle. Falls Staaten mit geringerer Verkehrsdichte niedrigere Alkoholsteuer haben, besteht Verdacht auf Verzerrung durch vergessene Variablen. Problem: nicht alle diese Variablen sind erhältlich. C. Kleiber: Ökonometrie 1 Kap. 8-5 U Basel, HS 2008
7 8.2 Paneldaten für zwei Perioden Grundidee: Modell sei Y it = β 0 + β 1 X it + β 2 Z i + u it also Z i im Zeitablauf konstant (kulturelle Einstellungen zum Alkohol?). Effekt von Z i lässt sich eliminieren, falls Daten für (mind.) 2 Jahre beschaffbar. Formal: Y i,1988 = β 0 + β 1 X i, β 2 Z i + u i,1988 Y i,1982 = β 0 + β 1 X i, β 2 Z i + u i,1982 Differenzenbildung liefert Y i,1988 Y i,1982 = β 1 (X i,1988 X i,1982 ) + (u i,1988 u i,1982 ) Annahme: E(u it X i1,..., X it, Z i ) = 0. Per Annahme korreliert u i,1988 u i,1982 weder mit X i,1988 noch mit X i,1982. Kann mit OLS geschätzt werden obwohl Z i gar nicht beobachtbar! C. Kleiber: Ökonometrie 1 Kap. 8-6 U Basel, HS 2008
8 8.2 Paneldaten für zwei Perioden Im Beispiel: Ŷ i,1982 = X i,1982 Ŷ i,1988 = X i,1988 Regression für Differenzen liefert aber R> ydiff <- (with(f1988, fatal/pop) - with(f1982, fatal/pop))*10000 R> beertaxdiff <- f1988$beertax - f1982$beertax R> fmdiff <- lm(ydiff ~ beertaxdiff) R> coeftest(fmdiff, vcov = sandwich) t test of coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) beertaxdiff also Y i,1988 Y i,1982 = (X i,1988 X i,1982 ) C. Kleiber: Ökonometrie 1 Kap. 8-7 U Basel, HS 2008
9 8.2 Paneldaten für zwei Perioden beertaxdiff ydiff C. Kleiber: Ökonometrie 1 Kap. 8-8 U Basel, HS 2008
10 8.3 Regression mit festen Effekten bzgl. Individuen Was tun bei mehr als 2 Perioden (Datensatz umfasst 7 Jahre)? Regression kann umformuliert werden: Y it = β 0 + β 1 X it + β 2 Z i + u it mit n 1 binären Variablen ( Dummies ) mit fixed effects Ansatz C. Kleiber: Ökonometrie 1 Kap. 8-9 U Basel, HS 2008
11 8.3 Regression mit festen Effekten bzgl. Individuen Fixed Effects-Ansatz: Y it = β 0 + β 2 Z i + β 1 X it + u it =: α i + β 1 X it + u it also staaten-spezifische Achsenabschnitte (insg. 48 in Statistik-Terminologie: Faktor Staat mit 48 Stufen) Dummy-Version: Wir wissen: Faktor mit n Stufen lässt sich durch n Indikatorvariablen beschreiben. Wird wie üblich ein Achsenabschnitt ins Modell aufgenommen, muss auf eine Indikatorvariable verzichtet werden (warum?). Weglassen der ersten Kategorie (repräsentiert durch Indikator D1) ergibt Y it = β 0 + β 1 X it + γ 2 D2 i + γ 3 D3 i γ n Dn i + u it Im Prinzip kann dieses Modell mit OLS geschätzt werden nichts Neues. Aber: in typischen Panel-Anwendungen ist n sehr gross (n=10000 oder mehr), so dass oder mehr Parameter geschätzt werden müssten für die man sich noch nicht einmal interessiert (sie fangen ja nur weitere Einflussgrössen auf). C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008
12 8.3 Regression mit festen Effekten bzgl. Individuen Lösung: verwende anderen Algorithmus zur Bestimmung der Schätzungen. Da im Bsp. nur ein (!) Koeffizient von Interesse, bereinige bzgl. fester Effekte durch Zentrieren. Heisst in Panel-Literatur Within-Transformation. Gleichung für gemittelte Werte ist Ȳ i = α i + β 1 Xi + ū i Gleichung für zentrierte Werte ist dann mit Ȳi = 1 T T Y it, etc. t=1 Y it Ȳi = β 1 (X it X i ) + (u it ū i ) OLS-Regression der zentrierten Variablen heisst in in Panel-Literatur Within-Schätzung. Man kann zeigen: diese Schätzung von β 1 ist numerisch identisch zur Schätzung in der Dummy-Version. Bei T = 2 auch identisch zur Schätzung in Differenzen, falls dort auf einen Achsenabschnitt verzichtet wird. C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008
13 8.3 Regression mit festen Effekten bzgl. Individuen Im Beispiel: R> fmfes <- lm(i(fatal/pop * 10000) ~ beertax + state - 1, + data = Fatalities) R> coeftest(fmfes, vcov = sandwich)[1,] Estimate Std. Error t value Pr(> t ) Schätzung nicht identisch zur Schätzung über Differenzen zwischen 1988 und 1982 (warum?) Standardfehler kleiner als im Zwei-Perioden-Ansatz (warum?) C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008
14 8.4 Regression mit festen Effekten bzgl. Zeit Denkbar sind auch Variablen, die über die Zeit, aber nicht die Staaten variieren: Sicherheit der Autos, Gesetzesänderungen auf nationaler Ebene, etc. Führt auf Achsenabschnitte, die über die Perioden variieren (Faktor Zeit ): oder auch Y it = β 0 + β 1 X it + β 2 S t + u it =: λ t + β 1 X it + u it Y it = β 0 + β 1 X it + δ 2 B2 t + δ 3 B3 t δ n BT t + u it C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008
15 8.4 Regression mit festen Effekten bzgl. Zeit Erweiterung: Kombination von Individuen- und Zeiteffekten Y it = β 0 + β 1 X it + γ 2 D2 i + γ 3 D3 i γ n Dn i + δ 2 B2 t + δ 3 B3 t δ T BT t + u it Modell eliminiert Verzerrung durch vergessene Variablen, die über Staaten oder über Zeit konstant sind. In Fixed-Effects-Formulierung: Y it = β 1 X it + α i + λ t + u it C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008
16 8.4 Regression mit festen Effekten bzgl. Zeit Im Beispiel: R> fmfest <- lm(i(fatal/pop * 10000) ~ -1 + beertax + state + year, + data = Fatalities) R> coeftest(fmfest, vcov = sandwich)[1,] Estimate Std. Error t value Pr(> t ) Modell enthält auf der rechten Seite Biersteuer, keinen Achsenabschnitt, 48 Indikatorvariablen für Staaten und 6 Indikatorvariablen für Perioden insg. also = 55 Variablen davon hier nur ein Koeffizient von Interesse. Es ist üblich, die festen Effekten nicht in den Regressionsoutput aufzunehmen. Schätzung mit Zeit-Effekten unterscheidet sich nur wenig von Schätzung ohne Zeit-Effekte. diese Spezifikation ist abgesichert gegen unbeobachtete ( vergessene ) Variablen, die konstant über Untersuchungseinheiten und/oder über die Zeit sind. Es könnte aber noch weitere Einflussgrössen geben, auf die dies nicht zutrifft! C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008
17 8.5 Annahmen in Paneldaten-Modellen Modell mit festen Effekten (bzgl. i) und einem echten Regressor: Y it = α i + β 1 X it + u it Annahmen: (A1) E(u i X i1,..., X it, α i ) = 0 (A2) (X i1,..., X it, u i1,..., u it ), i = 1,..., n, sind u.i.v. (Unabh. im Querschnitt!) (A3) X it, u it haben je 4 Momente (A4) Regressoren sind nicht linear abhängig (keine perfekte Multikollinearität ) (A5) Cov(u is, u it X i1,..., X it, α i ) = 0 für t s Dabei (A3) und (A4) bekannt, (A1) und (A2) modifiziert, (A5) neu. C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008
18 8.5 Annahmen in Paneldaten-Modellen Diskussion der Annahmen: (A3) und (A4) sind unverändert. (A1) und (A2) sind Verallgemeinerungen der alten Annahmen. Achtung: (A2) verlangt Unabhängigkeit im Querschnitt (Untersuchungseinheiten), nicht über Zeit! (A5) besagt, dass Fehler über die Zeit nicht korrelieren, gegeben die Regressoren. Im Beispiel: u it fängt weitere Einflüsse auf, z.b. Wetter. Bedingung wäre bspw. verletzt, wenn schneereiche Winter gehäuft auftreten. Korrelation über die Zeit heisst Autokorrelation. (A5) verlangt: keine Autokorrelation in Fehlerterm. Es gibt Formeln für Standardfehler, die nicht nur gegen Heteroskedastie, sondern auch gegen Autokorrelation absichern können: Heteroskedastie- und autokorrelationskonsistente (HAC) Standardfehler. Und schliesslich auch noch verschiedene Panel-robuste Standardfehler (oft genannt clustered standard errors ). C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008
19 8.6 Datenanalyse: Tödliche Unfälle und Alkohol Hintergrund: in USA ca Verkehrstote jährlich (1990er Jahre) Haupttodesursache für Personen unter 40 1/3 der Unfälle mit Trunkenheit am Steuer Schätzung: Problem besteht bei 25% der Fahrer zw. 1 und 3 Uhr nachts Politikmassnahmen: Mindeststrafen Mindestalter für Alkoholkonsum ökonomische Interventionen (Alkoholsteuern) C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008
20 8.6 Datenanalyse: Tödliche Unfälle und Alkohol Regression mit weiteren relevanten Variablen: Gesetzgebung zu Trunkenheit am Steuer, ökonomische Rahmenbedingungen. R> fm <- lm(i(fatal/pop * 10000) ~ beertax + drinkage + jail + service + + miles + unemp + log(income) + state + year, data = Fatalities) R> round(coeftest(fm, vcov = sandwich)[2:8,], 3) Estimate Std. Error t value Pr(> t ) beertax drinkage jailyes serviceyes miles unemp log(income) C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008
21 8.6 Datenanalyse: Tödliche Unfälle und Alkohol Sind Zeiteffekte nötig? R> fm_notime <- update(fm,. ~. - year) R> waldtest(fm_notime, fm, vcov = sandwich) Wald test Model 1: I(fatal/pop * 10000) ~ beertax + drinkage + jail + service + miles + unemp + log(income) + state Model 2: I(fatal/pop * 10000) ~ beertax + drinkage + jail + service + miles + unemp + log(income) + state + year Res.Df Df F Pr(>F) e-14 C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008
22 8.6 Datenanalyse: Tödliche Unfälle und Alkohol Hauptergebnisse: Vorzeichen des Effekts der Steuer ändert sich, sobald feste Effekte eingebaut werden (Hinweis auf Verzerrung durch vergessene Variablen!) Effekt der Steuer nimmt ab, wenn andere Gesetze berücksichtigt werden Wichtigste Politik-Variable scheint dennoch Alkoholsteuer nicht Strafen (!) Aber: Grösse des Effekts kann nur ungenau geschätzt werden. Beispiel: Erhöhung der Steuer um $0.50 ist verbunden mit Verringerung um = 0.23 (pro Einwohner). Da Standardfehler 0.201, ist ein 95% Konfidenzintervall gegeben durch: ± = ( 0.427, 0.033) Also Effekt negativ, aber möglicherweise sehr nahe Null! C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008
23 8.6 Datenanalyse: Tödliche Unfälle und Alkohol Abschliessende Bemerkungen: Vorteile der Fixed-Effects-Methoden: kontrollieren bzgl. unbeobachteter Variablen, die nur über Staaten oder Zeit variieren einfache Erweiterung der multiplen Regressionsmethoden Nachteile der Fixed-Effects-Methoden: brauchen Variation in X über Zeit innerhalb Staaten wie behandelt man dynamische Aspekte? hier benutzte Standardfehler evtl. falsch, da Korrelation über Zeit unberücksichtigt Hier wurden alle Modelle in R mit der üblichen Funktion lm() geschätzt, dies ist hier möglich, da n klein. Es gibt auch richtige Panel-Methoden im R-Zusatzpaket plm. C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008
Was sind Paneldaten? Datenquellen Vor- und Nachteile von Paneldaten Historische Bemerkungen Beispiel Software Literatur Programm
Kap. 1: Einführung Was sind Paneldaten? Datenquellen Vor- und Nachteile von Paneldaten Historische Bemerkungen Beispiel Software Literatur Programm 1.1 Was sind Paneldaten? Aus Arellano (2003, p. 2):...
Lineare Regression in R, Teil 2
Lineare Regression in R, Teil 2 Christian Kleiber Abt. Quantitative Methoden, WWZ, Universität Basel 28. Oktober 2009 1 Vorbereitungen Zur Illustration betrachten wir wieder den Datensatz CASchools. Laden
Lineare Regression in R, Teil 1
Lineare Regression in R, Teil 1 Christian Kleiber Abt. Quantitative Methoden, WWZ, Universität Basel October 6, 2009 1 Vorbereitungen Zur Illustration betrachten wir wieder den Datensatz CASchools aus
Regression mit Faktoren, Interaktionen und transformierten Variablen
Kap. 5: Regression mit Faktoren, Interaktionen und transformierten Variablen Motivation Regressionen mit transformierten Variablen Ausblick: Nichtlineare Regression Mehr zu Regressionen mit qualitativen
Ordinale abhängige Variablen. Einführung Regressionsmodelle für ordinale Variablen Empirisches Beispiel Ausblick
Kap. 6: Ordinale abhängige Variablen Einführung Regressionsmodelle für ordinale Variablen Empirisches Beispiel Ausblick 6.1 Einführung Typische ökonomische Beispiele für ordinale abhängige Variablen: Bildungsniveau
Einführung in Panel-Verfahren
Einführung in Panel-Verfahren Thushyanthan Baskaran [email protected] Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Drei Arten von Datensätzen Cross-Section
Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)
3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =
Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)
3 Einfache lineare Regression Einfache lineare Modelle mit R 3.6 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula
Prognoseintervalle für y 0 gegeben x 0
10 Lineare Regression Punkt- und Intervallprognosen 10.5 Prognoseintervalle für y 0 gegeben x 0 Intervallprognosen für y 0 zur Vertrauenswahrscheinlichkeit 1 α erhält man also analog zu den Intervallprognosen
Treatment-Evaluationsproblematik
Treatment-Evaluationsproblematik Seminarvortrag Seminar: Statistische Herausforderungen im Umgang mit fehlenden bzw. fehlerbehafteten Daten 23.01.2015 Betreuer: Prof. Dr. Thomas Augustin Institut für Statistik
Lineare Regression (Ein bisschen) Theorie
Kap. 6: Lineare Regression (Ein bisschen) Theorie Lineare Regression in Matrixform Verteilung des KQ-Schätzers Standardfehler für OLS Der Satz von Gauss-Markov Das allgemeine lineare Regressionsmodell
Kapitel 10. Multikollinearität. Exakte Multikollinearität Beinahe Multikollinearität
Kapitel 0 Multikollinearität Exakte Multikollinearität Beinahe Multikollinearität Exakte Multikollinearität Unser Modell lautet y = Xb + u, Dimension von X: n x k Annahme : rg(x) = k Wenn sich eine oder
Aufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie WS 2014/15. ( = 57 Punkte)
Aufgabe 3 (6 + 4 + 8 + 4 + 10 + 4 + 9 + 4 + 8 = 57 Punkte) Hinweis: Beachten Sie die Tabellen mit Quantilen am Ende der Aufgabenstellung! Mit Hilfe eines multiplen linearen Regressionsmodells soll auf
Beispiel: Multiples Modell/Omitted Variable Bias I
4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss
Inferenz im multiplen Regressionsmodell
1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall
Empirical Banking and Finance
Empirical Banking and Finance Vorlesung zur Volkswirtschaftspolitik Prof. Dr. Isabel Schnabel Lehrstuhl für Volkswirtschaftslehre, insb. Financial Economics Johannes Gutenberg-Universität Mainz Wintersemester
2 Anwendungen und Probleme
Prof. Dr. Werner Smolny Sommersemester 2005 Abteilung Wirtschaftspolitik Helmholtzstr. 20, Raum E 05 Tel. 0731 50 24261 UNIVERSITÄT DOCENDO CURANDO ULM SCIENDO Fakultät für Mathematik und Wirtschaftswissenschaften
Lineare Modelle in R: Zweiweg-Varianzanalyse und Kovarianzanalyse
Lineare Modelle in R: Zweiweg-Varianzanalyse und Kovarianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon im Tutorium LiMo2.pdf laden wir den GSA Datensatz R> load("gsa.rda") und wählen
Vorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation
Statistik II. Regressionsrechnung+ Regressionsanalyse. Statistik II
Statistik II Regressionsrechnung+ Regressionsanalyse Statistik II - 16.06.2006 1 Regressionsrechnung Nichtlineare Ansätze In einigen Situation könnte man einen nichtlinearen Zusammenhang vermuten. Bekannte
11. Übungsblatt zur Vorlesung Ökonometrie SS 2014
Universität des Saarlandes Lehrstab Statistik Dr. Martin Becker Dipl.-Kfm. Andreas Recktenwald 11. Übungsblatt zur Vorlesung Ökonometrie SS 2014 Aufgabe 45 Die in Aufgabe 43 getroffene Annahme heteroskedastischer
= 2 ( 3250,3 ( 3251,5)) = 1,1662 F(2,800) = 2,4 χ2
Pobeklausur: Einführung in die Ökonometrie (Lösung) Gesamtpunktzahl: 96 1. (20 Punkte) a) Anmerkung: statt im Durchschnitt kann auch der/die/das erwartete... stehen. educ : Wenn die Bildung um 1 Jahr steigt,
Interne und externe Modellvalidität
Interne und externe Modellvalidität Interne Modellvalidität ist gegeben, o wenn statistische Inferenz bzgl. der untersuchten Grundgesamtheit zulässig ist o KQ-Schätzer der Modellparameter u. Varianzschätzer
Proxies, Endogenität, Instrumentvariablenschätzung
1 4.2 Multivariate lineare Regression: Fehler in den Variablen, Proxies, Endogenität, Instrumentvariablenschätzung Literatur: Wooldridge, Kapitel 15, Appendix C.3 und Kapitel 9.4 Wahrscheinlichkeitslimes
Empirische Wirtschaftsforschung
Empirische Wirtschaftsforschung Prof. Dr. Bernd Süßmuth Universität Leipzig Institut für Empirische Wirtschaftsforschung Volkswirtschaftslehre, insbesondere Ökonometrie 6.. Herleitung des OLS-Schätzers
Empirische Wirtschaftsforschung
Thomas K. Bauer Michael Fertig Christoph M. Schmidt Empirische Wirtschaftsforschung Eine Einführung ß 361738 4y Springer Inhaltsverzeichnis 1 Wichtige Konzepte der Statistik - Eine Einführung 1 1.1 Die
Multiple Regression III
Multiple Regression III Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Überprüfung der Modellannahmen Residuen-Plot Normal-Q-Q-Plot Cook s Distanz-Plot Maßnahmen bei Abweichungen von Modellannahmen
Beispiel: Multiples Modell/Omitted Variable Bias I
4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss
Fortgeschrittene Ökonometrie: GLS
Universität Regensburg, Lehrstuhl für Ökonometrie Sommersemester 2012 Fortgeschrittene Ökonometrie: GLS 1 Verallgemeinerte Kleinst-Quadrate als Momentenschätzer Betrachten Sie das Modell y = Xβ + u, E(uu
Seminar zur Energiewirtschaft:
Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable
4 Multiple lineare Regression Multikollinearität 4.9
Multikollinearität Erinnerung: Unter der (gemäß Modellannahmen ausgeschlossenen) perfekten Multikollinearität versteht man eine perfekte lineare Abhängigkeit unter den Regressoren (einschließlich des Absolutglieds
7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien
Statistik 7.1 Korrelationsanalyse Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 7 Regressions- und Korrelationsanalyse Kovarianz Pearson-Korrelation Der (lineare)
Perfekte Multikollinearität III. Multikollinearität
Multikollinearität Perfekte Multikollinearität I Erinnerung: Unter der (gemäß Modellannahmen ausgeschlossenen) perfekten Multikollinearität versteht man eine perfekte lineare Abhängigkeit unter den Regressoren
Mehr-Ebenen-Analyse I. Regressionsmodelle für Politikwissenschaftler
Mehr-Ebenen-Analyse I Regressionsmodelle für Politikwissenschaftler Was sind strukturierte Daten? Was ist Struktur? Probleme Bisher sind wir stets von einfachen Zufallsstichproben ausgegangen (Registerstichprobe)
Lineare Regression 1 Seminar für Statistik
Lineare Regression 1 Seminar für Statistik Markus Kalisch 17.09.2014 1 Statistik 2: Ziele Konzepte von einer breiten Auswahl von Methoden verstehen Umsetzung mit R: Daten einlesen, Daten analysieren, Grafiken
Breusch-Pagan-Test I auf Heteroskedastie in den Störgrößen
Breusch-Pagan-Test I Ein weiterer Test ist der Breusch-Pagan-Test. Im Gegensatz zum Goldfeld-Quandt-Test ist es nicht erforderlich, eine (einzelne) Quelle der Heteroskedastizität anzugeben bzw. zu vermuten.
1 Beispiel zur Methode der kleinsten Quadrate
1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25
Pobeklausur: Einführung in die Ökonometrie. 1. (20 Punkte) Wir betrachten 2 (in den Koeffizienten) lineare Modelle mit folgenden Variablen:
Gesamtpunktzahl: 96 Pobeklausur: Einführung in die Ökonometrie 1. (20 Punkte) Wir betrachten 2 (in den Koeffizienten) lineare Modelle mit folgenden Variablen: cigs: gerauchte Zigaretten pro Tag educ: Bildung
Vorlesung 4: Spezifikation der unabhängigen Variablen
Vorlesung 4: Spezifikation der unabhängigen Variablen. Fehlspezifikation der unabhängigen Variablen. Auswirkungen einer Fehlspezifikation a. auf die Erwartungstreue der Schätzung b. auf die Effizienz der
Analyse von Querschnittsdaten. Spezifikation der unabhängigen Variablen
Analyse von Querschnittsdaten Spezifikation der unabhängigen Variablen Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Annahmen gegeben? kategoriale Variablen Datum 3.0.004 0.0.004
Schätzung im multiplen linearen Modell VI
Schätzung im multiplen linearen Modell VI Wie im einfachen linearen Regressionsmodell definiert man zu den KQ/OLS-geschätzten Parametern β = ( β 0, β 1,..., β K ) mit ŷ i := β 0 + β 1 x 1i +... β K x Ki,
1 Gliederung Zeitreihenökonometrie. Angewandte Ökonometrie (Folien) Zeitreihenökonometrie Universität Basel, FS 09. Dr. Sylvia Kaufmann.
Angewandte Ökonometrie (Folien) Zeitreihenökonometrie Universität Basel, FS 09 Dr Sylvia Kaufmann Februar 2009 Angewandte Ökonometrie, Sylvia Kaufmann, FS09 1 1 Gliederung Zeitreihenökonometrie Einführung
John Komlos Bernd Süssmuth. Empirische Ökonomie. Eine Einführung in Methoden und Anwendungen. 4y Springer
John Komlos Bernd Süssmuth Empirische Ökonomie Eine Einführung in Methoden und Anwendungen 4y Springer 1 Einführung 1 1.1 Ökonometrie 1 2 Vorüberlegungen und Grundbegriffe 7 2.1 Statistik als Grundlage
1 Einführung Ökonometrie... 1
Inhalt 1 Einführung... 1 1.1 Ökonometrie... 1 2 Vorüberlegungen und Grundbegriffe... 7 2.1 Statistik als Grundlage der Empirischen Ökonomie... 7 2.2 Abgrenzung und Parallelen zu den Naturwissenschaften...
Prof. Dr. Marc Gürtler WS 2014/2015. Prof. Dr. Marc Gürtler. Klausur zur 10/12 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft
Prof. Dr. Marc Gürtler WS 04/05 Prof. Dr. Marc Gürtler Klausur zur 0/ SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft Lösungsskizze Prof. Dr. Marc Gürtler WS 04/05 Aufgabe : (37 Punkte) ) Die
Konfidenz-, Prognoseintervalle und Hypothesentests IV im multiplen linearen Regressionsmodell mit heteroskedastischen Störgrößen
4 Multiple lineare Regression Heteroskedastische Störgrößen 4.10 Konfidenz-, Prognoseintervalle und Hypothesentests IV im multiplen linearen Regressionsmodell mit heteroskedastischen Störgrößen Ein approximatives
Lineare Modelle in R: Klassische lineare Regression
Lineare Modelle in R: Klassische lineare Regression Achim Zeileis 2009-02-20 1 Das Modell Das klassische lineare Regressionsmodell versucht den Zusammenhang zwischen einer abhängigen Variablen (oder Responsevariablen)
Computerübung 5. Empirische Wirtschaftsforschung. Willi Mutschler. Ökonometrie und Wirtschaftsstatistik Uni Münster. 26.
Computerübung 5 Empirische Wirtschaftsforschung Willi Mutschler Ökonometrie und Wirtschaftsstatistik Uni Münster 26. November 2010 Willi Mutschler (Uni Münster) Computerübung 5 26. November 2010 1 / 11
Computerübung 10. Empirische Wirtschaftsforschung. Willi Mutschler. 27. Januar Ökonometrie und Wirtschaftsstatistik Uni Münster
Computerübung 10 Empirische Wirtschaftsforschung Willi Mutschler Ökonometrie und Wirtschaftsstatistik Uni Münster 27. Januar 2011 Willi Mutschler (Uni Münster) Computerübung 10 27. Januar 2011 1 / 12 Inhaltsverzeichnis
6.2 Lineare Regression
6.2 Lineare Regression Einfache lineare Regression (vgl. Kap. 4.7) Y i = θ 0 + θ 1 X i + ǫ i ǫ i (0, σ 2 ) ˆθ 1 ˆθ 0 = S XY S 2 X = 1 ( Yi n ˆθ ) 1 Xi als Lösung der Minimumaufgabe n (Y i θ 1 X 1 θ 0 )
x t2 y t = 160, y = 8, y y = 3400 t=1
Aufgabe 1 (25 Punkte) 1. Eine Online Druckerei möchte die Abhängigkeit des Absatzes gedruckter Fotos vom Preis untersuchen. Dazu verwendet die Firma das folgende lineare Regressionsmodell: wobei y t =
Empirische Analysen mit dem SOEP
Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael
Aufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie SS ( = 57 Punkte)
Aufgabe 3 (9 + 5 + 7 + 7 + 3 + 9 + 7 + 10 = 57 Punkte) Hinweis: Beachten Sie die Tabellen mit Quantilen am Ende der Aufgabenstellung! Zu Beginn der Studienjahre 2011 und 2012 wurden Studienanfänger an
Annahmen des linearen Modells
Annahmen des linearen Modells Annahmen des linearen Modells zusammengefasst A1: Linearer Zusammenhang: y = 0 + 1x 1 + 2x 2 + + kx k A2: Zufallsstichprobe, keine Korrelation zwischen Beobachtungen A3: Erwartungswert
Lineare Regression in R
Lineare Regression in R Christian Kleiber Abt. Quantitative Methoden, WWZ, Universität Basel 30. September 2009 1 Vorbereitungen Zur Illustration betrachten wir den Datensatz CASchools aus der Vorlesung
Aufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie SS 2018
Aufgabe 3 (15 + 1 + 7 + 7 + 7 + 5 = 42 Punkte) Hinweis: Beachten Sie die Tabellen mit Quantilen am Ende der Aufgabenstellung! Mit Hilfe der Statistiksoftware R soll der Datensatz HousePrices aus dem Paket
Lineare Regressionen mit R (Ökonometrie SS 2014 an der UdS)
Lineare Regressionen mit R (Ökonometrie SS 2014 an der UdS) Es soll untersucht werden, ob und wie sich Rauchen während der Schwangerschaft auf den Gesundheitszustand des Neugeborenen auswirkt. Hierzu werden
Statistik II Übung 4: Skalierung und asymptotische Eigenschaften
Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden
Konfidenz-, Prognoseintervalle und Hypothesentests II bei heteroskedastischen Störgrößen
Konfidenz-, Prognoseintervalle und Hypothesentests II bei heteroskedastischen Störgrößen Achtung! Bei der Verwendung von heteroskedastie-konsistenten Schätzern für V( β) muss unbedingt darauf geachtet
Übung V Lineares Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung
Auswertung und Lösung
Körperkraft [Nm] 0 50 100 150 200 250 0 20 40 60 80 Lean Body Mass [kg] Dieses Quiz soll Ihnen helfen, den R Output einer einfachen linearen Regression besser zu verstehen (s. Kapitel 5.4.1) Es wurden
Teil: lineare Regression
Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge
Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp
Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:
Aufgabe 35 mit R (Ökonometrie SS 2014 an der UdS)
Vorbereitungen Aufgabe 35 mit R (Ökonometrie SS 2014 an der UdS) Falls das R - Paket car noch nicht installiert wurde, kann dies mit der Funktion install.packages() erledigt werden. install.packages("car")
Kapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen.
Kapitel 3 Schließende lineare Regression 3.1. Einführung induktiv Fragestellungen Modell Statistisch bewerten, der vorher beschriebenen Zusammenhänge auf der Basis vorliegender Daten, ob die ermittelte
1. Einleitung. 1.1 Phasen einer ökonometrischen Analyse
1. Einleitung 1.1 Phasen einer ökonometrischen Analyse Empirische ökonomische bzw. ökonometrische Analyse: Nutzung von Schätz- und Testmethoden zur Überprüfung ökonomischer Hypothesen oder Quantifizierung
2.3 Nichtlineare Regressionsfunktion
Nichtlineare Regressionsfunktion Bisher: lineares Regressionsmodell o Steigung d. Regressionsgerade ist konstant o Effekt einer Änderung von X auf Y hängt nicht vom Niveau von X oder von anderen Regressoren
Einführung in die Induktive Statistik: Regressionsanalyse
Einführung in die Induktive Statistik: Regressionsanalyse Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Regressionsanalyse Ziel: Analyse
SPEZIALGEBIETE: ÖKONOMETRIE
SPEZIALGEBIETE: ÖKONOMETRIE Lehrstuhl Ökonometrie und Statistik Technische Universität Dortmund Studienjahr 2017/18 27. Juni 2017 1 / 14 Übersicht Bis jetzt fixiert: Advanced Econometrics (WS 2017/18)
2. Stochastische ökonometrische Modelle. - Modelle der ökonomischen Theorie an der Wirklichkeit überprüfen
.1. Stochastische ökonometrische Modelle.1 Einführung Ziele: - Modelle der ökonomischen Theorie an der Wirklichkeit überprüfen - Numerische Konkretisierung ökonomischer Modelle und deren Analse. . Variierende
Statistik II Übung 1: Einfache lineare Regression
Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der
1 Kodierung kategorialer Einflussgrößen
Übung zur Vorlesung Generalisierte Regressionsmodelle Blatt 1 Christiane Fuchs, Moritz Berger, Micha Schneider WiSe 16/17 1 Kodierung kategorialer Einflussgrößen Lösung zu Aufgabe 3 Einlesen der Daten:
Deskriptive Beschreibung linearer Zusammenhänge
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei k > 2 unabhängigen Stichproben 9.4 Beispiel: p-wert bei Varianzanalyse (Grafik) Bedienungszeiten-Beispiel, realisierte Teststatistik F = 3.89,
Dynamische Modelle: Schätzen und Modellwahl
1 / 23 Dynamische Modelle: Schätzen und Modellwahl Kapitel 18 Angewandte Ökonometrie / Ökonometrie III Michael Hauser 2 / 23 Inhalt Dynamische Modelle und autokorrelierte Fehler Tests auf Autokorrelation
3.1 Modell und Statistik Zusammenhang zwischen einer Zielgrösse Y und mehreren Eingangsgrössen X (1), X (2),..., X (m)
3.1. MODELL UND STATISTIK 32 3 Multiple lineare Regression a 3.1 Modell und Statistik Zusammenhang zwischen einer Zielgrösse Y und mehreren Eingangsgrössen X (1), X (2),..., X (m) Y i = β 0 + β 1 x (1)
Vorlesung: Lineare Modelle. Verschiedene Typen von Residuen. Probleme bei der Regression und Diagnose. Prof. Dr. Helmut Küchenhoff.
Vorlesung: Lineare Modelle Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München SoSe 205 5 Metrische Einflußgrößen: Polynomiale Regression, Trigonometrische Polynome, Regressionssplines, Transformationen.
Vorlesung: Statistik I für Studierende der Statistik, Mathematik & Informatik. Regression. Einfache lineare Regression
Vorlesung: Statistik I für Studierende der Statistik, Mathematik & Informatik Regression Dozent: Fabian Scheipl Material: H. Küchenhoff LMU München 39 Einfache lineare Regression Bestimmung der Regressionsgerade
Identifizierbarkeit von Modellen
Identifizierbarkeit von Modellen Stichwörter: Simultanes Mehrgleichungsmodell Struktur- und reduzierte Form Vollständigkeit Identifizierbarkeit Abzählbedingung Rangbedingung o1-19.tex/0 Interdependente
5 Multivariate stationäre Modelle
5 Multivariate stationäre Modelle 5.1 Autoregressive distributed lag (ADL) 5.1.1 Das Modell und dessen Schätzung Im vorangehenden Kapitel führten wir mit der endogenen verzögerten Variablen, y t 1, als
Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 27
Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 27 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)
Musterlösung. Modulklausur Multivariate Verfahren
Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn
Statistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
Korrelation und Regression
FB 1 W. Ludwig-Mayerhofer und 1 und FB 1 W. Ludwig-Mayerhofer und 2 Mit s- und sanalyse werden Zusammenhänge zwischen zwei metrischen Variablen analysiert. Wenn man nur einen Zusammenhang quantifizieren
