Tobit-I Regressionen. Warum ist die lineare Regression des zensierten y auf x verzerrt?

Größe: px
Ab Seite anzeigen:

Download "Tobit-I Regressionen. Warum ist die lineare Regression des zensierten y auf x verzerrt?"

Transkript

1 Tobit-I Regressionen 29. November 2017 Mit einem Tobit-I Regressionsmodell adressiert man eine Intervall-Zensierung in der erklärten Variable y, im Standardfall eine Linkszensierung bei y = 0. (Beispiel: y = wöchentliche Arbeitszeit von Arbeitnehmern; sie ist = 0 für Arbeitslose.) Man hat dabei gewissermaßen eine Mischung aus linearer und binärer Regression: Für y wäre ein lineares Modell adäquat, zur Erklärung, warum überhaupt y und nicht y = 0 beobachtet wird, ein binäres Modell. Sowohl eine zensierte lineare Regression (verwende alle Beobachtungen, mit ersetztem y = 0 bei den zensierten) als auch eine gestutzte lineare Regression (verwende nur die Beobachtungen mit y ) führt zu Verzerrungen in der Schätzung von Effekten auf die unterstellte latente Variable y, die man mit einer Max.Likelihood- Schätzung des Tobit-I-Modells vermeiden kann. Wir betonen hier diesen Aspekt, obwohl in der Praxis das Tobit-I Modell häufiger zur Prognose des zensierten y (und nicht des latenten y ) benutzt wird. Tobit-I Regressionen Folie 2 Warum ist die lineare Regression des zensierten y auf x verzerrt? Frage könnte auch lauten: Warum schätzt das naive Vorgehen Ignorieren der Zensierung in y nicht den wahren Effekt von x auf y? Erläutern anhand des folgenden Diagramms: Stata-Code zum Erzeugen des Plots: drop all set obs 200 gen x = 2* n/200 gen yexakt= *x gen ystar = yexakt+0.15*rnormal() gen yzens = max(ystar,0) regress yzens x // Lin.Regr. predict yhat // Fit der lin.regr. twoway (line yexakt x) /// (scatter ystar x if ystar<0)/// (scatter yzens x) /// (line yhat x), /// legend(position(11) ring(0)) yexakt yzens ystar Fitted values x Aber: Bei Tobit-I liegt das primäre Interesse meist nicht auf unverzerrter oder konsistenter Schätzung der wahren Effektstärke β j auf das partiell unbeobachtete y (bekommt man auch), sondern auf einem guten Fit des zensierten (aber vollständig beobachteten) y. Tobit-I Regressionen Folie 1 Standard-Tobit Modell (Tobit-I, zensierte Variante) Tobit I: Die zu erklärende Variable y stimmt mit einer latenten Variable y überein, sofern diese positiv ist. Ist y 0, so wird y = 0 beobachtet (y ist bei 0 linkszensiert). Für die latente Variable y gilt ein lineares Regr.Modell (mit normalverteilten Fehlern ε): { 0 wenn yi 0 wobei yi = x i β + ε i, i = 1,..., N (Tobit-I cens ) Beispiele: Arbeitnehmer: y = Arbeitslohn. Tobit-I hier geradezu zynisch y i 0: Person ist arbeitslos und y i quantifiziert deren min. Lohn-Subvention, um Arbeit zu erhalten Individuen: y = Ausgaben für Tabak (od. Alkohol od. Fleisch od Autos od....) y i 0: Die Person ist Nicht-Raucher und y i quantifiziert den Grad an Tabak-Aversion ( Disnutzen ) Krankenversicherte: y = Kosten der Vorsorgeuntersuchung (od. Ambulanz od....) y i 0: Person hat keinen Bedarf und y i quantifiziert ihren Grad der Bedarflosigkeit Anmerkungen: Bei Tobit-I stellt y selbst (bzw. y 0) den Grund für die Zensierung von y dar. Bei Tobit-II gibt es ein eigenes (binäres) Modell, das die Zensierung von y erklärt. Bsp. f. Notwdkt. Tobit-II: y = Rating. Der Fall kein Rating entspricht nicht einem negativen Rating Tobit-I Regressionen Folie 3 Primäres Interesse bei Tobit-I meist: Guter Fit des zensierten y Im folgenden Stata Code wurden nur regress- und predict- Befehl ausgetauscht. Geschätzt wird jetzt ein Tobit-I Modell. Dessen Fit ŷ ˆ= E[y x, y ] ist nicht-linear in x Stata-Code zum Erzeugen des Plots: drop all set obs 200 gen x = 2* n/200 gen yexakt= *x gen ystar = yexakt+0.15*rnormal() gen yzens = max(ystar,0) tobit yzens x, ll(0) //Tobit-Regr. predict yhat, e(0,.) //Tobit-Fit twoway (line yexakt x) /// (scatter ystar x if ystar<0)/// (scatter yzens x) /// (line yhat x), /// legend(position(11) ring(0)) yexakt yzens ystar E(yzens* yzens>0) x Man sieht: Mit dem Tobit-I-Modell bekommt man einen guten Fit des zensierten y Tobit-I eignet sich zur Prognose des zensierten (d.h. faktischen) y (z.b: kein negatives ŷ) Das ist die eigentliche Stärke von Tobit-I. (Wir gehen aber im Folgenden nicht näher darauf ein)

2 Tobit-I Regressionen Folie 4 Likelihood des Tobit-I cens -Modells Ziel: Maximum-Likelihood { Schätzung des Modells 0 wenn yi 0 wobei yi = x i β + ε i, i = 1,..., N (Tobit-I cens ) Immer: Maximum-Likelihood beruht auf Verteilungsannahmen. Dies ist hier die Annahme über die Verteilung der Fehlerterme ε i im latenten Regr.modell y i = x i β + ε i: Verteilung von ε sei durch die (kumulierte) Verteilungsfunktion (cdf) F (e) beschrieben. (Wir schreiben hier e für das vorherige s, da suggestiver) Bei Tobit-Modellen wird i.d.r. Std-Normalvtlg. für ε i σ angenommen: F (e) = Φ( e σ ) Theorie geht allgemein, aber implementiert ist meistens nur Normalvtlg. Beachte: Auch σ ist zu schätzen (Auch: Implizite Homoskedastie-Annahme bzgl. y ) Herleitung der Likelihood: Wir fassen die zensierten i in einer Indexmenge I 0, die unzensierten in I 1 zusammen. Für zensiertes i ( I 0 ) wird nur y i = 0 beobachtet und der Likelihood-Beitrag L i ist Tobit-I Regressionen Folie 6 Unterschied Zensierung (Censoring) und Stutzung (Truncation) Anstatt einer Regression der zensierten y i = max{y i, 0} auf x i könnten wir auch eine Regression nur der i mit unzensiertem y i durchführen. Zugehöriges Tobit-I-Modell: { n.a. wenn yi 0 wobei yi = x i β + ε i, i = 1,..., N (Tobit-I trunc ) Auch die lineare Regression auf den gestutzten Daten ist problematisch, nicht so sehr wegen der Reduktion des Stichprobenumfangs N, sondern weil man damit den potentiellen Selection Bias ignoriert: Die Stichprobe ist danach u.u. nicht mehr repräsentativ für die Gesamtpopulation, da sie auf der impliziten Annahme y beruht. i I 0 : L i = P (y i = 0) = P (y i 0) = P (x iβ + ε i 0) = P (ε i x iβ) = F ( x iβ) Tobit-I Regressionen Folie 5 Für unzensiertes i ( I 1 ) wird ein y i = yi beobachtet, das dem Regr.Modell yi = x i β + ε i folgt. Da ε i stetig verteilt ist, ist die Wkt. für die Punkt-Beobachtung (y i, x i ), d.h. für ε i = y i x iβ, immer 0. Der Ausweg aus diesem Dilemma besteht darin, für die Likelihood die Dichte f = F von ε zu verwenden. (Die Likelihood ist dann nur proportional zur Wkt. der Beobachtg. von ε i in einem kleinen Umgebungsintervall von y i x iβ, aber nicht die Wkt. selbst) P (y i x i i I 1 : L i = lim β de/2 ε i y i x i β + de/2) = f(y i x de 0 de iβ) Die gesamte Likelihood ergibt sich als Produkt der individuellen Likelihoods, die log-likelihood durch Summation der logarithmierten individuellen Likelihoods zu: log L = i I 0 log F ( x iβ) + i I 1 log f(y i x iβ) Anmerkung: Mischung von Wkten (i I 0 ) und Dichten (i I 1 ) verhindert, dass man diese Likelihood als Wkt. interpretieren kann. Aber: Asymptot. Aussagen aus ML-Theorie (z.b. Konsist., Effiz.) bleiben gültig. Bei Normalverteilung mit F (e) = Φ( e σ ), f(e) = F (e) = 1 2π σ e 1 2 ( σ e )2, ergibt sich: log L(β, σ 2 ) = log Φ ( x i β ) i I σ + log ( ( yi x ) 1 i β 2 ) 0 i I 1 2πσ 2 e 1 2 σ Tobit-I Regressionen Folie 7 Likelihood des Tobit-I trunc -Modells Gesehen: Auch OLS mit den gestutzten Daten problematisch (potent. Select. Bias). Ausweg auch hier: ML-Schätzung basierend auf unterstellter Fehlerterm-Vtlg. F für ε. In die Likelihood gehen hier nur die Individuen i I 1 ein (i I 0 ist n.a. ) Entscheidender Unterschied zur naiven Schätzung auf den abgeschnittenen Daten i I 1 : Für i I 1 weiß man, dass i nicht in I 0 war. Das heißt: Für i I 1 ist die bedingte Dichte zu verwenden, gegeb. dass i unzensiert war. Diese ist ( Bayes-Formel ): L i = f(y i x iβ x i, y i ) = f(y i x iβ x i ) / P (y i x i ) Dabei: P (y i x i ) ist das Komplement dessen, was bei zens. Tobit aus i I 0 kam: P (y i ) = P (y i ) = P (x iβ + ε i ) = P (ε i > x iβ) = 1 F ( x iβ) Damit: Gesamte LogLikelihood für Tobit-I trunc log L trunc = log f(y i x i I 1 }{{ iβ) } wie OLS logl Bei symmetr. Vtlg. (insbes. Normalvtlg) ist F ( e) = 1 F (e). Damit für Normalvtlg.: log L trunc (β, σ 2 ) = i I 1 log ( 1 2πσ 2 e 1 2 log ( 1 F ( x iβ) ) }{{} zusätzlich zu OLS-logL ( yi x i β σ ) 2 ) ( x log Φ + i β ) σ

3 Tobit-I Regressionen Folie 8 Hinweise zur Implementierung von Tobit-I in Stata Der Stata-Befehl zur ML-Schätzung des zensierten Modells (Tobit-I cens ) heißt tobit. Der Stata-Befehl zur ML-Schätzung des gestutzten Modells (Tobit-I trunc ) heißt truncreg. Allgemeiner als hier behandelt können diese Befehle Intervall-zensierte Modelle schätzen: a falls y a y = y falls a < y < b, wobei y = x β + ε b falls y b Die hier behandelte Standardvariante entspricht dem Spezialfall a = 0, b =. Die Schwellenwerte a bzw. b werden über die Optionen ll(a) bzw. ul(b) spezifiziert (ll = lower limit, ul = upper limit). Da beide Befehle verlangen, dass mindestens eine der Schwellen a bzw. b spezifiziert ist, müssen sie für die Standardvariante (Linkszensier. bei a = 0) wie folgt eingegeben werden: tobit y $xlist, ll(0) // statt: regress y $xlist bzw. truncreg y $xlist, ll(0) // statt: regress y $xlist if y Implementiert ist jeweils nur die Normalverteilungsvariante. Bei tobit wird, anders als bei truncrec und sonstigen ML-Schätzungen, kein Iterations-Log ausgegeben (Option log) Tobit-I Regressionen Folie 10 ALCTOBAC.DTA: Summary statistics. global xlist age nadults nkids lincome agelnx. sum $xlist share_alc share_tbo age nadults nkids lincome agelnx share_alc share_tbo Also im Schnitt: Alter: ca 35 Jahre Zahl der Erwachsenen: 2 Zahl der Kinder: 0.56 Haushaltseinkommen: e (dabei nicht beachtet: E[e X ] = e µ X +1 2 σ2 X) Welche (Geld-)Einheit zugrundeliegt, spielt im Folgenden keine Rolle, da nur log(income) eingeht. 1.8% des Einkommens gehen in alkohol. Getränke 1.2% des Einkommens werden für Tabakwaren ausgegeben Tobit-I Regressionen Folie 9 Beispiel ALCTOBAC.DTA: Datenbeschreibung Die Datei ALCTOBAC.DTA enthält Daten von 2724 belgischen Haushalten in den Jahren 1995/96 Verfügbare Variablen: share alc: Anteil Ausgaben für alkohl. Getränke am Gesamtbudget (1 = 100%) share tbo: Anteil Ausgaben für Tabakwaren am Gesamtbudget (1 = 100%) lincome: Log. des Haushaltseinkommens age: Alter (von wem?) gemessen in 10-Jahres-Intervallen, 0: jünger als 30, 1: , 2: , 3: , 4: älter als 60 Eigentlich besser: Für jede Altersklasse ein Dummy, Stata: i.age nadults: Anzahl Erwachsener im Haushalt nkids: Anzahl Kinder im Haushalt agelnx: age*lincome für nicht-lineare Interaktion von age und income Tobit-I Regressionen Folie 11 ALCTOBAC.DTA: Summary statistics (II). sum $xlist share_alc share_tbo age nadults nkids lincome agelnx share_alc share_tbo ***********************************************************************. sum $xlist share_alc share_tbo if share_tbo age nadults nkids lincome agelnx share_alc share_tbo

4 Tobit-I Regressionen Folie 12 Tobit für Anteil Tabak (TobitCens). tobit share_tbo $xlist, ll(0) Tobit regression Number of obs = 2724 LR chi2(5) = Prob > chi2 = Log likelihood = Pseudo R2 = age nadults nkids lincome agelnx _cons /sigma Obs. summary: 1688 left-censored observations at share_tbo<= uncensored observations 0 right-censored observations ****** Beachte: left-censored bedeutet hier: Nicht-Raucher ******** Tobit-I Regressionen Folie 14 Lineare Regression des zensierten y (LinCens) Zum Vgl. das Ergebnis der OLS-Schätzung des zensierten y = max{0, y } auf dem gesamten Sample (dies lieferte Stata den Startvektor für die ML-Schätzung tobit share tbo $xlist, ll(0).). regress share_tbo $xlist Source SS df MS Number of obs = F( 5, 2718) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = age nadults nkids lincome agelnx _cons Tobit-I Regressionen Folie 13 Tobit-Schätzung diskutieren Ergebnis der Tobit-Schätzung war: Log likelihood = Pseudo R2 = age nadults nkids lincome agelnx _cons /sigma Fragen: Warum ist es kein Problem, dass die log L ist (so dass die Likelihood L = e log L > 1 ist)? Warum kann es sein, dass Rpseudo 2 < 0? Warum ist das hier irrelevant? Was bedeutet es, dass a) ˆβ nkids und b) ˆβ lincome < 0 ist? Zahlenwert von a) ˆβ nkids und b) ˆβ lincome interpretieren! Tobit-I Regressionen Folie 15 Gestutzte Lineare Regression (LinTrunc) Zum Vgl. auch noch das Ergebnis der OLS-Schätzung auf dem unzensierten Subsample (dies liefert Stata den Startvektor für die ML-Schätzung truncreg share tbo $xlist, ll(0); das Ergebnis dieser ML-Schätzung, d.h. des Tobit-I trunc -Modells, wird im Folgenden aber nicht angegeben.). regress share_tbo $xlist if share_tbo Source SS df MS Number of obs = F( 5, 1030) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = age nadults nkids lincome agelnx _cons

5 Tobit-I Regressionen Folie 16 Vergleich der Schätzungen (rechts für Anteil Alkohol ) Variable LinTrunc LinCens TobitCens LinTrunc LinCens TobitCens share_tbo - share_tbo - share_tbo -+- share_alc- share_alc - share_alc age nadults nkids lincome agelnx _cons sigma N r2/r2_p ll Tobit-I Regressionen Folie 18 Tobit mit log-normalem y (Vorbereitung isoelastisches Modell) Ziel: Wir möchten (nicht den Anteil = share am Einkommen, sondern) den Log. der Ausgaben ( expenditure, expnd ) für Tabak, log(expnd tbo) erklären: Iso-elastisches Modell log(expnd tbo) log(income) Annahme: expnd tbo = income * share tbo. Dann lässt sich log(expnd tbo) als log(expnd tbo) = log(income) + log(share tbo) berechnen. Problem: Dabei werden die zensierten Beobachtungen (= Nicht-Raucher) zu n.a. in lexpnd tbo = log(expnd tbo) (da für die Zensierten log(share tbo) = log(0) = n.a. ist) Lösung: Minimales y der Unzensierten ermitteln, untere Schwelle ll etwas darunter legen: gen lexpnd_tbo = lincome + log(share_tbo) sum lexpnd_tbo scalar ll_tbo = r(min) replace lexpnd_tbo = ll_tbo if lexpnd_tbo ==. Danach lässt sich das isoelastische Tobit-I cens -Modell schätzen mit: tobit lexpnd tbo $xlist, ll(ll tb0) Tobit-I Regressionen Folie 17 Diskussion der Ergebnisse für Anteile an Gesamtausgaben Koeffizienten-Schätzungen sehr verschieden zwischen den Modellen/Methoden Fast durchgängig werden die stärksten Effekte bei TobitCens (Tobit-I-Schätzung für zensiertes y) geschätzt, die schwächsten bei LinTrunc (Lin.Regr. mit gestutzten Daten) Das passiert nicht nur hier, sondern recht systematisch. Das Phänomen hängt mit der Grundannahme von Tobit-I zusammen (dass die Abstinenten den Tabak-/Alkohol-Konsum wegen ihres Disnutzens daraus meiden, und Nutzen wie Disnutzen durch das gleiche lin.regr.modell beschrieben wird) Da die Grundannahme kaum zu rechtfertigen ist, ist vermutlich keines der drei Modelle vollkommen adäquat (auch nicht nicht Tobit-I, die anderen beiden sind es ohnehin nicht) Starke Unterschiede zwischen Tabak und Alkohol (viele Vorzeichen drehen sich um) Insbesondere: Auf den Anteil f. Tabak an den Gesamtausgaben wirkt höheres Einkommen negativ. Auf den Alkohol-Anteil an den Gesamtausg. wirkt höheres Einkommen dagegen positiv (außer LinTrunc, aber dort ist Effekt insignifikant und zweitens ist dies ohnehin ein falsches Modell) Aufgabe: Ökonomische Interpretation, auch des Effekts von Kindern und der Zahl der Erwachsenen im Haushalt Tobit-I Regressionen Folie 19 Ergebnisse log-normales Tobit (y = log(expenditure tobacco/alcohol)) Variable LinTrunc LinCens TobitCens LinTrunc LinCens TobitCens lexpnd_tbo lexpnd_alc age nadults nkids lincome agelnx _cons sigma N r2/r2_p ll

Tobit-II und Heckman-Modell für Selection Bias

Tobit-II und Heckman-Modell für Selection Bias Tobit-II und Heckman-Modell für Selection Bias 17. Dezember 2014 Wie Tobit-I behandelt auch das Tobit-II-Modell die Situation, dass die erklärte Variable y teilweise nicht beobachtbar (zensiert) ist. Das

Mehr

Mikro-Ökonometrie, WS 2017/2018 Musterlösung von Aufgabe H(eckman sche Selection Bias Analyse)

Mikro-Ökonometrie, WS 2017/2018 Musterlösung von Aufgabe H(eckman sche Selection Bias Analyse) Mikro-Ökonometrie, WS 2017/2018 Musterlösung von Aufgabe H(eckman sche Selection Bias Analyse) Aufgabe H: Für diese Analyse verwenden wir Daten aus dem Current Population Survey 1991 USamerikanischer Haushalte,

Mehr

Seminar zur Energiewirtschaft:

Seminar zur Energiewirtschaft: Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable

Mehr

Spezifikationsprobleme Omitted Variable Bias

Spezifikationsprobleme Omitted Variable Bias Spezifikationsprobleme Omitted Variable Bias Spezifikationsprobleme In der Grundgesamtheit gilt der wahre (aber unbekannte) Zusammenhang y = 0 + 1x 1 + : : : kx k dieser Zusammenhang soll anhand einer

Mehr

Prüfung im Fach Mikroökonometrie im Sommersemester 2014 Aufgaben

Prüfung im Fach Mikroökonometrie im Sommersemester 2014 Aufgaben Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Mikroökonometrie im Sommersemester 014 Aufgaben Vorbemerkungen: Anzahl der Aufgaben: Bewertung:

Mehr

Das Lineare Regressionsmodell

Das Lineare Regressionsmodell Das Lineare Regressionsmodell Bivariates Regressionsmodell Verbrauch eines Pkw hängt vom Gewicht des Fahrzeugs ab Hypothese / Theorie: Je schwerer ein Auto, desto mehr wird es verbrauchen Annahme eines

Mehr

Theorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte

Theorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte Hochschule RheinMain WS 2018/19 Prof. Dr. D. Lehmann Probe-Klausur zur Vorlesung Ökonometrie Theorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte (die eigentliche Klausur wird

Mehr

Masterprüfung. Fach: Mikroökonometrie Prüfer: Prof. Regina T. Riphahn, Ph.D. Vorbemerkungen: Anzahl der Aufgaben: Bewertung:

Masterprüfung. Fach: Mikroökonometrie Prüfer: Prof. Regina T. Riphahn, Ph.D. Vorbemerkungen: Anzahl der Aufgaben: Bewertung: Masterprüfung Fach: Mikroökonometrie Prüfer: Prof. Regina T. Riphahn, Ph.D. Vorbemerkungen: Anzahl der Aufgaben: Bewertung: Erlaubte Hilfsmittel: Wichtige Hinweise: Die Klausur besteht aus 4 Aufgaben,

Mehr

Klausur: Angewandte Ökonometrie. Termin: , 14:00 16:00. Prüfer: Prof. Dr. Hans-Jörg Schmerer. Datum:

Klausur: Angewandte Ökonometrie. Termin: , 14:00 16:00. Prüfer: Prof. Dr. Hans-Jörg Schmerer. Datum: Fakultät für Wirtschaftswissenschaft Lehrstuhl für Volkswirtschaftslehre, insb. Internationale Ökonomie Univ.-Prof. Dr. Hans-Jörg Schmerer Name: Vorname: Matrikel-Nr.: Klausur: 42270 Angewandte Ökonometrie

Mehr

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Ausblick; Darstellung von Ergebnissen; Wiederholung

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Ausblick; Darstellung von Ergebnissen; Wiederholung Institut für Soziologie Dipl.-Soz. Methoden 2 Ausblick; Darstellung von Ergebnissen; Wiederholung Ein (nicht programmierbarer) Taschenrechner kann in der Klausur hilfreich sein. # 2 Programm Ausblick über

Mehr

Mikro-Ökonometrie, WS 2017/2018 Musterlösung Aufgabenblatt 4

Mikro-Ökonometrie, WS 2017/2018 Musterlösung Aufgabenblatt 4 Mikro-Ökonometrie, WS 2017/2018 Musterlösung Aufgabenblatt 4 Aufgabe 4: In dieser Aufgabe sollen anhand der Daten aus WAGE2.DTA Einflussfaktoren für die Wkt., dass ein männlicher US-amerikanischer Arbeitnehmer

Mehr

1 Beispiel zur Methode der kleinsten Quadrate

1 Beispiel zur Methode der kleinsten Quadrate 1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25

Mehr

Kapitel 4. Zensierte (censored) und gestutzte (truncated) abhängige Variablen, Sample Selection

Kapitel 4. Zensierte (censored) und gestutzte (truncated) abhängige Variablen, Sample Selection Kapitel 4 Zensierte (censored) und gestutzte (truncated) abhängige Variablen, Sample Selection In den vorhergehenden Abschnitten haben wir uns mit Fällen beschäftigt, in denen die abhängige Variable y

Mehr

ANOVA und Transformationen. Statistik II

ANOVA und Transformationen. Statistik II und Statistik II Wiederholung Literatur Statistik II und (1/28) Literatur Zum Nachlesen Agresti ch. 12 (nur bis Seite 381) Agresti ch. 13 (nur bis Seite 428) Statistik II und (2/28) Literatur für nächste

Mehr

Einführung in die Maximum Likelihood Methodik

Einführung in die Maximum Likelihood Methodik in die Maximum Likelihood Methodik Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Gliederung 1 2 3 4 2 / 31 Maximum Likelihood

Mehr

Einführung II. Kontext und Mehr-Ebenen-Datensätze. Wiederholung Statistische Mehr-Ebenen-Modelle Politisches Vertrauen in Europa Fazit/Ausblick

Einführung II. Kontext und Mehr-Ebenen-Datensätze. Wiederholung Statistische Mehr-Ebenen-Modelle Politisches Vertrauen in Europa Fazit/Ausblick Einführung II Kontext und Mehr-Ebenen-Datensätze Kontext und Mehr-Ebenen-Datensätze Einführung II (1/28) Warum? Wiederholung Moderne Erklärungen = Mehr-Ebenen-Erklärungen Viele Datensätze sind strukturiert

Mehr

x t2 y t = 160, y = 8, y y = 3400 t=1

x t2 y t = 160, y = 8, y y = 3400 t=1 Aufgabe 1 (25 Punkte) 1. Eine Online Druckerei möchte die Abhängigkeit des Absatzes gedruckter Fotos vom Preis untersuchen. Dazu verwendet die Firma das folgende lineare Regressionsmodell: wobei y t =

Mehr

Übungsblatt 10: Lineare Regression (Sitzung 11)

Übungsblatt 10: Lineare Regression (Sitzung 11) 1 Übungsblatt 10: Lineare Regression (Sitzung 11) Aufgabe 1 a) Nach welchem Kriterium wird die Regressionsgerade zur Vorhersage von Y-Werten festgelegt? b) Was sind die Gemeinsamkeiten und Unterschiede

Mehr

Mikro-Ökonometrie, WS 15/16 Musterlösung Aufgabenblatt 3

Mikro-Ökonometrie, WS 15/16 Musterlösung Aufgabenblatt 3 Mikro-Ökonometrie, WS 15/16 Musterlösung Aufgabenblatt 3 Aufgabe 3: Die Datei WAGE2.DTA enthält Daten einer Stichprobe von 935 männlichen US-amerikanischen Arbeitnehmern im Alter von 28 bis 38 Jahren.

Mehr

Übung V Lineares Regressionsmodell

Übung V Lineares Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung

Mehr

Statistik II Übung 1: Einfache lineare Regression

Statistik II Übung 1: Einfache lineare Regression Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der

Mehr

8 Allgemeine Modelle & Robuste Regression

8 Allgemeine Modelle & Robuste Regression 8.1 Allgemeines Lineares Regressions-Modell 182 8 Allgemeine Modelle & Robuste Regression 8.1 Allgemeines Lineares Regressions-Modell a Modell. Y i F µ i, γ, g µ i = η i = x T i β b Weibull-Verteilung.

Mehr

X =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode?

X =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode? Aufgabe 1 (25 Punkte) Zur Schätzung der Produktionsfunktion des Unternehmens WV wird ein lineares Regressionsmodell der Form angenommen. Dabei ist y t = β 1 + x t2 β 2 + e t, t = 1,..., T (1) y t : x t2

Mehr

Lösungen Aufgabenblatt 7, Mikro-Ökonometrie, WS 2017/2018

Lösungen Aufgabenblatt 7, Mikro-Ökonometrie, WS 2017/2018 Lösungen Aufgabenblatt 7, Mikro-Ökonometrie, WS 2017/2018 Aufgabe 7: Für diese Aufgabe verwenden wir die Daten aus ALLBUS12.DTA. 1 Die ALLBUS-Daten enthalten unter anderem Angaben der befragten Personen

Mehr

Modellspezifikationen Nichtlinearitäten

Modellspezifikationen Nichtlinearitäten Modellspezifikationen Nichtlinearitäten Agenda Dummy-Variablen Interaktionseffekte (quadratische Effekte / Polynome) Dummy Interaktion Logarithmierte Variablen Wachstumsraten / Semielastizitäten Elastizitäten

Mehr

Stochastik Praktikum Lineare Modelle

Stochastik Praktikum Lineare Modelle Stochastik Praktikum Lineare Modelle Thorsten Dickhaus Humboldt-Universität zu Berlin 06.10.2010 Übersicht 1 Einfache lineare Regression 2 Multiple lineare Regression 3 Varianzanalyse 4 Verallgemeinerte

Mehr

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im SS 2012

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im SS 2012 Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im SS 2012 Aufgabe 1 (20 Punkte) Sei y = Xβ + ε ein N 1 Vektor und X eine N K Matrix.

Mehr

Multiple Regression III

Multiple Regression III Multiple Regression III Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Überprüfung der Modellannahmen Residuen-Plot Normal-Q-Q-Plot Cook s Distanz-Plot Maßnahmen bei Abweichungen von Modellannahmen

Mehr

ANOVA und Transformationen

ANOVA und Transformationen und Statistik II Literatur Statistik II und (1/28) Literatur Zum Nachlesen Agresti ch. 12 (nur bis Seite 381) Agresti ch. 13 (nur bis Seite 428) Statistik II und (2/28) Literatur Literatur für nächste

Mehr

1 Gliederung Zeitreihenökonometrie. Angewandte Ökonometrie (Folien) Zeitreihenökonometrie Universität Basel, FS 09. Dr. Sylvia Kaufmann.

1 Gliederung Zeitreihenökonometrie. Angewandte Ökonometrie (Folien) Zeitreihenökonometrie Universität Basel, FS 09. Dr. Sylvia Kaufmann. Angewandte Ökonometrie (Folien) Zeitreihenökonometrie Universität Basel, FS 09 Dr Sylvia Kaufmann Februar 2009 Angewandte Ökonometrie, Sylvia Kaufmann, FS09 1 1 Gliederung Zeitreihenökonometrie Einführung

Mehr

Inferenz im multiplen Regressionsmodell

Inferenz im multiplen Regressionsmodell 1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall

Mehr

Hochschule RheinMain WS 2018/19 Prof. Dr. D. Lehmann. 8. Übungsblatt zur Vorlesung Ökonometrie

Hochschule RheinMain WS 2018/19 Prof. Dr. D. Lehmann. 8. Übungsblatt zur Vorlesung Ökonometrie Hochschule RheinMain WS 2018/19 Prof. Dr. D. Lehmann 8. Übungsblatt zur Vorlesung Ökonometrie Aufgabe 1: In der Vorlesung haben wir das lineare Regressionsproblem als statistisches Problem formuliert:

Mehr

Teekonsum in den USA (in 1000 Tonnen), Nimmt den Wert 1 an für alle Perioden, Durchschnittlicher Preis des Tees in Periode t (in Tausend $/Tonne).

Teekonsum in den USA (in 1000 Tonnen), Nimmt den Wert 1 an für alle Perioden, Durchschnittlicher Preis des Tees in Periode t (in Tausend $/Tonne). Aufgabe 1 (5 Punkte) Gegeben sei ein lineares Regressionsmodell in der Form. Dabei ist y t = x t1 β 1 + x t β + e t, t = 1,..., 10 (1) y t : x t1 : x t : Teekonsum in den USA (in 1000 Tonnen), Nimmt den

Mehr

Mikro-Ökonometrie: Small Sample Inferenz mit OLS

Mikro-Ökonometrie: Small Sample Inferenz mit OLS Mikro-Ökonometrie: Small Sample Inferenz mit OLS 1. November 014 Mikro-Ökonometrie: Small Sample Inferenz mit OLS Folie Zusammenfassung wichtiger Ergebnisse des letzten Kapitels (I) Unter den ersten vier

Mehr

2. Fehlerhafte Auswahl der exogenen Variablen (Verletzung der A1-Annahme)

2. Fehlerhafte Auswahl der exogenen Variablen (Verletzung der A1-Annahme) 2. Fehlerhafte Auswahl der exogenen Variablen (Verletzung der A1-Annahme) Annahme A1: Im multiplen Regressionsmodell fehlen keine relevanten exogenen Variablen und die benutzten exogenen Variablen x 1,

Mehr

Beispiel: Multiples Modell/Omitted Variable Bias I

Beispiel: Multiples Modell/Omitted Variable Bias I 4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss

Mehr

Statistik II Übung 1: Einfache lineare Regression

Statistik II Übung 1: Einfache lineare Regression Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der

Mehr

Masterprüfung SS 2016

Masterprüfung SS 2016 Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Fach: Mikroökonometrie Semester: Sommersemester 2016 Prüfer: Prof. Regina T. Riphahn, Ph.D. Masterprüfung SS 2016

Mehr

Pobeklausur: Einführung in die Ökonometrie. 1. (20 Punkte) Wir betrachten 2 (in den Koeffizienten) lineare Modelle mit folgenden Variablen:

Pobeklausur: Einführung in die Ökonometrie. 1. (20 Punkte) Wir betrachten 2 (in den Koeffizienten) lineare Modelle mit folgenden Variablen: Gesamtpunktzahl: 96 Pobeklausur: Einführung in die Ökonometrie 1. (20 Punkte) Wir betrachten 2 (in den Koeffizienten) lineare Modelle mit folgenden Variablen: cigs: gerauchte Zigaretten pro Tag educ: Bildung

Mehr

Statistische Methoden der Lebensverlaufsforschung. Prof. Dr. Johannes Giesecke Humboldt-Universität zu Berlin Institut für Sozialwissenschaften

Statistische Methoden der Lebensverlaufsforschung. Prof. Dr. Johannes Giesecke Humboldt-Universität zu Berlin Institut für Sozialwissenschaften Statistische Methoden der Lebensverlaufsforschung Prof. Dr. Johannes Giesecke Humboldt-Universität zu Berlin Institut für Sozialwissenschaften Lebensverlauf Deutschland, ca 1870 Johannes Giesecke Statistische

Mehr

Prüfung im Fach Ökonometrie im SS 2011 Aufgabenteil. Name, Vorname. Matrikelnr. Studiengang. -Adresse. Unterschrift

Prüfung im Fach Ökonometrie im SS 2011 Aufgabenteil. Name, Vorname. Matrikelnr. Studiengang.  -Adresse. Unterschrift Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im SS 2011 Aufgabenteil Name, Vorname Matrikelnr. Studiengang E-Mail-Adresse Unterschrift

Mehr

Varianzkomponentenschätzung

Varianzkomponentenschätzung Qualitas AG Varianzkomponentenschätzung Peter von Rohr Qualitas AG Peter von Rohr Folien ZL I+II LFW C11 October 29, 2015 2 / 23 Multiple Lineare Regression Annahmen Modell y = Xb + e Varianz der Fehler

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

Allgemeine lineare Modelle

Allgemeine lineare Modelle 262 Merkpunkte Allgemeine lineare Modelle Multiple lineare Regression mit nicht-normalen Zufallsabweichungen bilden eine harmlose" Verallgemeinerung der multiplen lin. Regr. Beispiele: Gumbel-Regression,

Mehr

Abschlussklausur zur Vorlesung Empirische Wirtschaftsforschung

Abschlussklausur zur Vorlesung Empirische Wirtschaftsforschung Dr Isabel Schnabel Johannes Gutenberg-Universität Mainz Abschlussklausur zur Vorlesung Empirische Wirtschaftsforschung Sommersemester 2007, 14082007, 16:30 18:30 Uhr Hinweise zur Klausur Die Klausur besteht

Mehr

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions

Mehr

= 2 ( 3250,3 ( 3251,5)) = 1,1662 F(2,800) = 2,4 χ2

= 2 ( 3250,3 ( 3251,5)) = 1,1662 F(2,800) = 2,4 χ2 Pobeklausur: Einführung in die Ökonometrie (Lösung) Gesamtpunktzahl: 96 1. (20 Punkte) a) Anmerkung: statt im Durchschnitt kann auch der/die/das erwartete... stehen. educ : Wenn die Bildung um 1 Jahr steigt,

Mehr

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften

Mehr

Kategorielle Zielgrössen

Kategorielle Zielgrössen Kategorielle Zielgrössen 27.11.2017 Motivation Bisher gesehen: Regressionsmodelle für diverse Arten von Zielgrössen Y. kontinuierliche Zielgrösse Lineare Regression Binäre/binomiale Zielgrösse Logistische

Mehr

Beispiel: Multiples Modell/Omitted Variable Bias I

Beispiel: Multiples Modell/Omitted Variable Bias I 4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss

Mehr

FRAGESTUNDE WS 2016/17 QM 2. Dr. Christian Schwarz 1

FRAGESTUNDE WS 2016/17 QM 2. Dr. Christian Schwarz 1 FRAGESTUNDE Dr. Christian Schwarz 1 #2 - Allgemein Q: Müssen wir den Standard Error händisch berechnen können? R: Nein. Q: Hat das Monte Carlo Experiment irgendeine Bedeutung für uns im Hinblick auf die

Mehr

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38 Dynamische Systeme und Zeitreihenanalyse Multivariate Normalverteilung und ML Schätzung Kapitel 11 Statistik und Mathematik WU Wien Michael Hauser Dynamische Systeme und Zeitreihenanalyse // Multivariate

Mehr

Musterlösung. Modulklausur Multivariate Verfahren

Musterlösung. Modulklausur Multivariate Verfahren Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn

Mehr

Proxies, Endogenität, Instrumentvariablenschätzung

Proxies, Endogenität, Instrumentvariablenschätzung 1 4.2 Multivariate lineare Regression: Fehler in den Variablen, Proxies, Endogenität, Instrumentvariablenschätzung Literatur: Wooldridge, Kapitel 15, Appendix C.3 und Kapitel 9.4 Wahrscheinlichkeitslimes

Mehr

Schriftliche Prüfung (90 Minuten)

Schriftliche Prüfung (90 Minuten) Dr. M. Kalisch Prüfung Statistik I Winter 2016 Schriftliche Prüfung (90 Minuten) Bemerkungen: Erlaubte Hilfsmittel: 10 hand- oder maschinengeschriebene A4 Seiten (=5 Blätter). Taschenrechner ohne Kommunikationsmöglichkeit.

Mehr

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests. 0 Einführung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung 5 Hypothesentests 6 Regression Lineare Regressionsmodelle Deskriptive Statistik:

Mehr

Kapitel 1 Einführung. Angewandte Ökonometrie WS 2012/13. Nikolaus Hautsch Humboldt-Universität zu Berlin

Kapitel 1 Einführung. Angewandte Ökonometrie WS 2012/13. Nikolaus Hautsch Humboldt-Universität zu Berlin Kapitel 1 Einführung Angewandte Ökonometrie WS 2012/13 Nikolaus Hautsch Humboldt-Universität zu Berlin 1. Allgemeine Informationen 2 17 1. Allgemeine Informationen Vorlesung: Mo 12-14, SPA1, 23 Vorlesung

Mehr

Statistischer Rückschluss und Testen von Hypothesen

Statistischer Rückschluss und Testen von Hypothesen Statistischer Rückschluss und Testen von Hypothesen Statistischer Rückschluss Lerne von der Stichprobe über Verhältnisse in der Grundgesamtheit Grundgesamtheit Statistischer Rückschluss lerne aus Analyse

Mehr

Fortgeschrittene Ökonometrie: Maximum Likelihood

Fortgeschrittene Ökonometrie: Maximum Likelihood Universität Regensburg, Lehrstuhl für Ökonometrie Sommersemester 202 Fortgeschrittene Ökonometrie: Maximum Likelihood Poissonverteilung Man betrachte die poisson-verteilten Zufallsvariablen y t, t =, 2,...,

Mehr

Wichtige Definitionen und Aussagen

Wichtige Definitionen und Aussagen Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge

Mehr

Statistics, Data Analysis, and Simulation SS 2017

Statistics, Data Analysis, and Simulation SS 2017 Statistics, Data Analysis, and Simulation SS 2017 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Mainz, May 29, 2017 Dr. Michael O. Distler

Mehr

Lineare Regression. Kapitel Regressionsgerade

Lineare Regression. Kapitel Regressionsgerade Kapitel 5 Lineare Regression 5 Regressionsgerade Eine reelle Zielgröße y hänge von einer reellen Einflussgröße x ab: y = yx) ; zb: Verkauf y eines Produkts in Stückzahl] hängt vom Preis in e] ab Das Modell

Mehr

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers 4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur

Mehr

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC Referenten: Linda Gräfe & Konstantin Falk 1 Agenda Schätzverfahren ML REML Beispiel in SPSS Modellbeurteilung Devianz AIC BIC

Mehr

Prüfung im Fach Mikroökonometrie im Wintersemester 2012/13 Aufgaben

Prüfung im Fach Mikroökonometrie im Wintersemester 2012/13 Aufgaben Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Mikroökonometrie im Wintersemester 2012/13 Aufgaben Vorbemerkungen: Anzahl der Aufgaben: Bewertung:

Mehr

Zahl der Kreditpunkte, die Sie erwerben möchten: 3 CP 4 CP 6 CP

Zahl der Kreditpunkte, die Sie erwerben möchten: 3 CP 4 CP 6 CP Klausur in Mikroökonometrie am 26.07.2006 Hinweise: (1) Teil 1 (90 Punkte) muss von allen gelöst werden, Teil 2 (30 Punkte) nur von denjenigen, die 4 oder 6 CP erwerben wollen. (2) Die Punktverteilung

Mehr

Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen. Statistik II. Prof. Dr.

Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen. Statistik II. Prof. Dr. Statistik II Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen Statistik II 2. Parameterschätzung: 2.1 Grundbegriffe; 2.2 Maximum-Likelihood-Methode;

Mehr

Logistische Regression

Logistische Regression Logistische Regression Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Logistische Regression Beispiel 1: Herzerkrankungsdaten aus Framingham Log Odds Modell Beispiel 1: Einfluss von Blutdruck Maximum

Mehr

Masterprüfung. Die Klausur besteht aus 3 Aufgaben, die alle bearbeitet werden müssen.

Masterprüfung. Die Klausur besteht aus 3 Aufgaben, die alle bearbeitet werden müssen. Fach: Prüfer: Mikroökonometrie Prof. Regina T. Riphahn, Ph.D. Masterprüfung Vorbemerkungen: Bearbeitungszeit: 60 Minuten. Anzahl der Aufgaben: Bewertung: Erlaubte Hilfsmittel: Wichtige Hinweise: Die Klausur

Mehr

Auswertung und Lösung

Auswertung und Lösung Körperkraft [Nm] 0 50 100 150 200 250 0 20 40 60 80 Lean Body Mass [kg] Dieses Quiz soll Ihnen helfen, den R Output einer einfachen linearen Regression besser zu verstehen (s. Kapitel 5.4.1) Es wurden

Mehr

Kurs Empirische Wirtschaftsforschung

Kurs Empirische Wirtschaftsforschung Kurs Empirische Wirtschaftsforschung 5. Bivariates Regressionsmodell 1 Martin Halla Institut für Volkswirtschaftslehre Johannes Kepler Universität Linz 1 Lehrbuch: Bauer/Fertig/Schmidt (2009), Empirische

Mehr

Binäre Auswahlmodelle (Logit, Probit,...)

Binäre Auswahlmodelle (Logit, Probit,...) Binäre Auswahlmodelle Logit, Probit, ) 13. November 2017 Die nächsten Kapitel beschäftigen sich mit der Frage, wie man vorgeht, wenn die eigentlich durch ein lineares Regressionsmodell zu erklärende Variable

Mehr

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden

Mehr

Vorlesung 12a. Schätzen von Parametern. Teil 2

Vorlesung 12a. Schätzen von Parametern. Teil 2 Vorlesung 12a Schätzen von Parametern Teil 2 1 Unser Logo der ersten Stunde: X P ϑ (X da) = ρ ϑ (da), ϑ Θ S 2 Ein Logo der Statistik: Θ ˆϑ t X S P ϑ (X da) = ρ ϑ (da), ϑ Θ Θ... Parameterraum S... Beobachtungsraum

Mehr

Lean Body Mass [kg] Estimate Std. Error t value Pr(> t ) (Intercept) ??? lbm <2e-16 ***

Lean Body Mass [kg] Estimate Std. Error t value Pr(> t ) (Intercept) ??? lbm <2e-16 *** Körperkraft [Nm] 0 50 100 150 200 250 0 20 40 60 80 Lean Body Mass [kg] Dieses Quiz soll Ihnen helfen, den R Output einer einfachen linearen Regression besser zu verstehen (s. Kapitel 5.4.1) Es wurden

Mehr

6. Schätzverfahren für Parameter

6. Schätzverfahren für Parameter 6. Schätzverfahren für Parameter Ausgangssituation: Ein interessierender Zufallsvorgang werde durch die ZV X repräsentiert X habe eine unbekannte Verteilungsfunktion F X (x) Wir interessieren uns für einen

Mehr

VO Biostatistik im WS 2006/2007

VO Biostatistik im WS 2006/2007 VO Biostatistik im WS 2006/2007 1 Beispiel 1: Herzerkrankungsdaten aus Framingham für skoeffizienten : Leukemie-Daten 2 Beispiel 1: Herzerkrankungsdaten aus Framingham Stichprobe: 1329 männliche Bewohner

Mehr

Empirische Analysen mit dem SOEP

Empirische Analysen mit dem SOEP Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael

Mehr

Logistische Regression

Logistische Regression Logistische Regression Markus Kalisch 30.09.2014 1 Big Picture: Statistisches Lernen Supervised Learning (X,Y) Unsupervised Learning X VL 7, 11, 12 Regression Y kontinuierlich VL 1, 2, 4, 5, 6 Klassifikation

Mehr

Lösung Aufgabenblatt 3 zur Mikro-Ökonometrie, WS 2017/2018

Lösung Aufgabenblatt 3 zur Mikro-Ökonometrie, WS 2017/2018 Lösung Aufgabenblatt 3 zur Mikro-Ökonometrie, WS 2017/2018 Aufgabe 3: Die Datei WAGES2.DTA enthält Daten einer Stichprobe von 935 männlichen US-amerikanischen Arbeitnehmern im Alter von 28 bis 38 Jahren.

Mehr

Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation

Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation PEΣO 12. November 2001 Von der Tabellenanalyse zur Regression Die bivariate Verteilung zweier metrischer Variablen kann konzeptionell

Mehr

Schätzung im multiplen linearen Modell VI

Schätzung im multiplen linearen Modell VI Schätzung im multiplen linearen Modell VI Wie im einfachen linearen Regressionsmodell definiert man zu den KQ/OLS-geschätzten Parametern β = ( β 0, β 1,..., β K ) mit ŷ i := β 0 + β 1 x 1i +... β K x Ki,

Mehr

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20 Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 20 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)

Mehr

Kurze Einführung in die Ökonometrie-Software E-Views

Kurze Einführung in die Ökonometrie-Software E-Views Kurze Einführung in die Ökonometrie-Software E-Views Folie 2 Workfile Kurze Einführung in die Ökonometrie-Software E-Views 4. November 2008 Typischerweise liegen die Daten in einem Spreadsheet -Format

Mehr

7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien

7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Statistik 7.1 Korrelationsanalyse Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 7 Regressions- und Korrelationsanalyse Kovarianz Pearson-Korrelation Der (lineare)

Mehr

Regressionsmodelle mit Anwendungen in der Versicherungs- und Finanzwirtschaft Probeklausur Wintersemester 2017/

Regressionsmodelle mit Anwendungen in der Versicherungs- und Finanzwirtschaft Probeklausur Wintersemester 2017/ Regressionsmodelle mit Anwendungen in der Versicherungs- und Finanzwirtschaft Probeklausur Wintersemester 2017/2018 06.12.2018 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN Nachname:...................................................................

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie

Mehr

Das lineare Regressionsmodell

Das lineare Regressionsmodell Universität Ulm 89069 Ulm Germany Prof. Dr. Werner Smolny Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Institutsdirektor Das ökonomische

Mehr

Analyse von Querschnittsdaten. Signifikanztests I Basics

Analyse von Querschnittsdaten. Signifikanztests I Basics Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004

Mehr

5 Multivariate stationäre Modelle

5 Multivariate stationäre Modelle 5 Multivariate stationäre Modelle 5.1 Autoregressive distributed lag (ADL) 5.1.1 Das Modell und dessen Schätzung Im vorangehenden Kapitel führten wir mit der endogenen verzögerten Variablen, y t 1, als

Mehr

Klassen diskreter Variablen

Klassen diskreter Variablen Modelle diskreter Variablen Klassen diskreter Variablen binär multinomial Weitere Klassifizierung multinomialer diskreter Variablen: kategorial y = 1, falls Einkommen < 3000 e. y = 2, falls Einkommen zw.

Mehr

Institut für Soziologie Benjamin Gedon. Methoden 2. Kausalanalyse

Institut für Soziologie Benjamin Gedon. Methoden 2. Kausalanalyse Institut für Soziologie Methoden 2 Kausalanalyse Inhalt 1. Kausalanalyse 2. Anwendungsbeispiel 3. Wiederholung 4. Übungsaufgabe # 2 Kausalanalyse Kausalität: Identifizieren von Ursache-Wirkungs-Beziehungen

Mehr

2.5 Lineare Regressionsmodelle

2.5 Lineare Regressionsmodelle 2.5.1 Wiederholung aus Statistik I Gegeben Datenpunkte (Y i, X i ) schätze die beste Gerade Y i = β 0 + β 1 X i, i = 1,..., n. 2 Induktive Statistik 409 Bsp. 2.30. [Kaffeeverkauf auf drei Flohmärkten]

Mehr

Allgemein zu Hypothesentests: Teststatistik. OLS-Inferenz (Small Sample) Allgemein zu Hypothesentests

Allgemein zu Hypothesentests: Teststatistik. OLS-Inferenz (Small Sample) Allgemein zu Hypothesentests OLS-Inferenz (Small Sample) K.H. Schild 3. Mai 017 Allgemein zu Hypothesentests: Teststatistik Konstruktion eines Hypothesentests erfolgt meistens über eine Teststatistik Eine Teststatistik T ist eine

Mehr

3. Das einfache lineare Regressionsmodell

3. Das einfache lineare Regressionsmodell 3. Das einfache lineare Regressionsmodell Ökonometrie: (I) Anwendung statistischer Methoden in der empirischen Forschung in den Wirtschaftswissenschaften Konfrontation ökonomischer Theorien mit Fakten

Mehr

Kap. 2: Generalisierte lineare Modelle (GLMs) Lineare und generalisierte lineare Modelle Schätzung und Inferenz in GLMs Literatur

Kap. 2: Generalisierte lineare Modelle (GLMs) Lineare und generalisierte lineare Modelle Schätzung und Inferenz in GLMs Literatur Kap. 2: Generalisierte lineare Modelle (GLMs) Lineare und generalisierte lineare Modelle Schätzung und Inferenz in GLMs Literatur 2.1 Lineare und generalisierte lineare Modelle Das klassische lineare Regressionsmodell

Mehr