Prof. Bernd Ftzenberger, Ph.D. Ute Leuschner Anthony Strttmatter Übung zur Veranstaltung Emprsche Wrtschaftsforschung Albert-Ludwgs-Unverstät Freburg Wntersemester 2009/10 Übungsblatt 8: Spezfkatons- und andere Fragen rund um das lneare Regressonsmodell 1. Parttonerte Regresson Betrachten Se das folgende Regressonsmodell: Y = 1X1 + 2X 2 + u, wobe alle Varablen enen Mttelwert von null haben. a) Geben Se de KQ-Schätzer für deses Modell an. b) En Kommltone behauptet, dass man den Koeffzenten 1 auch durch folgendes zwestufges Verfahren berechnen kann: Schrtt 1: Schätze das Modell X 1 = X 2 +. Schrtt 2: Regressere Y auf de Resduen aus Schrtt 1: entsprcht dann 1. Y = ˆ. Der Koeffzent + Überprüfen Se sene Aussage. 2. Mncersche Verdenstfunkton für Berufsensteger Ihnen legt en Datensatz mt dem Enstegsgehalt und der Ausbldungsdauer von Berufsanfängern vor. Damt möchten Se folgendes Modell schätzen: ln Y = 1 + 2S + u, (1) wobe Y den monatlchen Bruttoverdenst und S de Ausbldungsdauer n Jahren bezechnet. a) En n der Lteratur häufg vorgebrachter Enwand st, dass der Verdenst und de gewählte Schulbldung auch vom ncht beobachtbaren Talent (Englsch: ablty) ener Person abhängen. In desem Fall wäre ene Spezfkaton, de nur de Ausbldungsdauer berückschtgt, unvollständg. Zegen Se, we sch der aus Modell (1) geschätzte Koeffzent der Ausbldungsdauer von dem m wahren Modell, n dem auch das Talent lnear engeht, unterschedet. b) In welche Rchtung st der auf Bass von Modell (1) geschätzte Koeffzent der Ausbldungsdauer verzerrt? Erläutern Se de Konsequenzen unter folgenden Annahmen: () Talentertere Indvduen wählen en höheres Ausbldungsnveau, da hnen das Lernen lechter fällt. () Es wählen dejengen en höheres Ausbldungsnveau, de wenger Talent haben auf andere Wese enen hohen Verdenst zu erzelen. 1
Hnwes: Gehen Se davon aus, dass ene talentertere Person ceters parbus mehr verdent als ene wenger talenterte Person. c) Se überlegen ene Instrumentvarablen Schätzung durchzuführen. In Ihrem Datensatz stehen Ihnen außerdem noch folgende Varablen zur Verfügung: (1) IQ, (2) Dummyvarable, de ens st, wenn de Person n ener Unverstätsstadt aufgewachsen st, (3) Dummyvarable, de ens st, wenn der/de Personalmanagern en anderes Geschlecht hat als der/de Berufsanfänger/n, (4) Ausbldungsdauer der Mutter, (5) Bruttomonatsverdenst des Vaters und (6) Geburtsmonat. Welche davon würden sch als Instrument für de Ausbldungsdauer egnen und welche eher ncht? Begründen Se Ihre Antwort. d) Krtker der Mncerschen Verdenstfunkton führen zudem an, dass der Verdenst ncht so sehr von der Anzahl n Ausbldung verbrachter Jahre, sondern velmehr vom errechten Abschluss abhängt. Welche Annahmen stecken mplzt n ener Spezfkaton, n der de Ausbldungsdauer n Jahren lnear engeht? Welche Möglchketen gbt es dese Annahmen zu lockern und anhand von Hypothesentests zu überprüfen? 3. Zusammenhang zwschen Knderzahl, Ausbldung und Alter Mt enem Datensatz, der de Angaben von 4361 Frauen enthält, st der Zusammenhang zwschen der Anzahl der Knder, der Ausbldungsdauer n Jahren und dem Alter untersucht worden. Am Ende des Übungsblatts fnden Se den TSP-Output der Analyse. Kommenteren und nterpreteren Se hn. Hnwes: De Varable frsthalf st ens, wenn de Frau n den Monaten Januar bs Jun geboren wurde und null sonst. 4. Messfehler n den Varablen Betrachten Se das folgende Regressonsmodell: Y = u. 1 + 2X + a) We wrkt sch en Messfehler aus, be dem de zu erklärende Varable mmer um enen festen Betrag zu hoch gemessen wrd? b) We wrkt sch en Messfehler n der erklärenden Varable aus, der zufällg um den wahren Wert schwankt? c) Gehen Se nun davon aus, dass X ene fehlerhaft gemessene Dummyvarable st. Ist de Annahme, dass der Messfehler zufällg um den wahren Wert streut haltbar? 2
5. Zusatzaufgabe Nehmen Se an Se schätzen das Regressonsmodell Y = 1 2X1 + 3X 2 + u mt TSP. Dabe stellen Se fest, dass bede Stegungskoeffzenten ncht sgnfkant von null verscheden snd, obwohl das R 2 recht hoch st. a) Welches Problem legt her möglcherwese vor? We würden Se Ihre Vermutung überprüfen? b) Ist ene Schätzung, n der deses Problem vorlegt, noch zu gebrauchen? TSP-Output zu Aufgabe 3 PROGRAM COMMAND *************************************************************** 1? 1?Fertltaet 1? 1 1 optons crt ; 2 2?Daten enlesen 2 freq n ; 3 3 read(fle='fertl.raw') chldren educ age agesq frsthalf ; 4 matrx fullsmpl=@smpl ; 5 5?Daten ueberpruefen 5?smpl 1 10 ; 5?prnt chldren educ age agesq frsthalf ; 5 5 smpl fullsmpl ; 6 msd(terse,byvar) chldren educ age agesq frsthalf ; 7 7?Analyse 7 ols chldren c educ age agesq ; 8 8 msd(terse,corr) educ age frsthalf ; 9 9 ols educ c age agesq frsthalf ; 10 10 genr ueduc=@res ; 11 11 ols(robust) chldren c educ age agesq ueduc ; 12 12 2sls( nst=(c age agesq frsthalf) ) chldren c educ age agesq ; 13 13 end; EXECUTION *************************************************************************** 3
Unvarate statstcs ========= Number of Observatons: 4361 Num.Obs Mean Std Dev Mnmum Maxmum CHILDREN 4361.00000 2.26783 2.22203 0.00000 13.00000 EDUC 4361.00000 5.85600 3.92708 0.00000 20.00000 AGE 4361.00000 27.40518 8.68523 15.00000 49.00000 AGESQ 4361.00000 826.45999 526.92319 225.00000 2401.00000 FRSTHALF 4361.00000 0.54047 0.49842 0.00000 1.00000 Equaton 1 Method of estmaton = Ordnary Least Squares Dependent varable: CHILDREN Number of observatons: 4361 Mean of dep. var. = 2.26783 LM het. test = 1108.41 [.000] Std. dev. of dep. var. = 2.22203 Durbn-Watson = 1.86823 [<.000] Sum of squared resduals = 9284.15 Jarque-Bera test = 715.951 [.000] Varance of resduals = 2.13086 Ramsey's RESET2 = 68.2000 [.000] Std. error of regresson = 1.45975 F (zero slopes) = 1915.20 [.000] R-squared =.568724 Schwarz B.I.C. = 7852.35 Adjusted R-squared =.568427 Log lkelhood = -7835.59 Estmated Standard Varable Coeffcent Error t-statstc P-value C -4.13831.240594-17.2004 [.000] EDUC -.090575.592069E-02-15.2981 [.000] AGE.332449.016549 20.0882 [.000] AGESQ -.263082E-02.272592E-03-9.65113 [.000] Number of Observatons: 4361 Results of Covarance procedure ======= Mean Std Dev Mnmum Maxmum EDUC 5.85600 3.92708 0.00000 20.00000 AGE 27.40518 8.68523 15.00000 49.00000 FRSTHALF 0.54047 0.49842 0.00000 1.00000 Correlaton Matrx EDUC AGE FRSTHALF EDUC 1.00000 AGE -0.30960 1.00000 FRSTHALF -0.11901 0.035392 1.00000 4
Equaton 2 Method of estmaton = Ordnary Least Squares Dependent varable: EDUC Number of observatons: 4361 Mean of dep. var. = 5.85600 LM het. test = 120.258 [.000] Std. dev. of dep. var. = 3.92708 Durbn-Watson = 1.35176 [<.000] Sum of squared resduals = 60001.1 Jarque-Bera test = 56.5549 [.000] Varance of resduals = 13.7712 Ramsey's RESET2 = 2.34052 [.126] Std. error of regresson = 3.71096 F (zero slopes) = 175.207 [.000] R-squared =.107651 Schwarz B.I.C. = 11921.3 Adjusted R-squared =.107037 Log lkelhood = -11904.5 Estmated Standard Varable Coeffcent Error t-statstc P-value C 9.69286.598069 16.2069 [.000] AGE -.107950.042040-2.56779 [.010] AGESQ -.505567E-03.692940E-03 -.729597 [.466] FRSTHALF -.852285.112830-7.55374 [.000] Equaton 3 Method of estmaton = Ordnary Least Squares Dependent varable: CHILDREN Number of observatons: 4361 Mean of dep. var. = 2.26783 LM het. test = 1108.40 [.000] Std. dev. of dep. var. = 2.22203 Durbn-Watson = 1.86915 [<.000] Sum of squared resduals = 9278.93 Jarque-Bera test = 722.129 [.000] Varance of resduals = 2.13015 Ramsey's RESET2 = 70.3546 [.000] Std. error of regresson = 1.45950 F (zero slopes) = 1437.49 [.000] R-squared =.568967 Schwarz B.I.C. = 7855.32 Adjusted R-squared =.568571 Log lkelhood = -7834.37 Estmated Standard Varable Coeffcent Error t-statstc P-value C -3.38781.536618-6.31325 [.000] EDUC -.171499.051392-3.33706 [.001] AGE.323605.020130 16.0755 [.000] AGESQ -.267228E-02.351944E-03-7.59289 [.000] UEDUC.081983.051609 1.58855 [.112] Standard Errors are heteroskedastc-consstent (HCTYPE=2). Dependent varable: CHILDREN Endogenous varables: EDUC Included exogenous varables: C AGE AGESQ Excluded exogenous varables: FRSTHALF Equaton 4 Method of estmaton = Instrumental Varable 5
Number of observatons: 4361 Mean of dep. var. = 2.26783 R-squared =.552676 Std. dev. of dep. var. = 2.22203 Adjusted R-squared =.552368 Sum of squared resduals = 9682.22 Durbn-Watson = 1.87482 [<.000] Varance of resduals = 2.22222 F (zero slopes) = 1765.12 [.000] Std. error of regresson = 1.49071 E'PZ*E = 0. Estmated Standard Varable Coeffcent Error t-statstc P-value C -3.38781.548150-6.18043 [.000] EDUC -.171499.053180-3.22490 [.001] AGE.323605.017860 18.1194 [.000] AGESQ -.267228E-02.279687E-03-9.55451 [.000] *************************************************************************** END OF OUTPUT. 6