Übungsblatt 8: Spezifikations- und andere Fragen rund um das lineare Regressionsmodell

Ähnliche Dokumente
Lösung - Übungsblatt 10

Fragen zum zweiten Teil der Vorlesung

Übungsblatt 7: Schätzung eines Mietspiegels

Fragestunde zur Übung

Klausur zur Vorlesung Lineare Modelle SS 2006 Diplom, Klausur A

(2) i = 0) in Abhängigkeit des Zeitunterschieds x ZeitBus ZeitAuto für seinen Arbeitsweg.) i = 1) oder Bus ( y

Klausur zur Vorlesung: Einführung in die Empirische Wirtschaftsforschung. Prof. Bernd Fitzenberger, Ph.D. WS 2010/11. Mittwoch, 16.

P[bk t c se(b k) k bk t c se(b k)] 1 (5.1.3)

6. Modelle mit binären abhängigen Variablen

Kurs 9.3: Forschungsmethoden II

Ökonomische und ökonometrische Evaluation. 1.3 Ökonometrische Grundkonzepte

Grundgedanke der Regressionsanalyse

Übungsklausur zur Vorlesung Wahrscheinlichkeit und Regression Lösungen. Übungsklausur Wahrscheinlichkeit und Regression Die Lösungen

5 Gemischte Verallgemeinerte Lineare Modelle

Lineare Regression (1) - Einführung I -

Empirische Wirtschaftsforschung

Resultate / "states of nature" / mögliche Zustände / möglicheentwicklungen

6. Übung zur Linearen Algebra II

Weitere NP-vollständige Probleme

Mehrfachregression: Einfluss mehrerer Merkmale auf ein metrisches Merkmal. Designmatrix Bestimmtheitsmaß F-Test T-Test für einzelne Regressoren

(Theoretische) Konfidenzintervalle für die beobachteten Werte: Die Standardabweichung des Messfehlers wird Standardmessfehler genannt:

Definition des linearen Korrelationskoeffizienten

Stefanie Licklederer/Ute Schulze Wintersemester 2013/14. Übungsblatt 1 Wachstumsraten, Indizes

X =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode?

Sind die nachfolgenden Aussagen richtig oder falsch? (1 Punkt pro korrekter Beantwortung)

WS 2016/17 Prof. Dr. Horst Peters , Seite 1 von 9

3 Multiple lineare Regression

Probeklausur EW II. Für jede der folgenden Antworten können je 2 Punkte erzielt werden!

Multivariate Analysemethoden

Klausur ÖKONOMETRIE für Bachelor

Analyse von Querschnittsdaten. Bivariate Regression

Grundlagen der Mathematik I Lösungsvorschlag zum 12. Tutoriumsblatt

Beschreibung des Zusammenhangs zweier metrischer Merkmale. Streudiagramme Korrelationskoeffizienten Regression

Elemente der Mathematik - Sommer 2016

Lineare Regression. Stefan Keppeler. 16. Januar Mathematik I für Biologen, Geowissenschaftler und Geoökologen

Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte: Itemschwierigkeit P i

Theoretische Physik II Elektrodynamik Blatt 2

1.1 Beispiele zur linearen Regression

4.2 Zweistufige Methode der Kleinsten Quadrate

Übungen zu Algorithmen

Näherungsverfahren. Wiederhole den Algorithmusbegriff. Erläutere die Begriffe: Klasse der NP-Probleme. Probleme. Probleme. Approximative Algorithmen

Teekonsum in den USA (in 1000 Tonnen), Nimmt den Wert 1 an für alle Perioden, Durchschnittlicher Preis des Tees in Periode t (in Tausend $/Tonne).

Informatik II. Minimalpolynome und Implikanten. Minimalpolynome. Minimalpolynome. Rainer Schrader. 27. Oktober Was bisher geschah: Definition

Zulassungsprüfung Stochastik,

Klausur ÖKONOMETRIE für Bachelor VWL

nonparametrische Tests werden auch verteilungsfreie Tests genannt, da sie keine spezielle Verteilung der Daten in der Population voraussetzen

Klausur zur Vorlesung: Prof. Bernd Fitzenberger, Ph.D. SS 2012 Donnerstag, 31. Juli 2012

Teil XIV. Lösung linearer Gleichungssysteme. Scientific Computing in Computer Science, Technische Universität München

Sei T( x ) die Tangente an den Graphen der Funktion f(x) im Punkt ( x 0, f(x 0 ) ) : T( x ) = f(x 0 ) + f (x 0 ) ( x - x 0 ).

1 Definition und Grundbegriffe

Kaplan- Meier- Schätzer

Rückblick Regression II: Anpassung an Polynome

Wahrscheinlichkeitslimes und Konsistenz eines Schätzers

Stochastische Prozesse

3.3 Lineare Abbildungen und Matrizen

2. Fehlerhafte Auswahl der exogenen Variablen (Verletzung der A1-Annahme)

NSt. Der Wert für: x= +1 liegt, erkennbar an dem zugehörigen Funktionswert, der gesuchten Nullstelle näher.

Übung zur Vorlesung - Theorien Psychometrischer Tests II

Klasse : Name1 : Name 2 : Datum : Nachweis des Hookeschen Gesetzes und Bestimmung der Federkonstanten

Beschreibende Statistik Mittelwert

Kurs Mikroökonometrie Rudolf Winter-Ebmer Thema 3: Binary Choice Models Probit & Logit. Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit

Analysis I. Vorlesung 17. Logarithmen. R R, x exp x,

Free Riding in Joint Audits A Game-Theoretic Analysis

Statistik und Wahrscheinlichkeit

Lösungen der Aufgaben zu Kapitel 2

Teil E: Qualitative abhängige Variable in Regressionsmodellen

Universität Karlsruhe (TH)

Daten sind in Tabellenform gegeben durch die Eingabe von FORMELN können mit diesen Daten automatisierte Berechnungen durchgeführt werden.

Diskrete Mathematik 1 WS 2008/09

Prof. Dr. P. Kischka WS 2012/13 Lehrstuhl für Wirtschafts- und Sozialstatistik. Klausur Statistische Inferenz

Lehrstuhl für Statistik und emp. Wirtschaftsforschung, Prof. R. T. Riphahn, Ph.D. Bachelorprüfung, Praxis der empirischen Wirtschaftsforschung

wird auch Spannweite bzw. Variationsbreite genannt ist definiert als die Differenz zwischen dem größten und kleinsten Messwert einer Verteilung:

Konkave und Konvexe Funktionen

Determinanten - I. den i-ten Zeilenvektor der n n-matrix A bezeichnet.

Kapitel 4: Unsicherheit in der Modellierung Modellierung von Unsicherheit. Machine Learning in der Medizin 104

Funktionsgleichungen folgende Funktionsgleichungen aus der Vorlesung erhält. = e

Standardnormalverteilung / z-transformation

1 Mehrdimensionale Analysis

18. Vorlesung Sommersemester

9 Komplexe Zahlen ( ) ( ) 9.1 Ziele. 9.2 Warum braucht man komplexe Zahlen? 9.3 Darstellung von komplexen Zahlen. r 2. j 2. j 1.

An welche Stichwörter von der letzten Vorlesung können Sie sich noch erinnern?

16. Vorlesung Sommersemester

Netzwerkstrukturen. Entfernung in Kilometer:

Klausur ÖKONOMETRIE für Bachelor VWL

-70- Anhang: -Lineare Regression-

Schriftliche Prüfung aus Systemtechnik am

Die Transzendenz der Eulerschen Zahl e

Übung zur Vorlesung - Theorien Psychometrischer Tests II

-2 Das einfache Regressionsmodell 2.1 Ein ökonomisches Modell

Nachholklausur ÖKONOMETRIE für Bachelor VWL

Fallstudie 4 Qualitätsregelkarten (SPC) und Versuchsplanung

Nullstellen Suchen und Optimierung

Prof. Dr.- Ing. Herzig Vorlesung "Grundlagen der Elektrotechnik 1" 1etv3-4

Nachholklausur ÖKONOMETRIE für Bachelor VWL

Lineare Regression - Mathematische Grundlagen

Transkript:

Prof. Bernd Ftzenberger, Ph.D. Ute Leuschner Anthony Strttmatter Übung zur Veranstaltung Emprsche Wrtschaftsforschung Albert-Ludwgs-Unverstät Freburg Wntersemester 2009/10 Übungsblatt 8: Spezfkatons- und andere Fragen rund um das lneare Regressonsmodell 1. Parttonerte Regresson Betrachten Se das folgende Regressonsmodell: Y = 1X1 + 2X 2 + u, wobe alle Varablen enen Mttelwert von null haben. a) Geben Se de KQ-Schätzer für deses Modell an. b) En Kommltone behauptet, dass man den Koeffzenten 1 auch durch folgendes zwestufges Verfahren berechnen kann: Schrtt 1: Schätze das Modell X 1 = X 2 +. Schrtt 2: Regressere Y auf de Resduen aus Schrtt 1: entsprcht dann 1. Y = ˆ. Der Koeffzent + Überprüfen Se sene Aussage. 2. Mncersche Verdenstfunkton für Berufsensteger Ihnen legt en Datensatz mt dem Enstegsgehalt und der Ausbldungsdauer von Berufsanfängern vor. Damt möchten Se folgendes Modell schätzen: ln Y = 1 + 2S + u, (1) wobe Y den monatlchen Bruttoverdenst und S de Ausbldungsdauer n Jahren bezechnet. a) En n der Lteratur häufg vorgebrachter Enwand st, dass der Verdenst und de gewählte Schulbldung auch vom ncht beobachtbaren Talent (Englsch: ablty) ener Person abhängen. In desem Fall wäre ene Spezfkaton, de nur de Ausbldungsdauer berückschtgt, unvollständg. Zegen Se, we sch der aus Modell (1) geschätzte Koeffzent der Ausbldungsdauer von dem m wahren Modell, n dem auch das Talent lnear engeht, unterschedet. b) In welche Rchtung st der auf Bass von Modell (1) geschätzte Koeffzent der Ausbldungsdauer verzerrt? Erläutern Se de Konsequenzen unter folgenden Annahmen: () Talentertere Indvduen wählen en höheres Ausbldungsnveau, da hnen das Lernen lechter fällt. () Es wählen dejengen en höheres Ausbldungsnveau, de wenger Talent haben auf andere Wese enen hohen Verdenst zu erzelen. 1

Hnwes: Gehen Se davon aus, dass ene talentertere Person ceters parbus mehr verdent als ene wenger talenterte Person. c) Se überlegen ene Instrumentvarablen Schätzung durchzuführen. In Ihrem Datensatz stehen Ihnen außerdem noch folgende Varablen zur Verfügung: (1) IQ, (2) Dummyvarable, de ens st, wenn de Person n ener Unverstätsstadt aufgewachsen st, (3) Dummyvarable, de ens st, wenn der/de Personalmanagern en anderes Geschlecht hat als der/de Berufsanfänger/n, (4) Ausbldungsdauer der Mutter, (5) Bruttomonatsverdenst des Vaters und (6) Geburtsmonat. Welche davon würden sch als Instrument für de Ausbldungsdauer egnen und welche eher ncht? Begründen Se Ihre Antwort. d) Krtker der Mncerschen Verdenstfunkton führen zudem an, dass der Verdenst ncht so sehr von der Anzahl n Ausbldung verbrachter Jahre, sondern velmehr vom errechten Abschluss abhängt. Welche Annahmen stecken mplzt n ener Spezfkaton, n der de Ausbldungsdauer n Jahren lnear engeht? Welche Möglchketen gbt es dese Annahmen zu lockern und anhand von Hypothesentests zu überprüfen? 3. Zusammenhang zwschen Knderzahl, Ausbldung und Alter Mt enem Datensatz, der de Angaben von 4361 Frauen enthält, st der Zusammenhang zwschen der Anzahl der Knder, der Ausbldungsdauer n Jahren und dem Alter untersucht worden. Am Ende des Übungsblatts fnden Se den TSP-Output der Analyse. Kommenteren und nterpreteren Se hn. Hnwes: De Varable frsthalf st ens, wenn de Frau n den Monaten Januar bs Jun geboren wurde und null sonst. 4. Messfehler n den Varablen Betrachten Se das folgende Regressonsmodell: Y = u. 1 + 2X + a) We wrkt sch en Messfehler aus, be dem de zu erklärende Varable mmer um enen festen Betrag zu hoch gemessen wrd? b) We wrkt sch en Messfehler n der erklärenden Varable aus, der zufällg um den wahren Wert schwankt? c) Gehen Se nun davon aus, dass X ene fehlerhaft gemessene Dummyvarable st. Ist de Annahme, dass der Messfehler zufällg um den wahren Wert streut haltbar? 2

5. Zusatzaufgabe Nehmen Se an Se schätzen das Regressonsmodell Y = 1 2X1 + 3X 2 + u mt TSP. Dabe stellen Se fest, dass bede Stegungskoeffzenten ncht sgnfkant von null verscheden snd, obwohl das R 2 recht hoch st. a) Welches Problem legt her möglcherwese vor? We würden Se Ihre Vermutung überprüfen? b) Ist ene Schätzung, n der deses Problem vorlegt, noch zu gebrauchen? TSP-Output zu Aufgabe 3 PROGRAM COMMAND *************************************************************** 1? 1?Fertltaet 1? 1 1 optons crt ; 2 2?Daten enlesen 2 freq n ; 3 3 read(fle='fertl.raw') chldren educ age agesq frsthalf ; 4 matrx fullsmpl=@smpl ; 5 5?Daten ueberpruefen 5?smpl 1 10 ; 5?prnt chldren educ age agesq frsthalf ; 5 5 smpl fullsmpl ; 6 msd(terse,byvar) chldren educ age agesq frsthalf ; 7 7?Analyse 7 ols chldren c educ age agesq ; 8 8 msd(terse,corr) educ age frsthalf ; 9 9 ols educ c age agesq frsthalf ; 10 10 genr ueduc=@res ; 11 11 ols(robust) chldren c educ age agesq ueduc ; 12 12 2sls( nst=(c age agesq frsthalf) ) chldren c educ age agesq ; 13 13 end; EXECUTION *************************************************************************** 3

Unvarate statstcs ========= Number of Observatons: 4361 Num.Obs Mean Std Dev Mnmum Maxmum CHILDREN 4361.00000 2.26783 2.22203 0.00000 13.00000 EDUC 4361.00000 5.85600 3.92708 0.00000 20.00000 AGE 4361.00000 27.40518 8.68523 15.00000 49.00000 AGESQ 4361.00000 826.45999 526.92319 225.00000 2401.00000 FRSTHALF 4361.00000 0.54047 0.49842 0.00000 1.00000 Equaton 1 Method of estmaton = Ordnary Least Squares Dependent varable: CHILDREN Number of observatons: 4361 Mean of dep. var. = 2.26783 LM het. test = 1108.41 [.000] Std. dev. of dep. var. = 2.22203 Durbn-Watson = 1.86823 [<.000] Sum of squared resduals = 9284.15 Jarque-Bera test = 715.951 [.000] Varance of resduals = 2.13086 Ramsey's RESET2 = 68.2000 [.000] Std. error of regresson = 1.45975 F (zero slopes) = 1915.20 [.000] R-squared =.568724 Schwarz B.I.C. = 7852.35 Adjusted R-squared =.568427 Log lkelhood = -7835.59 Estmated Standard Varable Coeffcent Error t-statstc P-value C -4.13831.240594-17.2004 [.000] EDUC -.090575.592069E-02-15.2981 [.000] AGE.332449.016549 20.0882 [.000] AGESQ -.263082E-02.272592E-03-9.65113 [.000] Number of Observatons: 4361 Results of Covarance procedure ======= Mean Std Dev Mnmum Maxmum EDUC 5.85600 3.92708 0.00000 20.00000 AGE 27.40518 8.68523 15.00000 49.00000 FRSTHALF 0.54047 0.49842 0.00000 1.00000 Correlaton Matrx EDUC AGE FRSTHALF EDUC 1.00000 AGE -0.30960 1.00000 FRSTHALF -0.11901 0.035392 1.00000 4

Equaton 2 Method of estmaton = Ordnary Least Squares Dependent varable: EDUC Number of observatons: 4361 Mean of dep. var. = 5.85600 LM het. test = 120.258 [.000] Std. dev. of dep. var. = 3.92708 Durbn-Watson = 1.35176 [<.000] Sum of squared resduals = 60001.1 Jarque-Bera test = 56.5549 [.000] Varance of resduals = 13.7712 Ramsey's RESET2 = 2.34052 [.126] Std. error of regresson = 3.71096 F (zero slopes) = 175.207 [.000] R-squared =.107651 Schwarz B.I.C. = 11921.3 Adjusted R-squared =.107037 Log lkelhood = -11904.5 Estmated Standard Varable Coeffcent Error t-statstc P-value C 9.69286.598069 16.2069 [.000] AGE -.107950.042040-2.56779 [.010] AGESQ -.505567E-03.692940E-03 -.729597 [.466] FRSTHALF -.852285.112830-7.55374 [.000] Equaton 3 Method of estmaton = Ordnary Least Squares Dependent varable: CHILDREN Number of observatons: 4361 Mean of dep. var. = 2.26783 LM het. test = 1108.40 [.000] Std. dev. of dep. var. = 2.22203 Durbn-Watson = 1.86915 [<.000] Sum of squared resduals = 9278.93 Jarque-Bera test = 722.129 [.000] Varance of resduals = 2.13015 Ramsey's RESET2 = 70.3546 [.000] Std. error of regresson = 1.45950 F (zero slopes) = 1437.49 [.000] R-squared =.568967 Schwarz B.I.C. = 7855.32 Adjusted R-squared =.568571 Log lkelhood = -7834.37 Estmated Standard Varable Coeffcent Error t-statstc P-value C -3.38781.536618-6.31325 [.000] EDUC -.171499.051392-3.33706 [.001] AGE.323605.020130 16.0755 [.000] AGESQ -.267228E-02.351944E-03-7.59289 [.000] UEDUC.081983.051609 1.58855 [.112] Standard Errors are heteroskedastc-consstent (HCTYPE=2). Dependent varable: CHILDREN Endogenous varables: EDUC Included exogenous varables: C AGE AGESQ Excluded exogenous varables: FRSTHALF Equaton 4 Method of estmaton = Instrumental Varable 5

Number of observatons: 4361 Mean of dep. var. = 2.26783 R-squared =.552676 Std. dev. of dep. var. = 2.22203 Adjusted R-squared =.552368 Sum of squared resduals = 9682.22 Durbn-Watson = 1.87482 [<.000] Varance of resduals = 2.22222 F (zero slopes) = 1765.12 [.000] Std. error of regresson = 1.49071 E'PZ*E = 0. Estmated Standard Varable Coeffcent Error t-statstc P-value C -3.38781.548150-6.18043 [.000] EDUC -.171499.053180-3.22490 [.001] AGE.323605.017860 18.1194 [.000] AGESQ -.267228E-02.279687E-03-9.55451 [.000] *************************************************************************** END OF OUTPUT. 6