1. Lösungen zu Kapitel 5

Ähnliche Dokumente
Kurs Empirische Wirtschaftsforschung

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell

1. Lösungen zu Kapitel 7

Übung V Lineares Regressionsmodell

1. Lösungen zu Kapitel 6

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

V. Das lineare Regressionsmodell

1 Beispiel zur Methode der kleinsten Quadrate

Die Stochastischen Eigenschaften von OLS

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

Empirische Wirtschaftsforschung

Teekonsum in den USA (in 1000 Tonnen), Nimmt den Wert 1 an für alle Perioden, Durchschnittlicher Preis des Tees in Periode t (in Tausend $/Tonne).

Prof. Dr. Marc Gürtler WS 2015/2016. Prof. Dr. Marc Gürtler. Klausur zur 10/12 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

Inferenz im multiplen Regressionsmodell

x t2 y t = 160, y = 8, y y = 3400 t=1

Statistik II. IV. Hypothesentests. Martin Huber

Proxies, Endogenität, Instrumentvariablenschätzung

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.

Schätzung im multiplen linearen Modell VI

Bivariate Zusammenhänge

Multivariate Verfahren

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 27

Instrument zur Untersuchung eines linearen Zusammenhangs zwischen zwei (oder mehr) Merkmalen.

2. Fehlerhafte Auswahl der exogenen Variablen (Verletzung der A1-Annahme)

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Das lineare Regressionsmodell

Seminar zur Energiewirtschaft:

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

2.5 Lineare Regressionsmodelle

D-CHAB Frühlingssemester 2017 T =

Vorlesung: Statistik II für Wirtschaftswissenschaft

Regression und Korrelation

Lineare Regression mit einem Regressor: Einführung

Klausur zu Statistik II

Analyse von Querschnittsdaten. Signifikanztests I Basics

Statistik II Übung 2: Multivariate lineare Regression

Bachelorprüfung SS 2014

I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03

Musterlösung. Modulklausur Multivariate Verfahren

1. Lösungen zu Kapitel 8

Das Lineare Regressionsmodell

Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen. Statistik II. Prof. Dr.

Statistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik II Übung 2: Multivariate lineare Regression

Statistik II. Regressionsanalyse. Statistik II

Prof. Regina T. Riphahn, Ph.D. WS 04/05 Abschlussklausur zur Veranstaltung "Einführung in die Ökonometrie" am 24. Februar 2005,

Lineare Modelle in R: Klassische lineare Regression

Zusammenfassung: Einfache lineare Regression I

X =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode?

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20

Statistik II Übung 1: Einfache lineare Regression

Quantitative Methoden der Agrarmarktanalyse und des Agribusiness

Bachelorprüfung WS 2013/14

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II

Goethe-Universität Frankfurt

Statistik II für Betriebswirte Vorlesung 8

Bachelorprüfung SS MUSTERLÖSUNG

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

Bachelorprüfung SS 2015

Teil XII. Einfache Lineare Regression. Woche 10: Lineare Regression. Lernziele. Zusammenfassung. Patric Müller

2. Stochastische ökonometrische Modelle. - Modelle der ökonomischen Theorie an der Wirklichkeit überprüfen

2 Anwendungen und Probleme

Statistischer Rückschluss und Testen von Hypothesen

Statistik II Übung 2: Multivariate lineare Regression

= 2 ( 3250,3 ( 3251,5)) = 1,1662 F(2,800) = 2,4 χ2

3. Das einfache lineare Regressionsmodell

Aufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten:

Analyse von Querschnittsdaten. Signifikanztests I Basics

Statistik II. Statistische Tests. Statistik II

Datenanalyse mit Excel und Gretl

EGRESSIONSANALYSE AVID BUCHATZ NIVERSITÄT ZU KÖLN

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief

Aufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie WS 2017/18. ( = 58 Punkte)

Zusammenfassung 11. Sara dos Reis.

Tests einzelner linearer Hypothesen I

Econometrics Übung 1. CLRM & Verletzung der Unabhängigkeitsannahme

Wichtige Definitionen und Aussagen

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38

Bachelorprüfung SS MUSTERLÖSUNG

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Lehrstuhl für Statistik und emp. Wirtschaftsforschung, Prof. R. T. Riphahn, Ph.D. Bachelorprüfung, Praxis der empirischen Wirtschaftsforschung

Vorlesung: Lineare Modelle

0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1

Annahmen des linearen Modells

Statistik. R. Frühwirth. Statistik. VO Februar R. Frühwirth Statistik 1/536

Einführung in die Methoden der Empirischen Wirtschaftsforschung

Statistik II Übung 1: Einfache lineare Regression

Bachelorprüfung WS 2015/2016

11. Übungsblatt zur Vorlesung Ökonometrie SS 2014

Lineare Regression (Ein bisschen) Theorie

Test von Hypothesen: Signifikanz des Zusammenhangs (F-Test)

Transkript:

. Lösungen zu Kapitel 5 Übungsaufgabe 5. a) Falsch! Die Varianz des geschätzten Koeffizienten ˆβ berechnet sich folgendermaßen: ) b) Falsch! Var(β ˆ ) = ˆσ2 ˆσ X 2 = = ( ˆεt 2 (K+) X 2 t X 2 5 5 2 0 8 = 5 2 = 2.5 Ist E[ε t ε s ] = 0, so sind die Störterme korreliert (z.b. Autokorrelation bei Zeitreihendaten). Die geschätzten Koeffizienten sind weiterhin unverzerrt, jedoch sind die Standardfehler inkonsistent. c) Falsch! ˆβ = XY Y X X 2 X 2 = 8 5 3 3 2 = 3 2 =.5 d) Falsch! ˆβ 0 = Y ˆβ X = 5.5 3 = 0.5 Die Formel für die Varianz des Schätzers ˆβ verdeutlicht den Zusammenhang zwischen der Präzision der Schätzung und der Variation in X: ˆσ 2ˆβ = ˆσ 2 (X i X) 2.

2 Solutions Die Präzision des geschätzten ˆβ ist folglich umso höher, je geringer die Varianz des Störterms und je größer die Variation der exogenen Variablen X ist. e) Falsch! Aus den zwei OLS-Annahmen, dass X i nicht stochastisch ist und dass der Erwartungswert der Störterme gleich ull ist ergibt sich: E(X t ε t ) = X t E(ε t ) = X t 0 = 0. Übungsaufgabe 5.2 Aus den beiden ormalgleichungen (5.6) und (5.7), die hier zur Wiederholung noch einmal aufgeführt sind 2 (Y i ˆβ 0 ˆβ X i ) = 0 (.) 2 (Y i ˆβ 0 ˆβ X i )X i = 0, (.2) erhält man durch folgende Umformungen die Schätzformeln (5.8) und (5.9) (bzw. (5.0)),. ˆβ 0 = Y ˆβ X YX Y X ˆβ = Xi 2 X2 und Auf- Aus Gleichung (.) ergibt sich durch Multiplikation mit spalten der Summe 2 Y i ˆβ 0 ˆβ X i = 0. (.3) Da ˆβ 0 und ˆβ Konstanten sind, entspricht dies bzw. nach ˆβ 0 aufgelöst Y i ˆβ 0 ˆβ X i = Y ˆβ 0 ˆβ X = 0, (.4) ˆβ 0 = Y ˆβ X = 0. (.5)

Solutions 3 Dies bedeutet, dass der Schätzer ˆβ 0 vom Schätzer ˆβ abhängt. Gleichung (.5) legt nahe, zuerst einen Schätzwert für ˆβ zu ermitteln, um dann auf Basis von (.5) den Schätzwert für ˆβ 0 zu errechnen. Aus Gleichung (.2) ergibt sich wiederum durch Multiplikation mit 2 und Aufspalten der Summe Y i X i ˆβ 0 X i ˆβ Xi 2 = 0. (.6) Da ˆβ 0 und ˆβ Konstanten sind und für ˆβ 0 Gleichung (.5) gilt, ergibt sich Y i X i Y i X i Y (Y ˆβ X)X i ˆβ X i + ˆβ X Xi 2 = X i ˆβ Xi 2 = YX Y X + ˆβ X 2 ˆβ X 2 = 0. (.7) bzw. Löst man diese Gleichung nach ˆβ auf, erhält man ˆβ (X 2 X 2) = YX Y X (.8) YX Y X ˆβ =. (.9) X2 X 2 i Mit dieser Gleichung könnte man bereits arbeiten, denn sie enthält nur beobachtbare Werte und Konstanten. Sie lässt sich aber noch etwas vereinfachen und in eine übersichtlichere Schreibweise bringen. Hierzu vergegenwärtige man sich, dass für die geschätzte Kovarianz von Y und X gilt ˆσ XY = = = = (Y i Y)(X i X) Y i X i YX i XY i + Y i X i Y X X Y +X Y Y i X i Y X X Y = YX Y X. (.0)

4 Solutions Gleichung (.0) entspricht dem Zähler von ˆβ in Gleichung (.9). Die geschätzte Kovarianz von X mit sich selbst entspricht natürlich der geschätzten Varianz von X. Für diese gilt dann analog zu Gleichung (.0) ˆσ XX = X i X i X X = Xi 2 X X = X 2 i X2 = ˆσ 2 X. (.) Gleichung (.) entspricht dem enner von ˆβ in Gleichung (5.50). Der Schätzer für ˆβ kann daher auch als ˆβ = (X i X)(Y i Y) (X i X) 2 = ˆσ XY ˆσ 2 X (.2) geschrieben werden. Die Tatsache, dass in diesen Herleitungen statt zur ormierung benutzt wurde, schränkt die Gültigkeit in keiner Weise ein, denn dieser ormierungsfaktor kürzt sich in der Schätzformel für ˆβ ohnehin heraus. Häufig findet man als Formel für den Schätzer ˆβ auch die Gleichungen ˆβ = (X i X)Y i (X i X) 2 (.3) bzw. ˆβ = (Y i Y)X i (X i X) 2 (.4) Diese Gleichung erhält man, indem man den Zähler von Gleichung (.2) entsprechend auflöst. Dies sei für Gleichung (.4) exemplarisch dargestellt. Löst man die Summe im Zähler von Gleichung (.2) auf und verwendet man, dass Y = Y i bzw. dass Y i = Y, erhält man den Zähler von Gleichung (.4):

Solutions 5 (X i X)(Y i Y) = Y i X i YX i XY i + X Y = Y i X i YX i X Y i + X Y = Y i X i YX i XY +X Y = Y i X i YX i = Y i X i YX i = (Y i Y)X i. Übungsaufgabe 5.3 Der OLS-Schätzer ergibt sich aus der Minimierung der Summe der quadratischen Residuen, i.e.: min ˆβ 0 ˆε 2 i = (Y i ˆβ 0 ) 2. Durch Ableitung nach ˆβ 0 gelangt man zur Bedingung erster Ordnung: (ˆε2 i ) ˆβ 0 Durch Multiplikation mit 2 = 2 (Y i ˆβ 0 ) = ˆβ 0 = (Y i ˆβ 0 ) = 0. erhält man: Y i ˆβ 0 = 0 Y i = Y Der geschätzte Koeffizient ˆβ 0 in dem Regressionsmodell Y = β 0 +ε entspricht foglich dem Stichprobenmittel. Übungsaufgabe 5.4 Ein Schätzer ist unverzerrt, wenn der Erwartungswert des Schätzers dem tatsächlichen Wert in der Population entspricht. Es muss gelten E(ˆβ) = β.

6 Solutions E(ˆβ) = E[(X X) X Y ] = E[(X X) X (Xβ +ε)] = E[(X X) X Xβ]+E[(X X) X ε] }{{} =I = E[β]+E[(X X) X ε] = β +E[(X X) X }{{} ε] =0 = β. Übungsaufgabe 5.5 Die Erwartungswertbildung von E(X ˆε) im multivariaten Regressionsmodell findet analog zum bivariaten Modell statt: E(X ˆε) = X E(ˆε) = 0. }{{} =0 Da die erklärende Variable X nicht stochastisch ist, kann diese Umformung vorgenommen werden. Sind X und ˆε unkorreliert, so wird X als exogene erklärende Variable bezeichnet. Übungsaufgabe 5.6 Eine Koeffizient kann statistisch signifikant sein und dennoch ökonomisch insignifikant. Ein Beispiel ist der Einfluss der Schulausbildung auf die Löhne. Dieser kann zwar statistisch signifikant sein, dennoch aber so gering, dass er ökonomisch nicht von großer Bedeutung ist. Führen z.b. 20 Schuljahre zu einer Erhöhung der Löhne um eine Einheit, so ist dieser Effekt zu vernachlässigen. Übungsaufgabe 5.7 Das BestimmtheitsmaßR 2 ist definiert als der Anteil der vom Modell erklärten Variation an der gesamten Variation in Y i, d.h. R 2 = RSS TSS = ESS TSS, wobei TSS (Total Sum of Squares) die gesamte Variation in der abhängigen Variablen Y i, RSS(Regression Sum of Squares) die vom Modell erklärte Variation in Y i und ESS die Error Sum of Squares, also die verbleibende, nicht

Solutions 7 vom Modell erklärte Variation der abhängigen Variablen ist. Am besten lässt sich der Einfluss eines weiteren Regressors über folgende Dekomposition betrachten: (Y i Y) 2 = (Y i ˆY i ) 2 + (ˆY i Y) 2. } {{ } TSS } {{ } ESS } {{ } RSS Die Hinzunahme eines weiteren Regressors führt nie dazu, dass RSS, sprich die vom Modell erklärte Variation der abhängigen Variablen, sinkt. Somit wird auch das R 2 durch Hinzunahme eines Regressors nicht sinken - unabhängig davon ob er einen Erklärungsbeitrag zu dem Model liefert oder nicht. Da ESS durch die zusätzliche erklärende Variable sinken kann, ist es sogar möglich, dass das R 2 steigt. Übungsaufgabe 5.8 a) Zunächst wird getestet, ob die Koeffizienten statistisch signifikant verschieden von ull sind. Die Hypothesen werden mit Hilfe des t-tests überprüft. Die t-statistiken lauten: t = 2,894 0 3,77 = 4,059 t 04 2 t =,397 0 0,229 = 6,00 t 04 2. In beiden Fällen kann die ullhypothese H 0 : β n = 0 bzw. H 0 : β K = 0 verworfen werden, da die t-statistik größer als der kritische Wert der t- Verteilung ist (,984 bei einer 5% Irrtumswahrscheinlichkeit). Die Schätzung ergibt einen negativen Effekt des Bevölkerungswachstums auf das Bruttoinlandsprodukt pro Kopf und einen positiven Einfluss der Sparrate auf das BIP pro Kopf. Steigt die durchschnittliche Rate des Bevölkerungswachstums um eine Einheit, so sinkt das BIP pro Kopf um 2,894 Einheiten. Steigt der durchschnittliche Anteil der Investitionen am BIP von 960 bis 990 um eine Einheit, steigt auch das BIP um,379 Einheiten. Während der positive Effekt der Sparrate den Erwartungen bzw. den Vorhersagen des neoklassischen Wachstumsmodells entspricht, ist der negative Effekt der Wachstumsrate der Bevölkerung überraschend. In der neoklassischen Wachstumstheorie erhöht sich durch Bevölkerungswachstum das Angebot an Arbeitskräften und somit die gesamtwirtschaftliche Produktion.

8 Solutions b) Die Variable durchschnittliche Ausbildung in Jahren für 985 hat einen positiven und signifikanten Einfluss auf das Bruttoinlandsprodukt. Steigt die durchschnittliche Ausbildung der Bevölkerung um ein Jahr, erhöht sich das BIP um 0,055 Einheiten. Durch Hinzunahme dieser Variablen wird der Koeffizient der Wachstumsrate der Bevölkerung mehr als halbiert. Auch der positive Effekt der Sparrate verringert sich. Der Koeffizient ist zwar weiterhin auf dem 95%- iveau signifikant, jedoch nicht mehr dem 99%-Signifikanzlevel. Das R 2 des geschätzten Models steigt von 0,62 auf 0,775, sprich der Anteil der erklärten Varianz steigt um 5,4 Prozentpunkte. Eine mögliche Erklärung für dieses Ergebnis könnte sein, dass ein hohes Bevölkerungswachstum die durchschnittliche Ausbildung in Jahren pro Person reduziert hat, da die Bildungsinstitutionen überlastet sind. c) Setzt man die Werte für Brasilien in die geschätzte Regression ein, so ergibt sich ein BIP pro Kopf von 0,24. Das BIP wird für Brasilien folglich unterschätzt. Eine Verdopplung der Ausgaben würde zu einem geschätzten BIP von 0,43 führen. Übungsaufgabe 5.9 a) Die Schätzergebnisse besagen, dass ein Student ohne Lernen im Durchschnitt25,87 Punkte in der Klausur erreichen würde (β 0 ). Jede zusätzliche Stunde erhöht die Punktzahl im Schnitt um 3,45 Punkte (β ). b) Die Teststatistik für den Test, ob der Lernaufwand einen signifikanten Effekt auf das Klausurergebnis hat (H 0 : β = 0, H : β = 0), lautet: t = 3,45 0 0,52 = 6,622. Bei einem Signifikanzniveau von 95% (99%) beträgt der kritische t-wert bei 28 Freiheitsgraden ( (K+)), 70 (2, 763). Da unsere Teststatistik größer als der kritische Wert ist, können wir mit einer Irrtumswahrscheinlichkeit von 5% (%) die ullhypothese, dass Lernen das Testergebnis nicht beeinflusst, verwerfen. c) Die t-statistik für die ullhypothese, dass das durchschnittliche Klausurergebnis der Studenten in Wirklichkeit größer ist (H 0 : β 0 = 50), gegen die Alternativhypothese H : β 0 = 50 sieht folgendermaßen aus: t = 25,87 50 6,96 = 3,894. Da die Teststatistik größer als der kritische Wert der t-verteilung ist (3, 894 > 2, 763) kann die ullhypothese mit einer Irrtumswahrscheinlichkeit von % verworfen werden, β 0 ist folglich signifikant von 50 verschieden.

Solutions 9 d) Die erwartete Anzahl von Punkten in der Klausur für einen Lernaufwand von 9,5 Stunden beträgt: E(Y X = 9,5) = 25,87+3,45 9,5 = 58,645. e) Das R 2 beträgt 0,5. Dies bedeutet, dass 5% der Variation der Klausurergebnisse durch den Lernaufwand der Studenten in Stunden erklärt werden können. Übungsaufgabe 5.0 a) Die Schätzergebnisse besagen, dass sich die Größe eines Studenten für jeden cm, den die Eltern im Durchschnitt größer sind, um 0,73 cm erhöht. Die Konstante hat keine Interpretation. b) (i) Wenn man erwarten würde, dass Kinder im Durchschnitt die gleiche Größe hätten wie ihre Eltern, dann wäre die ullhypothese für den Achsenabschnitt, dass die Konstante gleich ull ist (H 0 : β 0 = 0). Die Alternativhypothese ist H : β 0 = 0. Die Teststatistik sieht folgendermaßen aus: t = 49,9 0 7,2 = 6,93. Die Teststatistik überschreitet den kritischen t-wert (t = 2,579) und die ullhypothese, dass die Konstante gleich ull, ist kann mit einer Irrtumswahrscheinlichkeit von % verworfen werden. (ii) Die ullhypothese für den Steigungskoeffizienten lautet H 0 : β =. Man erwartet, dass wenn die Eltern im Schnitt einen cm größer sind, auch die Kinder einen cm größer sind. Dies wird gegen die Alternativhypothese H : β = getestet. t = 0,73 0,0 = 2,7 Bei einem Signifikanzniveau von 95% ist der kritische t-wert bei 498 Freiheitsgraden t =,960. Die ullhypothese, dass Kinder im Durchschnitt die gleiche Größe haben wie ihre Eltern, kann mit einer Irrtumswahrscheinlichkeit von 5% abgelehnt werden. c) Die vorhergesagte Größe für ein Kind, dessen Eltern eine durchschnittliche Größe von 70 cm haben, beträgt 74 cm. Student = 49,9+0,73 70 = 74 d) Der Steigungskoeffizient gibt an, wie sehr die Größe der Eltern die Größe der Kinder beeinflusst. Je größer der Absolutwert des Steigungskoeffizienten ist, desto stärker ist der Einfluss.

0 Solutions Die geschätzte Gleichung besagt, dass bei einer durchschnittlichen Größe der Eltern von 84,8 cm, Eltern und Kinder gleich groß sind (Student = Eltern). Bis zu dieser Größe sind die Kinder im Schnitt größer als ihre Eltern und ab diesem Punkt sind die Kinder im Schnitt kleiner. Diese bedeutet, dass Kinder die relativ große Eltern haben, im Schnitt kleiner sind als ihre Eltern und Kinder mit relativ kleinen Eltern im Schnitt größer sind als ihre Eltern. Große Eltern werden dennoch im Durchschnitt große Kinder haben (wenn diese auch nicht so groß sein werden wie ihre Eltern) und kleine Eltern werden im Durchschnitt kleine Kinder haben (wobei diese größer sein werden als ihre Eltern). Übungsaufgabe 5. a) min β ˆε 2 i = [Y i ( ˆβ X i )] 2 ˆε2 i ˆβ = 2 (Y i ˆβ X i )X i = 0 Durch Multiplikation mit ( 2 ) erhält man: Y i X i ˆβ X i X i = 0 ˆβ = Y ix i X ix i. b) Ist die Varianz des Störterms konstant, so spricht man von Homoskedastizität. Variiert des Störmerms mit der Höhe der Variablen X i, liegt Heteroskedastizität vor. c) Im Falle von Heteroskedastizität ist eine der fünf klassischen Annahmen des bivariaten linearen Regressionsmodells verletzt. Die Kleinst-Quadrate- Methode würde in diesem Fall nicht zu effizienten Schätzern führen. d) E(Y i X i = 2) = E(0,5 2+ε i ) = E()+E(ε i ) = +E(ε i ) = e) ˆσ 2 = ˆε2 i 2 ist ein erwartungstreuer Schätzer für σ 2 Die quadrierten Residuen berechnen sich als ˆε i = y i ˆy i = y i ˆβ x i (.5) = β x i +η i ˆβ x i = (β ˆβ )x i +η i.

Solutions Quadriert man Gleichung (.6), erhält man ˆε 2 i = (β ˆβ ) 2 x 2 i +ηi 2 +2(β ˆβ )x i η i (.6) = (ˆβ β ) 2 x 2 i +ηi 2 2(ˆβ β )x i η i. Aufsummieren über alle Beobachtungen ergibt ε 2 i = (ˆβ β ) 2 x 2 i + ηi 2 2(ˆβ β ) x i η i. (.7) Gleichung (.7) ausgedrückt in Erwartungen lautet [ ] [ E = E [(ˆβ β ) 2] x 2 i +E ˆε 2 i [ ] 2E (ˆβ β ) x i η i. (.8) η 2 i ] Hierbei gilt [ E (ˆβ β ) 2] σ 2 = Var(ˆβ ) = x2 i (.9) und (vgl. Kapitel 2) E sowie [ ] [ ] = E (ε i ε) 2 = σ 2 ( ) (.20) ηi 2 (ˆβ β ) = = x iy i β x2 i x i(β x i +η i ) x2 i β = β x2 i x2 i + x iη i β x2 i = x iη i x2 i bzw. x i η i = (ˆβ β ) x 2 i. (.2)

2 Solutions Setzt man die Gleichungen (.9) - (.2) in Gleichung (.8) ein, erhält man [ ] [ ] E ˆε 2 σ 2 i = x 2 x2 i +σ 2 ( ) 2E (ˆβ β )(ˆβ β ) x 2 i i [ ] = σ 2 +σ 2 ( ) 2E (ˆβ β ) 2 = σ 2 +σ 2 ( ) 2 = σ 2 +σ 2 ( ) 2σ 2 = σ 2 +σ 2 ( ) x 2 i x 2 i E [(ˆβ β ) 2] }{{} Var(ˆβ )= σ2 x 2 i = σ 2 ( 2). (.22) f) Angenommen der Erwartungswert der Störgröße sei nicht ull, sondern würde den Wert einer Konstanten k annehmen (E(ε i ) = k ). In diesem Fall lässt sich das Modell so transformieren, dass E(ε i ) = 0 wieder gilt. Y i = β 0 +β X i +ε i = β 0 +k+β }{{} X i +ε i k }{{} β0 β0 = β0 +β X i +ε i. Lediglich der Achsenabschnitt β 0 nicht aber der Steigungskoeffizient β wäre betroffen. Die Annahme, dass der Erwartungswert der Störterme ε i ull ist besagt, dass die Störgröße keinen systematischen Beitrag zur Erklärung der abhängigen Variablen besitzt. Wichtig ist, dass der Erwartungswert existiert und konstant ist. Die Annahme, dass der Erwartungswert ull ist, ist lediglich eine Möglichkeit. Übungsaufgabe 5.2 a) Eine mögliche kontrafaktische Fragestellung des Modells ist, wie die Brutto-Jahreslöhne mit einem Jahr mehr oder weniger Ausbildung bei gegebenem Alter variieren. Andersherum könnte man fragen, was für einen Effekt eine gegebene Anzahl von Ausbildungsjahren in verschiedenen Altersstufen hat. b) Von statistischer Signifikanz spricht man, wenn die Wahrscheinlichkeit, dass eine Variable einen bestimmten Wert nur durch Zufall annimmt, gering ist. Als Wahrscheinlichkeitsgrenze werden zumeist %, 5% oder 0% verwendet.

Solutions 3 c) Um Signifikanz zu testen, braucht man eine Vermutung darüber, wie groß der Koeffizient tatsächlich ist. Es wird fast immer getestet, ob der Koeffizient signifikant verschieden von ull ist. Das heißt man testet bei gegebener Irrtumswahrscheinlichkeit, ob der geschätzte (in diesem Falle positive) Einfluss nur Zufall ist. Die Teststatistiken für einen zweiseitigen Test der jeweiligen Koeffizienten lauten: t = 0,06 0,007 = 8,57 t = 0,07 0,009 = 7,778 In beiden Fällen ist die Teststatistik größer als der kritische t-wert (t 2764 =,96) bei einem Signifikanzniveau von 95%. Die Wahrscheinlichkeit, die geschätzten Koeffizienten zu erhalten, obwohl der tatsächliche Wert ull ist, ist unter 5%. Dies bedeutet, dass man sich mit einer 5% Wahrscheinlichkeit irrt, wenn man die ullhypothese dass der wahre Koeffizient gleich ull ist, verwirft. d) Das Bestimmtheitsmaß R 2 misst den Anteil der durch das Modell erklärten Variation an der gesamten Variation in Y. Im vorliegenden Modell lassen sich 20% der Variation in den logarithmierten Brutto-Jahreslöhnen durch Unterschiede in der Ausbildungsdauer und Unterschiede im Alter der Individuen erklären. e) ln(w i ) = 6,5+0,06 8+0,07 30 = 9,68 w i = exp(ln(w i )) = exp(9,68) = 5.994,50 Laut Model würde man für eine 30-jährige Person mit 8 Jahren Schulausbildung einen Brutto-Jahreslohn von 5.994,50, schätzen. f) Die Homoskedastizitätsannahme besagt, dass der Erwartungswert des Störterms für alle Beobachtungseinheiten konstant ist. Sie wäre in dem vorliegenden Modell verletzt, wenn die Varianz von der Länge der Schulausbildung oder vom Alter abhängen würde. Wenn z.b. die Varianz der Löhne für ältere Menschen viel größer wäre, läge Heteroskedastizität vor. g) Unter Erwartungstreue (oder auch Unverzerrtheit) versteht man die Tatsache, dass die Erwartungswerte der Schätzer (ˆβ) den tatsächlichen Populationsparametern (β) entsprechen, d.h. E(ˆβ) = β. Man kann sich also vorstellen, dass man, würde man die Schätzung sehr häufig wiederholen, zumindest im Schnitt richtig liegen würde. Das Konzept von Konsistenz liegt sehr nahe an dem der Erwartungstreue. Die Idee hinter Konsistenz ist, dass eine Erhöhung des Stichprobenumfangs wenigstens irgendwann zu einer Annäherung an den tatsächlichen Parameter führen sollte und die Schätzunsicherheit vernachlässigbar werden könnte. Dies lässt sich auch als plimˆβ = β schreiben.

4 Solutions Effizienz bedeutet, dass die Varianz des Schätzers ˆβ möglichst gering ist. Je geringer die Varianz ist, desto höher ist die Präzision mit der β geschätzt werden kann und desto geringer ist die Varianz σ 2 des Störterms.