Breusch-Pagan-Test I auf Heteroskedastie in den Störgrößen

Transkript

1 Breusch-Pagan-Test I auf Heteroskedastie in den Störgrößen Ein weiterer Test auf Heteroskedastie in den Störgrößen ist der Breusch-Pagan-Test. Im Gegensatz zum Goldfeld-Quandt-Test ist es nicht erforderlich, eine (einzelne) Quelle der Heteroskedastizität anzugeben bzw. zu vermuten. Vielmehr lässt sich mit dem Breusch-Pagan-Test eine konstante Störgrößenvarianz σ 2 σi 2 gegen eine recht allgemeine Abhängigkeit der Störgrößenvarianzen von Q Variablen z 1i, z 2i,..., z Qi, i {1,..., n}, in der Form σi 2 = h(γ 0 + γ 1 z 1i γ Q z Qi ) (1) mit einer Funktion h, an die nur moderate Bedingungen gestellt werden müssen, abgrenzen. Im Breusch-Pagan-Test entspricht der Fall einer konstanten Störgrößenvarianz der Nullhypothese H 0 : γ 1 =... = γ Q = 0 σ 2 i h(γ 0 ) im allgemeineren Varianz-Modell aus Formel (1). Ökonometrie (SS 2018) Folie 289 Breusch-Pagan-Test II auf Heteroskedastie in den Störgrößen Häufig werden als Variablen z 1i, z 2i,..., z Qi gerade wieder die Regressoren des ursprünglichen Regressionsmodells eingesetzt, es gilt dann also Q = K und z ji = x ji für i {1,..., n}, j {1,..., K}. Durch die Freiheit bei der Auswahl der Einflussvariablen z 1i, z 2i,..., z Qi sind aber auch zahlreiche Varianten möglich, zum Beispiel die Verwendung nicht nur der Regressoren des ursprünglichen Modells, sondern auch Potenzen hiervon und/oder Produkte verschiedener Regressoren oder die Verwendung der aus der ursprünglichen Modellschätzung gewonnenen ŷi. Unter dem Namen Breusch-Pagan-Test (BP-Test) werden üblicherweise zwei unterschiedliche Versionen subsumiert, nämlich der ursprüngliche Test von Breusch und Pagan (Econometrica, 1979), der unabhängig auch von Cook und Weisberg (Biometrika, 1983) vorgeschlagen wurde, sowie eine robuste Modifikation von Koenker (Journal of Econometrics, 1981), die geeigneter ist, wenn die Störgrößen nicht normalverteilt sind. Ökonometrie (SS 2018) Folie 290

2 Breusch-Pagan-Test III auf Heteroskedastie in den Störgrößen Beide Versionen des BP-Tests sind als Score-Test konzipiert, die Teststatistik lässt sich jedoch jeweils leicht auf Basis von (OLS-)Schätzergebnissen einer (linearen) Hilfsregression berechnen. Sind û i die Residuen aus der Schätzung des auf heteroskedastische Störgrößen zu untersuchenden linearen Modells und RSS die Residual Sum of Squares (mit RSS = n i=1 û2 i = û û), so benötigt man als abhängige Variable der Hilfsregression die gemäß w i := n ûû2 û i = RSSû2 n i für i {1,..., n} standardisierten quadrierten Residuen w i. Ökonometrie (SS 2018) Folie 291 Breusch-Pagan-Test IV auf Heteroskedastie in den Störgrößen Für beide Versionen des BP-Tests ist dann die Hilfsregression w i = γ 0 + γ 1 z 1i γ Q z Qi + e i, i {1,..., n}, (per OLS-/KQ-Methode) zu schätzen. Im ursprünglichen BP-Test erhält man die unter der Nullhypothese näherungsweise χ 2 (Q)-verteilte Teststatistik dann als die Hälfte der Explained Sum of Squares der Hilfsregression, mit der Bezeichnung ê i für die Residuen der Hilfsregression und der Abkürzung w = 1 n n i=1 w i also zum Beispiel unter Verwendung von ESS = TSS RSS durch (( n ) ( n )) χ 2 = 1 2 (w i w) 2. i=1 i=1 ê 2 i Ökonometrie (SS 2018) Folie 292

3 Breusch-Pagan-Test V auf Heteroskedastie in den Störgrößen In der robusteren Version von Koenker erhält man die unter der Nullhypothese ebenfalls näherungsweise χ 2 (Q)-verteilte Teststatistik als n-faches multiples Bestimmtheitsmaß der Hilfsregression, es gilt also χ 2 = n R 2 H mit der Bezeichnung RH 2 für das Bestimmtheitsmaß der Hilfsregression. Offensichtlich kann (nur) bei Verwendung der Version von Koenker auf die Standardisierung der quadrierten Residuen der ursprünglichen Modellschätzung verzichtet werden und die Hilfsregression auch direkt mit der abhängigen Variablen ûi 2 durchgeführt werden, da dies das Bestimmtheitsmaß nicht ändert (wohl aber die ESS!). Ökonometrie (SS 2018) Folie 293 Zusammenfassung: Breusch-Pagan-Test ( Original ) auf Heteroskedastizität der Störgrößen Anwendungs- approx.: y = Xβ + u mit E(u) = 0, V(u) = diag(σ1, 2..., σn), 2 voraussetzungen X deterministisch mit vollem Spaltenrang K + 1, Realisation y = (y 1,..., y n ) beobachtet, Q Einflussvariablen z 1i,..., z Qi, σi 2 = h(γ 0 + γ 1 z 1i γ Q z Qi ) Nullhypothese H 0 : γ 1 =... = γ Q = 0 σi 2 h(γ 0 ) Gegenhypothese H 1 : γ q 0 für mindestens ein q {1,..., Q} (( n ) ( n )) Teststatistik χ 2 = 1 2 (w i w) 2 Verteilung (H 0 ) χ 2 ist approx. χ 2 (Q)-verteilt, falls σ 2 i h(γ 0 ) konstant. Benötigte Größen û = (û 1,..., û n ) = y X(X X) 1 X y, w i = n û û û2 i, ê i die Residuen der Hilfsregression w i = γ 0 + γ 1 z 1i γ Q z Qi + e i Kritischer Bereich (χ 2 Q;1 α, ) zum Niveau α p-wert 1 F χ 2 (Q)(χ 2 ) i=1 i=1 ê 2 i Ökonometrie (SS 2018) Folie 294

4 Zusammenfassung: Breusch-Pagan-Test ( Koenker ) auf Heteroskedastizität der Störgrößen Anwendungs- approx.: y = Xβ + u mit E(u) = 0, V(u) = diag(σ1, 2..., σn), 2 voraussetzungen X deterministisch mit vollem Spaltenrang K + 1, Realisation y = (y 1,..., y n ) beobachtet, Q Einflussvariablen z 1i,..., z Qi, σi 2 = h(γ 0 + γ 1 z 1i γ Q z Qi ) Nullhypothese H 0 : γ 1 =... = γ Q = 0 σi 2 h(γ 0 ) Gegenhypothese H 1 : γ q 0 für mindestens ein q {1,..., Q} Teststatistik χ 2 = n RH 2 Verteilung (H 0 ) χ 2 ist approx. χ 2 (Q)-verteilt, falls σi 2 h(γ 0 ) konstant. Benötigte Größen û = (û 1,..., û n ) = y X(X X) 1 X y, R 2 H das Bestimmtheitsmaß der Hilfsregression û 2 i Kritischer Bereich (χ 2 Q;1 α, ) zum Niveau α = γ 0 + γ 1 z 1i γ Q z Qi + e i p-wert 1 F χ 2 (Q)(χ 2 ) Ökonometrie (SS 2018) Folie 295 White-Test auf Heteroskedastie in den Störgrößen White hat in seiner Arbeit von 1980 (Econometrica) nicht nur heteroskedastie-konsistente Schätzverfahren, sondern auch einen Test auf Heteroskedastie in den Störgrößen vorgeschlagen. Es zeigt sich, dass der White-Test auf heteroskedastische Störgrößen ein Spezialfall der Koenker -Version des Breusch-Pagan-Tests ist. Konkret erhält man den White-Test bei der Durchführung eines Breusch-Pagan-Tests nach Koenker, wenn man als Einflussvariablen z qi für die Varianz der Störgrößen gerade alle Regressoren, zusätzlich alle quadrierten Regressoren sowie zusätzlich alle gemischten Produkte von Regressoren des ursprünglichen Modells wählt. In einem Modell mit 2 Regressoren wäre also die Hilfsregression û 2 i = γ 0 + γ 1 x 1i + γ 2 x 2i + γ 3 x 2 1i + γ 4 x 2 2i + γ 5 x 1i x 2i + e i durchzuführen. Ökonometrie (SS 2018) Folie 296

5 Beispiel: Breusch-Pagan-Test/White-Test I Im Folgenden werden zwei Varianten des Breusch-Pagan-Test am bereits mehrfach verwendeten Lohnhöhen -Beispiel illustriert. Ausgehend von den quadrierten Residuen ûi 2 der ursprünglichen Regression der Lohnhöhe auf die beiden Regressoren Ausbildung und Alter (sowie ein Absolutglied) werden für die Original -Version des Breusch-Pagan-Tests zunächst die standardisierten quadrierten Residuen w i = n û ûû2 i berechnet: > uhat <- residuals(lm(lohnhöhe~ausbildung+alter)) > w <- uhat^2/mean(uhat^2) Als Summe der quadrierten Abweichungen vom arithmetischen Mittel n i=1 (w i w) 2 der w i (also als TSS der folgenden Hilfsregression!) erhält man: > sum((w-mean(w))^2) [1] Ökonometrie (SS 2018) Folie 297 Beispiel: Breusch-Pagan-Test/White-Test II Werden als Einflussvariablen für die Varianz der Störgrößen die beiden ursprünglichen Regressoren Ausbildung und Alter gewählt, ist dann die Hilfsregression w i = γ 0 + γ 1 Ausbildung i + γ 2 Alter i + e i zu schätzen und die zugehörige RSS zu bestimmen, man erhält > sum(residuals(lm(w~ausbildung+alter))^2) [1] und damit (gerundet) die Teststatistik (( n ) ( n χ 2 = 1 2 (w i w) 2 i=1 i=1 ê 2 i )) = 1 ( ) = Ein Vergleich zum kritischen Wert χ 2 2;0.95 = bei einem Test zum Niveau α = 0.05 erlaubt die Ablehnung der Nullhypothese und damit den Schluss auf das Vorliegen von Heteroskedastie in den Störgrößen. Ökonometrie (SS 2018) Folie 298

6 Beispiel: Breusch-Pagan-Test/White-Test III Wird in der beschriebenen Situation ein White-Test durchgeführt, so muss eine der Hilfsregressionen û 2 i = γ 0 + γ 1 Ausbildung i + γ 2 Alter i + γ 3 Ausbildung 2 i + γ 4 Alter 2 i + γ 5 Ausbildung i Alter i + e i oder w i = γ 0 + γ 1 Ausbildung i + γ 2 Alter i + γ 3 Ausbildung 2 i durchgeführt werden. + γ 4 Alter 2 i + γ 5 Ausbildung i Alter i + e i In der Statistik-Software R müssen diese Rechenoperationen von Regressoren bei der Modellformulierung in den Befehl I() eingeschlossen werden, da ^ und * bei der Notation von Modellgleichungen andere Bedeutungen haben! Ökonometrie (SS 2018) Folie 299 Beispiel: Breusch-Pagan-Test/White-Test IV Man erhält als OLS-Schätzergebnis: Call: lm(formula = uhat^2 ~ Ausbildung + Alter + I(Ausbildung^2) + I(Alter^2) + I(Ausbildung * Alter)) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) Ausbildung Alter I(Ausbildung^2) * I(Alter^2) I(Ausbildung * Alter) ** --- Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: on 14 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 5 and 14 DF, p-value: Ökonometrie (SS 2018) Folie 300

7 Beispiel: Breusch-Pagan-Test/White-Test V Unter Verwendung des Bestimmtheitsmaßes dieser Hilfsregression ergibt sich χ 2 = n RH 2 = = > χ2 5;0.95 = 11.07, also wird auch hier zum Niveau α = 0.05 signifikante Heteroskedastie in den Störgrößen festgestellt. Schneller: mit dem Befehl bptest() im Paket lmtest: Original -Breusch-Pagan-Test (1. Beispiel): > bptest(lm(lohnhöhe~ausbildung+alter),studentize=false) Breusch-Pagan test data: lm(lohnhöhe ~ Ausbildung + Alter) BP = , df = 2, p-value = White - bzw. Koenker -Variante (2. Beispiel): > bptest(lm(lohnhöhe~ausbildung+alter), + ~Ausbildung+Alter+I(Ausbildung^2)+I(Alter^2)+I(Ausbildung*Alter)) studentized Breusch-Pagan test data: lm(lohnhöhe ~ Ausbildung + Alter) BP = , df = 5, p-value = Ökonometrie (SS 2018) Folie Nichtlineare Regressionsfunktionen Nichtlinearität in den Regressoren 5.1 Inhaltsverzeichnis (Ausschnitt) 5 Nichtlineare Regressionsfunktionen Nichtlinearität in den Regressoren Nichtlinearität in einer Variablen Modelle mit Interaktionen Strukturbruchmodelle Ökonometrie (SS 2018) Folie 302

8 5 Nichtlineare Regressionsfunktionen Nichtlinearität in den Regressoren 5.1 Nichtlinearität in den Regressoren I Eine Variable y hängt linear von einer Variablen x ab, wenn der Differenzenquotient bzw. die Ableitung bzgl. dieser Variablen konstant ist, wenn also y x = c bzw. y x = c für eine Konstante c R gilt. Im bisher betrachteten linearen Regressionsmodell y i = β 0 + β 1 x 1i β K x Ki + u i, i {1,..., n}, hängt y also linear von jedem Regressor x k (k {1,..., K}) ab, denn es gilt y x k = β k bzw. y x k = β k. Die hier als marginaler Effekt einer Änderung von x k auf y interpretierbare (partielle) Ableitung ist also konstant und damit insbesondere unabhängig von x k (sowie unabhängig von anderen Variablen). Ökonometrie (SS 2018) Folie Nichtlineare Regressionsfunktionen Nichtlinearität in den Regressoren 5.1 Nichtlinearität in den Regressoren II Bereits im White-Test verwendet: Regressionsfunktion y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x β 4 x β 5 x 1 x 2, die zwar linear in den Regressionsparametern β 0,..., β 5, aber nichtlinear in den Regressoren x 1 und x 2 ist. Der marginale Effekt einer Änderung von x 1 auf y beträgt hier beispielsweise (abhängig vom Wert der Regressoren x 1 und x 2!) y x 1 = β 1 + 2β 3 x 1 + β 5 x 2. Allgemein betrachten wir nun Regressionsmodelle, die sich in der Form g(y i ) = β 0 +β 1 h 1 (x 1i,..., x Ki )+...+β M h M (x 1i,..., x Ki )+u i, i {1,..., n}, mit M Transformationen h 1,..., h M der K Regressoren und (ggf.) einer Transformation g der abhängigen Variablen darstellen lassen. Ökonometrie (SS 2018) Folie 304

9 5 Nichtlineare Regressionsfunktionen Nichtlinearität in den Regressoren 5.1 Nichtlinearität in den Regressoren III Unter den üblichen Annahmen an die Störgrößen u i und unter der Voraussetzung, dass die Transformationen h 1,..., h M zu einer neuen Regressormatrix 1 h 1 (x 11,..., x K1 ) h M (x 11,..., x K1 ) 1 h 1 (x 12,..., x K2 ) h M (x 12,..., x K2 ) X :=... 1 h 1 (x 1n,..., x Kn ) h M (x 1n,..., x Kn ) mit vollem Spaltenrang M + 1 führen, bleiben die bisher besprochenen Eigenschaften der OLS-/KQ-Schätzung dieses Modells bestehen. Bezeichnet ỹ := (g(y 1 ),..., g(y n )) den transformierten (bzw. falls g(y) = y für alle y R gilt untransformierten) Vektor der abhängigen Variable, erhält man beispielsweise den KQ-Schätzer als β = ( X X) 1 X ỹ. Ökonometrie (SS 2018) Folie Nichtlineare Regressionsfunktionen Nichtlinearität in den Regressoren 5.1 Nichtlinearität in den Regressoren IV Weitere Beispiele für Modelle mit Regressionsfunktionen, die nichtlinear in den (ursprünglichen) Regressoren x k sind: Wichtig! 1 y i = β 0 + β 1 x 1i + β 2 x 2 1i + u i, 2 y i = β 0 + β 1 x 1i + β 2 x 2 1i + β 3 x 3 1i + u i, 3 y i = β 0 + β 1 ln(x 1i ) + u i, 4 ln(y i ) = β 0 + β 1 x 1i + u i, 5 ln(y i ) = β 0 + β 1 ln(x 1i ) + β 2 ln(x 2i ) + u i. Unabhängig von der konkreten Form der Regressionsfunktion muss (wie auch bisher!) die Korrektheit der Spezifikation der Regressionsfunkion gewährleistet sein, um die Ergebnisse der Schätzung überhaupt sinnvoll verwerten zu können! Im Folgenden werden zunächst Regressionsfunktionen untersucht, die nur von einer unabhängigen Variablen x 1 abhängen (wie in den Beispielen 1 4 ). Ökonometrie (SS 2018) Folie 306

10 Polynomiale Modelle I in nur einer Variablen x 1 Die Modelle aus 1 bzw. 2, y i = β 0 + β 1 x 1i + β 2 x 2 1i + u i bzw. y i = β 0 + β 1 x 1i + β 2 x 2 1i + β 3 x 3 1i + u i, sind Beispiele für polynomiale Modelle (in einer Variablen) der Form y i = β 0 + β 1 x 1i + β 2 x 2 1i β r x r 1i + u i zu vorgegebenem Grad r {2, 3,...} des Polynoms. In polynomialen Modellen (in einer Variablen) sind die marginalen Effekte einer Änderung von x 1 auf y gegeben durch y = β 1 + 2β 2 x rβ r x r 1 1 x 1 und damit insbesondere nicht konstant, sondern abhängig vom Regressor x 1. Ökonometrie (SS 2018) Folie 307 Polynomiale Modelle II in nur einer Variablen x 1 Konfidenzintervalle für die marginalen Effekte an einem vorgegebenen Wert x 1 des Regressors können dann als Konfidenzintervalle für Linearkombinationen a β bestimmt werden, wenn der Vektor a R r+1 (abhängig von x 1 ) entsprechend gewählt wird, im polynomialen Modell mit Polynomgrad r also als a = [ 0 1 2x 1... rx r 1 ] 1. Bei einer sehr großen Wahl von r besteht die Gefahr des Overfittings : Sind bei einer Punktwolke aus n Beobachtungen (x 1i, y i ) alle x i unterschiedlich, so kann die Punktwolke durch ein Polynom vom Grad r = n 1 perfekt interpoliert werden! In der Praxis finden sich häufig polynomiale Modelle mit r = 2 oder r = 3. Ökonometrie (SS 2018) Folie 308

11 Polynomiale Modelle III in nur einer Variablen x 1 Gelegentlich wird unter der Annahme, dass die wahre Regressionsfunktion ein Polynom von unbekanntem Grad ist zunächst ein Modell mit großem r geschätzt und dann sukzessive mit Hilfe von t-tests überprüft, ob β r signifikant von Null verschieden ist, um ggf. den Grad r des Polynoms in der Regressionsfunktion um 1 zu reduzieren. Die Nullhypothese eines linearen Zusammenhangs gegen die Alternative eines polynomialen Zusammenhangs (mit Polynomgrad r 2) kann offensichtlich durch einen F -Test mit überprüft werden. H 0 : β 2 =... = β r = 0 Natürlich können Tests bzw. Konfidenzintervalle auch unter der Annahme heteroskedastischer Störgrößen durchgeführt werden, wenn die entsprechende heteroskedastie-konsistente Schätzung V hc ( β) der Varianz-Kovarianzmatrix V( β) und die dafür geeigneten Darstellungen der jeweiligen Tests verwendet werden. Ökonometrie (SS 2018) Folie 309 (Semi-)logarithmische Modelle I in nur einer Variablen x 1 Log-Transformationen von x 1i in ln(x 1i ) und/oder y i in ln(y i ) bieten sich dann an, wenn anstelle der Annahme eines konstanten Effekts y = β 1 x 1 von absoluten Änderungen x 1 auf absolute Änderungen y eher dann ein konstanter Effekt β 1 erwartet wird, wenn relative, prozentuale Änderungen bei der Ursache ( x 1 x 1 ) und/oder bei der abhängigen Variablen ( y y ) betrachtet werden. Grundlage dafür ist ln(x) x = 1 x bzw. ln(x + x) ln(x) = ln ( 1 + x ) x, wenn x x. x x Abhängig davon, ob nur die unabhängige Variable, nur die abhängige Variable oder beide Variablen transformiert werden, sind die folgenden Spezifikationen möglich: Ökonometrie (SS 2018) Folie 310

12 (Semi-)logarithmische Modelle II in nur einer Variablen x 1 1 Linear-log-Spezifikation: y i = β 0 + β 1 ln(x 1i ) + u i. Konstanter Effekt β 1 der relativen Änderung von x 1 auf eine absolute Änderung von y, bzw. abnehmender marginaler Effekt bei steigendem x: y β 1 x 1 x 1 bzw. y x 1 = β 1 x 1 Bsp.: x 1i Düngemitteleinsatz, y i Ernteertrag (auf Feld i). Eine (relative) Erhöhung des Düngemitteleinsatzes um 1% erhöht den (absoluten) Ernteertrag (etwa) um 0.01 β 1. Eine (absolute) Erhöhung des Düngemitteleinsatzes um einen Betrag x1 hat dort mehr Wirkung, wo noch nicht so viel Dünger eingebracht wurde ( abnehmende Grenzerträge ). Ökonometrie (SS 2018) Folie 311 (Semi-)logarithmische Modelle III in nur einer Variablen x 1 2 Log-linear-Spezifikation: ln(y i ) = β 0 + β 1 x 1i + u i. Konstanter Effekt β 1 der absoluten Änderung von x 1 auf eine relative Änderung von y, bzw. steigender marginaler Effekt bei steigendem y: y y β 1 x 1 bzw. y x 1 = β 1 y Bsp.: x 1i Berufserfahrung von BWL-Absolventen (in Jahren), y i Einkommen. Ein Jahr zusätzliche Berufserfahrung erhöht danach das mittlere Einkommen um etwa 100β 1 %. Eine (absolute) Erhöhung der Berufserfahrung hat also einen höheren (absoluten) Effekt auf das Einkommen dort, wo das Einkommen ohnehin bereits ein höheres Niveau hatte. Ökonometrie (SS 2018) Folie 312

13 (Semi-)logarithmische Modelle IV in nur einer Variablen x 1 3 Log-log-Spezifikation: ln(y i ) = β 0 + β 1 ln(x 1i ) + u i. Konstanter Effekt β 1 (=Elastizität) der relativen Änderung von x 1 auf eine relative Änderung von y: y y β 1 x 1 x 1 bzw. y x 1 x 1 y = β 1 Bsp.: x 1i Kapitaleinsatz pro Arbeitskraft, y i Output pro Arbeitskraft. Erhöhung des per-capita-kapitaleinsatzes um 1% führt zur Erhöhung des per-capita-output um β 1 % (Cobb-Douglas-Produktionsfunktion). Modellierung von konstanten Skalenerträgen. Ökonometrie (SS 2018) Folie 313 (Semi-)logarithmische Modelle V in nur einer Variablen x 1 Anmerkungen zu Log-transformierten abhängigen Variablen (ln(y)) Insbesondere Log-log-Spezifikationen können bei der sog. Linearisierung von Regressionsmodellen entstehen, die zunächst nichtlinear (auch!) in den Regressionsparametern sind, zum Beispiel erhält man aus dem Modell (hier: mit mehreren Regressoren) y i = β 0 x β 1 1i x β 2 2i e u i, i {1,..., n}, durch Logarithmieren auf beiden Seiten mit ln(y i ) = β 0 + β 1 ln(x 1i ) + β 2 ln(x 2i ) + u i, i {1,..., n}. ein linearisiertes Modell. Ökonometrie (SS 2018) Folie 314

14 (Semi-)logarithmische Modelle VI in nur einer Variablen x 1 Bei der Prognose von y 0 gegeben x 0 bzw. der Bestimmung von ŷ i auf Basis von Modellen mit log-tranformierter abhängiger Variablen ln(y) ist zu beachten, dass wegen E (e u i ) e E(u i ) trotz der Annahme E(u i ) 0 im Allgemeinen E (e u i ) 1 = e 0 gilt. Für u i iid N(0, σ 2 ) gilt insbesondere E (e u i ) = e σ2 iid 2, damit erhält man für ln(y i ) = h(x 1i ) + u i mit u i N(0, σ 2 ) ( ) ) ( ) E(y i ) = E e ln(y i ) = E (e h(x 1i )+u i = E e h(x 1i ) e u i = e h(x 1i ) E (e u i ) = e h(x 1i ) e σ2 2 > e h(x 1i ). Wenn die abhängige Variable y in ln(y) transformiert wird, kann man das Bestimmtheitsmaß für die geschätzte Regression nicht sinnvoll mit dem Bestimmtheitsmaß einer Regressionsgleichung für y vergleichen! (Anteil der erklärten Varianz der ln(y i ) vs. Anteil der erklärten Varianz der y i ) Ökonometrie (SS 2018) Folie 315 Beispiel zur Nichtlinearität in einer Variablen I Im Folgenden soll am Beispiel der Abhängigkeit der Milchleistung von Kühen von der zugeführten Futtermenge die Schätzung einiger in den Regressoren nichtlinearer Modelle illustriert werden. Es liege hierzu folgender Datensatz vom Umfang n = 12 zu Grunde: i Milchleistung (Liter/Jahr) y i Futtermenge (Zentner/Jahr) x 1i i Milchleistung (Liter/Jahr) y i Futtermenge (Zentner/Jahr) x 1i (vgl. von Auer, Ludwig: Ökonometrie Eine Einführung, 6. Aufl., Tabelle 14.1) Es wird nacheinander die Gültigkeit einer linearen, quadratischen, kubischen, linear-log-, log-linear- bzw. log-log-spezifikation unterstellt und das zugehörige Modell geschätzt (unter Homoskedastieannahme). Ökonometrie (SS 2018) Folie 316

15 Beispiel zur Nichtlinearität in einer Variablen II Lineares Modell: Milch i = β 0 + β 1 Futter i + u i Call: lm(formula = Milch ~ Futter) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-08 *** Futter e-05 *** --- Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: on 10 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 10 DF, p-value: 1.597e-05 Ökonometrie (SS 2018) Folie 317 Beispiel zur Nichtlinearität in einer Variablen III Quadratisches Modell: Milch i = β 0 + β 1 Futter i + β 2 Futter 2 i + u i Call: lm(formula = Milch ~ Futter + I(Futter^2)) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-07 *** Futter e-05 *** I(Futter^2) ** --- Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: on 9 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 2 and 9 DF, p-value: 1.452e-06 Ökonometrie (SS 2018) Folie 318

16 Beispiel zur Nichtlinearität in einer Variablen IV Kubisches Modell: Milch i = β 0 + β 1 Futter i + β 2 Futter 2 i + β 3 Futter 3 i + u i Call: lm(formula = Milch ~ Futter + I(Futter^2) + I(Futter^3)) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-06 *** Futter * I(Futter^2) I(Futter^3) Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: on 8 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 3 and 8 DF, p-value: 1.29e-05 Ökonometrie (SS 2018) Folie 319 Beispiel zur Nichtlinearität in einer Variablen V Linear-log-Modell: Milch i = β 0 + β 1 ln(futter i ) + u i Call: lm(formula = Milch ~ log(futter)) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-07 *** log(futter) e-06 *** --- Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: on 10 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 10 DF, p-value: 1.996e-06 Ökonometrie (SS 2018) Folie 320

17 Beispiel zur Nichtlinearität in einer Variablen VI Log-linear-Modell: ln(milch i ) = β 0 + β 1 Futter i + u i Call: lm(formula = log(milch) ~ Futter) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** Futter e-05 *** --- Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: on 10 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 10 DF, p-value: 5.098e-05 Ökonometrie (SS 2018) Folie 321 Beispiel zur Nichtlinearität in einer Variablen VII Log-log-Modell: ln(milch i ) = β 0 + β 1 ln(futter i ) + u i Call: lm(formula = log(milch) ~ log(futter)) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** log(futter) e-07 *** --- Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: on 10 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 10 DF, p-value: 1.912e-07 Ökonometrie (SS 2018) Folie 322

18 Geschätzte Regressions-/Prognosefunktionen I Lineares Modell Quadratisches Modell Milch Milch Futter Futter Kubisches Modell Linear log Modell Milch Milch Futter log(futter) Log linear Modell Log log Modell log(milch) log(milch) Futter log(futter) Ökonometrie (SS 2018) Folie 323 Geschätzte Regressions-/Prognosefunktionen II Vergleich der Prognosefunktionen Milch Linear Quadratisch Kubisch Linear log Log linear Log log Futter Ökonometrie (SS 2018) Folie 324