7. Integrierte Prozesse

7. Integrierte Prozesse Bisher: Behandlung stationärer Prozesse (stationäre ARMA(p, q)-prozesse) Problem: Viele ökonomische Zeitreihen weisen im Zeitverlauf ein nichtstationäres Verhalten auf 225

Beispiel: Betrachte (log.) DAX von Folie 8 Schätze den AR(1)-Prozess DAX t = c + φ DAX t 1 + ɛ t Offensichtlich: ˆφ = 1.000314 sehr nahe bei 1 (vgl. Folie 227) DAX-Zeitreihe weist wahrscheinlich eine Einheitswurzel auf (das AR-Polynom φ(l) = 1 L hat ein Nullstelle auf dem Einheitskreis; Unit Root) DAX-Zeitreihe ist ein Random-Walk und nicht-stationär 226

Schätzung eines AR(1)-Prozesses für den log. DAX Dependent Variable: DAX_LOG Method: Least Squares Date: 22/06/08 Time: 13:39 Sample (adjusted): 1960M01 2008M02 Included observations: 578 after adjustments Variable Coefficient Std. Error t-statistic Prob. C 0.002606 0.017254 0.151020 0.8800 DAX_LOG(-1) 1.000314 0.002429 411.8280 0.0000 R-squared 0.996615 Mean dependent var 7.043221 Adjusted R-squared 0.996609 S.D. dependent var 0.962492 S.E. of regression 0.056044 Akaike info criterion -2.921888 Sum squared resid 1.809206 Schwarz criterion -2.906803 Log likelihood 846.4258 F-statistic 169602.3 Durbin-Watson stat 1.893856 Prob(F-statistic) 0.000000 227

Bemerkung: Man erhält ein ähnliches Ergebnis, wenn man einen ARMA(p, q)- Prozess anpasst Sprechweise: Wenn man sagt: Eine Zeitreihe weist eine Einheitswurzel auf, dann ist gemeint: Die Zeitreihe ist nicht-stationär, jedoch kann durch Bildung der Differenzen Stationarität erreicht werden. 228

.2 DAX (1. Differenzen im Logarithmus).1.0 -.1 -.2 -.3 1960 1970 1980 1990 2000 Zeit Dependent Variable: DAX_LOG_DIFF Method: Least Squares Date: 22/06/08 Time: 14:33 Sample (adjusted): 1960M02 2008M02 Included observations: 577 after adjustments Variable Coefficient Std. Error t-statistic Prob. C 0.004566 0.002341 1.950640 0.0516 DAX_LOG_DIFF(-1) 0.053286 0.041648 1.279451 0.2013 R-squared 0.002839 Mean dependent var 0.004824 Adjusted R-squared 0.001105 S.D. dependent var 0.056045 S.E. of regression 0.056014 Akaike info criterion -2.922980 Sum squared resid 1.804083 Schwarz criterion -2.907875 Log likelihood 845.2798 F-statistic 1.636995 Durbin-Watson stat 2.002391 Prob(F-statistic) 0.201254

Differenzenbildung: 1. Differenzen: X t = (1 L)X t = X t X t 1 2. Differenzen: 2 X t = (1 L) 2 X t = (1 2L + L 2 )X t = X t 2X t 1 + X t 2 Differenzen der Ordnung d: d X t = (1 L) d X t 230

Definition 7.1: (Integration eines SP) Der Prozess {X t } heißt integriert der Ordnung d (in Zeichen: X t I(d)), falls {X t } d mal differenziert werden muss, damit der Prozess stationär wird. Bemerkungen: Die meisten ökonomischen Einheitswurzel-Zeitreihen werden durch einmaliges Differenzieren stationär (d.h. die Zeitreihen sind I(1)) Stationäre Zeitreihen werden oft als I(0) bezeichnet 231

7.1 Stochastische vs. deterministische Trends Bemerkung: Die Nicht-Stationarität eines ARMA(p, q)-prozesses {X t } aufgrund einer Einheitswurzel bezieht sich auf die Nullstellen des AR(p)-Polynoms Wir betrachten jetzt nur den AR(p)-Teil von {X t } (der MA(q)-Teil ist immer stationär) 232

Zwischenfazit: Viele ökonomische Zeitreihen enthalten einen Trend (vgl. Folien 8-15) AR(p)-Modelle mit einer Einheitswurzel können einen Trend erfassen Frage: Gibt es neben AR(p)-Prozessen mit einer Einheitswurzel noch andere theoretische Modelle, die einen zeitlichen Trend implizieren? 233

Betrachte das folgende Modell: mit {ɛ t } WR(0, σ 2 ) Spezialfälle: (I) X t = c + φ X t 1 + δ t + ɛ t Random Walk mit/ohne Drift, d.h. φ = 1, δ = 0: X t = c + X t 1 + ɛ t {X t } hat eine Einheitswurzel (und damit einen Trend), jedoch impliziert Differenzenbildung Stationarität: Stochastischer Trend X t = X t X t 1 = c + ɛ t 234

Spezialfälle: (II) Trend-stationärer Prozess, d.h. φ = 0, δ = 0: Es gilt: X t = c + δ t + ɛ t E(X t ) = c + δ t, V ar(x t ) = V ar(ɛ t ) = σ 2 d.h. {X t } ist nicht-stationär und hat einen Trend. Betrachtet man jedoch den Prozess {Y t } = {X t E(X t )} = {X t c δ t} = {ɛ t }, so ist dieser stationär Deterministischer Trend 235

Stochastischer vs. deterministischer Trend 40 Stochastischer Trend 30 20 Deterministischer Trend 10 0-10 0 200 400 600 800 1000 t 236

Unterschied zwischen beiden Trends: (I) Deterministischer Trend: Sind c und δ bekannt, so kann der E-Wert von X t perfekt vorhergesagt werden Abweichungen von der Trendlinie c + δ t sind rein zufällig und haben keinerlei Einfluss auf das Langfrist-Verhalten von X t Stationarität wird über Detrenden erreicht 237

Unterschied zwischen beiden Trends: (II) Stochastischer Trend: Die stochastische Komponente ɛ t hat langfristigen Einfluss auf X t (ohne mathematischen Beweis) Stationarität wird nur über Differenzieren erreicht 238

7.2 Parametertests im AR(p)-Modell mit deterministischem Trend Ausgangssituation: Betrachte das AR(p)-Modell der Form X t = c + φ 1 X t 1 +... + φ p X t p + ɛ t mit ɛ t WR(0, σ 2 ) Ziel: Entwicklung eines statistischen Tests auf Einheitswurzel in einer Zeitreihe (Stationaritätstest) 239

Hierfür zunächst: Günstige Umformulierung des AR(p)-Modells Satz 7.2: (Äquivalente Darstellung von AR(p)-Prozessen) Es sei {X t } ein AR(p)-Prozess gemäß der obigen Darstellung. Dann lässt sich der Prozess {X t } mit geeignet gewählten Parametern ϱ, ψ 1,..., ψ p 1 auch wie folgt in Differenzen darstellen: X t = c+ϱ X t 1 +ψ 1 X t 1 +ψ 2 X t 2 +...+ψ p 1 X t p+1 +ɛ t. 240

Bemerkungen: Die Äquivalenz der AR(p)-Darstellungen ergibt sich durch einfache algebraische Umformungen Die neuen Parameter ϱ, ψ 1,..., ψ p 1 sind einfache Funktionen der ursprünglichen Parameter φ 1,..., φ p Z.B. gilt: ϱ = φ 1 + φ 2 +... + φ p 1 Beide Darstellungen haben insgesamt p+1 Parameter, nämlich c, φ 1,..., φ p bzw. c, ϱ, ψ 1,..., ψ p 1 241

Satz 7.3: (Stationarität von AR(p)-Prozessen) Es sei {X t } ein AR(p)-Prozess in der Darstellung des Satzes 7.2. Dann gilt: (a) Der Prozess {X t } ist stationär, falls 2 < ϱ < 0. (b) Der Prozess {X t } hat eine Einheitswurzel (d.h. ist nichtstationär), falls ϱ = 0. 242

Bemerkungen: In der umformulierten Fassung des AR(p)-Modells hängt die Stationarität nur noch vom Parameter ϱ ab In der ursprünglichen Form hängt die Stationarität von der Lage der Nullstellen des AR(p)-Polynoms Φ(z) = 1 φ 1 z φ 2 z 2... φ p z p und damit von den p Parametern φ 1,..., φ p ab (vgl. Folien 83, 84) 243

Jetzt: Betrachte das AR(p)-Modell aus Satz 7.2 erweitert um den deterministischen Trend: X t = c + ϱ X t 1 + p 1 j=1 ψ j X t j + δ t + ɛ t (AR(p)-mit-deterministischem-Trend-Modell, kurz: DT-Modell) AR(p)- Test auf Einheitswurzel im AR(p)-DT-Modell lautet H 0 : ϱ = 0 gegen H 1 : ϱ < 0 244

Betrachte: Statistische Tests im AR(p)-DT-Modell 2 Ziele dieser Tests: Bestimmung der geeigneten Lag-Länge p Test auf Einheitswurzel (Unit Root) Dafür: Unterteilung der Parameter in 2 Gruppen, nämlich (a) c, ψ 1,..., ψ p 1 und δ (b) ϱ 245

Vorläufige Begründung: Test für Parameter ϱ unterscheidet sich von Tests für alle anderen Parameter (genaue Erklärung folgt) Zunächst: Sequentielles Verfahren zur Bestimmung der Lag-Länge p im AR(p)-DT-Modell 246

Strategie in 5 Schritten: (I) 1. Wähle eine inhaltlich sinnvolle Maximal-Länge p max 2. Schätze mittels KQ das AR(p max )-DT-Modell X t = c + ϱ X t 1 + p max 1 j=1 Entscheide anhand des t-tests: ψ j X t j + δ t + ɛ t H 0 : ψ pmax 1 = 0 gegen H 1 : ψ pmax 1 0 Bei Ablehnung von H 0, gehe zu Schritt 5 Bei Nicht-Ablehnung von H 0, gehe zu Schritt 3 247

Strategie in 5 Schritten: (II) 3. Schätze mittels KQ das AR(p max 1)-DT-Modell X t = c + ϱ X t 1 + p max 2 j=1 Entscheide anhand des t-tests: ψ j X t j + δ t + ɛ t H 0 : ψ pmax 2 = 0 gegen H 1 : ψ pmax 2 0 Bei Ablehnung von H 0, gehe zu Schritt 5 Bei Nicht-Ablehnung von H 0, gehe zu Schritt 4 4. Wiederhole die Schätzung des Modells mit schrittweise reduzierten Lags bis ein ψ-koeffizient statistisch signifikant ist oder bis keine Lags mehr übrig sind 248

Strategie in 5 Schritten: (III) 5. Teste anhand des t-tests H 0 : δ = 0 gegen H 1 : δ 0 und entscheide so über die Belassung des deterministischen Trends im Modell 249

Beispiel: Betrachte log. DAX und beginne mit p max = 4 Ergebnis (vgl. Folien 251, 252): Modell reduziert sich auf X t = c + ϱ X t 1 + δ t + ɛ t Frage: Ist ϱ = 0, d.h. weist die Zeitreihe eine Einheitswurzel auf? Plausible Vorgehensweise: Gemäß t-test (vgl. Folie 252) ist ϱ signifikant von Null verschieden zum Niveau 0.05 250

Dependent Variable: D(DAX_LOG) Method: Least Squares Date: 22/06/08 Time: 17:42 Sample (adjusted): 1960M04 2008M02 Included observations: 575 after adjustments Variable Coefficient Std. Error t-statistic Prob. C 0.080399 0.035856 2.242239 0.0253 DAX_LOG(-1) -0.014513 0.006485-2.237911 0.0256 D(DAX_LOG(-1)) 0.056230 0.041823 1.344494 0.1793 D(DAX_LOG(-2)) 0.028922 0.042240 0.684693 0.4938 D(DAX_LOG(-3)) 0.019308 0.042221 0.457311 0.6476 T 8.96E-05 3.73E-05 2.400637 0.0167 R-squared 0.013597 Mean dependent var 0.004860 Adjusted R-squared 0.004929 S.D. dependent var 0.056135 S.E. of regression 0.055996 Akaike info criterion -2.916681 Sum squared resid 1.784151 Schwarz criterion -2.871244 Log likelihood 844.5457 F-statistic 1.568696 Durbin-Watson stat 1.999215 Prob(F-statistic) 0.166999 Dependent Variable: D(DAX_LOG) Method: Least Squares Date: 22/06/08 Time: 17:43 Sample (adjusted): 1960M03 2008M02 Included observations: 576 after adjustments Variable Coefficient Std. Error t-statistic Prob. C 0.078717 0.035652 2.207934 0.0276 DAX_LOG(-1) -0.014189 0.006443-2.202013 0.0281 D(DAX_LOG(-1)) 0.056398 0.041747 1.350959 0.1772 D(DAX_LOG(-2)) 0.029728 0.042134 0.705563 0.4807 T 8.79E-05 3.71E-05 2.371416 0.0181 R-squared 0.013139 Mean dependent var 0.004862 Adjusted R-squared 0.006226 S.D. dependent var 0.056086 S.E. of regression 0.055911 Akaike info criterion -2.921462 Sum squared resid 1.784981 Schwarz criterion -2.883648 Log likelihood 846.3810 F-statistic 1.900547 Durbin-Watson stat 2.000813 Prob(F-statistic) 0.108867

Dependent Variable: D(DAX_LOG) Method: Least Squares Date: 22/06/08 Time: 17:45 Sample (adjusted): 1960M02 2008M02 Included observations: 577 after adjustments Variable Coefficient Std. Error t-statistic Prob. C 0.077131 0.035460 2.175164 0.0300 DAX_LOG(-1) -0.013912 0.006404-2.172346 0.0302 D(DAX_LOG(-1)) 0.057755 0.041651 1.386645 0.1661 T 8.71E-05 3.69E-05 2.364580 0.0184 R-squared 0.012478 Mean dependent var 0.004824 Adjusted R-squared 0.007308 S.D. dependent var 0.056045 S.E. of regression 0.055840 Akaike info criterion -2.925761 Sum squared resid 1.786644 Schwarz criterion -2.895551 Log likelihood 848.0822 F-statistic 2.413400 Durbin-Watson stat 2.003207 Prob(F-statistic) 0.065757 Dependent Variable: D(DAX_LOG) Method: Least Squares Date: 22/06/08 Time: 17:46 Sample (adjusted): 1960M01 2008M02 Included observations: 578 after adjustments Variable Coefficient Std. Error t-statistic Prob. C 0.073723 0.035336 2.086314 0.0374 DAX_LOG(-1) -0.013278 0.006377-2.082053 0.0378 T 8.45E-05 3.67E-05 2.303511 0.0216 R-squared 0.009172 Mean dependent var 0.004813 Adjusted R-squared 0.005726 S.D. dependent var 0.055997 S.E. of regression 0.055836 Akaike info criterion -2.927614 Sum squared resid 1.792663 Schwarz criterion -2.904986 Log likelihood 849.0804 F-statistic 2.661481 Durbin-Watson stat 1.885543 Prob(F-statistic) 0.070705

Leider: Im AR(p)-DT-Modell ist der t-test für den Parameter ϱ ungültig! Die Vtlg. der t-statistik des Parameters ϱ unter H 0 folgt im AR(p)-DT-Modell nicht der t-verteilung, sondern einer anderen Verteilung! 253

7.3 Statistische Tests auf Einheitswurzel Frage: Wie kann statistisch auf das Vorliegen einer Einheitswurzel (d.h. auf Nicht-Stationarität) einer Zeitreihe getestet werden? Betrachte dazu: AR(p)-DT-Modell X t = c + ϱ X t 1 + p 1 j=1 ψ j X t j + δ t + ɛ t, das mit der 5-Schritt-Strategie der Folien 247-249 angepasst wurde 254

Erinnerung: Statistischer Test ist gleichbedeutend mit H 0 : ϱ = 0 gegen H 1 : ϱ < 0 H 0 : Zeitreihe weist eine Einheitswurzel auf (Stochastischer Trend) gegen H 1 : Zeitreihe weist keine Einheitswurzel auf (Kein stochastischer Trend) 255

Erinnere ferner: Die gewöhnliche t-statistik für den Parameter ϱ im AR(p)- DT-Modell ist unter H 0 nicht t-verteilt (vgl. Folie 253) Deshalb: t-statistik für Parameter ϱ im AR(p)-DT-Modell wird häufig als τ-statistik bezeichnet 256

Bemerkungen zur Vtlg. der τ-statistik unter H 0 : Vtlg. geht zurück auf Dickey-Fuller (1979, 1981) Exakte H 0 -Vtlg. der τ-statistik hängt davon ab, ob der deterministische Trend t im AR(p)-DT-Modell enthalten ist die Niveaukonstante c im AR(p)-DT-Modell enthalten ist Die kritischen Werte der H 0 -Verteilung werden MacKinnon-Werte genannt und sind in EViews implementiert 257

Definition 7.4: (Augmented-Dickey-Fuller-Test) Man betrachte das AR(p)-DT-Modell von Folie 244, das mit Hilfe der 5-schrittigen Strategie der Folien 247-249 an eine Zeitreihe {x t } t=0,1,... angepasst wurde. Der statistische Test für das Problem H 0 : ϱ = 0 gegen H 1 : ϱ < 0, der anhand der τ-statistik und den MacKinnon-Werten durchgeführt wird, heißt Augmented-Dickey-Fuller-Test (ADF-Test). 258

Bemerkungen: Der ADF-Test ist ein Test auf Stationarität Der ADF-Test lehnt die Nullhypothese einer Einheitswurzel (die Nicht-Stationarität) zugunsten der Alternative (der Stationarität) ab, falls die τ-statistik stärker negativ ist als der MacKinnon-Wert zum gewünschten Signifikanzniveau (d.h. falls der τ-wert betraglich größer ist als der Betrag des entsprechenden MacKinnon-Wertes) 259

Beispiel: (ADF-Test für den log. DAX) Die 5-schrittige Anpassungsstrategie auf den Folien 247-249 führte zu einem AR(p)-DT-Modell mit p = 1, δ 0 (Modell ohne verzögerte Differenzen, mit determin. Trend) Null Hypothesis: DAX_LOG has a unit root Exogenous: Constant, Linear Trend Lag Length: 0 (Automatic based on SIC, MAXLAG=18) t-statistic Prob.* Augmented Dickey-Fuller test statistic -2.082053 0.5542 Test critical values: 1% level -3.974012 5% level -3.417613 10% level -3.131232 *MacKinnon (1996) one-sided p-values. 260

Ergebnis mit EViews: τ-statistik = 2.082053 ist betraglich kleiner als die jeweiligen Beträge der 3 MacKinnon-Werte H 0 kann zu den Sig.-Niveaus 1%, 5%, 10% nicht abgelehnt werden Stat. Anzeichen für eine Einheitswurzel (stochastischer Trend) 261

Abschließende Bemerkungen: (I) Der ADF-Test unterstellt folgende Eigenschaften für den Fehlerprozess {ɛ t } t=0,1,... im AR(p)-DT-Modell: Die Fehler ɛ t sind stochastisch unabhängig (keine Autokorrelation) Der Fehlerprozess ist homoskedastisch (V ar(ɛ t ) = σ 2 für alle t) Ein alternativer (nicht-parametrischer) Einheitswurzel-Test, der Autokorrelation und Heteroskedastie im Fehlerprozess {ɛ t } zulässt, ist der Phillips-Perron-Test 262

Abschließende Bemerkungen: (II) ADF-Tests haben in der Praxis oft eine geringe Güte: Die ADF-Tests halten häufig an der Nullhypothese einer Einheitswurzel (also der Nicht-Stationarität) fest, wenn die Nullhypothese in Wirklichkeit falsch ist (Fehlentscheidung des Tests) Liegt in den Daten ein Strukturbruch vor, so versagen die ADF-Tests vollständig 263

7.4 Regressionen mit integrierten Variablen Bisher: Eigenschaften eines Prozesses {X t }: Stationarität Einheitswurzel (integrierter Prozess) Jetzt: Regressionsmodelle mit Zeitreihenvariablen, z.b. Y t = β 0 + β 1 X 1t +... + β K X Kt + ɛ t 264

Zentrale Frage: Eigenschaften der KQ-Schätzer für β 0,..., β K, falls alle Variablen stationär sind einige Variablen Einheitswurzeln aufweisen Problem der Schein-Regression (spurious Regression) Es gilt: Falls alle Variablen {Y t }, {X 1t },..., {X Kt } stationär und die klassischen Annahmen des multiplen Regressionsmodells erfüllt sind, so ist die KQ-Schätzung völlig unproblematisch 265

7.4.1 Schein-Regression (spurious regression) Frage: Warum sind Regressionen mit Einheitswurzel-Zeitreihen problematisch? 266

Beispiel: Betrachte 2 Random Walks {Y t }, {X t } (nicht-stationäre Prozesse mit Einheitswurzel) Beide Prozesse werden unabhängig voneinander erzeugt: Y t = Y t 1 + ɛ 1t X t = X t 1 + ɛ 2t mit {ɛ 1t }, {ɛ 2t } GWR(0, 1) ({ɛ 1t }, {ɛ 2t } unabhängig) Betrachte Regressionen in Niveaugrößen in 1. Differenzen Y t = β 0 + β 1 X t + ɛ t Y t = β 0 + β 1 X t + ɛ t 267

60 1. Random Walk 40 20 0 2. Random Walk -20 200 400 600 800 1000 Dependent Variable: RANDOMWALK_1 Method: Least Squares Date: 01/20/03 Time: 10:10 Sample: 1 1000 Included observations: 1000 t Variable Coefficient Std. Error t-statistic Prob. C 3.108647 0.688040 4.518121 0.0000 RANDOMWALK_2 1.316307 0.033693 39.06771 0.0000 R-squared 0.604641 Mean dependent var 25.60444 Adjusted R-squared 0.604245 S.D. dependent var 18.93122 S.E. of regression 11.90946 Akaike info criterion 7.794541 Sum squared resid 141551.5 Schwarz criterion 7.804356 Log likelihood -3895.270 F-statistic 1526.286 Durbin-Watson stat 0.017870 Prob(F-statistic) 0.000000

4 1. Differenzen des 2. Random Walk 2 0-2 -4-4 -2 0 2 4 1. Differenzen des 1. Random Walk Dependent Variable: D(RANDOMWALK_1) Method: Least Squares Date: 01/20/03 Time: 10:14 Sample(adjusted): 2 1000 Included observations: 999 after adjusting endpoints Variable Coefficient Std. Error t-statistic Prob. C 0.044324 0.031349 1.413892 0.1577 D(RANDOMWALK_2) 0.041491 0.032064 1.294021 0.1960 R-squared 0.001677 Mean dependent var 0.045276 Adjusted R-squared 0.000675 S.D. dependent var 0.990895 S.E. of regression 0.990561 Akaike info criterion 2.820909 Sum squared resid 978.2666 Schwarz criterion 2.830732 Log likelihood -1407.044 F-statistic 1.674491 Durbin-Watson stat 1.962213 Prob(F-statistic) 0.195958

Regression in Niveaugrößen: Parameter β 1 ist statistisch signifikant R 2 ist hoch und ebenfalls statistisch signifikant (vgl. F -Test) Regression in 1. Differenzen: Parameter β 1 ist nicht mehr signifikant R 2 ist praktisch gleich 0 und ebenfalls nicht mehr statistisch signifikant 270

Fazit: Regressionszusammenhang in Niveaugrößen basiert einzig und allein darauf, dass beide Zeitreihen einen stochastischen Trend in die gleiche Richtung aufweisen (unechter [spurious] Zusammenhang) Regression in 1. Differenzen weist darauf hin, dass beide Variablen nichts miteinander zu tun haben (was ihrem Erzeugungsmechanismus entspricht) 271

7.4.2 Kointegration Jetzt: Betrachte vereinfachend die 2-Variablen-Regression Y t = β 0 + β 1 X t + ɛ t mit {Y t } und {X t } als Einheitswurzel-Prozesse Frage: Gibt es Situationen, in denen das Problem der Schein-Regression entfällt? 272

Antwort: Ja, falls {Y t } und {X t } kointegriert sind Durchführung einer gewöhnlichen KQ-Schätzung trotz Einheitswurzeln unproblematisch Definition 7.5: (Kointegration) Es seien {X t }, {Y t } I(1) zwei Einheitswurzel-Prozesse. Falls es einen Koeffizienten β gibt, so dass der Prozess {Y t βx t } stationär ist (d.h. falls {Y t βx t } I(0)), so heißen {X t } und {Y t } kointegriert. Der Koeffizient β heißt Kointegrationskoeffizient. 273

Bemerkungen: Wenn {X t } und {Y t } kointegriert sind, dann haben beide Prozesse einen gemeinsamen stochastischen Trend Der Differenzprozess {Y t βx t } eliminiert den gemeinsamen stochastischen Trend Eine Kointegrationsbeziehung zwischen {Y t } und {X t } repräsentiert eine langfristige Gleichgewichtsbeziehung zwischen den Prozessen 274

Ökonomische Beispiele für Kointegration: (I) 1. Preise stark substituierbarer Güter (z.b. Preise für normale und für Bio-Orangen) Grund für Kointegration: Konsumenten haben grundsätzlich höhere Zahlungsbereitschaft für Bio-Orangen (deshalb liegt die Bio-Orangen-Preiskurve höher) Höhere Zahlungsbereitschaft ist aber begrenzt Abstand zwischen beiden Kurven sollte stationär sein 275

Pfundpreise von normalen und Bio-Orangen 300 Preis / Pfund 250 200 150 100 Bio-Orangen Herkömmliche Orangen 50 20 40 60 80 100 120 140 160 180 Monate 276

Ökonomische Beispiele für Kointegration: (II) 2. Kurz- und langfristige Zinssätze Langfr. Zinssätze sind i.d.r. höher als kurzfristige (Risikoprämie, Theorie der Zinsstruktur) Unangemessen hohe Risikoprämie führt zu Portfolio-Umschichtungen der Anleger Zinssätze gleichen sich wieder an, d.h. Zinsverläufe werden durch Marktmechanismus zusammengehalten 277

Ökonomische Beispiele für Kointegration: (III) 3. Absolute Kaufkraft-Parität Nominaler Wechselkurs entspricht Kaufkraft zwischen den Ländern, d.h. W t = P t P t oder in Logarithmen w t = p t p t mit W = nominalem Wechselkurs P, P = inländ. bzw. ausländ. Preisniveau Diese Beziehung ist ein Gleichgewicht (mit entsprechenden Anpassungsmechanismen, falls nicht erfüllt) {w t + p t p t} sollte stationär sein (d.h. Prozesse {w t }, {p t p t } sind kointegriert) 278

Satz 7.6: (Konsequenzen von Kointegration) Man betrachte die 2-Variablen-Regression Y t = β 0 + β 1 X t + ɛ t. Falls {X t } und {Y t } kointegriert sind, gilt: 1. Das Problem der Schein-Regression entfällt. 2. Die 2-Variablen-Regression kann problemlos mit der KQ- Methode geschätzt werden. Die klassische statistische Inferenz ist gültig. 279

7.4.3 Ein Test auf Kointegration Ziel: Entwicklung eines statistischen Tests auf Kointegration zweier I(1)-Variablen {X t }, {Y t } Intuitive Idee: Basiere Test auf 2-Variablen-Regression: Y t = β 0 + β 1 X t + ɛ t Y t β 1 X t }{{} Differenzprozess = β 0 + ɛ t Engle-Granger-Kointegrationstest in 3 Schritten 280

Engle-Granger-Kointegrationstest: 1. Schätze die 2-Variablen-Regression mittels der KQ-Methode und speichere die Residuen 2. Führe mit den Residuen einen ADF-Test (ohne deterministischen Trend) auf Stationarität durch (vgl. Abschnitt 7.3) 3. Falls der ADF-Test die Nullhypothese der Einheitswurzel verwirft, schließe auf Kointegration zwischen {X t } und {Y t }. Falls der ADF-Test die Nullhypothese der Einheitswurzel nicht verwerfen kann, schließe auf keine Kointegration zwischen {X t } und {Y t } 281

Bemerkungen: (I) Der ADF-Test auf Stationarität in den Residuen vollzieht sich durch die Anpassung eines AR(p)-Modells an die Residuen unter Anwendung der 5-schrittigen Strategie von Folie 247-249 (vgl. Definition 7.4, Folie 258) Jedoch wird beim Engle-Granger-Kointegrationstest auf die Einbeziehung des deterministischen Trends t verzichtet Da die Residuen {ˆɛ t } auf den Parameterschätzungen ˆβ 0 und ˆβ 1 (und nicht auf den tatsächlichen Parametern β 0, β 1 ) basieren, gelten andere kritische Werte als die MacKinnon- Werte für den gewöhnlichen ADF-Test 282

Bemerkungen: (II) Für den Stichprobenumfang T ergeben sich die gängigen kritischen Werte wie folgt: 1% Krit. Wert = 3.9001 10.534 T 1 30.03 T 2 5% Krit. Wert = 3.3377 5.967 T 1 8.98 T 2 10% Krit. Wert = 3.0462 4.069 T 1 5.73 T 2 (vgl. MacKinnon, 1991, S. 267-276) Analog zum ADF-Test muss auch beim Engle-Granger-Kointegrationstest der τ-wert stärker negativ ausfallen als der entsprechende kritische Wert, um die Nullhypothese der Einheitswurzel in den Residuen (keine Kointegration) abzulehnen 283

Bemerkungen: (III) Der Engle-Granger-Test ist im wesentlichen ein ADF-Einheitswurzel-Test angewendet auf die Residuen Es gelten in übertragener Form die Bemerkungen zum ADF-Test auf den Folien 262, 263 (Annahmen über den Fehlerterm, geringe Güte) 284

Beispiel: (Zusammenhang Konsum Einkommen) Betrachte die USA-Zeitreihen Private Konsumausgaben (PCE) Privates verfügbares Einkommen (PDI) Sind die Prozesse {P CE t }, {P DI t } kointegriert? (Übungsaufgabe) 285

7.4.4 Vektor-Fehlerkorrekturmodell Ausgangssituation: {Y t }, {X t } I(1) und kointegriert mit Kointegrationskoeffizient β Hieraus folgt: { Y t } und { X t } sind stationär {Y t βx t } ist stationär 286

Konsequenz: Man kann die differenzierten Prozesse { Y t } und { X t } mit dem folgenden 2-Gleichungssystem schätzen: Y t = β 10 + β 11 Y t 1 +... + β 1p Y t p + γ 11 X t 1 +... + γ 1p X t p + α 1 (Y t 1 βx t 1 ) + ɛ 1t (1) X t = β 20 + β 21 Y t 1 +... + β 2p Y t p + γ 21 X t 1 +... + γ 2p X t p + α 2 (Y t 1 βx t 1 ) + ɛ 2t (2) Definition 7.7: (Fehlerkorrekturmodell) Das obige 2-Gleichungssystem heißt vektorielles Fehlerkorrekturmodell und der Term {Y t 1 βx t 1 } heißt Fehlerkorrekturterm. 287

Bemerkungen: Da alle Variablen des 2-Gleichungssystems stationär sind, kann jede Einzelgleichung für sich mit der KQ-Methode geschätzt werden (vgl. Stock and Watson, 2011, S. 693 ff.) Der Kointegrationskoeffizient β ist in praxi oft unbekannt Man ersetzt den Fehlerkorrekturterm durch den Regressor Ẑ t 1 = Y t 1 ˆβX t 1, wobei ˆβ der KQ-Schätzer für β ist Vergangene Werte des Fehlerkorrekturterms {Y t βx t } fließen in die Prognose zukünftiger Werte von { Y t } und { X t } ein 288

Beispiel: Zinssatz-Datensatz (vgl. Stock & Watson, 2011, S. 698-701) 289

7.4.5 Multiple kointegrierte Variablen Jetzt: Übertragung des Konzeptes auf multiples Regressionsmodell Y t = β 0 + β 1 X 1t +... + β K X Kt + ɛ t Analoge Vorgehensweise: Falls {Y t }, {X 1t },... {X Kt } I(1), dann sind die Variablen kointegriert mit Koeffizienten θ 1,... θ K, wenn {Y t θ 1 X 1t... θ K X Kt } I(0) 290

Man beachte: Bei multiplen Regressoren können verschiedene einzelne Kointegrationsbeziehungen bestehen, z.b. zwischen {Y t } und {X 1t }, zwischen {Y t } und {X 2t }, u.s.w. Test auf Kointegration: Analogon zum Engle-Granger-Test Test auf multiple Kointegrationsbeziehungen (vgl. Johansen, 1988) 291