1. Grundlagen linearer Panelmodelle

Ähnliche Dokumente
2. Statische lineare Panelmodelle

Einführung in Panel-Verfahren

Das Lineare Regressionsmodell

Kurs Empirische Wirtschaftsforschung

Statistischer Rückschluss und Testen von Hypothesen

Übung V Lineares Regressionsmodell

Annahmen des linearen Modells

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im SS 2012

1. Einleitung. 1.1 Phasen einer ökonometrischen Analyse

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

Analyse von Querschnittsdaten. Spezifikation der unabhängigen Variablen

Vorlesung 4: Spezifikation der unabhängigen Variablen

Zeitreihen. Statistik II. Literatur. Zeitreihen-Daten Modelle Probleme Trends und Saisonalität Fehlerstruktur. 1 Wiederholung.

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell

Vorlesung 9: Kumulierte (gepoolte) Querschnittsdaten

Datenanalyse mit Excel und Gretl

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Statistik II. IV. Hypothesentests. Martin Huber

Vorlesung 3: Schätzverfahren

1. Lösungen zu Kapitel 7

Einfache Modelle für Paneldaten. Statistik II

1 Beispiel zur Methode der kleinsten Quadrate

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20

Kapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen.

Institut für Soziologie Benjamin Gedon. Methoden 2. Kausalanalyse

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II

Teil: lineare Regression

1 Einführung Ökonometrie... 1

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Statistik II Übung 1: Einfache lineare Regression

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief

Analyse von Querschnittsdaten. Heteroskedastizität

John Komlos Bernd Süssmuth. Empirische Ökonomie. Eine Einführung in Methoden und Anwendungen. 4y Springer

Empirical Banking and Finance

Statistik II Übung 1: Einfache lineare Regression

Analyse von Querschnittsdaten. Signifikanztests I Basics

Breusch-Pagan-Test I auf Heteroskedastie in den Störgrößen

FRAGESTUNDE WS 2016/17 QM 2. Dr. Christian Schwarz 1

Panelregression (und Mehrebenenanwendungen)

Interne und externe Modellvalidität

Das lineare Regressionsmodell

Statistik II Übung 2: Multivariate lineare Regression

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

Bachelorprüfung WS 2012/13

1 Gliederung Zeitreihenökonometrie. Angewandte Ökonometrie (Folien) Zeitreihenökonometrie Universität Basel, FS 09. Dr. Sylvia Kaufmann.

Analyse zeitabhängiger Daten. Kumulierte (gepoolte) Querschnittsdaten I

Empirical Banking and Finance

Statistische Tests (Signifikanztests)

Arbeitsmarktökonomie. Fragestunde. Universität Basel HS 2014 Christoph Sajons, Ph.D.

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38

Analyse von Querschnittsdaten. Statistische Inferenz

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im SS 2012 Lösungsskizze

5. Lineare Regressionsmodelle mit Zeitreihendaten 5.1 Vorüberlegungen

Empirische Wirtschaftsforschung

OLS-Schätzung: asymptotische Eigenschaften

Klassifikation von Signifikanztests

13. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017

Masterprüfung SS 2014

3 Grundlagen statistischer Tests (Kap. 8 IS)

Die Regressionsanalyse

1. Lösungen zu Kapitel 8

Instrumentvariablen und Instrumentvariablenschätzer

Econometrics Übung 1. CLRM & Verletzung der Unabhängigkeitsannahme

Nachschreibklausur im Anschluss an das SS 2009

Inferenz im multiplen Regressionsmodell

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

Kurze Einführung in die Ökonometrie-Software E-Views

Einführung in die Methoden der Empirischen Wirtschaftsforschung

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 27

2. Stochastische ökonometrische Modelle. - Modelle der ökonomischen Theorie an der Wirklichkeit überprüfen

Klausur zu Statistik II

Zeitreihen. Statistik II

Vorlesung: Lineare Modelle. Verschiedene Typen von Residuen. Probleme bei der Regression und Diagnose. Prof. Dr. Helmut Küchenhoff.

Empirische Analysen mit dem SOEP

Institut für Soziologie Christian Ganser. Methoden 2. Regressionsanalyse II: Lineare multiple Regression

Statistik II. IV. Hypothesentests. Martin Huber

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk

Bachelorprüfung WS 2012/13 - MUSTERLÖSUNG

Musterlösung. Modulklausur Multivariate Verfahren

Lösung Übungsblatt 5

Lehrstuhl für Statistik und emp. Wirtschaftsforschung, Prof. R. T. Riphahn, Ph.D. Bachelorprüfung, Praxis der empirischen Wirtschaftsforschung

Seminar zur Energiewirtschaft:

Mikro-Ökonometrie, WS 15/16 Musterlösung Aufgabenblatt 3

Modell (Konstante) 0,411 0,155 male 0,212 0,13 job 0,119 0,131 alcohol 0,255 0,05 a. Abhängige Variable: skipped

Lineare Regression mit einem Regressor: Einführung

Statistik II Übung 2: Multivariate lineare Regression

Angewandte Ökonometrie Übung. Endogenität, VAR, Stationarität und Fehlerkorrekturmodell

Statistik II Übung 2: Multivariate lineare Regression

Prognoseintervalle für y 0 gegeben x 0

7. Stochastische Prozesse und Zeitreihenmodelle

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. . Studiengang.

X =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode?

Mikro-Ökonometrie: Small Sample Inferenz mit OLS

Mehr-Ebenen-Analyse I. Regressionsmodelle für Politikwissenschaftler

Statistik II. I. Einführung. Martin Huber

Grundlegende Eigenschaften von Punktschätzern

Bivariate Zusammenhänge

Kategoriale abhängige Variablen:

Vorlesung: Statistik II für Wirtschaftswissenschaft

Transkript:

1. Grundlagen linearer Panelmodelle 1.1 Aggregierte (gepoolte) Querschnittsdaten Viele Befragungen von Personen, Haushalten oder Unternehmen werden regelmäßig wiederholt. Beispiele sind die jährliche Current Population Survey (CPS) in den USA oder die alle fünf Jahre (zuletzt 2013) in Deutschland durchgeführte Einkommens- und Verbrauchsstichprobe (EVS). Falls zufällige Stichproben in mehreren Zeitperioden gezogen werden, ergibt ihre Aggregation unabhängig aggregierte (gepoolte) Querschnittsdaten. Kennzeichen von aggregierten Querschnittsdaten: Aggregierte Querschnittsdaten weisen sowohl Querschnitts- als auch Zeitreiheneigenschaften auf Durch diese Daten kann die Anzahl der Beobachtungen erhöht werden. Somit erhöht sich auch die Präzision von Schätzern und Testverfahren in linearen Regressionsmodellen (falls der Zusammenhang zumindest zwischen einigen erklärenden und abhängigen Variablen über die Zeit konstant bleibt). Im Hinblick auf die Zugehörigkeit der Population zu verschiedenen Zeitperioden werden entsprechende Dummy-Variablen (die selbst im Fokus der Analyse stehen können) in lineare Regressionsmodelle einbezogen. Es können auch Interaktionsterme mit diesen Dummy-Variablen gebildet werden, falls sich der Effekt der erklärenden Variablen über die Zeit verändert. 1

--------------------------- Beispiel: Erklärung der Fertilität von Frauen (I) Mit Daten der in geraden Jahren von 1972 bis 1984 vom National Opinion Research Center durchgeführten General Social Surveys werden mit Hilfe eines linearen gepoolten Regressionsmodells die Determinanten der Anzahl der von einer Frau geborenen Kinder (kids) in den USA untersucht. Erklärende Variablen sind: Ausbildungszeit in Jahren (educ) Alter in Jahren (age) Quadriertes Alter in Jahren (agesq) Hautfarbe (black) Heimat-Regionen im Alter von 16 Jahren (east, northcen, west) Lebensumwelten im Alter von 16 Jahren (farm, othrural, town, smcity) Das Basisjahr für die einbezogenen Dummy-Variablen der einzelnen Jahre (y74, y76, y78, y80, y82, y84) ist 1972. Eine wichtige Fragestellung der Analyse ist, wie sich die Fertilitätsrate über die Zeit verändert hat, falls alle anderen beobachteten Faktoren konstant sind. Bei der OLS-Schätzung des linearen gepoolten Regressionsmodells mit STATA zeigen sich dabei für n = 1129 Frauen (im Alter zwischen 35 und 54 Jahren) folgende Ergebnisse: --------------------------- 2

--------------------------- Beispiel: Erklärung der Fertilität von Frauen (II) reg kids educ age agesq black east northcen west farm othrural town smcity y74 y76 y78 y80 y82 y84 Source SS df MS Number of obs = 1129 -------------+------------------------------ F( 17, 1111) = 9.72 Model 399.610888 17 23.5065228 Prob > F = 0.0000 Residual 2685.89841 1111 2.41755033 R-squared = 0.1295 -------------+------------------------------ Adj R-squared = 0.1162 Total 3085.5093 1128 2.73538059 Root MSE = 1.5548 kids Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- educ -.1284268.0183486-7.00 0.000 -.1644286 -.092425 age.5321346.1383863 3.85 0.000.2606065.8036626 agesq -.005804.0015643-3.71 0.000 -.0088733 -.0027347 black 1.075658.1735356 6.20 0.000.7351631 1.416152 east.217324.1327878 1.64 0.102 -.0432192.4778672 northcen.363114.1208969 3.00 0.003.125902.6003261 west.1976032.1669134 1.18 0.237 -.1298978.5251041 farm -.0525575.14719-0.36 0.721 -.3413592.2362443 othrural -.1628537.175442-0.93 0.353 -.5070887.1813814 town.0843532.124531 0.68 0.498 -.1599893.3286957 smcity.2118791.160296 1.32 0.187 -.1026379.5263961 y74.2681825.172716 1.55 0.121 -.0707039.6070689 y76 -.0973795.1790456-0.54 0.587 -.448685.2539261 y78 -.0686665.1816837-0.38 0.706 -.4251483.2878154 y80 -.0713053.1827707-0.39 0.697 -.42992.2873093 y82 -.5224842.1724361-3.03 0.003 -.8608214 -.184147 y84 -.5451661.1745162-3.12 0.002 -.8875846 -.2027477 3

--------------------------- Beispiel: Erklärung der Fertilität von Frauen (III) Interpretation der Ergebnisse: Die geschätzten Regressionsparameter der Dummy-Variablen der einzelnen Jahre implizieren einen starken Rückgang der Fertilität in den 1980er Jahren. Die geschätzten Parameter für y82 und y84 sind auch signifikant von null verschieden. 1984 ist somit z.b. (bei konstanten Werten der anderen erklärenden Variablen) die geschätzte Anzahl der geborenen Kinder um 0,545 geringer als 1972. Die Gruppe der geschätzten Parameter aller Dummy-Variablen der einzelnen Jahre sind zudem gemeinsam signifikant von null verschieden. Mit STA- TA zeigen sich folgende Ergebnisse des entsprechenden F-Tests: test y74=y76=y78=y80=y82=y84=0 ( 1) y74 - y76 = 0 ( 2) y74 - y78 = 0 ( 3) y74 - y80 = 0 ( 4) y74 - y82 = 0 ( 5) y74 - y84 = 0 ( 6) y74 = 0 F( 6, 1111) = 5.87 Prob > F = 0.0000 Die Ausbildungszeit hat einen signifikant negativen und die schwarze Hautfarbe einen signifikant positiven Effekt auf kids --------------------------- 4

--------------------------- Beispiel: Erklärung der Fertilität von Frauen (IV) Die geschätzten Parameter für age und agesq sind signifikant von null verschieden, so dass ein signifikanter nicht-linearer marginaler Effekt vorliegt Da der geschätzte Parameter für age positiv und der geschätzte Parameter für agesq negativ ist, hat age bis zu einem Wendepunkt zunächst einen (mit zunehmendem Alter sinkenden) geschätzten positiven und nach diesem Punkt einen geschätzten negativen marginalen Effekt. Der Wendepunkt des geschätzten Effektes von age ergibt sich folgendermaßen: age* = β age /(2 β agesq ) = 0,5321/[2 (-0,0058)] = 45,87 Jahre Es kann bei extrem geringen Signifikanzniveaus Heteroskedastizität nachgewiesen werden. Mit STATA zeigen sich folgende Ergebnisse des entsprechenden Breusch-Pagan-Tests: estat hettest, rhs iid Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: educ age agesq black east northcen west farm othrural town smcity y74 y76 y78 y80 y82 y84 chi2(17) = 55.32 Prob > chi2 = 0.0000 Bei der OLS-Schätzung mit STATA zeigen sich bei der Einbeziehung heteroskedastizitäts-robust geschätzter Standardabweichungen der geschätzten Parameter folgende Ergebnisse: 5

--------------------------- Beispiel: Erklärung der Fertilität von Frauen (V) reg kids educ age agesq black east northcen west farm othrural town smcity y74 y76 y78 y80 y82 y84, robust Linear regression Number of obs = 1129 F( 17, 1111) = 10.19 Prob > F = 0.0000 R-squared = 0.1295 Root MSE = 1.5548 Robust kids Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- educ -.1284268.021146-6.07 0.000 -.1699175 -.0869362 age.5321346.1389371 3.83 0.000.2595258.8047433 agesq -.005804.0015791-3.68 0.000 -.0089024 -.0027056 black 1.075658.2013188 5.34 0.000.6806496 1.470666 east.217324.127466 1.70 0.088 -.0327773.4674252 northcen.363114.1167013 3.11 0.002.1341342.5920939 west.1976032.1626813 1.21 0.225 -.121594.5168003 farm -.0525575.1460837-0.36 0.719 -.3391886.2340736 othrural -.1628537.1808546-0.90 0.368 -.5177087.1920014 town.0843532.1284759 0.66 0.512 -.1677295.3364359 smcity.2118791.1539645 1.38 0.169 -.0902149.5139731 y74.2681825.1875121 1.43 0.153 -.0997353.6361003 y76 -.0973795.1999339-0.49 0.626 -.4896701.2949112 y78 -.0686665.1977154-0.35 0.728 -.4566042.3192713 y80 -.0713053.1936553-0.37 0.713 -.4512767.3086661 y82 -.5224842.1879305-2.78 0.006 -.8912228 -.1537456 y84 -.5451661.1859289-2.93 0.003 -.9099776 -.1803547 _cons -7.742457 3.070656-2.52 0.012-13.7674-1.717518 --------------------------- 6

Anwendung für difference-in-differences Schätzer: Untersucht werden hier die Auswirkungen von natürlichen (bzw. Quasi-) Experimenten. Ein natürliches Experiment liegt vor, wenn ein exogenes Ereignis (insbesondere eine Politikmaßnahme wie z.b. eine arbeitspolitische Maßnahme) das Umfeld von Personen, Haushalten, Unternehmen oder Regionen verändert. Bei natürlichen Experimenten liegt eine typische was wäre wenn Frage vor, da die kontrafaktische Situation ohne exogenes Ereignis fehlt Ein natürliches Experiment enthält eine Treatmentgruppe, die vom Ereignis betroffen ist, sowie eine Kontrollgruppe, die nicht vom Ereignis betroffen ist Für die Analyse der Differenzen zwischen den beiden Gruppen werden Daten vor dem Ereignis und Daten nach dem Ereignis benötigt. Damit erhält man vier Gruppen, d.h. die Treatmentgruppe vor dem Ereignis, die Treatmentgruppe nach dem Ereignis, die Kontrollgruppe vor dem Ereignis und die Kontrollgruppe nach dem Ereignis. Der Effekt des Ereignisses auf Variablen y der Treatmentgruppe kann durch die Differenz zwischen der Differenz der durchschnittlichen Werte der Treatmentgruppe (TG) nach (y NE,TG ) und vor (y VE,TG ) dem Ereignis sowie der Differenz der durchschnittlichen Werte der Kontrollgruppe (KG) nach (y NE,KG ) und vor (y VE,KG ) dem Ereignis geschätzt werden, d.h. durch: (y NE,TG - y NE,KG ) - (y VE,TG - y VE,KG) 7

Dieser difference-in-differences Schätzer lässt sich auch mit Hilfe eines linearen gepoolten Regressionsmodells ermitteln, das als erklärende Variablen eine Dummy-Variable für die Zeit nach dem Ereignis (NE), eine Dummy-Variable für die Treatmentgruppe (TG) und einen Interaktionsterm von NE und TG enthält: y = β + δ NE + δ TG + δ NE TG + ε 0 1 2 3 δ 3 misst somit den durchschnittlichen Effekt des Ereignisses auf die Variablen y der Treatmentgruppe und wird deshalb auch als average treatment effect bezeichnet. Jedoch hängt die untersuchte Variable y in der Regel nicht nur vom Ereignis, sondern auch von anderen erklärenden Variablen ab, die in das lineare gepoolte Regressionsmodell einbezogen werden können: y = β + δ NE + δ TG + δ NE TG + β x + + β x + ε 0 1 2 3 1 1 k k Auch hier misst δ 3 den average treatment effect und somit den Effekt des Ereignisses, wenngleich er nicht mehr die vorherige einfache Form hat. Der difference-in-differences Ansatz kann folgendermaßen dargestellt werden: E(y) VE NE NE-VE KG β 0 +β 1 x 1 + +β k x k β 0 +δ 1 +β 1 x 1 + +β k x k δ 1 TG β 0 +δ 2 +β 1 x 1 + +β k x k β 0 +δ 1 +δ 2 +δ 3 +β 1 x 1 + +β k x k δ 1 +δ 3 TG-KG δ 2 δ 2 +δ 3 δ 3 8

--------------------------- Beispiel: Effekt von Arbeitsunfallgesetz auf Dauer ohne Arbeit (I) In Kentucky wurde 1980 die Obergrenze des Einkommens, bei dem Beschäftigte bei einem Arbeitsunfall eine Entschädigung erhalten, angehoben. Eine solche Anhebung hat keinen Einfluss auf entsprechende Ausgleichszahlungen für Geringverdiener, vermindert aber die Kosten für Hochverdiener. Zur Kontrollgruppe gehören deshalb Geringverdiener und zur Treatmentgruppe gehören jene Hochverdiener, die von diesem Arbeitsunfallgesetz betroffen waren. Auf Basis von zufälligen Stichproben von Beschäftigten mit einem Arbeitsunfall in beiden Gruppen vor und nach dem Gesetz soll untersucht werden, ob dieses den Logarithmus des Zeitraums ohne Arbeit (logdurat), für den Entschädigungen bezahlt werden, erhöht hat. In das lineare gepoolte Regressionsmodell werden somit folgende erklärende Variablen einbezogen: Eine Dummy-Variable für die Zeit nach der Politikmaßnahme (afchnge) Eine Dummy-Variable für die Treatmentgruppe der Hochverdiener (highearn) Der entsprechende Interaktionsterm afchngehighearn von afchnge und highearn Dabei zeigen sich mit STATA folgende OLS-Schätzergebnisse: 9

--------------------------- Beispiel: Effekt von Arbeitsunfallgesetz auf Dauer ohne Arbeit (II) reg logdurat afchnge highearn afchngehighearn Source SS df MS Number of obs = 5626 ----------------+------------------------------ F( 3, 5622) = 39.54 Model 191.071425 3 63.6904751 Prob > F = 0.0000 Residual 9055.93385 5622 1.61080289 R-squared = 0.0207 ----------------+------------------------------ Adj R-squared = 0.0201 Total 9247.00528 5625 1.64391205 Root MSE = 1.2692 --- logdurat Coef. Std. Err. t P> t [95% Conf. Interval] ----------------+---------------------------------------------------------------- afchnge.0076573.0447173 0.17 0.864 -.0800058.0953204 highearn.2564785.0474464 5.41 0.000.1634652.3494918 afchngehighearn.1906012.0685089 2.78 0.005.0562973.3249051 _cons 1.125615.0307368 36.62 0.000 1.065359 1.185871 --- Interpretation: Der difference-in-differences Schätzer beträgt 0,191. Mit t = 2,78 ist der geschätzte Parameter des Interaktionsterms signifikant von null verschieden. Der Schätzer impliziert, dass die Dauer ohne Arbeit (aber mit Entschädigungszahlungen) bei Hochverdienern (d.h. highearn = 1) durch die Politikmaßnahme (also durch die Erhöhung der Obergrenze des Einkommens, bei der Beschäftigte bei einem Arbeitsunfall eine Entschädigung erhalten) durchschnittlich um mehr als 19% gestiegen ist --------------------------- 10

--------------------------- Beispiel: Effekt von Arbeitsunfallgesetz auf Dauer ohne Arbeit (III) Weitere Interpretationen: Der geschätzte Parameter für afchnge zeigt für Geringverdiener (d.h. highearn = 0) die geschätzte durchschnittliche Differenz in logdurat zwischen der Zeit nach und der Zeit vor der Politikmaßnahme. Da der Parameter nicht signifikant von null verschieden ist, ergibt sich erwartungsgemäß kein Hinweis darauf, dass diese Politikmaßnahme einen Effekt auf die Dauer ohne Arbeit bei Geringverdienern hat Der geschätzte Parameter von highearn zeigt für die Zeit vor der Politikmaßnahme (d.h. afchnge = 0) die geschätzte durchschnittliche Differenz in logdurat zwischen Hochverdienern und Geringverdienern. Diese Differenz ist hochsignifikant positiv. Das Beispiel zeigt einen typischen Fall, bei dem ein signifikanter Effekt einer Politikmaßnahme vorliegt, obwohl sich die Variation der abhängigen Variablen aufgrund des kleinen Wertes des Bestimmtheitsmaßes nur zu einem geringen Anteil durch die OLS-Regressionsfunktion erklären lässt. Dies war absehbar, da die Dauer ohne Arbeit natürlich von vielen anderen Faktoren wie z.b. der Schwere der Verletzung abhängt. --------------------------- 11

--------------------------- Beispiel: Effekt von Arbeitsunfallgesetz auf Dauer ohne Arbeit (IV) Die Einbeziehung einer Vielzahl weiterer erklärender Variablen hat jedoch nur einen geringen Effekt auf den difference-in-differences Schätzer. Zum Beispiel zeigen sich bei der zusätzlichen Einbeziehung zweier Dummy-Variablen für das Geschlecht (male) und den Familienstand (marr) mit STATA folgende OLS- Schätzergebnisse: reg logdurat male married afchnge highearn afchngehighearn Source SS df MS Number of obs = 5362 ----------------+------------------------------ F( 5, 5356) = 27.08 Model 214.963534 5 42.9927068 Prob > F = 0.0000 Residual 8502.41251 5356 1.58745566 R-squared = 0.0247 ----------------+------------------------------ Adj R-squared = 0.0237 Total 8717.37604 5361 1.62607276 Root MSE = 1.2599 --- logdurat Coef. Std. Err. t P> t [95% Conf. Interval] ----------------+---------------------------------------------------------------- male -.0837481.0440588-1.90 0.057 -.1701213.0026251 married.1346087.0392796 3.43 0.001.0576047.2116126 afchnge.0119027.0451964 0.26 0.792 -.0767005.100506 highearn.2264434.0515625 4.39 0.000.1253599.327527 afchngehighearn.2244848.0698407 3.21 0.001.0875686.361401 _cons 1.097571.0482829 22.73 0.000 1.002917 1.192225 --- --------------------------- 12

1.2 Einfache lineare Panelmodelle für zwei Perioden Im Folgenden werden nun Paneldaten betrachtet, bei denen im Unterschied zu aggregierten Querschnittsdaten für dieselben Untersuchungseinheiten (z.b. Personen, Haushalte, Unternehmen, Regionen) Daten über mehrere Zeitperioden vorliegen. Beispiele auf Basis von Befragungen sind die weltweit am längsten andauernde Befragung (seit 1968) des Panel Study of Income Dynamics (PSID) in den USA oder das (seit 1991 durchgeführte) British Household Panel Survey (BHPS) in Großbritannien. Wichtige Paneldatensätze in Deutschland sind das 1984 aufgebaute Sozio-ökonomische Panel (SOEP) für Haushalte sowie das 1993 aufgebaute Mannheimer Innovationspanel (MIP) für Unternehmen. Vorüberlegungen: Zunächst werden für jede Untersuchungseinheit lediglich zwei (nicht unbedingt direkt aufeinander folgende) Perioden betrachtet, t = 1 und t = 2 Grundsätzlich können für beide Perioden t = 1 und t = 2 (z.b. Jahre) jeweils getrennte Querschnittsanalysen durchgeführt werden. Häufig entsteht dabei allerdings das Problem von Verzerrungen bei der Vernachlässigung relevanter erklärender Variablen ( omitted variable bias ). Die Einbeziehung aller relevanten erklärenden Variablen ist aber oft nicht möglich. 13

Beim Vorliegen von Paneldaten bietet sich die Einbeziehung von zwei Typen unbeobachteter Faktoren an, die einen Einfluss auf die abhängige Variable haben: Ein konstanter Faktor α i sowie ein über die Zeit variierender Faktor v it. Bei deren Einbeziehung in ein lineares Regressionsmodell ergibt sich: y = β + δ d2 + β x + + β x + α + v für i = 1,, n; t = 1, 2 it 0 1 t 1 it1 k itk i it Erläuterungen: Der Index i bezeichnet die jeweilige Querschnittseinheit, also z.b. eine Person, einen Haushalt, ein Unternehmen oder eine Region. Der Index t bezeichnet dagegen die Zeitperiode. Die Dummy-Variable d2 t nimmt für t = 2 den Wert eins und für t = 1 den Wert null an. Sie enthält nicht das Subskript i, da sie sich bei verschiedenen i nicht verändert. Die Konstante lautet somit β 0 für t = 1 und β 0 + δ 1 für t = 2. Die Variable α i beinhaltet alle unbeobachteten zeitinvarianten Faktoren, die einen Effekt auf die abhängige Variable y it haben. Aufgrund der Zeitinvarianz enthält sie nicht das Subskript t. Die Variable α i wird auch als unbeobachteter Effekt, fixer Effekt oder unbeobachtete Heterogenität bezeichnet. Dieses lineare Regressionsmodell wird deshalb auch als unobserved effects oder fixed effects Modell bezeichnet. Der Fehlerterm v it wird dagegen häufig als idiosynkratischer oder zeitvarianter Fehler bezeichnet, da er unbeobachtete Faktoren enthält, die sich über die Zeit verändern 14

Ein Ansatz zur Schätzung der Regressionsparameter solcher linearer fixed effects Modelle ergibt sich durch die Aggregation der Daten über beide Perioden. Im entsprechenden linearen gepoolten Regressionsmodell kann dann eine OLS-Schätzung durchgeführt werden. Eine wesentliche Voraussetzung für die Konsistenz der geschätzten Regressionsparameter ist dabei allerdings, dass der unbeobachtete Effekt α i mit allen erklärenden Variablen unkorreliert ist. Diese generelle Bedingung bei linearen Regressionsmodellen kann mit dem zusammengesetzten Fehlerterm ε it = α i + v it durch folgende Modifikation veranschaulicht werden: y = β + δ d2 + β x + + β x + ε für i = 1,, n; t = 1, 2 it 0 1 t 1 it1 k itk it Das heißt, ε it muss also für eine konsistente OLS-Schätzung aller Regressionsparameter mit allen x it1,, x itk unkorreliert sein. Selbst wenn also v it mit den erklärenden Variablen unkorreliert ist, ergeben sich verzerrte und inkonsistente Schätzer, falls α i mit einer erklärenden Variablen korreliert ist. Allerdings liegt ein wesentlicher Grund der Anwendung von Paneldaten für empirische Analysen gerade darin, dass α i mit den erklärenden Variablen korreliert sein kann. Da der fixe Effekt α i über die Zeit konstant ist, kann er beseitigt werden, indem für das lineare fixed effects Modell für jede Querschnittseinheit i die ersten Differenzen der Gleichungen in den beiden Perioden t = 2 und t = 1 gebildet werden. Für jedes i = 1,, n ergibt sich dabei zunächst: 15

y = β + β x + + β x + α + v (t = 1) i1 0 1 i11 k i1k i i1 y = β + δ + β x + + β x + α + v (t = 2) i2 0 1 1 i21 k i2k i i2 Durch die Subtraktion der ersten von der zweiten Gleichung ergibt sich: y - y = δ + β (x - x ) + + β (x - x ) + v - v bzw. i2 i1 1 1 i21 i11 k i2k i1k i2 i1 Δy = δ + β Δx + + β Δx + Δv i 1 1 i1 k ik i Diese Gleichung erster Differenzen stellt letztlich eine Querschnittsgleichung dar, bei der jede Variable über die Zeit differenziert ist. Deshalb kann dieser Ansatz wie ein lineares Regressionsmodell mit Querschnittsdaten behandelt werden. Die OLS-Schätzung der Regressionsparameter wird als first-differenced Schätzer (OLS-Schätzer in den ersten Differenzen) bezeichnet. Voraussetzungen für die erwartungstreue OLS-Schätzung (siehe auch später): x ih (h = 1,, k) muss über i variabel sein, d.h. eine erklärende Variable darf nicht über die Zeit invariant sein (z.b. Geschlecht) oder sich bei allen i mit dem gleichen Betrag über die Zeit verändern (z.b. Alter). Diese Bedingung macht Sinn, da α i mit den erklärenden Variablen korreliert sein darf, so dass deren Effekte bei zeitinvarianten erklärenden Variablen nicht separabel sind. v i ist unkorreliert mit allen x ih. Diese Bedingung ist erfüllt, falls die v it in beiden Perioden mit den erklärenden Variablen unkorreliert sind. Dies ist eine andere Version der strikten Exogenität der erklärenden Variablen (und schließt die Einbeziehung verzögerter abhängiger Variablen aus). 16

--------------------------- Beispiel 1: Erklärung von Kriminalitätsraten (I) Im Hinblick auf die Untersuchung des Effektes von Arbeitslosenraten (unem) auf Kriminalitätsraten, gemessen mit der Anzahl der Straftaten auf 1000 Personen (crmrte), liegen für n = 46 Städte in den USA sowohl für 1982 (t = 1) als auch für 1987 (t = 2) entsprechende Paneldaten vor. Dabei wird zunächst eine Querschnittsanalyse für 1987 durchgeführt, d.h. auf Basis der Daten von 1987 wird folgende OLS-Regressionsfunktion geschätzt (n = 46, R 2 = 0,033): ˆ crmrte = 128,378-4,161unem (20,757) (3,416) Diese Schätzung impliziert einen unplausiblen (insignifikanten) negativen Effekt der Arbeitslosenraten. Allerdings dürften hier Verzerrungen aufgrund der Vernachlässigung relevanter erklärender Variablen vorliegen. Aufgrund des Vorliegens von Paneldaten für 1982 und 1987 kann aber folgendes lineares fixed effects Modell spezifiziert werden: crmrte = β + δ d87 + β unem + α + v für i = 1,, 46; t = 1, 2 it 0 1 t 1 it i it Dabei bezeichnet d87 die Dummy-Variable für das Jahr 1987. --------------------------- 17

--------------------------- Beispiel 1: Erklärung von Kriminalitätsraten (II) In einem ersten Schritt werden zunächst die Paneldaten in einem entsprechenden linearen gepoolten Regressionsmodell aggregiert. Unter Einbeziehung von d87 wird folgende OLS-Regressionsfunktion geschätzt (n 2 = 92 Beobachtungen, R 2 = 0,012): crmrte ˆ = 93,420 + 7,940d87 + 0,427unem (12,739) (7,975) (1,188) Allerdings ergibt sich auch unter den restriktiven Annahmen des linearen gepoolten Regressionsmodells ein insignifikanter Effekt von unem. Deshalb wird eine entsprechende OLS-Schätzung in den ersten Differenzen durchgeführt mit folgenden Ergebnissen (n(2-1) = 46 Beobachtungen, R 2 = 0,127): crmrte ˆ = 15,402 + 2,218 unem (4,702) (0,878) Damit zeigt sich nun der erwartete signifikant positive Effekt der Arbeitslosenrate, so dass sich durch die Differenzierung und damit Beseitigung des fixen Effektes ein völlig anderes Resultat ergibt. Interessant ist hier auch die geschätzte Konstante, die selbst bei gleichbleibender Arbeitslosenrate einen Anstieg der Kriminalitätsrate (um durchschnittlich über 15 Fälle pro 1000 Einwohner) impliziert. 18

--------------------------- Beispiel 1: Erklärung von Kriminalitätsraten (III) reg crmrte unem if year==87 Source SS df MS Number of obs = 46 -------------+------------------------------ F( 1, 44) = 1.48 Model 1775.90928 1 1775.90928 Prob > F = 0.2297 Residual 52674.6428 44 1197.15097 R-squared = 0.0326 -------------+------------------------------ Adj R-squared = 0.0106 Total 54450.5521 45 1210.01227 Root MSE = 34.6 crmrte Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- unem -4.161134 3.416456-1.22 0.230-11.04655 2.72428 _cons 128.3781 20.75663 6.18 0.000 86.54589 170.2104 reg crmrte unem Source SS df MS Number of obs = 92 -------------+------------------------------ F( 1, 90) = 0.11 Model 98.0718025 1 98.0718025 Prob > F = 0.7420 Residual 80947.4319 90 899.41591 R-squared = 0.0012 -------------+------------------------------ Adj R-squared = -0.0099 Total 81045.5037 91 890.609931 Root MSE = 29.99 crmrte Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- unem -.3076651.9317223-0.33 0.742-2.158694 1.543364 _cons 103.2434 8.058736 12.81 0.000 87.23332 119.2535 --------------------------- 19

--------------------------- Beispiel 1: Erklärung von Kriminalitätsraten (IV) reg crmrte unem d87 Source SS df MS Number of obs = 92 -------------+------------------------------ F( 2, 89) = 0.55 Model 989.717314 2 494.858657 Prob > F = 0.5788 Residual 80055.7864 89 899.503218 R-squared = 0.0122 -------------+------------------------------ Adj R-squared = -0.0100 Total 81045.5037 91 890.609931 Root MSE = 29.992 crmrte Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- unem.4265461 1.188279 0.36 0.720-1.934539 2.787631 d87 7.940413 7.975324 1.00 0.322-7.906386 23.78721 _cons 93.42026 12.73947 7.33 0.000 68.1072 118.7333 reg d.(crmrte unem) Source SS df MS Number of obs = 46 -------------+------------------------------ F( 1, 44) = 6.38 Model 2566.43056 1 2566.43056 Prob > F = 0.0152 Residual 17689.5426 44 402.035059 R-squared = 0.1267 -------------+------------------------------ Adj R-squared = 0.1069 Total 20255.9732 45 450.132737 Root MSE = 20.051 D.crmrte Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- unem D1. 2.217996.8778657 2.53 0.015.4487745 3.987218 _cons 15.40219 4.702116 3.28 0.002 5.925702 24.87869 20

--------------------------- Beispiel 2: Zusammenhang zwischen Schlaf und Arbeit (I) Mit Paneldaten von n = 239 Personen in den USA für 1975 und 1981 sollen die Determinanten der Schlafzeit in Minuten pro Woche (slpnap) untersucht werden. Als erklärende Variablen werden folgende Faktoren betrachtet: Arbeitszeit in Minuten pro Woche (totwrk) Ausbildungszeit in Jahren (educ) Familienstand, d.h. eine Dummy-Variable, die den Wert eins annimmt, falls die Person verheiratet ist (marr) Dummy-Variable für die Präsenz eines Kleinkindes (yngkid) Gesundheitsstatus (gdhlth) Analysiert wird ein lineares fixed effects Modell, bei dem zeitinvariante Variablen wie z.b. Geschlecht oder Hautfarbe nicht einbezogen werden. Bei der OLS-Schätzung in den ersten Differenzen impliziert der signifikant von null verschiedene negative Parameter für totwrk einen Trade-off zwischen Schlaf und Arbeit. Alle anderen Steigungsparameter sind nicht signifikant von null verschieden. Der sehr hohe Schätzwert der Standardabweichung bei educ weist auf die geringe Variation der Ausbildungszeit im Datensatz hin (bei mehr als 76% der 239 Personen liegt keinerlei Variation vor). Im Einzelnen zeigen sich mit STATA folgende Schätzergebnisse: --------------------------- 21

--------------------------- Beispiel 2: Zusammenhang zwischen Schlaf und Arbeit (II) xtset id year, delta(6) panel variable: id (strongly balanced) time variable: year, 75 to 81 delta: 6 units reg d.(slpnap totwrk educ marr yngkid gdhlth) Source SS df MS Number of obs = 239 -------------+------------------------------ F( 5, 233) = 8.19 Model 14674698.2 5 2934939.64 Prob > F = 0.0000 Residual 83482611.7 233 358294.471 R-squared = 0.1495 -------------+------------------------------ Adj R-squared = 0.1313 Total 98157309.9 238 412425.672 Root MSE = 598.58 D.slpnap Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- totwrk D1. -.2266694.036054-6.29 0.000 -.2977029 -.1556359 educ D1. -.0244717 48.75938-0.00 1.000-96.09008 96.04113 marr D1. 104.2139 92.85536 1.12 0.263-78.72946 287.1574 yngkid D1. 94.6654 87.65252 1.08 0.281-78.02739 267.3582 gdhlth D1. 87.57785 76.59913 1.14 0.254-63.33758 238.4933 _cons -92.63404 45.8659-2.02 0.045-182.9989-2.269152 --------------------------- 22

Mit first-differenced OLS-Schätzungen in linearen fixed effects Modellen können wie bei der vorherigen Betrachtung auch Programme wie z.b. Politikmaßnahmen untersucht werden. Der Unterschied liegt darin, dass bei Paneldaten dieselben Untersuchungseinheiten betrachtet werden können. Dadurch kann für unbeobachtete Heterogenität kontrolliert werden. Einfaches lineares fixed effects Modell: y = β + δ d2 + β prog + α + v für i = 1,, n; t = 1, 2 it 0 1 t 1 it i it Dabei nimmt d2 t wieder für t = 2 den Wert eins und für t = 1 den Wert null an. Die Dummy-Variable prog it nimmt dagegen den Wert eins an, wenn Untersuchungseinheit i in der entsprechenden Zeitperiode t von einem spezifischen Programm betroffen ist. Durch Differenzierung ergibt sich: Δy = δ + β Δprog + Δv i 1 1 i i Falls eine Programmbeteiligung nur in der zweiten Periode t = 2 vorliegt, ergibt sich für den OLS-Schätzer für β 1 in den ersten Differenzen: ˆβ = Δy - Δy 1 TG KG Dies ist die Paneldatenversion des vorherigen difference-in-differences Schätzers bei aggregierten Querschnittsdaten. Wenn eine Programmbeteiligung in beiden Perioden möglich ist, kann der first-differenced Schätzer für die Veränderung von y durch die Programmbeteiligung nicht mehr wie hier dargestellt werden. 23

--------------------------- Beispiel: Weiterbildungsprogramme und Ausschussraten (I) Für die Analyse des Effektes eines Weiterbildungsprogramms (grant) in Michigan auf Ausschussraten in Unternehmen in % (scrap) liegen Paneldaten für die Jahre 1987 und 1988 vor. Damit ergeben sich folgende linearen fixed effects und first-differenced Modelle (wobei y88 eine Dummy-Variable für 1988 ist): scrap = β + δ y88 + β grant + α + v für i = 1,, 54; t = 1, 2 it 0 1 t 1 it i it Δscrap = δ + β Δgrant + Δv i 1 1 i i Es zeigen sich folgende first-differenced OLS-Schätzergebnisse (R 2 = 0,022): ˆ Δscrap = -0,564-0,739Δgrant (0,405) (0,683) Demnach zeigt sich kein signifikanter Effekt des Weiterbildungsprogramms. Dagegen zeigen sich bei der Verwendung des Logarithmus der Ausschussraten (logscrap) folgende first-differenced OLS-Schätzergebnisse (R 2 = 0,067): Δlogscrap ˆ = -0,057-0,317Δgrant (0,097) (0,164) Für den difference-in-differences Schätzer ergibt sich nun ein t-wert von -1,93. Bei der Betrachtung einer gepoolten OLS-Schätzung zeigt sich dagegen kein signifikanter Effekt. --------------------------- 24

--------------------------- Beispiel: Weiterbildungsprogramme und Ausschussraten (II) reg scrap y88 grant Source SS df MS Number of obs = 108 -------------+------------------------------ F( 2, 105) = 0.45 Model 34.5580029 2 17.2790015 Prob > F = 0.6410 Residual 4062.74089 105 38.6927704 R-squared = 0.0084 -------------+------------------------------ Adj R-squared = -0.0105 Total 4097.2989 107 38.292513 Root MSE = 6.2204 scrap Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- y88 -.4199524 1.34983-0.31 0.756-3.096416 2.256511 grant -1.14803 1.77256-0.65 0.519-4.662689 2.366629 _cons 4.611667.8464826 5.45 0.000 2.933248 6.290085 reg logscrap y88 grant Source SS df MS Number of obs = 108 -------------+------------------------------ F( 2, 105) = 0.18 Model.810536031 2.405268016 Prob > F = 0.8378 Residual 240.098945 105 2.28665662 R-squared = 0.0034 -------------+------------------------------ Adj R-squared = -0.0156 Total 240.909481 107 2.25149048 Root MSE = 1.5122 logscrap Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- y88 -.1889081.3281441-0.58 0.566 -.8395572.461741 grant.0566004.43091 0.13 0.896 -.7978145.9110152 _cons.597434.2057802 2.90 0.005.1894099 1.005458 25

--------------------------- Beispiel: Weiterbildungsprogramme und Ausschussraten (III) reg d.(scrap grant) Source SS df MS Number of obs = 54 -------------+------------------------------ F( 1, 52) = 1.17 Model 6.73345587 1 6.73345587 Prob > F = 0.2837 Residual 298.400031 52 5.73846213 R-squared = 0.0221 -------------+------------------------------ Adj R-squared = 0.0033 Total 305.133487 53 5.7572356 Root MSE = 2.3955 D.scrap Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- grant D1. -.7394436.6826276-1.08 0.284-2.109236.6303488 _cons -.5637143.4049149-1.39 0.170-1.376235.2488069 reg d.(logscrap grant) Source SS df MS Number of obs = 54 -------------+------------------------------ F( 1, 52) = 3.74 Model 1.23795555 1 1.23795555 Prob > F = 0.0585 Residual 17.1971834 52.330715065 R-squared = 0.0672 -------------+------------------------------ Adj R-squared = 0.0492 Total 18.4351389 53.34783281 Root MSE =.57508 D.logscrap Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- grant D1. -.3170579.1638751-1.93 0.058 -.6458974.0117816 _cons -.0574357.097206-0.59 0.557 -.2524938.1376223 26

1.3 Einfache lineare Panelmodelle für mehr als zwei Perioden Wenn für i = 1,, n Querschnittseinheiten Paneldaten für t = 1,, T Perioden vorliegen (wobei bei mikroökonometrischen Betrachtungen T > 2 eher klein ist im Vergleich zu großen n) ergibt sich unter Einbeziehung von T-1 Dummy-Variablen für die Perioden t = 2,, T mit der Basisperiode t = 1 folgendes allgemeines lineares fixed effects Modell: y = β + δ d2 + δ d3 + + δ dt + β x + + β x + α + v it 0 1 t 2 t T-1 t 1 it1 k itk i it Dadurch liegen nun insgesamt N = nt Beobachtungen vor. Ausführlich dargestellt ergibt sich: y = β + β x + + β x + α + v i1 0 1 i11 k i1k i i1 y = β + δ + β x + + β x + α + v i2 0 1 1 i21 k i2k i i2 y = β + δ + β x + + β x + α + v it 0 T-1 1 it1 k itk i it Wie bereits erwähnt, setzt die Konsistenz der OLS-Schätzer im gepoolten linearen Regressionsmodel voraus, dass α i mit allen erklärenden Variablen unkorreliert ist. Aber selbst in diesem (oft unrealistischen) Fall liegen (wegen der Einbeziehung derselben Querschnittseinheiten i über die Zeit) meist für den gemeinsamen Störterm ε it = α i + v it (zumindest für einzelne i) Autokorrelationen vor, so dass z.b. die t-statistiken nicht mehr t-verteilt sind und entsprechend (z.b. cluster-) robuste t-statistiken (siehe Kapitel 2) betrachtet werden sollten. 27

Jedoch kann der fixe Effekt α i wiederum beseitigt werden, indem für das lineare fixed effects Modell für jede Untersuchungseinheit i und über alle Zeitperioden t = 2,, T die ersten Differenzen gebildet werden, wobei jeweils die erste von der zweiten Periode, die zweite von der dritten Periode subtrahiert wird usw. bis schließlich die Periode T-1 von Periode T subtrahiert wird. Damit ergibt sich für t = 2,, T folgendes lineares first-differenced Modell: Δy = δ Δd2 + δ Δd3 + + δ ΔdT + β Δx + + β Δx + Δv bzw. it 1 t 2 t T-1 t 1 it1 k itk it Δy = δ + β Δx + + β Δx + Δv i2 1 1 i21 k i2k i2 Δy = -δ + δ + β Δx + + β Δx + Δv i3 1 2 1 i31 k i3k i3 Δy = -δ + δ + β Δx + + β Δx + Δv it T-2 T-1 1 it1 k itk it Falls bei einer Aggregation der Daten über alle Perioden für dieses (gepoolte) first-differenced Modell die klassischen linearen Modellannahmen gelten, ergeben sich bei der OLS-Schätzung erwartungstreue Schätzer und die t- und F- Statistiken folgen der t- und F-Verteilung. Allerdings enthält dieses Modell keine Konstante. Dies ist für einige Anwendungen unpraktisch, weshalb in der Regel folgendes lineares first-differenced Modell mit einer Konstante und T-2 Dummy- Variablen für die Perioden t = 3, 4,, T betrachtet wird (die Einbeziehung einer linearen Zeittrendvariablen wäre auch möglich): 28

Δy it = β 0+ δ1d3 t+ δ2d4 t+ + δt-2dt t+ β1δx it1+ + βkδx itk+ Δvit Auch das lineare first-differenced Modell kann mit OLS geschätzt werden. Da bei einem balanced panel für jede Untersuchungseinheit i jeweils T-1 Perioden vorliegen, beträgt hier die gesamte Anzahl an Beobachtungen N = n(t-1). Im Folgenden werden die Annahmen zur Betrachtung des Erwartungswertes bei der OLS-Schätzung in allgemeinen linearen (gepoolten) first-differenced Modellen zusammengestellt: Annahme C1: Lineares fixed effects Modell y it = β 1 x it1 + + β k x itk + α i + v it Annahme C2: Zufallsstichprobe Es liegt im Querschnitt eine Stichprobe vom Umfang n aus der Grundgesamtheit vor Annahme C3: Keine perfekte Kollinearität und Zeitvarianz Jede erklärende Variable muss für einige i über die Zeit variieren und es besteht keine exakte lineare Beziehung zwischen den erklärenden Variablen Annahme C4: Bedingter Erwartungswert von v it ist null Für alle t ist der bedingte Erwartungswert des idiosynkratischen Fehlers, gegeben die erklärenden Variablen in allen Perioden sowie der unbeobachtete Effekt, null, d.h. E(v it x i, α i ) = 0 29

Mit diesen vier Annahmen C1 bis C4 sind die first-differenced OLS-Schätzungen der Regressionsparameter erwartungstreu und für festes T mit n konsistent. Zu Annahme C4 : Mit dem k-dimensionalen Vektor x it = (x it1,, x itk ) beinhaltet der T k-dimensionale Vektor x i = (x i1,, x it ) für eine Querschnittseinheit i alle erklärenden Variablen x ith über alle Zeitperioden (t = 1,, T; h = 1,, k) Unter dieser Annahme liegt eine bedingte strikte Exogenität der erklärenden Variablen, gegeben der fixe Effekt, vor. Damit besteht keine Korrelation zwischen den erklärenden Variablen und dem idiosynkratischen Fehler, wenn für die unbeobachtete Heterogenität kontrolliert wird. Annahme C4 ist restriktiver als notwendig und bezieht sich auf die Betonung des interessierenden Erwartungswertes E(y it x i, α i ) = β 1 x it1 + + β k x itk + α i, wobei der Steigungsparameter β h den partiellen Effekt der erklärenden Variablen x h misst, wenn für unbeobachtete Heterogenität kontrolliert wird Ausreichend für die Erwartungstreue der OLS-Schätzer in den ersten Differenzen wäre es, wenn E( v it x i ) = 0 (t = 2,, T). Ausreichend für die Konsistenz der Schätzer wäre es, wenn die x ith mit den v it unkorreliert sind. Dies gilt bereits bei schwacher Exogenität der erklärenden Variablen, d.h. mit E(v it x i1,, x it, α i ) = 0, so dass hierfür nicht die strikte Exogenität notwendig ist mit E(v it x i, α i ) = E(v it x i1,, x it,, x it, α i ) = 0. 30

Weitere Annahmen: Annahme C5: Homoskedastizität Die bedingte Varianz der ersten Differenzen der idiosynkratischen Fehler, gegeben alle erklärenden Variablen, ist für alle Zeitperioden t = 2,, T konstant, d.h. Var( v it x i ) = σ 2 Annahme C6: Keine Autokorrelation Für alle Perioden t s sind die ersten Differenzen der idiosynkratischen Fehler unter der Bedingung von x i unkorreliert, d.h. Cov( v it, v is x i ) = 0 Mit den sechs Annahmen C1 bis C6 sind die first-differenced OLS-Schätzer die besten linearen unverzerrten Schätzer unter der Bedingung von x i. Zusätzliche Annahme C7: Normalverteilung Unter der Bedingung von x i sind die ersten Differenzen der idiosynkratischen Fehler v it unabhängig und identisch normalverteilt Unter den sieben Annahmen C1 bis C7 sind die first-differenced OLS-Schätzer unter der Bedingung von x i normalverteilt, so dass die entsprechenden t- und F-Statistiken den t- und F-Verteilungen folgen. Ohne die Annahme C7, aber mit den sechs Annahmen C1 bis C6 kann jedoch die asymptotische Normalverteilung von Funktionen des OLS-Schätzers in den ersten Differenzen sowie die asymptotische t- und F-Verteilung der t- und F-Statistiken abgeleitet werden. 31

Zu Annahme C6: Falls die ursprünglichen idiosynkratischen Fehler v it über die Zeit unkorreliert sind, ergibt sich daraus nicht zwangsläufig, dass die ersten Differenzen v it der idiosynkratischen Fehler über die Zeit unkorreliert sind Falls die v it keine Autokorrelation und eine konstante Varianz aufweisen, ergibt sich für die Korrelation zwischen v it und v i,t+1 der Wert -0,5. Falls die v it einem stabilen AR(1) Prozess folgen (v it = ρv i,t-1 + e t ), sind die v it autokorreliert. Lediglich wenn die v it einem random walk folgen (v it = v i,t-1 + e t ), sind die v it nicht autokorreliert. Zur statistischen Überprüfung, dass die v it keine AR(1) Autokorrelation aufweisen, kann ein entsprechender t-test auf AR(1) Autokorrelation der Fehlerterme auf die Betrachtung der ersten Differenzen der idiosynkratischen Fehler übertragen werden Falls eine Autokorrelation in den v it vorliegt, können GLS-Schätzungen angewendet oder aber autokorrelations- (und auch heteroskedastizitäts-) robuste Korrekturen bei den Schätzern der Varianzen der geschätzten Parameter und damit bei den t-statistiken durchgeführt werden. Voraussetzung dafür ist aber, dass n groß und vor allem deutlich größer als T ist. Falls keine Autokorrelation in den v it vorliegt, können entsprechende Tests auf Heteroskedastizität (z.b. der Breusch-Pagan-Test) durchgeführt sowie heteroskedastizitäts-robuste Schätzer der Varianzen der geschätzten Parameter und damit t-statistiken abgeleitet werden 32

--------------------------- Beispiel 1: Effekt von Industriefördergebieten auf Arbeitslosenzahlen (I) Mit Hilfe von Paneldaten und eines linearen fixed effects Modells soll der Effekt eines Programms zur Einrichtung von Industriefördergebieten in Indiana auf den Logarithmus von Arbeitslosenzahlen (loguclms) für i = 1,, 22 Städte in Indiana über die Jahre von t = 1980 bis t = 1988 (T = 9) untersucht werden: loguclms = β + δ d81 + + δ d88 + β ez + α + v it 0 1 t 8 t 1 it i it Die Dummy-Variable ez it nimmt dabei den Wert eins an, wenn Stadt i im Jahr t ein Industriefördergebiet ist. Die Dummy-Variablen d81,, d88 beziehen sich auf die jeweiligen Jahre. Der fixe Effekt α i kann als allgemeines ökonomisches Umfeld in Stadt i interpretiert werden. Wenn die Einrichtung von Industriefördergebieten nicht zufällig ist, sondern vom ökonomischen Umfeld abhängt, sind ez it und α i korreliert, so dass α i im folgenden linearen first-differenced Modell beseitigt werden sollte (t = 1981,, t = 1988): loguclms = β + δ d82 + + δ d88 + β ez + Δv it 0 1 t 7 t 1 it it Mit N = n(t-1) = 22 8 = 176 Beobachtungen hat sich der first-differenced Schätzer β 1 = -0,182 bei einer geschätzten Standardabweichung von 0,078 ergeben. Damit ergibt sich ein signifikant negativer Effekt der Präsenz eines Industriefördergebietes. Der geschätzte Parameter impliziert näherungsweise eine durchschnittliche über 18% geringere Arbeitslosenzahl. --------------------------- 33

--------------------------- Beispiel 1: Effekt von Industriefördergebieten auf Arbeitslosenzahlen (II) reg d.(loguclms) d82 d83 d84 d85 d86 d87 d88 d.(ez) Source SS df MS Number of obs = 176 -------------+------------------------------ F( 8, 167) = 34.50 Model 12.8826177 8 1.61032721 Prob > F = 0.0000 Residual 7.79579179 167.046681388 R-squared = 0.6230 -------------+------------------------------ Adj R-squared = 0.6049 Total 20.6784095 175.11816234 Root MSE =.21606 D.loguclms Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- d82.7787587.0651442 11.95 0.000.6501465.907371 d83 -.0331199.0651442-0.51 0.612 -.1617321.0954923 d84 -.0171392.0685453-0.25 0.803 -.1524661.1181877 d85.3230797.0666772 4.85 0.000.1914409.4547186 d86.2921541.0651442 4.48 0.000.1635419.4207663 d87.0539477.0651442 0.83 0.409 -.0746646.1825599 d88 -.0170527.0651442-0.26 0.794 -.1456649.1115596 ez D1. -.1818761.0781859-2.33 0.021 -.3362363 -.0275159 _cons -.3216314.0460639-6.98 0.000 -.412574 -.2306888 --------------------------- 34

--------------------------- Beispiel 1: Effekt von Industriefördergebieten auf Arbeitslosenzahlen (III) Zum Vergleich zeigen sich in einem linearen gepoolten Regressionsmodell mit STATA folgende OLS-Schätzergebnisse: reg loguclms d81 d82 d83 d84 d85 d86 d87 d88 ez Source SS df MS Number of obs = 198 -------------+------------------------------ F( 9, 188) = 11.44 Model 35.5700478 9 3.95222754 Prob > F = 0.0000 Residual 64.9261685 188.34535196 R-squared = 0.3539 -------------+------------------------------ Adj R-squared = 0.3230 Total 100.496216 197.510133078 Root MSE =.58767 loguclms Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- d81 -.3216314.1771881-1.82 0.071 -.6711638.027901 d82.1354959.1771881 0.76 0.445 -.2140365.4850283 d83 -.2192554.1771881-1.24 0.217 -.5687879.130277 d84 -.5970718.1799354-3.32 0.001 -.9520237 -.24212 d85 -.621654.1847186-3.37 0.001 -.9860415 -.2572666 d86 -.6511314.1847186-3.52 0.001-1.015519 -.2867439 d87 -.9188151.1847186-4.97 0.000-1.283203 -.5544277 d88-1.257499.1847186-6.81 0.000-1.621887 -.8931118 ez -.0387083.11485-0.34 0.736 -.2652686.187852 _cons 11.69439.1252909 93.34 0.000 11.44724 11.94155 --------------------------- 35

--------------------------- Beispiel 2: Erklärung von Kriminalitätsraten (I) Mit Hilfe von Paneldaten für n = 90 Regionen in North Carolina für die Jahre von 1981 bis 1987 (T = 7) soll ein lineares fixed effects Modell für die Erklärung des Logarithmus der Anzahl von Straftaten pro Person (logcrmrte) betrachtet werden. Der unbeobachtete Effekt α i kann dabei verschiedene Faktoren wie geographische Lage oder Verhalten gegenüber Straftaten beinhalten. Als erklärende Variablen werden folgende Faktoren betrachtet: Logarithmus der Wahrscheinlichkeit einer Festnahme (logprbarr) Logarithmus der Wahrscheinlichkeit einer Verurteilung nach Festnahme (logprbcon) Logarithmus der Wahrscheinlichkeit eines Gefängnisaufenthalts nach Verurteilung (logprbpris) Logarithmus der durchschnittlichen Höhe des Strafmaßes (logavgsen) Logarithmus der Anzahl von PolizistInnen pro Kopf (logpolpc) Daneben wird die maximal mögliche Anzahl an Dummy-Variablen (d83, d84, d85, d86, d87) für die einzelnen Jahre einbezogen. Bei der OLS-Schätzung in den ersten Differenzen (mit einer cluster-robusten Schätzung der Standardabweichungen der geschätzten Regressionsparameter, siehe Kapitel 2) zeigen sich mit STATA folgende Schätzergebnisse: --------------------------- 36

--------------------------- Beispiel 2: Erklärung von Kriminalitätsraten (II) reg d.(logcrmrte) d83 d84 d85 d86 d87 d.(logprbarr logprbcon logprbpri logavgsen logpolpc), cluster(county) Linear regression Number of obs = 540 F( 10, 89) = 13.56 Prob > F = 0.0000 R-squared = 0.4325 Root MSE =.15431 (Std. Err. adjusted for 90 clusters in county) Robust D.logcrmrte Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- d83 -.0998657.0222563-4.49 0.000 -.1440886 -.0556429 d84 -.0479375.0200531-2.39 0.019 -.0877825 -.0080924 d85 -.0046111.02503-0.18 0.854 -.0543452.045123 d86.0275143.0211829 1.30 0.197 -.0145757.0696043 d87.0408267.0241102 1.69 0.094 -.0070797.0887331 logprbarr D1. -.3274944.0564281-5.80 0.000 -.4396158 -.2153729 logprbcon D1. -.2381068.0395843-6.02 0.000 -.31676 -.1594535 logprbpri D1. -.1650464.0457923-3.60 0.001 -.2560347 -.0740581 logavgsen D1. -.0217607.02582-0.84 0.402 -.0730644.0295431 logpolpc D1..3984266.1029343 3.87 0.000.1938983.6029549 _cons.0077133.0137846 0.56 0.577 -.0196763.035103 37

--------------------------- Beispiel 2: Erklärung von Kriminalitätsraten (III) Damit zeigen sich für die drei Wahrscheinlichkeitsvariablen die erwarteten signifikant negativen Elastizitäten (z.b. geschätzte 0,327% bei einer Erhöhung der Wahrscheinlichkeit einer Festnahme um 1%). Lediglich der positiv geschätzte Parameter für die Anzahl von PolizistInnen ist unplausibel. Zum Vergleich zeigen sich in einem linearen gepoolten Regressionsmodell (mit N = n T = 90 7 = 630) mit STATA folgende OLS-Schätzergebnisse: reg logcrmrte d82 d83 d84 d85 d86 d87 logprbarr logprbcon logprbpri logavgsen logpolpc, cluster(county) Robust logcrmrte Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- d82.0051371.0367296 0.14 0.889 -.0678439.0781181 d83 -.043503.033643-1.29 0.199 -.1103508.0233449 d84 -.1087542.0391758-2.78 0.007 -.1865956 -.0309127 d85 -.0780453.0385625-2.02 0.046 -.1546682 -.0014224 d86 -.0420791.0428788-0.98 0.329 -.1272783.0431201 d87 -.0270426.0381447-0.71 0.480 -.1028354.0487502 logprbarr -.7195033.1095979-6.56 0.000 -.9372719 -.5017346 logprbcon -.5456588.0704368-7.75 0.000 -.6856152 -.4057024 logprbpri.2475521.1088453 2.27 0.025.0312787.4638255 logavgsen -.0867575.1130321-0.77 0.445 -.3113499.1378349 logpolpc.3659887.1210781 3.02 0.003.1254092.6065682 _cons -2.082293.8647056-2.41 0.018-3.800445 -.3641417 38