2. Statische lineare Panelmodelle

Größe: px
Ab Seite anzeigen:

Download "2. Statische lineare Panelmodelle"

Transkript

1 2. Statische lineare Panelmodelle 2.1 Fixed effects Schätzung Eine gegenüber der first-differenced OLS-Schätzung oft vorteilhaftere Vorgehensweise zur Beseitigung der fixen Effekte α i in linearen fixed effects Modellen ergibt sich durch eine fixed effects Transformation Ausgangspunkt ist dabei folgendes lineares Panelmodell mit unbeobachteter Heterogenität: y = β x + β x + + β x + α + v für i = 1,..., n; t = 1,..., T it 1 it1 2 it2 k itk i it Für jede Querschnittseinheit i wird bei diesen Gleichungen das arithmetische Mittel über die Zeit gebildet: y = β x + β x + i 1 i1 2 i2 k ik i i Dabei gilt: T T 1 1 i it i1 it1 T t=1 T t=1 + β x + α + v y = y ; x = x usw. Da der fixe Effekt α i zeitinvariant ist, erscheint er in beiden Gleichungen. 1

2 Im Folgenden wird für alle t = 1,, T die obige Gleichung subtrahiert: y - y = β (x - x ) + β (x - x ) + + β (x - x ) + v - v it i 1 it1 i1 2 it2 i2 k itk ik it i Mit y it = y it - y i, x it1 = x it1 - x i1,, x itk = x itk - x ik sowie v it = v it - v i ergibt sich: y = β x + β x + + β x + v it 1 it1 2 it2 k itk it Diese fixed effects Transformation wird auch als within Transformation bezeichnet. Da der unbeobachtete Effekt (ebenso wie eine Konstante) nun beseitigt ist, kann hier eine gepoolte OLS-Schätzung durchgeführt werden (üblicherweise wird dabei von ökonometrischen Programmpaketen wie z.b. STATA auch eine geschätzte Konstante ausgewiesen, siehe unten). Dieser Schätzer wird als fixed effects oder within Schätzer bezeichnet. Diese Bezeichnung basiert darauf, dass sich die OLS-Schätzung auf die zeitliche Variation aller Variablen innerhalb (within) jeder Querschnittseinheit bezieht. Einen entsprechenden between Schätzer erhält man durch eine OLS-Schätzung allein mit den arithmetischen Mitteln der abhängigen und erklärenden Variablen über die Zeit, wobei zusätzlich noch eine Konstante einbezogen wird. Dabei handelt es sich letztlich um eine Querschnittsgleichung, die wie ein lineares Regressionsmodell mit Querschnittsdaten behandelt werden kann. Allerdings wird dieser Schätzer nicht sehr häufig angewendet, da er die wichtige Information, wie sich die Variablen über die Zeit verändern, ignoriert und da er verzerrt ist, falls α i mit den arithmetischen Mitteln der erklärenden Variablen korreliert ist. 2

3 Der fixed effects Schätzer erlaubt ebenso wie der first-differenced Schätzer in linearen Panelmodellen mit unbeobachteter Heterogenität in jeder Zeitperiode beliebige Korrelationen zwischen α i und den erklärenden Variablen. Allerdings müssen beim within Schätzer für dessen Erwartungstreue dieselben Annahmen vorliegen wie bei der Erwartungstreue von first-differenced Schätzern: Annahme D1: Lineares fixed effects Modell y it = β 1 x it1 + + β k x itk + α i + v it Annahme D2: Zufallsstichprobe Es liegt im Querschnitt eine Stichprobe vom Umfang n aus der Grundgesamtheit vor Annahme D3: Keine perfekte Kollinearität und Zeitvarianz Jede erklärende Variable muss für einige i über die Zeit variieren (es können also erneut Variablen wie z.b. Geschlecht nicht einbezogen werden) und es besteht keine exakte lineare Beziehung zwischen den erklärenden Variablen Annahme D4: Bedingter Erwartungswert von v it ist null Für alle t ist der bedingte Erwartungswert des idiosynkratischen Fehlers, gegeben die erklärenden Variablen in allen Perioden sowie der unbeobachtete Effekt, null, d.h. E(v it x i, α i ) = 0. Diese Unkorreliertheit von v it und x i impliziert wiederum die strikte Exogenität der erklärenden Variablen. Mit diesen vier Annahmen D1 bis D4 sind auch die within Schätzer der Regressionsparameter erwartungstreu und für festes T mit n konsistent. 3

4 Weitere Annahmen: Annahme D5: Homoskedastizität Var(v it x i, α i ) = σ 2 (für alle t = 1,, T) Annahme D6: Keine Autokorrelation Für alle Perioden t s sind die idiosynkratischen Fehler unter der Bedingung von x i und α i ) unkorreliert, d.h. Cov(v it, v is x i, α i ) = 0 Mit diesen sechs Annahmen D1 bis D6 sind die fixed effects Schätzer der Regressionsparameter die besten linearen unverzerrten Schätzer. Da der first-differenced Schätzer auch linear und unverzerrt ist, besitzt der within Schätzer notwendigerweise eine geringere Varianz. Diese Überlegenheit des within Schätzers basiert auf Annahme D6, die keine Autokorrelation in den idiosynkratischen Fehlern impliziert (und sich deshalb von Annahme C6 unterscheidet). Zusätzliche Annahme D7: Normalverteilung Unter der Bedingung von x i und α i sind die idiosynkratischen Fehler v it unabhängig und identisch normalverteilt mit Erwartungswert null und Varianz σ v 2 Annahme D7 impliziert die Annahmen D4 bis D6, ist aber aufgrund der Annahme der Normalverteilung restriktiver. Mit den sieben Annahmen D1 bis D7 folgen die t- und F-Statistiken bei fixed effects Schätzern exakt den t- und F-Verteilungen. Ohne die Annahme D7 können jedoch (bei großen n und kleinen T) asymptotische Approximationen abgeleitet werden. 4

5 Bemerkungen: Bei der fixed effects Schätzung der Parameter der k erklärenden Variablen (Konstanten werden durch die within Transformation eliminiert) können insgesamt N = nt Beobachtungen verwendet werden. Dies könnte bei der Ableitung von Teststatistiken zu einer Betrachtung von nt-k Freiheitsgraden verleiten. Allerdings geht für jede Querschnittseinheit i bei der within Transformation ein Freiheitsgrad verloren, so dass die korrekte Anzahl an Freiheitsgraden nt-n-k = n(t-1)-k lautet. Diese Korrektur muss bei einer eigenen within Schätzung durchgeführt werden, wird aber bei der Verwendung von Programmpaketen (z.b. STATA) üblicherweise beachtet. Obwohl zeitinvariante erklärende Variablen bei fixed effects Schätzungen nicht verwendet werden können, ist die Einbeziehung von Interaktionstermen von zeitinvarianten und zeitvarianten Variablen (einschließlich Dummy- Variablen für Zeitperioden) möglich. Zur Erklärung von individuellen Löhnen kann z.b. Bildung nicht einbezogen werden, wenn diese für alle betrachteten Personen über die Zeit konstant ist. Jedoch kann zur Überprüfung, ob der Effekt von Bildung sich über die Zeit ändert, Bildung mit allen Dummy- Variablen für Zeitperioden (außer für die Basisperiode) interagiert werden. Die Einbeziehung der maximal möglichen Anzahl an Dummy-Variablen für die Perioden (oder eines linearen Zeittrends) schließt die Identifikation des Effektes erklärender Variablen aus, die sich bei allen Querschnittseinheiten i mit dem gleichen Betrag über die Zeit verändern (z.b. Alter) 5

6 Beispiel 1: Weiterbildungsprogramme und Ausschussraten (I) Für die Analyse des Effektes von Beihilfen im Rahmen eines Weiterbildungsprogramms in Michigan auf den Logarithmus der Ausschussraten (logscrap) in 54 Unternehmen liegen Paneldaten für die Jahre 1987, 1988 und 1989 vor. Vor 1988 hat kein Unternehmen eine entsprechende Beihilfe erhalten. In 1988 haben 19 Unternehmen und in 1989 haben 10 andere Unternehmen eine Weiterbildungsbeihilfe bekommen. Als erklärende Variablen werden folgende Faktoren betrachtet: Beihilfe in einem Jahr t (grant) Um ein Jahr verzögerte Beihilfe (grantlagged) zur Überprüfung, ob eine Beihilfe in 1988 einen Effekt auf die Ausschussraten 1989 hat Dummy-Variablen für 1988 (d88) und für 1989 (d89) Bei der fixed effects Schätzung zeigen sich mit STATA folgende Ergebnisse:

7 Beispiel 1: Weiterbildungsprogramme und Ausschussraten (II) xtreg logscrap grant grantlagged d88 d89, fe Fixed-effects (within) regression Number of obs = 162 Group variable: fcode Number of groups = 54 R-sq: within = Obs per group: min = 3 between = avg = 3.0 overall = max = 3 F(4,104) = 6.54 corr(u_i, Xb) = Prob > F = logscrap Coef. Std. Err. t P> t [95% Conf. Interval] grant grantlagged d d _cons sigma_u sigma_e rho (fraction of variance due to u_i) F test that all u_i=0: F(53, 104) = Prob > F =

8 Beispiel 1: Weiterbildungsprogramme und Ausschussraten (III) Interpretation der Ergebnisse: Die Interpretation der Schätzergebnisse bezieht sich meist auf das zugrundeliegende lineare fixed effects Modell und nicht auf die Gleichung mit Differenzenbildung Der geschätzte Effekt der um ein Jahr verzögerten Beihilfe ist stärker als der kontemporäre Effekt und impliziert näherungsweise einen durchschnittlichen Rückgang der Ausschussrate von 42,2%. Zudem ist der geschätzte Parameter für die verzögerte Beihilfe im Vergleich zum geschätzten Parameter für die kontemporäre Beihilfe bei einem geringeren Signifikanzniveau von 5% von null verschieden. Falls die verzögerte Beihilfe nicht als erklärende Variable einbezogen wird, ergibt sich für die kontemporäre Beihilfe ein geschätzter Parameterwert von -0,082 bei einem t-wert von -0,65 Der geschätzte Parameter für d89 impliziert, dass die Ausschussraten unabhängig von den Weiterbildungsbeihilfen im Jahr 1989 geringer waren als im Jahr

9 Beispiel 1: Weiterbildungsprogramme und Ausschussraten (IV) Falls diese beiden Dummy-Variablen nicht einbezogen werden, schlägt sich der zeitliche Rückgang der Ausschussraten im Effekt der Beihilfe nieder: xtreg logscrap grant grantlagged, fe Fixed-effects (within) regression Number of obs = 162 Group variable: fcode Number of groups = 54 R-sq: within = Obs per group: min = 3 between = avg = 3.0 overall = max = 3 F(2,106) = corr(u_i, Xb) = Prob > F = logscrap Coef. Std. Err. t P> t [95% Conf. Interval] grant grantlagged _cons sigma_u sigma_e rho (fraction of variance due to u_i) F test that all u_i=0: F(53, 106) = Prob > F =

10 Beispiel 1: Weiterbildungsprogramme und Ausschussraten (V) Zum Vergleich zeigen sich in einem linearen gepoolten Regressionsmodell unter Einbeziehung der beiden Dummy-Variablen für 1988 und 1989 mit STATA folgende OLS-Schätzergebnisse: reg logscrap grant grantlagged d88 d89 Source SS df MS Number of obs = F( 4, 157) = 0.69 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = logscrap Coef. Std. Err. t P> t [95% Conf. Interval] grant grantlagged d d _cons

11 Beispiel 1: Weiterbildungsprogramme und Ausschussraten (VI) Darüber hinaus zeigen sich in einem linearen first-differenced Modell unter Einbeziehung der Dummy-Variablen für 1989 (und damit der maximal möglichen Anzahl an Dummy-Variablen für die drei Jahre 1987, 1988, 1989) mit STATA folgende OLS-Schätzergebnisse: reg d.(logscrap grant grantlagged) d89 Source SS df MS Number of obs = F( 3, 104) = 1.31 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = D.logscrap Coef. Std. Err. t P> t [95% Conf. Interval] grant D grantlagged D d _cons

12 Beispiel 2: Erklärung von Löhnen (I) Bei der Analyse der Determinanten des Logarithmus von Löhnen (logwage) liegen Paneldaten für 545 dauerhaft berufstätige Männer für die Jahre von 1980 bis 1987 vor. Einige Variablen im Datensatz variieren dabei über die Zeit, während andere zeitinvariant sind. Für within Schätzer (oder auch first-differenced Schätzer) kann z.b. Hautfarbe nicht alleine, aber als Interaktionsterm mit Dummy-Variablen für die Jahre 1981 bis 1987 einbezogen werden. Als erklärende Variablen werden deshalb jetzt folgende Faktoren betrachtet: Familienstand (married) Gewerkschaftszugehörigkeit (union) Dummy-Variablen für die Jahre 1981 (d81) bis 1987 (d87) Interaktionsterme des Bildungsstands mit den Dummy-Variablen d81 bis d87 (d81educ,, d87educ) Bei der entsprechenden fixed effects Schätzung ergeben sich für alle Interaktionsterme positive Schätzwerte. Der größte Schätzwert von 0,030 zeigt sich beim Interaktionsterm von Bildungsstand und der Dummy-Variable für 1987 bei einem t-wert von 2,48. Dies impliziert einen um drei Prozentpunkte (!) höheren (partiellen) Effekt (!) des Bildungsstandes in 1987 im Vergleich zu Es zeigen sich mit STATA folgende Schätzergebnisse:

13 Beispiel 2: Erklärung von Löhnen (II) xtreg logwage married union d81 d82 d83 d84 d85 d86 d87 d81educ d82educ d83educ d84educ d85educ d86educ d87educ, fe Fixed-effects (within) regression Number of obs = 4360 Group variable: nr Number of groups = 545 R-sq: within = Obs per group: min = 8 between = avg = 8.0 overall = max = 8 F(16,3799) = corr(u_i, Xb) = Prob > F = logwage Coef. Std. Err. t P> t [95% Conf. Interval] married union d d d81educ d87educ _cons sigma_u sigma_e rho (fraction of variance due to u_i)

14 Beispiel 2: Erklärung von Löhnen (III) Die Hypothese, dass alle sieben Parameter der Interaktionsterme gemeinsam den Wert null aufweisen, kann bei üblichen Signifikanzniveaus nicht verworfen werden. Dabei lautet die Anzahl der Freiheitsgrade für diesen F-Test 7 und n(t-1)-k = = Mit STATA zeigen sich folgende Testergebnisse: test d81educ d82educ d83educ d84educ d85educ d86educ d87educ ( 1) d81educ = 0 ( 2) d82educ = 0 ( 3) d83educ = 0 ( 4) d84educ = 0 ( 5) d85educ = 0 ( 6) d86educ = 0 ( 7) d87educ = 0 F( 7, 3799) = 1.24 Prob > F = Dagegen sind die Parameter von married und union gemeinsam hochsignifikant von null verschieden. Mit STATA zeigen sich folgende Ergebnisse des entsprechenden F-Tests: test married union ( 1) married = 0 ( 2) union = 0 F( 2, 3799) = Prob > F =

15 Beispiel 2: Erklärung von Löhnen (IV) Obwohl die Parameter von d81 und d81educ jeweils nicht signifikant von null verschieden sind, sind sie gemeinsam (ebenso wie die anderen Paare der Dummy-Variablen für die einzelnen Jahre und der jeweiligen Interaktionsterme) hochsignifikant von null verschieden. Mit STATA zeigen sich z.b. folgende Ergebnisse von entsprechenden F-Tests: test d81 d81educ ( 1) d81 = 0 ( 2) d81educ = 0 F( 2, 3799) = Prob > F = test d87 d87educ ( 1) d87 = 0 ( 2) d87educ = 0 F( 2, 3799) = Prob > F = Diese Testergebnisse weisen auf stark unterschiedliche Löhne über die Zeit (im Vergleich zu 1980) hin. Der signifikante Anstieg lässt sich durch eine fixed effects Schätzung ohne Einbeziehung der Interaktionsterme erkennen. Dabei zeigen sich mit STATA folgende Schätzergebnisse:

16 Beispiel 2: Erklärung von Löhnen (V) xtreg logwage married union d81 d82 d83 d84 d85 d86 d87, fe Fixed-effects (within) regression Number of obs = 4360 Group variable: nr Number of groups = 545 R-sq: within = Obs per group: min = 8 between = avg = 8.0 overall = max = 8 F(9,3806) = corr(u_i, Xb) = Prob > F = logwage Coef. Std. Err. t P> t [95% Conf. Interval] married union d d d d d d d _cons sigma_u sigma_e rho (fraction of variance due to u_i) F test that all u_i=0: F(544, 3806) = 9.14 Prob > F =

17 Beispiel 2: Erklärung von Löhnen (VI) Die alternative Einbeziehung einer linearen Zeittrendvariablen (year) ist auch möglich. Es zeigen sich mit STATA folgende Schätzergebnisse: xtreg logwage married union year, fe Fixed-effects (within) regression Number of obs = 4360 Group variable: nr Number of groups = 545 R-sq: within = Obs per group: min = 8 between = avg = 8.0 overall = max = 8 F(3,3812) = corr(u_i, Xb) = Prob > F = logwage Coef. Std. Err. t P> t [95% Conf. Interval] married union year _cons sigma_u sigma_e rho (fraction of variance due to u_i) F test that all u_i=0: F(544, 3812) = Prob > F =

18 Beispiel 2: Erklärung von Löhnen (VII) Zum Vergleich zeigen sich in einem linearen first-differenced Modell unter Einbeziehung der Dummy-Variablen d82 bis d87 mit STATA folgende OLS-Schätzergebnisse: reg d.(logwage married union) d82 d83 d84 d85 d86 d87 Source SS df MS Number of obs = F( 8, 3806) = 2.19 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = D.logwage Coef. Std. Err. t P> t [95% Conf. Interval] married D union D d d d d d d _cons

19 Beispiel 2: Erklärung von Löhnen (VIII) Mit der Einbeziehung einer linearen Zeittrendvariablen (year) anstatt d82 bis d87 zeigen sich mit STATA folgende Schätzergebnisse: reg d.(logwage married union) year Source SS df MS Number of obs = F( 3, 3811) = 3.43 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = D.logwage Coef. Std. Err. t P> t [95% Conf. Interval] married D union D year _cons

20 Dummy-Variablen Schätzung in linearen Panelmodellen mit unbeobachteter Heterogenität: Bei einer traditionellen Sichtweise der fixed effects Schätzung wird der unbeobachtete Effekt α i für Querschnittseinheit i, also z.b. für eine Person, einen Haushalt, ein Unternehmen oder eine Region zusammen mit den Regressionsparametern geschätzt. Das heißt, für alle n-1 Querschnittseinheiten (eine Einheit stellt die Basisgruppe dar) wird eine Konstante geschätzt. Hierzu werden neben der Betrachtung einer generellen Konstanten zusätzlich für n-1 Querschnittseinheiten Dummy-Variablen konstruiert, deren Parameter zusammen mit den anderen Regressionsparametern mit OLS geschätzt werden. Ein solches Vorgehen wird als Dummy-Variablen Schätzung bezeichnet, die bei einer Querschnittsanalyse nicht möglich ist, da bei n Beobachtungen nicht n+k Parameter geschätzt werden können. Somit müssen bei Dummy-Variablen Schätzungen mindestens zwei Perioden vorliegen, wenngleich auch bei einer moderaten Anzahl n die Anzahl der erklärenden Variablen und damit der zu schätzenden Regressionsparameter oft zu hoch ist. Dies schränkt die Praktikabilität der Anwendung dieser Schätzmethode ein. Ein wichtiges Kennzeichen von Dummy-Variablen Schätzungen ist, dass die geschätzten Regressionsparameter sowie geschätzten Standardabweichungen der Schätzwerte und Teststatistiken identisch sind mit den entsprechenden Ergebnissen bei der fixed effects Schätzung 20

21 Ein Vorzug von Dummy-Variablen Schätzungen ist, dass die korrekte Anzahl an Freiheitsgraden automatisch berechnet wird, wenngleich die korrekte Anzahl bei fixed effects Schätzungen mittlerweile meist auch von Programmpaketen (z.b. STATA) ausgewiesen wird Bei Dummy-Variablen Schätzungen ergeben sich durch die hohe Anzahl einbezogener Dummy-Variablen üblicherweise hohe Werte für R 2 Mit Hilfe von F-Tests kann überprüft werden, ob alle n-1 Dummy-Variablen den Wert null annehmen. Sehr häufig wird diese Nullhypothese bei geringen Signifikanzniveaus verworfen. In seltenen Fällen können die geschätzten Konstanten α i von Interesse sein, z.b. zur Überprüfung, ob diese für ein spezifisches i vom durchschnittlichen Wert für die anderen Querschnittseinheiten abweicht. Diese Schätzwerte können aber auch sehr einfach auf Basis von fixed effects Schätzungen mit entsprechenden Durchschnittswerten über die Zeit berechnet werden: ˆα = y - βˆ x - - βˆ x i i 1 i1 k ik Viele ökonometrische Programmpakete (wie z.b. STATA) weisen bei fixed effects Schätzungen eine geschätzte Konstante aus, die meist den Durchschnitt der α i über alle Querschnittseinheiten i darstellt In den meisten Fällen stehen aber die geschätzten Regressionsparameter der erklärenden Variablen im Blickpunkt, so dass die unbeobachteten Effekte üblicherweise als vernachlässigbare Variablen angesehen werden, für die bei within Schätzungen kontrolliert wird 21

22 Beispiel: Weiterbildungsprogramme und Ausschussraten (I) Wie zuvor wird wieder mit Paneldaten für die Jahre 1987, 1988 und 1989 der Effekt von Beihilfen im Rahmen eines Weiterbildungsprogramms in Michigan auf den Logarithmus der Ausschussraten (logscrap) in 54 Unternehmen untersucht. Als erklärende Variablen werden erneut die Beihilfe in einem Jahr t (grant), die um ein Jahr verzögerte Beihilfe (grantlagged) sowie Dummy-Variablen für 1988 (d88) und für 1989 (d89) betrachtet. Allerdings wird jetzt keine traditionelle fixed effects Schätzung betrachtet: Stattdessen sollen für die n Querschnittseinheiten (also hier 54 Unternehmen) n-1 (also hier 53) Dummy-Variablen einbezogen werden Dazu muss die Variable betrachtet werden, die die unterschiedlichen Querschnittseinheiten (also hier Unternehmen) identifiziert Durch das Voranstellen von i. wird STATA klargemacht, dass die zugrundeliegende stetige Variable als diskrete Variable mit der maximalen Anzahl an Dummy-Variablen betrachtet werden soll In diesem Fall wird somit i.fcode als zusätzliche erklärende Variable in das lineare Panelmodell mit unbeobachteter Heterogenität einbezogen Bei der entsprechenden OLS-Schätzung zeigen sich mit STATA folgende Ergebnisse:

23 Beispiel: Weiterbildungsprogramme und Ausschussraten (II) reg logscrap grant grantlagged d88 d89 i.fcode Source SS df MS Number of obs = F( 57, 104) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = logscrap Coef. Std. Err. t P> t [95% Conf. Interval] grant grantlagged d d fcode _cons

24 Die unbekannten Regressionsparameter in linearen Panelmodellen mit unbeobachteter Heterogenität können (neben der Betrachtung einer konventionellen gepoolten OLS-Schätzung) über within oder first-differenced Transformationen geschätzt werden, so dass sich die Frage stellt, welcher Ansatz gewählt werden sollte: Für den Fall von T = 2 stimmen fixed effects und first-differenced Schätzungen sowie alle darauf bezogenen Teststatistiken in identisch spezifizierten Modellen völlig überein, so dass es egal ist, welcher der beiden Ansätze gewählt wird Entsprechend Abschnitt 1.2 wird bei der Gleichung erster Differenzen üblicherweise eine Konstante einbezogen, die den Parameter der Dummy-Variable für die zweite Periode darstellt (die Konstante für die Gleichungen in den beiden Jahren wird herausdifferenziert) Deshalb muss in diesem Fall bei der within Schätzung im Hinblick auf die Identität der linearen Panelmodelle mit unbeobachteter Heterogenität eine Dummy-Variable für die zweite Zeitperiode einbezogen werden. Für diesen Fall von T = 2 hat die first-differenced Schätzung den Vorteil, dass diese sehr einfach mit ökonometrischen Programmpaketen selbst implementiert werden kann 24

25 Beispiel: Erklärung von Kriminalitätsraten (I) Mit Paneldaten für n = 46 Städte in den USA für die beiden Jahre 1982 und 1987 wird der Effekt von Arbeitslosenraten (unem) und der Bevölkerungsdichte (popden) auf die Anzahl der Straftaten auf 1000 Personen (crmrte) untersucht. Bei der OLS-Schätzung in den ersten Differenzen zeigen sich mit STATA folgende Ergebnisse: reg d.(crmrte unem popden) Source SS df MS Number of obs = F( 2, 43) = 4.21 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = D.crmrte Coef. Std. Err. t P> t [95% Conf. Interval] unem D popden D _cons

26 Beispiel: Erklärung von Kriminalitätsraten (II) Bei der fixed effects Schätzung zeigen sich mit STATA folgende Ergebnisse: xtreg crmrte unem popden d87, fe Fixed-effects (within) regression Number of obs = 92 Group variable: area Number of groups = 46 R-sq: within = Obs per group: min = 2 between = avg = 2.0 overall = max = 2 F(3,43) = 4.29 corr(u_i, Xb) = Prob > F = crmrte Coef. Std. Err. t P> t [95% Conf. Interval] unem popden d _cons sigma_u sigma_e rho (fraction of variance due to u_i) F test that all u_i=0: F(45, 43) = 8.18 Prob > F =

27 Für T 3 sind die fixed effects und first-differenced Schätzungen in linearen Panelmodellen mit unbeobachteter Heterogenität nicht mehr identisch: Da beide Schätzer mit den Annahmen D1 bis D4 sowohl erwartungstreu als auch konsistent (für festes T mit n ) sind, ergibt sich hieraus kein Kriterium für die Vorteilhaftigkeit eines der beiden Schätzer Für große n und kleine T ergeben sich bei beiden Schätzern jedoch Effizienzunterschiede, die durch Autokorrelationen in den idiosynkratischen Fehlern v it bestimmt werden (unter der Annahme der Homoskedastizität in v it, da nur in diesem Fall Effizienzunterschiede analysiert werden können) Falls die v it nicht autokorreliert sind (falls unbeobachtete Heterogenität vorliegt, ist der gesamte Störterm α i + v it definitionsgemäß immer autokorreliert), ist der fixed effects Schätzer effizienter als der first-differenced Schätzer. Da nun bei linearen Panelmodellen mit unbeobachteter Heterogenität oft unterstellt wird, dass die idiosynkratischen Fehler nicht autokorreliert sind, werden bei empirischen Studien fixed effects Schätzungen grundsätzlich häufiger angewendet. Häufig liegt allerdings eine entsprechende Autokorrelation vor. Falls die v it einem random walk folgen (und damit eine sehr starke positive Autokorrelation vorliegt), sind die ersten Differenzen v it nicht autokorreliert, so dass dann first-differenced Schätzungen vorteilhafter sind. Allerdings liegen in vielen Fällen schwache positive Autokorrelationen in v it vor, wodurch die Effizienz der beiden Schätzer nicht einfach abzuleiten ist 27

28 Generell ist nach einer fixed effects Schätzung die Überprüfung der Hypothese, dass keine Autokorrelation in v it vorliegt, (genauso wie die Überprüfung von Homoskedastizität) nicht einfach, da lediglich Schätzungen für v it nicht aber für v it abgeleitet werden können. Dagegen kann diese Hypothese in Bezug auf v it nach einer first-differenced Schätzung mit einem t-test einfach untersucht werden. Für den Fall, dass es dabei keinen Hinweis auf eine entsprechende Autokorrelation in v it gibt, ist es oft sinnvoll, first-differenced Schätzungen durchzuführen. Wenn dagegen eine negative Autokorrelation in v it nachgewiesen wird, bietet sich eher eine fixed effects Schätzung an. Falls alle erklärenden Variablen x ith zwar mit den v it unkorreliert sind, gegen die Annahme der strikten Exogenität aber verstoßen wird (z.b. bei verzögerten abhängigen Variablen), weisen fixed effects Schätzungen für große T meistens geringere Verzerrungen auf. Andererseits ist der first-differenced Schätzer bereits bei schwacher Exogenität der erklärenden Variablen mit E(v it x i1,, x it, α i ) = 0 konsistent. Insgesamt ist die Wahl zwischen beiden Schätzungen nicht einfach, so dass grundsätzlich, vor allem aber bei stark unterschiedlichen Ergebnissen, beide ausgewiesen werden sollten. Bei sehr ähnlichen Schätzergebnissen ist dagegen deren Robustheit umso größer. 28

29 Beispiel: Erklärung von Löhnen Wie zuvor werden wieder mit Paneldaten für 545 dauerhaft berufstätige Männer für die Jahre von 1980 bis 1987 die Determinanten des Logarithmus von Löhnen (logwage) untersucht. Als erklärende Variablen werden erneut lediglich der Familienstand (married) und die Gewerkschaftszugehörigkeit (union) betrachtet. Auf Basis der zuvor betrachteten OLS-Schätzung im linearen first-differenced Modell zeigen sich beim t-test auf AR(1) Autokorrelation in Bezug auf v it folgende Ergebnisse (alternativ können auch Konstante und erklärende Variablen in den t-test einbezogen werden mit ähnlichen Ergebnissen): reg d.(logwage married union) d82 d83 d84 d85 d86 d87 predict u, resid reg u l.u, noconstant Source SS df MS Number of obs = F( 1, 3269) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = u Coef. Std. Err. t P> t [95% Conf. Interval] u L

30 Cluster-robuste Konfidenzintervalle und t- und F-Tests: Fixed effects und first-differenced Schätzungen in linearen Panelmodellen mit unbeobachteter Heterogenität sind (unter den Annahmen D1 bis D4 sowie C1 bis C4) auch bei Heteroskedastizität und Autokorrelation in den idiosynkratischen Fehlern v it erwartungstreu und konsistent Allerdings erfordert die korrekte Konstruktion von Konfidenzintervallen sowie t- und F-Werten, dass Homoskedastizität und keine Autokorrelation vorliegt Für den Fall, dass N deutlich größer als T ist, können die geschätzten Standardabweichungen der geschätzten Parameter über ein clustering für jegliche Formen von Heteroskedastizität und Autokorrelation korrigiert werden Die Idee dabei ist, dass jede Querschnittseinheit i als ein Cluster von Beobachtungen über die Zeit definiert ist und für jedes Cluster beliebige Varianzen und Autokorrelationen in den Störtermen über die Zeit erlaubt sind Die cluster-robuste Schätzung der Standardabweichungen der geschätzten Parameter für die Ableitung von cluster-robusten Konfidenzintervallen und t- und F-Tests bezieht sich aufgrund der unterschiedlichen Ansätze bei fixed effects und first-differenced Schätzungen auf unterschiedliche Gleichungen Die cluster-robuste Schätzung mit STATA erfolgt durch die zusätzliche Anweisung cluster(id), wobei id sich auf die Variable bezieht, die die Querschnittseinheiten identifiziert (bei fixed und auch random effects Schätzern, siehe später, nicht aber bei first-differenced Schätzern ergeben sich durch die Anweisungen robust oder vce(robust) dieselben Resultate) 30

31 Beispiel: Weiterbildungsprogramme und Ausschussraten (I) Wie zuvor wird wieder mit Paneldaten für die Jahre 1987, 1988 und 1989 der Effekt von Beihilfen im Rahmen eines Weiterbildungsprogramms in Michigan auf den Logarithmus der Ausschussraten (logscrap) in 54 Unternehmen untersucht. Als erklärende Variablen werden erneut die Beihilfe in einem Jahr t (grant) und die um ein Jahr verzögerte Beihilfe (grantlagged) betrachtet. Es zeigen sich in einem linearen first-differenced Modell unter Einbeziehung der Dummy-Variablen für 1989 mit STATA folgende OLS-Schätzergebnisse: reg d.(logscrap grant grantlagged) d89, cluster(fcode) Linear regression Number of obs = 108 F( 3, 53) = 1.98 Prob > F = R-squared = Root MSE = (Std. Err. adjusted for 54 clusters in fcode) Robust D.logscrap Coef. Std. Err. t P> t [95% Conf. Interval] grant D grantlagged D d _cons

32 Beispiel: Weiterbildungsprogramme und Ausschussraten (II) Bei der entsprechenden fixed effects Schätzung zeigen sich unter Einbeziehung der Dummy-Variablen für 1988 und 1989 mit STATA folgende Ergebnisse: xtreg logscrap grant grantlagged d88 d89, fe cluster(fcode) Fixed-effects (within) regression Number of obs = 162 Group variable: fcode Number of groups = 54 R-sq: within = Obs per group: min = 3 between = avg = 3.0 overall = max = 3 F(4,53) = 7.07 corr(u_i, Xb) = Prob > F = (Std. Err. adjusted for 54 clusters in fcode) Robust logscrap Coef. Std. Err. t P> t [95% Conf. Interval] grant grantlagged d d _cons sigma_u sigma_e rho (fraction of variance due to u_i)

33 Fixed effects Schätzung mit unbalanced panels: Zumindest implizit wurden bisher balanced panels betrachtet, bei denen für jede Untersuchungseinheit i Daten für alle T Zeitperioden vorliegen. Allerdings fehlen bei vielen empirischen Anwendungen für einige i Daten für einzelne Perioden, so dass ein unbalanced panel gegeben ist. Auch mit unbalanced panels können grundsätzlich fixed effects Schätzungen durchgeführt werden. Wenn T i die Anzahl der Perioden darstellt, für die bei einer Querschnittseinheit i Daten vorliegen, beträgt hier die Anzahl der Beobachtungen N = T 1 + T T n. Durch die within Transformation bleiben diejenigen Querschnittseinheiten unberücksichtigt, bei denen nur für eine Periode Daten vorliegen. Zudem geht hier erneut bei jedem i ein Freiheitsgrad verloren. Allerdings kann der Verlust von Beobachtungen in einzelnen Perioden problematisch sein. Lediglich wenn der Grund für die fehlenden Daten ( attrition ) nicht mit den idiosynkratischen Fehlern v it korreliert ist, ergeben sich bei der fixed effects Schätzung keinerlei Probleme. Wenn allerdings dieser Grund mit den v it korreliert ist, ergeben sich durch die entstehenden Selektionsprobleme ( sample selection problems ) verzerrte fixed effects Schätzer. Demgegenüber erlauben fixed effects Schätzungen, dass attrition mit den unbeobachteten Effekten α i korreliert ist. Attrition Probleme sind eine wichtige Fragestellung in der Paneldatenanalyse. 33

34 Beispiel: Weiterbildungsprogramme und Ausschussraten (I) Wie zuvor wird wieder mit Paneldaten für die Jahre 1987, 1988 und 1989 der Effekt von Beihilfen im Rahmen eines Weiterbildungsprogramms in Michigan auf den Logarithmus der Ausschussraten (logscrap) in 54 Unternehmen untersucht. Als erklärende Variablen werden erneut die Beihilfe in einem Jahr t (grant), die um ein Jahr verzögerte Beihilfe (grantlagged) sowie Dummy-Variablen für 1988 (d88) und für 1989 (d89) betrachtet. Allerdings werden jetzt zwei zusätzliche erklärende Variablen einbezogen: Logarithmus der Umsätze (logsales) Logarithmus der Anzahl der Beschäftigten (logemploy) Dadurch fallen jetzt aber drei der 54 Unternehmen aufgrund fehlender Daten zu Umsätzen oder der Anzahl an Beschäftigten völlig heraus. Zudem gehen fünf weitere Beobachtungen wegen fehlender Daten für einzelne Jahre verloren. Damit reduziert sich die Gesamtzahl der Beobachtungen auf N = 148. Die Ergebnisse für den Effekt der kontemporären und der um ein Jahr verzögerten Weiterbildungsbeihilfe bleiben aber auf Basis der fixed effects Schätzung mit diesem unbalanced panel qualitativ sehr ähnlich. Es zeigen sich mit STATA folgende Schätzergebnisse:

35 Beispiel: Weiterbildungsprogramme und Ausschussraten (II) xtreg logscrap grant grantlagged logsales logemploy d88 d89, fe Fixed-effects (within) regression Number of obs = 148 Group variable: fcode Number of groups = 51 R-sq: within = Obs per group: min = 1 between = avg = 2.9 overall = max = 3 F(6,91) = 4.11 corr(u_i, Xb) = Prob > F = logscrap Coef. Std. Err. t P> t [95% Conf. Interval] grant grantlagged logsales logemploy d d _cons sigma_u sigma_e rho (fraction of variance due to u_i) F test that all u_i=0: F(50, 91) = Prob > F =

36 Beispiel: Weiterbildungsprogramme und Ausschussraten (III) Zum Vergleich zeigen sich im entsprechenden linearen first-differenced Modell mit STATA folgende OLS-Schätzergebnisse: reg d.(logscrap grant grantlagged logsales logemploy) d89 Source SS df MS Number of obs = F( 5, 91) = 0.87 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = D.logscrap Coef. Std. Err. t P> t [95% Conf. Interval] grant D grantlagged D logsales D logemploy D d _cons

37 2.2 Random effects Schätzung Ausgangspunkt ist erneut ein lineares Panelmodell mit unbeobachteter Heterogenität, bei dem jetzt explizit eine Konstante einbezogen wird, wodurch (ohne Beschränkung der Allgemeinheit) die Annahme getroffen werden kann, dass α i im Durchschnitt null ist: y = β + β x + β x + + β x + α + v für i = 1,..., n; t = 1,..., T it 0 1 it1 2 it2 k itk i it Dabei werden üblicherweise wiederum Dummy-Variablen für Zeitperioden einbezogen. Falls α i mit einer oder mehreren erklärenden Variablen korreliert ist, besteht das wesentliche Ziel zunächst darin, diesen unbeobachteten Effekt durch within Transformationen oder die Bildung erster Differenzen zu beseitigen. Allerdings stellt sich die Frage, ob diese Transformationen auch sinnvoll sind, wenn α i mit allen erklärenden Variablen unkorreliert ist: Cov(x ith, α ) = 0 für t = 1,2,..., T; h = 1, 2,..., k i In diesem Fall könnten die Regressionsparameter grundsätzlich in einer Querschnittsanalyse für eine Zeitperiode (also ohne eine Paneldatenanalyse) oder in einem gepoolten linearen Regressionsmodell mit OLS konsistent geschätzt werden. Bei einer Querschnittsanalyse würden allerdings nützliche Informationen aus den anderen Zeitperioden unberücksichtigt bleiben. Bei einem gepoolten linearen Regressionsmodell würde zudem eine wichtige Modelleigenschaft ignoriert werden. Mit ε it = α i + v it ergibt sich: 37

38 y it = β 0+ β1x it1+ β2x it2+ + βkx itk+ ε it für i = 1,..., n; t = 1,..., T Da die α i in ε it in jeder Zeitperiode enthalten sind, ergibt sich notwendigerweise, dass die ε it eine positive Autokorrelation aufweisen. Mit den Annahmen, dass die α i und die v it unkorreliert sind sowie in den v it keine Autokorrelation vorliegt, ergibt sich mit σ α 2 = Var(α i ) = Cov(ε it, ε is ) = Cov(α i +v it, α i +v is ) (für t s) sowie σ v 2 = Var(v it ): 2 Cov(ε it, ε is) σα Corr(ε it, ε is) = = Var(ε )Var(ε ) Var(α +v )Var(α +v ) it is i it i is σ σ = = für t s (σ +σ )(σ +σ ) 2 2 α α σ α v α v α+σv Auf Grund dieser Autokorrelation sind die konventionellen Schätzer der Standardabweichungen (bei Vernachlässigung der Autokorrelation) der mit OLS geschätzten Steigungsparameter verzerrt, so dass auch die Konfidenzintervalle nicht mehr korrekt sowie die t- und F-Statistiken nicht einmal asymptotisch t- und F-verteilt sind. Allerdings kann hier eine Schätzung mit der Verallgemeinerten Methode der kleinsten Quadrate (GLS) durchgeführt werden, bei der zunächst folgende Transformation betrachtet wird: yit- λy i = β 0(1 - λ) + β 1(xit1- λx i1) + + β k(xitk- λx ik) + εit- λεi 38

39 Dabei bedeuten die Überstriche für jede Querschnittseinheit i erneut das arithmetische Mittel über die Zeit und für 0 λ 1 gilt: λ = 1 - σ σ +Tσ 2 v 2 2 v α Es kann gezeigt werden, dass die Störterme (ε it -λε i ) in diesem Ansatz keine Autokorrelation aufweisen. Im Gegensatz zur within Transformation wird hier lediglich ein Teil der arithmetischen Mittel über die Zeit subtrahiert, der von den beiden Varianzen σ α 2 und σ v 2 sowie von der Anzahl der Perioden abhängt. Diese Transformation erlaubt deshalb im Gegensatz zur within Transformation oder der Bildung erster Differenzen auch die Einbeziehung von erklärenden Variablen, die über die Zeit konstant sind (z.b. Geschlecht). Ein GLS-Schätzer ergibt sich nun durch eine gepoolte OLS-Schätzung in obiger Gleichung. Dazu würde man den Wert des Parameters λ benötigen, der allerdings in der Praxis nicht bekannt ist. Er kann jedoch immer mit Hilfe konsistenter Schätzer von σ α 2 und σ v 2 geschätzt werden. Diese geschätzten Varianzen können mit Hilfe von Residuen bei OLS-Schätzungen in gepoolten linearen Regressionsmodellen oder bei fixed effects Schätzungen abgeleitet werden. Mit den Residuen ε it der gepoolten OLS-Schätzung ergibt sich eine Möglichkeit der Schätzung von σ α2 : 39

40 1 n T-1 T 2 α εˆˆ itεis i=1 t=1 s=t+1 ˆσ = nt(t-1) - (k+1) 2 Da σ ε 2 = σ α 2 + σ v 2 kann auf dieser Basis die Varianz σ v 2 mit dem Schätzer σ ε 2 der Varianz des Fehlerterms ε it bei der gepoolten OLS-Schätzung mit Hilfe von σ v 2 = σ ε 2 - σ α 2 geschätzt werden. Damit kann dann λ folgendermaßen geschätzt werden: 2 ˆσv 1 ˆλ = 1 - = σ ˆ ˆ σˆ v +Tσα 1+T ˆσ 2 α 2 v Eine durchführbare ( feasible ) GLS-Schätzung, bei der λ anstatt λ einbezogen ist, wird als random effects Schätzung bezeichnet. Der random effects Schätzer ist nicht erwartungstreu. Im Hinblick auf die Konsistenz und asymptotische Normalverteilung von Funktionen des Schätzers liegen idealerweise die zuvor diskutierten Annahmen D1 bis D4 beim within Schätzer vor. Da die random effects Transformation die Einbeziehung von erklärenden Variablen erlaubt, die über die Zeit konstant sind, kann Annahme D3 durch die schwächere Annahme E3 ersetzt werden. 40

41 Gleichzeitig muss aber zusätzlich zu D4 die Annahme getroffen werden, dass der unbeobachtete Effekt α i und die erklärenden Variablen unkorreliert sind. Es ergibt sich: Annahme E3: Keine perfekte Kollinearität Annahme E4: Bedingter Erwartungswert von α i ist konstant Zusätzlich zu D4 gilt, dass der bedingte Erwartungswert von α i, gegeben die erklärenden Variablen, konstant ist und bei der Einbeziehung einer Konstante deren Wert aufweist, d.h. E(α i x i ) = β 0. Diese Annahme ist der Hauptunterschied zwischen fixed effects und random effects Schätzungen. Mit den Annahmen D1, D2, E3 und E4 sind die random effects Schätzer der Regressionsparameter für festes T mit n konsistent und Funktionen des Schätzers asymptotisch normalverteilt. Für die Ableitung weiterer Eigenschaften der random effects Schätzer sowie von Konfidenzintervallen und t- und F-Statistiken muss neben Annahme D6 zum Fehlen von Autokorrelation in v it bei fixed effects Schätzern zusätzlich folgende Annahme gelten: Annahme E5: Homoskedastizität Zusätzlich zu Annahme D5 gilt, dass die bedingte Varianz von α i, gegeben alle erklärenden Variablen, konstant ist, d.h. Var(α i x i ) = σ α 2 41

42 Mit den Annahmen D1, D2, E3, E4, E5 und D6 sind die üblich geschätzten Standardabweichungen der random effects Schätzungen korrekt und damit die t- und F-Statistiken asymptotisch t- und F-verteilt. Vor allem aber sind die random effects Schätzer asymptotisch effizient. Folgerungen: Random effects Schätzer weisen damit in diesem Fall bei großen n geringere Varianzen auf als übliche gepoolte OLS-Schätzer (wenn bei den gepoolten OLS-Schätzern korrekterweise cluster-robuste Standardabweichungen der geschätzten Parameter geschätzt werden) Bei zeitvarianten erklärenden Variablen sind in diesem Fall die random effects Schätzer insbesondere effizienter als fixed effects Schätzer (zeitinvariante erklärende Variablen können ja ohnehin nicht in fixed effects Schätzungen einbezogen werden) Allerdings ist nicht die Effizienzeigenschaft, sondern die Robustheit bei Korrelationen zwischen dem unbeobachteten Effekt α i und den erklärenden Variablen bei fixed effects Schätzungen die eigentliche Stoßrichtung Insofern muss bei der Wahl zwischen fixed und random effects Schätzungen (siehe später) häufig eine Abwägung zwischen Robustheit und Effizienz vorgenommen werden 42

43 Zusammenhang zwischen verschiedenen Schätzungen in linearen Panelmodellen mit unbeobachteter Heterogenität: Falls λ = 0, ergibt sich eine gepoolte OLS-Schätzung und falls λ = 1, ergibt sich eine fixed effects Schätzung. Allerdings zeigt sich für den Schätzwert λ niemals der Wert null oder der Wert eins. Falls λ klein ist, liegt der random effects Schätzer nahe beim gepoolten OLS-Schätzer. In diesem Fall ist der unbeobachtete Effekt α i (aufgrund der relativ geringen Varianz σ α 2 im Vergleich zu σ v2 ) relativ unbedeutend. Dagegen nimmt λ mit hohem T sowie falls σ α 2 im Vergleich zu σ v 2 groß ist, hohe Werte an. In diesem Fall nähern sich die random effects und fixed effects Schätzer an. Falls α i mit einer erklärenden Variablen korreliert ist, ergibt sich ein inkonsistenter random effects Schätzer. Die entsprechende asymptotische Verzerrung wird durch den Faktor 1 - λ bestimmt, so dass diese für große λ, d.h. für λ 1, immer kleiner wird. In empirischen Anwendungen ist es häufig sinnvoll, auch die üblichen gepoolten OLS-Schätzungen auszuweisen. Dabei ist zu beachten, dass die Teststatistiken selbst für den Fall der Unkorreliertheit der α i mit den erklärenden Variablen wegen der Autokorrelation in den Fehlertermen nicht gültig sind. Allerdings können natürlich cluster-robuste Schätzungen der Standardabweichungen der geschätzten Parameter betrachtet werden. 43

44 Beispiel: Erklärung von Löhnen (I) Für die Analyse der Determinanten des Logarithmus von Löhnen (logwage) werden erneut die Paneldaten für 545 dauerhaft berufstätige Männer für die Jahre von 1980 bis 1987 betrachtet. Dabei werden jetzt neben den fixed effects Schätzungen zusätzlich auch gepoolte OLS-Schätzungen sowie random effects Schätzungen untersucht. In den beiden letzteren Ansätzen (nicht aber im fixed effects Ansatz) können nun die zeitinvarianten Variablen für Bildungsstand (educ) und schwarze Hautfarbe (black) einbezogen werden. Als zeitvariante erklärende Variablen werden Erfahrung (exper), quadrierte Erfahrung (expersq), Familienstand (married) und Gewerkschaftszugehörigkeit (union) betrachtet. Zusätzlich wird die maximale Anzahl von Dummy-Variablen für die Jahre 1981 bis 1987 einbezogen. Dadurch kann der Effekt von exper in der fixed effects Schätzung nicht identifiziert werden, da sich der Wert dieser Variable bei allen untersuchten Personen jeweils um ein Jahr über die Zeit erhöht. Dagegen kann die quadrierte Erfahrung auch im fixed effects Ansatz einbezogen werden. Dabei haben sich mit STATA bei den drei (cluster-robusten) Schätzungen folgende Ergebnisse gezeigt (cluster-robuste Schätzungen der Standardabweichungen der geschätzten Parameter sind somit auch bei der random effects Schätzung möglich):

1. Grundlagen linearer Panelmodelle

1. Grundlagen linearer Panelmodelle 1. Grundlagen linearer Panelmodelle 1.1 Aggregierte (gepoolte) Querschnittsdaten Viele Befragungen von Personen, Haushalten oder Unternehmen werden regelmäßig wiederholt. Beispiele sind die jährliche Current

Mehr

Übung V Lineares Regressionsmodell

Übung V Lineares Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung

Mehr

Empirical Banking and Finance

Empirical Banking and Finance Empirical Banking and Finance Vorlesung zur Volkswirtschaftspolitik Prof. Dr. Isabel Schnabel Lehrstuhl für Volkswirtschaftslehre, insb. Financial Economics Johannes Gutenberg-Universität Mainz Wintersemester

Mehr

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften

Mehr

Kurs Empirische Wirtschaftsforschung

Kurs Empirische Wirtschaftsforschung Kurs Empirische Wirtschaftsforschung 5. Bivariates Regressionsmodell 1 Martin Halla Institut für Volkswirtschaftslehre Johannes Kepler Universität Linz 1 Lehrbuch: Bauer/Fertig/Schmidt (2009), Empirische

Mehr

Statistischer Rückschluss und Testen von Hypothesen

Statistischer Rückschluss und Testen von Hypothesen Statistischer Rückschluss und Testen von Hypothesen Statistischer Rückschluss Lerne von der Stichprobe über Verhältnisse in der Grundgesamtheit Grundgesamtheit Statistischer Rückschluss lerne aus Analyse

Mehr

1 Beispiel zur Methode der kleinsten Quadrate

1 Beispiel zur Methode der kleinsten Quadrate 1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25

Mehr

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im SS 2012

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im SS 2012 Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im SS 2012 Aufgabe 1 (20 Punkte) Sei y = Xβ + ε ein N 1 Vektor und X eine N K Matrix.

Mehr

Das Lineare Regressionsmodell

Das Lineare Regressionsmodell Das Lineare Regressionsmodell Bivariates Regressionsmodell Verbrauch eines Pkw hängt vom Gewicht des Fahrzeugs ab Hypothese / Theorie: Je schwerer ein Auto, desto mehr wird es verbrauchen Annahme eines

Mehr

Panelregression (und Mehrebenenanwendungen)

Panelregression (und Mehrebenenanwendungen) Panelregression (und Mehrebenenanwendungen) Henning Lohmann Universität zu Köln Lehrstuhl für Empirische Sozial- und Wirtschaftsforschung SOEP@Campus 2007, Universität Duisburg-Essen, 11. Oktober 2007

Mehr

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010

Mehr

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur

Mehr

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers 4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis

Mehr

Einführung in Panel-Verfahren

Einführung in Panel-Verfahren Einführung in Panel-Verfahren Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Drei Arten von Datensätzen Cross-Section

Mehr

1. Lösungen zu Kapitel 7

1. Lösungen zu Kapitel 7 1. Lösungen zu Kapitel 7 Übungsaufgabe 7.1 Um zu testen ob die Störterme ε i eine konstante Varianz haben, sprich die Homogenitätsannahme erfüllt ist, sind der Breusch-Pagan-Test und der White- Test zwei

Mehr

Statistik II. Regressionsanalyse. Statistik II

Statistik II. Regressionsanalyse. Statistik II Statistik II Regressionsanalyse Statistik II - 23.06.2006 1 Einfachregression Annahmen an die Störterme : 1. sind unabhängige Realisationen der Zufallsvariable, d.h. i.i.d. (unabh.-identisch verteilt)

Mehr

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38 Dynamische Systeme und Zeitreihenanalyse Multivariate Normalverteilung und ML Schätzung Kapitel 11 Statistik und Mathematik WU Wien Michael Hauser Dynamische Systeme und Zeitreihenanalyse // Multivariate

Mehr

Empirische Wirtschaftsforschung

Empirische Wirtschaftsforschung Empirische Wirtschaftsforschung Prof. Dr. Bernd Süßmuth Universität Leipzig Institut für Empirische Wirtschaftsforschung Volkswirtschaftslehre, insbesondere Ökonometrie 6.. Herleitung des OLS-Schätzers

Mehr

1 Einführung Ökonometrie... 1

1 Einführung Ökonometrie... 1 Inhalt 1 Einführung... 1 1.1 Ökonometrie... 1 2 Vorüberlegungen und Grundbegriffe... 7 2.1 Statistik als Grundlage der Empirischen Ökonomie... 7 2.2 Abgrenzung und Parallelen zu den Naturwissenschaften...

Mehr

Vorlesung 4: Spezifikation der unabhängigen Variablen

Vorlesung 4: Spezifikation der unabhängigen Variablen Vorlesung 4: Spezifikation der unabhängigen Variablen. Fehlspezifikation der unabhängigen Variablen. Auswirkungen einer Fehlspezifikation a. auf die Erwartungstreue der Schätzung b. auf die Effizienz der

Mehr

Analyse von Querschnittsdaten. Spezifikation der unabhängigen Variablen

Analyse von Querschnittsdaten. Spezifikation der unabhängigen Variablen Analyse von Querschnittsdaten Spezifikation der unabhängigen Variablen Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Annahmen gegeben? kategoriale Variablen Datum 3.0.004 0.0.004

Mehr

Empirical Banking and Finance

Empirical Banking and Finance Empirical Banking and Finance Vorlesung zur Volkswirtschaftspolitik Prof. Dr. Isabel Schnabel Lehrstuhl für Volkswirtschaftslehre, insb. Financial Economics Johannes Gutenberg-Universität Mainz Wintersemester

Mehr

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Wiederholung Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte

Mehr

Statistik II. Weitere Statistische Tests. Statistik II

Statistik II. Weitere Statistische Tests. Statistik II Statistik II Weitere Statistische Tests Statistik II - 19.5.2006 1 Überblick Bisher wurden die Test immer anhand einer Stichprobe durchgeführt Jetzt wollen wir die statistischen Eigenschaften von zwei

Mehr

Datenanalyse mit Excel und Gretl

Datenanalyse mit Excel und Gretl Dozent: Christoph Hindermann christoph.hindermann@uni-erfurt.de Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 1 Teil 2: Gretl Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 2 Modellannahmen

Mehr

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte : Schätzung Statistik

Mehr

Analyse von Querschnittsdaten. Signifikanztests I Basics

Analyse von Querschnittsdaten. Signifikanztests I Basics Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004

Mehr

John Komlos Bernd Süssmuth. Empirische Ökonomie. Eine Einführung in Methoden und Anwendungen. 4y Springer

John Komlos Bernd Süssmuth. Empirische Ökonomie. Eine Einführung in Methoden und Anwendungen. 4y Springer John Komlos Bernd Süssmuth Empirische Ökonomie Eine Einführung in Methoden und Anwendungen 4y Springer 1 Einführung 1 1.1 Ökonometrie 1 2 Vorüberlegungen und Grundbegriffe 7 2.1 Statistik als Grundlage

Mehr

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell 1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs

Mehr

y t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen.

y t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen. Aufgabe 1 (25 Punkte Zur Schätzung des Werbe-Effekts in einem Getränke-Unternehmen wird das folgende lineare Modell aufgestellt: Dabei ist y t = β 1 + x t2 β 2 + e t. y t : x t2 : Umsatz aus Getränkeverkauf

Mehr

Die Regressionsanalyse

Die Regressionsanalyse Die Regressionsanalyse Zielsetzung: Untersuchung und Quantifizierung funktionaler Abhängigkeiten zwischen metrisch skalierten Variablen eine unabhängige Variable Einfachregression mehr als eine unabhängige

Mehr

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) 3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test

Mehr

Zeitreihen. Statistik II. Literatur. Zeitreihen-Daten Modelle Probleme Trends und Saisonalität Fehlerstruktur. 1 Wiederholung.

Zeitreihen. Statistik II. Literatur. Zeitreihen-Daten Modelle Probleme Trends und Saisonalität Fehlerstruktur. 1 Wiederholung. Statistik II 1 Literatur 2 -Daten Trends und Saisonalität Fehlerstruktur 3 Statistik II (1/31) Literatur Zum Nachlesen Wooldridge ch 101 & 102 Statistik II (2/31) Literatur Für nächste Woche Einfache für

Mehr

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20 Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 20 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)

Mehr

Klausur zu Statistik II

Klausur zu Statistik II GOETHE-UNIVERSITÄT FRANKFURT FB Wirtschaftswissenschaften Statistik und Methoden der Ökonometrie Prof. Dr. Uwe Hassler Wintersemester 03/04 Klausur zu Statistik II Matrikelnummer: Hinweise Hilfsmittel

Mehr

Interne und externe Modellvalidität

Interne und externe Modellvalidität Interne und externe Modellvalidität Interne Modellvalidität ist gegeben, o wenn statistische Inferenz bzgl. der untersuchten Grundgesamtheit zulässig ist o KQ-Schätzer der Modellparameter u. Varianzschätzer

Mehr

Lösung Übungsblatt 5

Lösung Übungsblatt 5 Lösung Übungsblatt 5 5. Januar 05 Aufgabe. Die sogenannte Halb-Normalverteilung spielt eine wichtige Rolle bei der statistischen Analyse von Ineffizienzen von Produktionseinheiten. In Abhängigkeit von

Mehr

5. Lineare Regressionsmodelle mit Zeitreihendaten 5.1 Vorüberlegungen

5. Lineare Regressionsmodelle mit Zeitreihendaten 5.1 Vorüberlegungen 5. Lineare Regressionsmodelle mit Zeitreihendaten 5.1 Vorüberlegungen Besonderheiten von Zeitreihendaten im Vergleich zu Querschnittsdaten: Bei Zeitreihendaten werden eine oder mehrere Variablen über mehrere

Mehr

Mikro-Ökonometrie: Small Sample Inferenz mit OLS

Mikro-Ökonometrie: Small Sample Inferenz mit OLS Mikro-Ökonometrie: Small Sample Inferenz mit OLS 1. November 014 Mikro-Ökonometrie: Small Sample Inferenz mit OLS Folie Zusammenfassung wichtiger Ergebnisse des letzten Kapitels (I) Unter den ersten vier

Mehr

Abschlussklausur zur Vorlesung Empirical Banking and Finance

Abschlussklausur zur Vorlesung Empirical Banking and Finance Prof Dr Isabel Schnabel Johannes Gutenberg-Universität Mainz Abschlussklausur zur Vorlesung Empirical Banking and Finance Sommersemester 2010, 26072010, 15:00 17:00 Uhr Hinweise zur Klausur Die Klausur

Mehr

Vorlesung: Lineare Modelle. Verschiedene Typen von Residuen. Probleme bei der Regression und Diagnose. Prof. Dr. Helmut Küchenhoff.

Vorlesung: Lineare Modelle. Verschiedene Typen von Residuen. Probleme bei der Regression und Diagnose. Prof. Dr. Helmut Küchenhoff. Vorlesung: Lineare Modelle Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München SoSe 205 5 Metrische Einflußgrößen: Polynomiale Regression, Trigonometrische Polynome, Regressionssplines, Transformationen.

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation

Mehr

3. Das einfache lineare Regressionsmodell

3. Das einfache lineare Regressionsmodell 3. Das einfache lineare Regressionsmodell Ökonometrie: (I) Anwendung statistischer Methoden in der empirischen Forschung in den Wirtschaftswissenschaften Konfrontation ökonomischer Theorien mit Fakten

Mehr

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung

Mehr

X =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode?

X =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode? Aufgabe 1 (25 Punkte) Zur Schätzung der Produktionsfunktion des Unternehmens WV wird ein lineares Regressionsmodell der Form angenommen. Dabei ist y t = β 1 + x t2 β 2 + e t, t = 1,..., T (1) y t : x t2

Mehr

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem

Mehr

FRAGESTUNDE WS 2016/17 QM 2. Dr. Christian Schwarz 1

FRAGESTUNDE WS 2016/17 QM 2. Dr. Christian Schwarz 1 FRAGESTUNDE Dr. Christian Schwarz 1 #2 - Allgemein Q: Müssen wir den Standard Error händisch berechnen können? R: Nein. Q: Hat das Monte Carlo Experiment irgendeine Bedeutung für uns im Hinblick auf die

Mehr

3 Grundlagen statistischer Tests (Kap. 8 IS)

3 Grundlagen statistischer Tests (Kap. 8 IS) 3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung

Mehr

Masterprüfung SS 2014

Masterprüfung SS 2014 Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Masterprüfung SS 2014 Fach: Ökonometrie Prüfer: Prof. Regina T. Riphahn, Ph.D. Name, Vorname Matrikelnummer E-Mail

Mehr

Lineare Regression mit einem Regressor: Einführung

Lineare Regression mit einem Regressor: Einführung Lineare Regression mit einem Regressor: Einführung Quantifizierung des linearen Zusammenhangs von zwei Variablen Beispiel Zusammenhang Klassengröße und Testergebnis o Wie verändern sich Testergebnisse,

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

Mikro-Ökonometrie, WS 15/16 Musterlösung Aufgabenblatt 3

Mikro-Ökonometrie, WS 15/16 Musterlösung Aufgabenblatt 3 Mikro-Ökonometrie, WS 15/16 Musterlösung Aufgabenblatt 3 Aufgabe 3: Die Datei WAGE2.DTA enthält Daten einer Stichprobe von 935 männlichen US-amerikanischen Arbeitnehmern im Alter von 28 bis 38 Jahren.

Mehr

Statistik. R. Frühwirth. Statistik. VO Februar R. Frühwirth Statistik 1/536

Statistik. R. Frühwirth. Statistik. VO Februar R. Frühwirth Statistik 1/536 fru@hephy.oeaw.ac.at VO 142.090 http://tinyurl.com/tu142090 Februar 2010 1/536 Übersicht über die Vorlesung Teil 1: Deskriptive Teil 2: Wahrscheinlichkeitsrechnung Teil 3: Zufallsvariable Teil 4: Parameterschätzung

Mehr

Kapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen.

Kapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen. Kapitel 3 Schließende lineare Regression 3.1. Einführung induktiv Fragestellungen Modell Statistisch bewerten, der vorher beschriebenen Zusammenhänge auf der Basis vorliegender Daten, ob die ermittelte

Mehr

Annahmen des linearen Modells

Annahmen des linearen Modells Annahmen des linearen Modells Annahmen des linearen Modells zusammengefasst A1: Linearer Zusammenhang: y = 0 + 1x 1 + 2x 2 + + kx k A2: Zufallsstichprobe, keine Korrelation zwischen Beobachtungen A3: Erwartungswert

Mehr

Musterlösung. Modulklausur Multivariate Verfahren

Musterlösung. Modulklausur Multivariate Verfahren Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn

Mehr

Breusch-Pagan-Test I auf Heteroskedastie in den Störgrößen

Breusch-Pagan-Test I auf Heteroskedastie in den Störgrößen Breusch-Pagan-Test I Ein weiterer Test ist der Breusch-Pagan-Test. Im Gegensatz zum Goldfeld-Quandt-Test ist es nicht erforderlich, eine (einzelne) Quelle der Heteroskedastizität anzugeben bzw. zu vermuten.

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

Institut für Statistik und Mathematische Wirtschaftstheorie Universität Augsburg. PROGNOSE II - Vertiefung Aufgaben und Lösungen Sommersemester 2004

Institut für Statistik und Mathematische Wirtschaftstheorie Universität Augsburg. PROGNOSE II - Vertiefung Aufgaben und Lösungen Sommersemester 2004 Institut für Statistik und Mathematische Wirtschaftstheorie Universität Augsburg PROGNOSE II - Vertiefung Aufgaben und Lösungen Sommersemester 2004 Aufgabe 1 U t bedeute weißes Rauschen und B den Backshift

Mehr

Analyse von Querschnittsdaten. Heteroskedastizität

Analyse von Querschnittsdaten. Heteroskedastizität Analyse von Querschnittsdaten Heteroskedastizität Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Annahmen gegeben? kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004 03.11.2004

Mehr

OLS-Schätzung: asymptotische Eigenschaften

OLS-Schätzung: asymptotische Eigenschaften OLS-Schätzung: asymptotische Eigenschaften Stichwörter: Konvergenz in Wahrscheinlichkeit Konvergenz in Verteilung Konsistenz asymptotische Verteilungen nicht-normalverteilte Störgrößen zufällige Regressoren

Mehr

Panel-Daten I (Grundlagen; Fixed- und Random-Effects)

Panel-Daten I (Grundlagen; Fixed- und Random-Effects) Panel-Daten I (Grundlagen; Fixed- und Random-Effects) 27 Januar 216 Panel-Daten entstehen, wenn man eine Anzahl von Individuen i (Personen, Haushalte, Unternehmen, Länder usw) über einen Zeitraum zu mehreren

Mehr

Lineare Modelle in R: Klassische lineare Regression

Lineare Modelle in R: Klassische lineare Regression Lineare Modelle in R: Klassische lineare Regression Achim Zeileis 2009-02-20 1 Das Modell Das klassische lineare Regressionsmodell versucht den Zusammenhang zwischen einer abhängigen Variablen (oder Responsevariablen)

Mehr

Statistik II Übung 1: Einfache lineare Regression

Statistik II Übung 1: Einfache lineare Regression Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der

Mehr

1. Einleitung. 1.1 Phasen einer ökonometrischen Analyse

1. Einleitung. 1.1 Phasen einer ökonometrischen Analyse 1. Einleitung 1.1 Phasen einer ökonometrischen Analyse Empirische ökonomische bzw. ökonometrische Analyse: Nutzung von Schätz- und Testmethoden zur Überprüfung ökonomischer Hypothesen oder Quantifizierung

Mehr

6. Schätzverfahren für Parameter

6. Schätzverfahren für Parameter 6. Schätzverfahren für Parameter Ausgangssituation: Ein interessierender Zufallsvorgang werde durch die ZV X repräsentiert X habe eine unbekannte Verteilungsfunktion F X (x) Wir interessieren uns für einen

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

Einführung in die Maximum Likelihood Methodik

Einführung in die Maximum Likelihood Methodik in die Maximum Likelihood Methodik Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Gliederung 1 2 3 4 2 / 31 Maximum Likelihood

Mehr

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte

Mehr

0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1

0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1 Aufgabe 1 (2 + 2 + 2 + 1 Punkte) Gegeben sei folgende gemeinsame Wahrscheinlichkeitsfunktion f(x, y) = P (X = x, Y = y) der Zufallsvariablen X und Y : 0.2 x = 1, y = 1 0.3 x = 2, y = 1 f(x, y) = 0.45 x

Mehr

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 27

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 27 Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 27 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)

Mehr

Tests einzelner linearer Hypothesen I

Tests einzelner linearer Hypothesen I 4 Multiple lineare Regression Tests einzelner linearer Hypothesen 4.5 Tests einzelner linearer Hypothesen I Neben Tests für einzelne Regressionsparameter sind auch Tests (und Konfidenzintervalle) für Linearkombinationen

Mehr

Lehrstuhl für Statistik und emp. Wirtschaftsforschung, Prof. R. T. Riphahn, Ph.D. Bachelorprüfung, Praxis der empirischen Wirtschaftsforschung

Lehrstuhl für Statistik und emp. Wirtschaftsforschung, Prof. R. T. Riphahn, Ph.D. Bachelorprüfung, Praxis der empirischen Wirtschaftsforschung Lehrstuhl für Statistik und emp. Wirtschaftsforschung, Prof. R. T. Riphahn, Ph.D. Bachelorprüfung, Praxis der empirischen Wirtschaftsforschung Aufgabe 1: [14,5 Punkte] Sie interessieren sich für die Determinanten

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie

Mehr

Regression und Korrelation

Regression und Korrelation Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandeltdie VerteilungeinerVariablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem dagegen

Mehr

Inferenz im multiplen Regressionsmodell

Inferenz im multiplen Regressionsmodell 1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall

Mehr

Das lineare Regressionsmodell

Das lineare Regressionsmodell Universität Ulm 89069 Ulm Germany Prof. Dr. Werner Smolny Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Institutsdirektor Das ökonomische

Mehr

Fortgeschrittene Ökonometrie: GLS

Fortgeschrittene Ökonometrie: GLS Universität Regensburg, Lehrstuhl für Ökonometrie Sommersemester 2012 Fortgeschrittene Ökonometrie: GLS 1 Verallgemeinerte Kleinst-Quadrate als Momentenschätzer Betrachten Sie das Modell y = Xβ + u, E(uu

Mehr

Institut für Soziologie Benjamin Gedon. Methoden 2. Kausalanalyse

Institut für Soziologie Benjamin Gedon. Methoden 2. Kausalanalyse Institut für Soziologie Methoden 2 Kausalanalyse Inhalt 1. Kausalanalyse 2. Anwendungsbeispiel 3. Wiederholung 4. Übungsaufgabe # 2 Kausalanalyse Kausalität: Identifizieren von Ursache-Wirkungs-Beziehungen

Mehr

Lehrstuhl für Statistik und empirische Wirtschaftsforschung, Prof. Regina T. Riphahn, Ph.D. Diplomprüfung in Ökonometrie im SS 09

Lehrstuhl für Statistik und empirische Wirtschaftsforschung, Prof. Regina T. Riphahn, Ph.D. Diplomprüfung in Ökonometrie im SS 09 Lehrstuhl für Statistik und empirische irtschaftsforschung, Prof. Regina T. Riphahn, Ph.D. Diplomprüfung in Ökonometrie im SS 09 Aufgabe 1: [17 Punkte] Sie interessieren sich für den Zusammenhang zwischen

Mehr

Bachelorprüfung WS 2012/13

Bachelorprüfung WS 2012/13 Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Fach: Praxis der empirischen Wirtschaftsforschung Prüfer: Prof. Regina T. Riphahn, Ph.D. Bachelorprüfung WS 2012/13

Mehr

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC Referenten: Linda Gräfe & Konstantin Falk 1 Agenda Schätzverfahren ML REML Beispiel in SPSS Modellbeurteilung Devianz AIC BIC

Mehr

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester 2013 Aufgabe 1 In einer Urne

Mehr

Vorlesung: Lineare Modelle

Vorlesung: Lineare Modelle Vorlesung: Lineare Modelle Prof Dr Helmut Küchenhoff Institut für Statistik, LMU München SoSe 2014 5 Metrische Einflußgrößen: Polynomiale Regression, Trigonometrische Polynome, Regressionssplines, Transformationen

Mehr

1 Gliederung Zeitreihenökonometrie. Angewandte Ökonometrie (Folien) Zeitreihenökonometrie Universität Basel, FS 09. Dr. Sylvia Kaufmann.

1 Gliederung Zeitreihenökonometrie. Angewandte Ökonometrie (Folien) Zeitreihenökonometrie Universität Basel, FS 09. Dr. Sylvia Kaufmann. Angewandte Ökonometrie (Folien) Zeitreihenökonometrie Universität Basel, FS 09 Dr Sylvia Kaufmann Februar 2009 Angewandte Ökonometrie, Sylvia Kaufmann, FS09 1 1 Gliederung Zeitreihenökonometrie Einführung

Mehr

4.1. Nullhypothese, Gegenhypothese und Entscheidung

4.1. Nullhypothese, Gegenhypothese und Entscheidung rof. Dr. Roland Füss Statistik II SS 8 4. Testtheorie 4.. Nullhypothese, Gegenhypothese und Entscheidung ypothesen Annahmen über die Verteilung oder über einzelne arameter der Verteilung eines Merkmals

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

Einfache Modelle für Paneldaten. Statistik II

Einfache Modelle für Paneldaten. Statistik II Einfache Modelle für daten Statistik II Wiederholung Literatur daten Policy-Analyse II: Statistik II daten (1/18) Literatur Zum Nachlesen Einfache Modelle für daten Wooldridge ch. 13.1-13.4 (im Reader)

Mehr

2. Stochastische ökonometrische Modelle. - Modelle der ökonomischen Theorie an der Wirklichkeit überprüfen

2. Stochastische ökonometrische Modelle. - Modelle der ökonomischen Theorie an der Wirklichkeit überprüfen .1. Stochastische ökonometrische Modelle.1 Einführung Ziele: - Modelle der ökonomischen Theorie an der Wirklichkeit überprüfen - Numerische Konkretisierung ökonomischer Modelle und deren Analse. . Variierende

Mehr

Prognoseintervalle für y 0 gegeben x 0

Prognoseintervalle für y 0 gegeben x 0 10 Lineare Regression Punkt- und Intervallprognosen 10.5 Prognoseintervalle für y 0 gegeben x 0 Intervallprognosen für y 0 zur Vertrauenswahrscheinlichkeit 1 α erhält man also analog zu den Intervallprognosen

Mehr

Bachelorprüfung WS 2012/13 - MUSTERLÖSUNG

Bachelorprüfung WS 2012/13 - MUSTERLÖSUNG Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Bachelorprüfung WS 2012/13 - MUSTERLÖSUNG Fach: Praxis der empirischen Wirtschaftsforschung Prüfer: Prof. Regina

Mehr

Vorlesung 3: Schätzverfahren

Vorlesung 3: Schätzverfahren Vorlesung 3: Schätzverfahren 1. Beispiel: General Social Survey 1978 2. Auswahl einer Zufallsstichprobe und Illustration des Stichprobenfehlers 3. Stichprobenverteilung eines Regressionskoeffizienten 4.

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

ML-Schätzung. Likelihood Quotienten-Test. Zusammenhang Reparametrisierung und Modell unter linearer Restriktion. Es gilt: β = Bγ + d (3.

ML-Schätzung. Likelihood Quotienten-Test. Zusammenhang Reparametrisierung und Modell unter linearer Restriktion. Es gilt: β = Bγ + d (3. Reparametrisierung des Modells Gegeben sei das Modell (2.1) mit (2.5) unter der linearen Restriktion Aβ = c mit A R a p, rg(a) = a, c R a. Wir betrachten die lineare Restriktion als Gleichungssystem. Die

Mehr

a) Man bestimme ein 95%-Konfidenzintervall für den Anteil der Wahlberechtigten, die gegen die Einführung dieses generellen

a) Man bestimme ein 95%-Konfidenzintervall für den Anteil der Wahlberechtigten, die gegen die Einführung dieses generellen 2) Bei einer Stichprobe unter n=800 Wahlberechtigten gaben 440 an, dass Sie gegen die Einführung eines generellen Tempolimits von 100km/h auf Österreichs Autobahnen sind. a) Man bestimme ein 95%-Konfidenzintervall

Mehr

Ökonometrie. Hans Schneeweiß. 3., durchgesehene Auflage. Physica-Verlag Würzburg-Wien 1978 ISBN

Ökonometrie. Hans Schneeweiß. 3., durchgesehene Auflage. Physica-Verlag Würzburg-Wien 1978 ISBN 2008 AGI-Information Management Consultants May be used for personal purporses only or by libraries associated to dandelon.com network. Hans Schneeweiß Ökonometrie 3., durchgesehene Auflage Physica-Verlag

Mehr