Zeitreihen. Statistik II

Größe: px
Ab Seite anzeigen:

Download "Zeitreihen. Statistik II"

Transkript

1 Statistik II

2 Wiederholung Literatur -Daten Trends und Saisonalität Fehlerstruktur Statistik II (1/31)

3 Wiederholung Literatur -Daten Trends und Saisonalität Fehlerstruktur Statistik II (1/31)

4 Zum Nachlesen Wiederholung Literatur Wooldridge ch 10.1 & 10.2 Statistik II (2/31)

5 Literatur Für nächste Woche Einfache für Paneldaten Wooldridge ch (im Reader) Statistik II (3/31)

6 -Daten Was sind? Bisher: Fälle Länder, Parteien, Städte, Personen... Unabhängig voneinander erhoben, in der Regel durch Zufallsverfahren aus Population (Grundgesamtheit) ausgewählt Jeder Fall hat Ordnungsnummer (Index) n: y 1, y 5, y 27, y n... Reihenfolge im Datensatz beliebig Statistik II (4/31)

7 -Daten Was sind? Bisher: Fälle Länder, Parteien, Städte, Personen... Unabhängig voneinander erhoben, in der Regel durch Zufallsverfahren aus Population (Grundgesamtheit) ausgewählt Jeder Fall hat Ordnungsnummer (Index) n: y 1, y 5, y 27, y n... Reihenfolge im Datensatz beliebig Datenmatrix kann umsortiert werden (Spalten und Zeilen) Statistik II (4/31)

8 -Daten Inwiefern sind anders? beziehen sich auf ein Objekt (z. B. ein politisches System) Beobachtungen sind nicht voneinander unabhängig Statistik II (5/31)

9 -Daten Inwiefern sind anders? beziehen sich auf ein Objekt (z. B. ein politisches System) Beobachtungen sind nicht voneinander unabhängig Reihenfolge der Beobachtungen im Datensatz ist nicht beliebig, sondern durch Kalenderzeit vorgegeben Spalten der Datenmatrix können umsortiert werden, Zeilen nicht Statistik II (5/31)

10 -Daten Inwiefern sind anders? beziehen sich auf ein Objekt (z. B. ein politisches System) Beobachtungen sind nicht voneinander unabhängig Reihenfolge der Beobachtungen im Datensatz ist nicht beliebig, sondern durch Kalenderzeit vorgegeben Spalten der Datenmatrix können umsortiert werden, Zeilen nicht Beobachtungen haben Ordnungsnummer (Index) t, beginnend mit t = 1 (erste Beobachtung) Abstände zwischen Beobachtungen sind (normalerweise) gleich groß Statistik II (5/31)

11 -Daten Abstände Typischerweise an Kalenderzeit orientiert In der Politikwissenschaft gängige Abstände: Tage Wochen Monate Quartale Jahre (Legislaturperioden) Statistik II (6/31)

12 -Daten Abstände Typischerweise an Kalenderzeit orientiert In der Politikwissenschaft gängige Abstände: Tage (tracking polls im Wahlkampf) Wochen Monate Quartale Jahre (Legislaturperioden) Statistik II (6/31)

13 -Daten Abstände Typischerweise an Kalenderzeit orientiert In der Politikwissenschaft gängige Abstände: Tage (tracking polls im Wahlkampf) Wochen (Anzahl terroristischer Anschläge im Irak) Monate Quartale Jahre (Legislaturperioden) Statistik II (6/31)

14 -Daten Abstände Typischerweise an Kalenderzeit orientiert In der Politikwissenschaft gängige Abstände: Tage (tracking polls im Wahlkampf) Wochen (Anzahl terroristischer Anschläge im Irak) Monate (Anteil der Parteiidentifizierer in Deutschland) Quartale Jahre (Legislaturperioden) Statistik II (6/31)

15 -Daten Abstände Typischerweise an Kalenderzeit orientiert In der Politikwissenschaft gängige Abstände: Tage (tracking polls im Wahlkampf) Wochen (Anzahl terroristischer Anschläge im Irak) Monate (Anteil der Parteiidentifizierer in Deutschland) Quartale (Wirtschaftsleistung und Zufriedenheit mit US- Präsident) Jahre (Legislaturperioden) Statistik II (6/31)

16 -Daten Abstände Typischerweise an Kalenderzeit orientiert In der Politikwissenschaft gängige Abstände: Tage (tracking polls im Wahlkampf) Wochen (Anzahl terroristischer Anschläge im Irak) Monate (Anteil der Parteiidentifizierer in Deutschland) Quartale (Wirtschaftsleistung und Zufriedenheit mit US- Präsident) Jahre (Zustimmung zur EU und politische Variablen) (Legislaturperioden) Statistik II (6/31)

17 -Daten Abstände Typischerweise an Kalenderzeit orientiert In der Politikwissenschaft gängige Abstände: Tage (tracking polls im Wahlkampf) Wochen (Anzahl terroristischer Anschläge im Irak) Monate (Anteil der Parteiidentifizierer in Deutschland) Quartale (Wirtschaftsleistung und Zufriedenheit mit US- Präsident) Jahre (Zustimmung zur EU und politische Variablen) (Legislaturperioden) (Entwicklung von Parteiprogrammen über die Zeit) Statistik II (6/31)

18 -Daten Abstände Typischerweise an Kalenderzeit orientiert In der Politikwissenschaft gängige Abstände: Tage (tracking polls im Wahlkampf) Wochen (Anzahl terroristischer Anschläge im Irak) Monate (Anteil der Parteiidentifizierer in Deutschland) Quartale (Wirtschaftsleistung und Zufriedenheit mit US- Präsident) Jahre (Zustimmung zur EU und politische Variablen) (Legislaturperioden) (Entwicklung von Parteiprogrammen über die Zeit) Beispiel: US-Präsident Statistik II (6/31)

19 -Daten Presidential Approval & Unemployment Presidential Approval Do you approve or disapprove of the way is handling his job as President? Statistik II (7/31)

20 -Daten Presidential Approval & Unemployment Presidential Approval Do you approve or disapprove of the way is handling his job as President? Wieviel Prozent Zustimmung zur Amtsführung? Statistik II (7/31)

21 -Daten Presidential Approval & Unemployment Presidential Approval Do you approve or disapprove of the way is handling his job as President? Wieviel Prozent Zustimmung zur Amtsführung? % Approval % Unemployed Kalenderzeit t q q q Statistik II (7/31)

22 -Daten Lags und Leads Lag: Wert aus Vergangenheit (früherer Zeitpunkt) (Lead: Wert aus Zukunft) Statistik II (8/31)

23 -Daten Lags und Leads Lag: Wert aus Vergangenheit (früherer Zeitpunkt) (Lead: Wert aus Zukunft) Bsp.: Zum Zeitpunkt t = 19 Ist das erste Lag der Arbeitslosenquote (Vorquartal, t 1) = 2.7 Das zweite Lag der Arbeitslosenquote (t 2) = 2.8 % Unemployed Kalenderzeit t q q q Statistik II (8/31)

24 -Daten Wie kommen zustande? Normale Regression (über Stichproben) 1. Stichprobe wird zufällig aus Grundgesamtheit ausgewählt 2. Eine Stichprobe, die auch anders aussehen könnte 3. Mathematisches Modell der Stichprobenziehung Inferenzstatistik 4. Rückschluß auf wahre Parameter in Grundgesamtheit Statistik II (9/31)

25 -Daten Wie kommen zustande? Normale Regression (über Stichproben) 1. Stichprobe wird zufällig aus Grundgesamtheit ausgewählt 2. Eine Stichprobe, die auch anders aussehen könnte 3. Mathematisches Modell der Stichprobenziehung Inferenzstatistik 4. Rückschluß auf wahre Parameter in Grundgesamtheit analyse 1. Datengenerierender Prozeß (DGP) erzeugt historischen Ablauf 2. Eine Zeitreihe, die auch anders hätte aussehen können 3. Mathematisches Modell des Prozesses (Inferenzstatistik) 4. Rückschluß auf wahre Parameter des Prozesses Statistik II (9/31)

26 -Daten Wie kommen zustande? Normale Regression (über Stichproben) 1. Stichprobe wird zufällig aus Grundgesamtheit ausgewählt 2. Eine Stichprobe, die auch anders aussehen könnte 3. Mathematisches Modell der Stichprobenziehung Inferenzstatistik 4. Rückschluß auf wahre Parameter in Grundgesamtheit analyse 1. Datengenerierender Prozeß (DGP) erzeugt historischen Ablauf 2. Eine Zeitreihe, die auch anders hätte aussehen können 3. Mathematisches Modell des Prozesses (Inferenzstatistik) 4. Rückschluß auf wahre Parameter des Prozesses Stärkere Annahmen, u. a. über Stabilität des DGP Statistik II (9/31)

27 -Daten Statisches Modell Lineare Beziehung zwischen y und x Schätzung des Modells Nicht auf Grundlage von unabhängigen Fällen Sondern auf Grundlage von zeitlich gestaffelten Beobachtungen am selben Objekt (z. B. USA) Veränderungen in x haben unmittelbaren Effekt auf y Unemployment approval (economic voting) Statistik II (10/31)

28 -Daten Statisches Modell Lineare Beziehung zwischen y und x Schätzung des Modells Nicht auf Grundlage von unabhängigen Fällen Sondern auf Grundlage von zeitlich gestaffelten Beobachtungen am selben Objekt (z. B. USA) Veränderungen in x haben unmittelbaren Effekt auf y Unemployment approval (economic voting) Statisches Modell approval t =β 0 + β 1 unemployment t + ɛ t y t =β 0 + β 1 x 1,t + ɛ t Statistik II (10/31)

29 -Daten Lineare Beziehung x und y unemrate approval Fitted values Statistik II (11/31)

30 -Daten Implikation statisches Modell. reg approval unemrate Source SS df MS Number of obs = 148 F( 1, 146) = 0.85 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] unemrate _cons Zu jedem Zeitpunkt t... Ist Zustimmung zur Amtsführung eine lineare Funktion der ALQ ( unemrate) Z. B. Zunahme ALQ um zwei Prozentpunkte Statistik II (12/31)

31 -Daten Implikation statisches Modell. reg approval unemrate Source SS df MS Number of obs = 148 F( 1, 146) = 0.85 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] unemrate _cons Zu jedem Zeitpunkt t... Ist Zustimmung zur Amtsführung eine lineare Funktion der ALQ ( unemrate) Z. B. Zunahme ALQ um zwei Prozentpunkte sofortige Abnahme Zustimmung um 1.2 Punkte Plausibel? Statistik II (12/31)

32 -Daten (Finite) Distributed Lag Model Veränderungen in x brauchen Zeit, um auf y zu wirken y eine Funktion von x heute plus vergangene 1, 2,... Werte von x (Lags) Anzahl der vergangenen Zeitpunkte, die wir berücksichtigen können, endlich (finit) Im Text: andere Bezeichung für Koeffizienten der Lags, um Sache klarer zu machen Statistik II (13/31)

33 -Daten (Finite) Distributed Lag Model FDL mit zwei Lags y t = β 0 + δ 0 x t + δ 1 x t 1 + δ 2 x t 2 + ɛ t approval t = β 0 + δ 0 unemployment t + δ 1 unemployment t 1 + δ 2 unemployment t 2 + ɛ t Statistik II (13/31)

34 -Daten (Finite) Distributed Lag Model Temporäre Zunahme der Arbeitslosigkeit Zeitpunkt t Effekt erst drei Quartale später (t + 3) abgeklungen δ 0 : impact propensity oder impact multiplier Permanente Zunahme der Arbeitslosigkeit: (Permanente) Veränderung von y braucht drei Quartale um sich aufzubauen Graphische Darstellung von δ 0, δ 1, δ 2 : Verteilung (distributed lag model) Gesamteffekt der Veränderung: Summe von δ 0, δ 1, δ 2 : long-run propensity oder long-run multiplier Statistik II (13/31)

35 -Daten (Finite) Distributed Lag Model. tset date time variable: date, 1949q1 to 1985q4 delta: 1 quarter. reg approval unemrate L1.unemrate L2.unemrate Source SS df MS Number of obs = 146 F( 3, 142) = 0.40 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] unemrate L L _cons Langfristiger Gesamteffekt einer Zunahme der ALQ um einen Punkt? Statistik II (13/31)

36 -Daten (Finite) Distributed Lag Model. tset date time variable: date, 1949q1 to 1985q4 delta: 1 quarter. reg approval unemrate L1.unemrate L2.unemrate Source SS df MS Number of obs = 146 F( 3, 142) = 0.40 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] unemrate L L _cons Langfristiger Gesamteffekt einer Zunahme der ALQ um einen Punkt? = Statistik II (13/31)

37 -Daten Approval & unemployment: lags. list date approval unemrate L1.unemrate L2.unemrate in 1/8,clean L. L2. date approval unemrate unemrate unemrate q q q q q q q q Statistik II (14/31)

38 -Daten Verzögerter Effekt der Arbeitslosigkeit Annahme: Modell ist korrekt, d. h. approval t = alq t alq t 1 1 alq t 2 ALQ einmalig 4 Prozent, sonst 2 Statistik II (15/31)

39 -Daten Verzögerter Effekt der Arbeitslosigkeit Annahme: Modell ist korrekt, d. h. approval t = alq t alq t 1 1 alq t 2 ALQ einmalig 4 Prozent, sonst 2 L. L2. date approval alq alq alq Statistik II (15/31)

40 -Daten Verzögerter Effekt der Arbeitslosigkeit Annahme: Modell ist korrekt, d. h. approval t = alq t alq t 1 1 alq t 2 ALQ 2 Prozent, dann dauerhafter Anstieg auf 4 Prozent Statistik II (15/31)

41 -Daten Verzögerter Effekt der Arbeitslosigkeit Annahme: Modell ist korrekt, d. h. approval t = alq t alq t 1 1 alq t 2 ALQ 2 Prozent, dann dauerhafter Anstieg auf 4 Prozent L. L2. date approval alq alq alq Statistik II (15/31)

42 -Daten Trends Annahme: die beobachteten x und y Werte werden zufällig vom DGP hervorgebracht Deshalb können wir sie ähnlich wie Stichprobe behandeln Tatsächlich: Trends Beispiel x und y nehmen beide über Zeit zu Regression von y auf x zeigt positiven Effekt, selbst wenn Korrelation 0 oder schwach negativ Drittvariablenproblem Drittvariablenkontrolle durch Einschluß Kalenderzeit Beispiel: Presidential Approval und Verbraucherpreise (CPI) Statistik II (16/31)

43 -Daten Presidential Approval und CPI. reg approval cpi Source SS df MS Number of obs = 148 F( 1, 146) = 9.76 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] cpi _cons Statistik II (17/31)

44 -Daten Presidential Approval und CPI. reg approval date Source SS df MS Number of obs = 148 F( 1, 146) = 9.23 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] date _cons reg cpi date Source SS df MS Number of obs = 148 F( 1, 146) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = cpi Coef. Std. Err. t P> t [95% Conf. Interval] date _cons Statistik II (17/31)

45 -Daten Presidential Approval und CPI. reg approval cpi date Source SS df MS Number of obs = 148 F( 2, 145) = 5.04 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] cpi date _cons Statistik II (17/31)

46 -Daten Presidential Approval und CPI. reg approval cpi Source SS df MS Number of obs = 148 F( 1, 146) = 9.76 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] cpi _cons Statistik II (17/31)

47 -Daten Presidential Approval und CPI. reg approval cpi date Source SS df MS Number of obs = 148 F( 2, 145) = 5.04 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] cpi date _cons Effekt des CPI nur halb so stark und nicht mehr signifikant, wenn für gemeinsamen Trend kontrolliert wird Kontrolle für Trends Entweder separate Regressionen von x und y auf Zeit, dann Regression mit Residuen rechnen Oder einfach multivariate Regression Äquivalent Statistik II (17/31)

48 -Daten Saisonalität In vielen ökonomischen Saisonalität (Zyklen) Arbeitslosigkeit im Winter höher Mehr Autos, Fahrräder etc. verkauft im Sommer Anstieg Ölpreis im Herbst Saisonalität in politikwissenschaftlichen weniger klar, aber Midterm-Effekt in amerikanischen Wahlen Beliebtheit der Regierungsparteien in Deutschland über BTW- Wahlzyklus Häufung von Terrorakten zu Jahrestagen/Festen Ggf. z. B. durch Dummies modellieren, um Verzerrungen zu vermeiden Statistik II (18/31)

49 -Daten Saisonalität: CPI und Approval. reg cpi _I* date Source SS df MS Number of obs = 148 F( 4, 143) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = cpi Coef. Std. Err. t P> t [95% Conf. Interval] _Iquarter_ _Iquarter_ _Iquarter_ date _cons Statistik II (19/31)

50 -Daten Saisonalität: CPI und Approval. reg cpi _I* date Source SS df MS Number of obs = 148 F( 4, 143) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = cpi Coef. Std. Err. t P> t [95% Conf. Interval] _Iquarter_ _Iquarter_ _Iquarter_ date _cons reg approval honeymoon date Source SS df MS Number of obs = 148 F( 2, 145) = 7.87 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] honeymoon date _cons Statistik II (19/31)

51 -Daten Recap: Schätzverfahren Welche Eigenschaften sollen Schätzverfahren haben? 1. Möglichst unverzerrt (wenig bias) 2. Möglichst wenig Varianz der Schätzungen (relative Effizienz) 3. Konsistenz (durch größere Fallzahlen beliebig kleine Abweichungen von wahren Werten) Statistik II (20/31)

52 -Daten Recap: Schätzverfahren Welche Eigenschaften sollen Schätzverfahren haben? 1. Möglichst unverzerrt (wenig bias) 2. Möglichst wenig Varianz der Schätzungen (relative Effizienz) 3. Konsistenz (durch größere Fallzahlen beliebig kleine Abweichungen von wahren Werten) Statistik II (20/31)

53 -Daten Recap: Schätzverfahren Welche Eigenschaften sollen Schätzverfahren haben? 1. Möglichst unverzerrt (wenig bias) 2. Möglichst wenig Varianz der Schätzungen (relative Effizienz) 3. Konsistenz (durch größere Fallzahlen beliebig kleine Abweichungen von wahren Werten) Wiederholte Stichprobenziehung (Umfang n) zufällige Verteilung von Schätzungen Mittelwert der Schätzungen stimmt mit wahrem Parameter in Grundgesamtheit überein Systematische Abweichung: bias (Mittelwert wahrer Parameter) Statistik II (20/31)

54 -Daten Recap: Schätzverfahren Welche Eigenschaften sollen Schätzverfahren haben? 1. Möglichst unverzerrt (wenig bias) 2. Möglichst wenig Varianz der Schätzungen (relative Effizienz) 3. Konsistenz (durch größere Fallzahlen beliebig kleine Abweichungen von wahren Werten) Wiederholte Stichprobenziehung (Umfang n) zufällige Verteilung von Schätzungen Unter verschiedenen Schätzverfahren das mit der geringsten Streuung der Schätzungen auswählen (Relativ) effizientes Verfahren Statistik II (20/31)

55 -Daten Recap: Schätzverfahren Welche Eigenschaften sollen Schätzverfahren haben? 1. Möglichst unverzerrt (wenig bias) 2. Möglichst wenig Varianz der Schätzungen (relative Effizienz) 3. Konsistenz (durch größere Fallzahlen beliebig kleine Abweichungen von wahren Werten) Trade-off zwischen Effizienz und möglichst wenig bias Gemeinsame Größe Mean Squared Error (MSE) (MSE) = (bias(ˆβ)) 2 + Varianz(ˆβ) Statistik II (20/31)

56 -Daten Recap: Schätzverfahren Welche Eigenschaften sollen Schätzverfahren haben? 1. Möglichst unverzerrt (wenig bias) 2. Möglichst wenig Varianz der Schätzungen (relative Effizienz) 3. Konsistenz (durch größere Fallzahlen beliebig kleine Abweichungen von wahren Werten) Was passiert bei steigendem Stichprobenumfang? Hinreichende Bedingung für Konsistenz Wenn Stichprobenumfang gegen geht Gehen bias und Varianz der Schätzungen gegen null D. h. die Wahrscheinlichkeit einer relevanten Abweichung zwischen Schätzung und wahrem Wert geht gegen null Statistik II (20/31)

57 -Daten Recap: Voraussetzungen für OLS Wann ist OLS unverzerrt, effizient und konsistent? (Gauß-Markov-Bedingungen): 1. y intervallskaliert und unbeschränkt, Varianz aller x, keine perfekte Multikollineariät 2. Keine Autokorrelation der zufälligen Einflüsse ɛ, d. h. für zwei Beobachtungen i und h sind ɛ i und ɛ h bei wiederholter Stichprobenziehung unkorreliert 3. Kein Zusammenhang zwischen ɛ und x-variablen, d. h. 3.1 Konditionaler Mittelwert von ɛ = 0 für alle Werte von x 3.2 Konstante konditionale Varianz von ɛ (Homoskedastizität) für alle Werte von x 4. (Normalverteilung von ɛ wird nur für Berechnung Standardfehler gebraucht, kein Problem bei großen Stichproben) OLS = BLUE: Best Linear Unbiased Estimator Statistik II (21/31)

58 -Daten mit daten Grundproblem: Fälle sind nicht zufällig ausgewählt, sondern zeitlich strukturiert Fiktives Beispiel: nationale Bildungsausgaben (x) und nationaler Schulleistungstests (y), jährliche Messung Typische : 1. (Zusammenhang zwischen Variablen bzw. Verteilung einer Variablen ändert sich über die Zeit ((Non-)Stationarität)) 2. (Extreme Autokorrelation einer x-variablen) 3. Heteroskedastizität (Varianz von ɛ nicht konstant) 4. Abhängigkeit zwischen x und ɛ 5. Autokorrelation von ɛ Statistik II (22/31)

59 -Daten mit daten Grundproblem: Fälle sind nicht zufällig ausgewählt, sondern zeitlich strukturiert Fiktives Beispiel: nationale Bildungsausgaben (x) und nationaler Schulleistungstests (y), jährliche Messung Typische : 1. (Zusammenhang zwischen Variablen bzw. Verteilung einer Variablen ändert sich über die Zeit ((Non-)Stationarität)) 2. (Extreme Autokorrelation einer x-variablen) 3. Heteroskedastizität (Varianz von ɛ nicht konstant) 4. Abhängigkeit zwischen x und ɛ 5. Autokorrelation von ɛ Statistik II (22/31)

60 -Daten Heteroskedastizität Höhere Bildungsausgaben Bessere Testergebnisse Tests werden sorgfältiger durchgeführt weniger zufällige Varianz Abhängigkeit der Varianz von ɛ vom Niveau von x Standardfehler zu optimistisch Mögliche Lösungen Qualität der Testdurchführung direkt messen (möglicherweise aber hoch mit x korreliert) Robuste Standardfehler berechnen lassen Statistik II (23/31)

61 -Daten Endogenität Idealerweise: Alle Werte von x komplett von aktuellen, vergangenen, zukünftigen Werten von ɛ unabhängig (strikt exogen) D. h. Gedankenexperiment: DGP würde sehr häufig wiederholt Werte für z. B. xt und ɛ t 1 würden notiert Korrelation zwischen beiden? Endogenität im Beispiel leicht möglich Zufälliger negativer ɛ t 1 (z. B. Fußball-WM 2014) beeinflußt Leistungen im Test 2014 (y t 1 ) Panische Erhöhung der Bildungsausgaben in 2015 (xt ) Zusammenhang zwischen x und ɛ; x ist nicht exogen Bias, aber möglicherweise noch konsistent besondere Statistik II (24/31)

62 -Daten Autokorrelation von ɛ In sind die Werte von ɛ häufig (positiv) mit sich selbst korreliert Neue Show mit G. Jauch führt zu besonderen Anstrengungen zum Zeitpunkt t ɛ t > 0, y t ungewöhnlich hoch Ein Jahr später: positiver Effekt der Show abgeschwächt, aber noch vorhanden ɛ t > ɛ t+1 > 0 Allgemein: ɛt = ρɛ t 1 + u t mit ρ < 1 Statistik II (25/31)

63 -Daten Autokorrelation von ɛ Positive Autokorrelation der zufälligen Einflüsse ( Fehler, ɛ) Statistik II (25/31)

64 -Daten Autokorrelation von ɛ In sind die Werte von ɛ häufig (positiv) mit sich selbst korreliert Neue Show mit G. Jauch führt zu besonderen Anstrengungen zum Zeitpunkt t ɛ t > 0, y t ungewöhnlich hoch Ein Jahr später: positiver Effekt der Show abgeschwächt, aber noch vorhanden ɛ t > ɛ t+1 > 0 Allgemein: ɛt = ρɛ t 1 + u t mit ρ < 1 OLS immer noch konsistent und unverzerrt, aber nicht mehr effizient R 2 zu hoch, Signifikanztests nicht mehr gültig Statistischer Test (Durbin-Watson-Test und Alternativen) Ggf. besonderes Modell schätzen Statistik II (25/31)

65 -Daten Presidential Approval. reg approval honeymoon date Source SS df MS Number of obs = 148 F( 2, 145) = 7.87 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] honeymoon date _cons estat durbina Durbin s alternative test for autocorrelation lags(p) chi2 df Prob > chi H0: no serial correlation Statistik II (26/31)

66 -Daten Presidential Approval. prais approval honeymoon date,robust Iteration 0: rho = Iteration 1: rho = Iteration 2: rho = Iteration 3: rho = Iteration 4: rho = Prais-Winsten AR(1) regression -- iterated estimates Linear regression Number of obs = 148 F( 3, 145) = Prob > F = R-squared = Root MSE = Semirobust approval Coef. Std. Err. t P> t [95% Conf. Interval] honeymoon date _cons rho Durbin-Watson statistic (original) Durbin-Watson statistic (transformed) Statistik II (26/31)

67 -Daten (1.) Differenzen mit starken Trends machen bei Schätzung Oft ist nicht Niveau, sondern Veränderung interessant Differenzen (gegenüber Vorperiode) für abhängige und/oder unabhängige Variablen In Stata: D.-Operator Statistik II (27/31)

68 -Daten (1.) Differenzen. list date approval D.approval cpi D.cpi in 1/6,clean D. D. date approval approval cpi cpi q q q q q q Statistik II (27/31)

69 -Daten Veränderung approval / Veränderung CPI D.approval D.cpi Statistik II (28/31)

70 -Daten Veränderung approval / Zeit D.approval q1 1955q1 1960q1 1965q1 1970q1 1975q1 1980q1 1985q1 date Statistik II (29/31)

71 -Daten Finales (?) Modell. prais D.approval honeymoon D.cpi date Iteration 0: rho = Iteration 1: rho = Iteration 2: rho = Iteration 3: rho = Iteration 4: rho = Prais-Winsten AR(1) regression -- iterated estimates Source SS df MS Number of obs = F( 3, 143) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = D.approval Coef. Std. Err. t P> t [95% Conf. Interval] honeymoon cpi D date _cons rho Durbin-Watson statistic (original) Durbin-Watson statistic (transformed) Statistik II (30/31)

72 sind anders: Kein Stichprobenziehung Nur ein Objekt wird beobachtet Viele Informationen über dieses Objekt sind schwach Beobachtungen sind voneinander abhängig Effektive Fallzahl kleiner als n Gleichzeitig informativer als Querschnittsdaten: Dynamik Sehr sorgfältige Analyse notwendig Statistik II (31/31)

Einfache Modelle für Paneldaten. Statistik II

Einfache Modelle für Paneldaten. Statistik II Einfache Modelle für daten Statistik II Wiederholung Literatur daten Policy-Analyse II: Statistik II daten (1/18) Literatur Zum Nachlesen Einfache Modelle für daten Wooldridge ch. 13.1-13.4 (im Reader)

Mehr

Kategoriale abhängige Variablen:

Kategoriale abhängige Variablen: Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell Statistik II

Mehr

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Wiederholung Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell

Mehr

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse Multiple Regression II: Signifikanztests,, Multikollinearität und Kohortenanalyse Statistik II Übersicht Literatur Kausalität und Regression Inferenz und standardisierte Koeffizienten Statistik II Multiple

Mehr

Interne und externe Modellvalidität

Interne und externe Modellvalidität Interne und externe Modellvalidität Interne Modellvalidität ist gegeben, o wenn statistische Inferenz bzgl. der untersuchten Grundgesamtheit zulässig ist o KQ-Schätzer der Modellparameter u. Varianzschätzer

Mehr

Panelregression (und Mehrebenenanwendungen)

Panelregression (und Mehrebenenanwendungen) Panelregression (und Mehrebenenanwendungen) Henning Lohmann Universität zu Köln Lehrstuhl für Empirische Sozial- und Wirtschaftsforschung SOEP@Campus 2007, Universität Duisburg-Essen, 11. Oktober 2007

Mehr

Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil. Name, Vorname. Matrikelnr. Studiengang. E-Mail-Adresse. Unterschrift

Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil. Name, Vorname. Matrikelnr. Studiengang. E-Mail-Adresse. Unterschrift Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil Name, Vorname Matrikelnr. Studiengang E-Mail-Adresse Unterschrift

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Multiple Regression. Statistik II

Multiple Regression. Statistik II Statistik II Übersicht Wiederholung Literatur Regression Assoziation und Kausalität Statistische Kontrolle Multivariate Beziehungen Inferenz Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

1 Statistische Grundlagen

1 Statistische Grundlagen Konzepte in Empirische Ökonomie 1 (Winter) Hier findest Du ein paar Tipps zu den Konzepten in Empirische 1. Wenn Du aber noch etwas Unterstützung kurz vor der Klausur brauchst, schreib uns eine kurze Email.

Mehr

3. Einführung in die Zeitreihenanalyse

3. Einführung in die Zeitreihenanalyse 3. Einführung in die Zeitreihenanalyse Dr. Johann Burgstaller Finance Department, JKU Linz (Dieser Foliensatz wurde zuletzt aktualisiert am 25. Dezember 2007.) Dr. Johann Burgstaller IK Empirische Kapitalmarktforschung

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Statistik Einführung // Lineare Regression 9 p.2/72

Statistik Einführung // Lineare Regression 9 p.2/72 Statistik Einführung Lineare Regression Kapitel 9 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Ledold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Lineare Regression

Mehr

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 8. Februar 2007 Hinweise:

Mehr

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Lösungsskizze

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Lösungsskizze Lehrstuhl für Statistik und empirische irtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im ach Ökonometrie im S 20/2 Lösungsskizze Aufgabe (.5 Punkte) Sie verfügen über einen Datensatz, der Informationen

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

Kap. 12: Regression mit Zeitreihendaten und Prognosemodelle

Kap. 12: Regression mit Zeitreihendaten und Prognosemodelle Kap. 12: Regression mit Zeitreihendaten und Prognosemodelle Motivation Grundbegriffe Autoregressionen (AR-Modelle) Dynamische Regressionsmodelle (ADL-Modelle) Nichstationarität Ausblick 12.1 Motivation

Mehr

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Aufgabe 1: Betrachtet wird folgendes Modell zur Erklärung des Managergehalts salary durch den Umsatz sales, die Eigenkapitalrendite roe und die

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 9B a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Man kann erwarten, dass der Absatz mit steigendem Preis abnimmt, mit höherer Anzahl der Außendienstmitarbeiter sowie mit erhöhten

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Andreas Berlin 14. Juli 2009 Bachelor-Seminar: Messen und Statistik Inhalt: 1 Aspekte einer Messung 2 Mess-System-Analyse 2.1 ANOVA-Methode 2.2 Maße

Mehr

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Warum überhaupt Gedanken machen? Was fehlt, ist doch weg, oder? Allgegenwärtiges Problem in psychologischer Forschung Bringt Fehlerquellen

Mehr

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Aufgabe 1: Grundzüge der Wahrscheinlichkeitsrechnung 19 P. Als Manager eines großen

Mehr

Mehr-Ebenen-Analyse I. Regressionsmodelle für Politikwissenschaftler

Mehr-Ebenen-Analyse I. Regressionsmodelle für Politikwissenschaftler Mehr-Ebenen-Analyse I Regressionsmodelle für Politikwissenschaftler Was sind strukturierte Daten? Was ist Struktur? Probleme Bisher sind wir stets von einfachen Zufallsstichproben ausgegangen (Registerstichprobe)

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen Analyse von Querschnittsdaten Regression mit Dummy-Variablen Warum geht es in den folgenden Sitzungen? Datum Vorlesung 9.0.05 Einführung 26.0.05 Beispiele 02..05 Forschungsdesigns & Datenstrukturen 09..05

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert

Mehr

2. Statistische Methoden in der Diagnostik. Elemente des Studiendesigns

2. Statistische Methoden in der Diagnostik. Elemente des Studiendesigns 2. Statistische Methoden in der Diagnostik Elemente des Studiendesigns Diagnosestudien in der Medizin Klassifikation in krank - nicht krank basierend auf diagnostischem Test Beispiel: Diagnose von Brustkrebs

Mehr

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse. Statistik II

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse. Statistik II Multiple Regression II: Signifikanztests,, Multikollinearität und Kohortenanalyse Statistik II Übersicht Wiederholung Literatur Kausalität und Regression Inferenz und standardisierte Koeffizienten Statistik

Mehr

Empirische Wirtschaftsforschung

Empirische Wirtschaftsforschung Empirische Wirtschaftsforschung Anne Neumann 21. Oktober 2015 Anne Neumann EWF 21. Oktober 2015 1 / 9 Inhaltsverzeichnis 1 Grobgliederung 2 Grundlagen Anne Neumann EWF 21. Oktober 2015 2 / 9 Grobgliederung

Mehr

Lineare Modelle in R: Einweg-Varianzanalyse

Lineare Modelle in R: Einweg-Varianzanalyse Lineare Modelle in R: Einweg-Varianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon in der Vorlesung wollen wir hier zur Illustration der Einweg-Analyse die logarithmierten Ausgaben der

Mehr

Die Varianzanalyse ohne Messwiederholung. Jonathan Harrington. Bi8e noch einmal datasets.zip laden

Die Varianzanalyse ohne Messwiederholung. Jonathan Harrington. Bi8e noch einmal datasets.zip laden Die Varianzanalyse ohne Messwiederholung Jonathan Harrington Bi8e noch einmal datasets.zip laden Variablen, Faktoren, Stufen Eine Varianzanalyse ist die Erweiterung von einem t- test t- test oder ANOVA

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Dynamische Modelle. 1 Ökonomische Relevanz. 2 Ökonometrische Modelle. a) Statisches Modell und Differenzenbildung

Dynamische Modelle. 1 Ökonomische Relevanz. 2 Ökonometrische Modelle. a) Statisches Modell und Differenzenbildung Universität Ulm 89069 Ulm Germany Prof. Dr. Werner Smolny Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Institutsdirektor Sommersemester

Mehr

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften

Mehr

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang.

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang. Lehrstuhl für Statistik und empirische Wirtschaftsforschung Fach: Prüfer: Bachelorprüfung Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname Matrikelnr. E-Mail Studiengang

Mehr

Teil II: Einführung in die Statistik

Teil II: Einführung in die Statistik Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu

Mehr

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Fallbeispiel 5: Humankapital und Returns to Education. Seite 1

Fallbeispiel 5: Humankapital und Returns to Education. Seite 1 Fallbeispiel 5: Humankapital und Returns to Education Seite 1 Gliederung Einführung: Wirkungsanalysen in der Wirtschaftspolitik I. Theoretischer Teil 1 Humankapital 2 Returns to Education: Schooling Model

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Prognosen. Prognosen sind schwierig, besonders wenn sie die Zukunft betreffen. Auch ein Weiser hat nicht immer recht Prognosefehler sind hoch

Prognosen. Prognosen sind schwierig, besonders wenn sie die Zukunft betreffen. Auch ein Weiser hat nicht immer recht Prognosefehler sind hoch Universität Ulm 8969 Ulm Germany Dipl.-WiWi Sabrina Böck Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Wintersemester 8/9 Prognosen

Mehr

Analyse von Zeitreihen in der Umweltphysik und Geophysik Stochastische Prozesse

Analyse von Zeitreihen in der Umweltphysik und Geophysik Stochastische Prozesse Analyse von Zeitreihen in der Umweltphysik und Geophysik Stochastische Prozesse Yannik Behr Gliederung 1 Stochastische Prozesse Stochastische Prozesse Ein stochastischer Prozess ist ein Phänomen, dessen

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

Univariate Lineare Regression. (eine unabhängige Variable)

Univariate Lineare Regression. (eine unabhängige Variable) Univariate Lineare Regression (eine unabhängige Variable) Lineare Regression y=a+bx Präzise lineare Beziehung a.. Intercept b..anstieg y..abhängige Variable x..unabhängige Variable Lineare Regression y=a+bx+e

Mehr

Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen. Das folgende Modell ist ein GARCH(1,1)-Modell:

Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen. Das folgende Modell ist ein GARCH(1,1)-Modell: Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen LV-Leiterin: Univ.Prof.Dr. Sylvia Frühwirth-Schnatter 1 Wahr oder falsch? 1. Das folgende Modell ist ein GARCH(1,1)-Modell: Y

Mehr

Musterlösung zu Serie 14

Musterlösung zu Serie 14 Dr. Lukas Meier Statistik und Wahrscheinlichkeitsrechnung FS 21 Musterlösung zu Serie 14 1. Der Datensatz von Forbes zeigt Messungen von Siedepunkt (in F) und Luftdruck (in inches of mercury) an verschiedenen

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen

Mehr

Institut für Soziologie Christian Ganser. Methoden 2. Regressionsanalyse III: Diagnostik

Institut für Soziologie Christian Ganser. Methoden 2. Regressionsanalyse III: Diagnostik Institut für Soziologie Methoden 2 Regressionsanalyse III: Diagnostik Wiederholung Regressionsanalyse beruht auf verschiedenen Annahmen Sind Annahmen verletzt, sind bestimmte Eigenschaften der Schätzer

Mehr

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Analytische Statistik I Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Testen Anpassungstests (goodness of fit) Weicht eine gegebene Verteilung signifikant von einer bekannten

Mehr

Lösung zu Kapitel 11: Beispiel 1

Lösung zu Kapitel 11: Beispiel 1 Lösung zu Kapitel 11: Beispiel 1 Eine Untersuchung bei 253 Personen zur Kundenzufriedenheit mit einer Einzelhandelskette im Südosten der USA enthält Variablen mit sozialstatistischen Daten der befragten

Mehr

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test 1/29 Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1516/ 11.12.2015 2/29 Inhalt 1 t-test

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

PRAKTIKUM Experimentelle Prozeßanalyse 2. VERSUCH AS-PA-2 "Methoden der Modellbildung statischer Systeme" Teil 2 (für ausgewählte Masterstudiengänge)

PRAKTIKUM Experimentelle Prozeßanalyse 2. VERSUCH AS-PA-2 Methoden der Modellbildung statischer Systeme Teil 2 (für ausgewählte Masterstudiengänge) FACHGEBIET Systemanalyse PRAKTIKUM Experimentelle Prozeßanalyse 2 VERSUCH AS-PA-2 "Methoden der Modellbildung statischer Systeme" Teil 2 (für ausgewählte Masterstudiengänge) Verantw. Hochschullehrer: Prof.

Mehr

In konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert.

In konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert. Konstante Modelle: In konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert. Der prognostizierte Wert für die Periode T+i entspricht

Mehr

Motivation. Jede Messung ist mit einem sogenannten Fehler behaftet, d.h. einer Messungenauigkeit

Motivation. Jede Messung ist mit einem sogenannten Fehler behaftet, d.h. einer Messungenauigkeit Fehlerrechnung Inhalt: 1. Motivation 2. Was sind Messfehler, statistische und systematische 3. Verteilung statistischer Fehler 4. Fehlerfortpflanzung 5. Graphische Auswertung und lineare Regression 6.

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Klausur zur Vorlesung Methoden der empirischen Kapitalmarktforschung

Klausur zur Vorlesung Methoden der empirischen Kapitalmarktforschung Universität Augsburg Wirtschaftswissenschaftliche Fakultät Lehrstuhl für Finanz und Bankwirtschaft Matrikelnummer Klausur zur Vorlesung Methoden der empirischen Kapitalmarktforschung Prof. Dr. Marco Wilkens

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Klausur, Multivariate Verfahren, SS 2006, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 08.08.2006 Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Gesamtpunkte: 39 Aufgabe

Mehr

Nichtparametrische statistische Verfahren

Nichtparametrische statistische Verfahren Nichtparametrische statistische Verfahren (im Wesentlichen Analyse von Abhängigkeiten) Kategorien von nichtparametrischen Methoden Beispiel für Rangsummentests: Wilcoxon-Test / U-Test Varianzanalysen 1-faktorielle

Mehr

ChangePoint-Analysen - ein Überblick

ChangePoint-Analysen - ein Überblick ChangePoint-Analysen - ein Überblick Gliederung Motivation Anwendungsgebiete Chow Test Quandt-Andrews Test Fluktuations-Tests Binary Segmentation Recursive circular and binary segmentation algorithm Bayesscher

Mehr

Log-lineare Analyse I

Log-lineare Analyse I 1 Log-lineare Analyse I Einleitung Die log-lineare Analysemethode wurde von L.A. Goodman in den 60er und 70er Jahren entwickelt. Sie dient zur Analyse von Zusammenhängen in mehrdimensionalen Kontingenztafeln

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Mikro-Ökonometrie: Small Sample Inferenz mit OLS

Mikro-Ökonometrie: Small Sample Inferenz mit OLS Mikro-Ökonometrie: Small Sample Inferenz mit OLS 1. November 014 Mikro-Ökonometrie: Small Sample Inferenz mit OLS Folie Zusammenfassung wichtiger Ergebnisse des letzten Kapitels (I) Unter den ersten vier

Mehr

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen Modelle mit Interationsvariablen I Modelle mit Interationsvariablen II In der beim White-Test verwendeten Regressionsfuntion y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 2 1 + β 4 x 2 2 + β 5 x 1 x 2, ist anders

Mehr

1. Erklären Sie den Unterschied zwischen einem einseitigen und zweiseitigen Hypothesentest.

1. Erklären Sie den Unterschied zwischen einem einseitigen und zweiseitigen Hypothesentest. Statistik II Übung 3: Hypothesentests Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier Stichproben). Verwenden

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Lineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA)

Lineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA) Interdisziplinäres Seminar Lineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA) WS 2008/09 19.11.2008 Julia Schiele und Lucie Wink Dozenten: Prof. Dr. Bühner, Prof. Dr. Küchenhoff

Mehr

Prüfen von Mittelwertsunterschieden: t-test

Prüfen von Mittelwertsunterschieden: t-test Prüfen von Mittelwertsunterschieden: t-test Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) t-test

Mehr

CreditMetrics. Portfoliokreditrisko Seminar. Korrelation und Asset Value Ansatz. 17. Oktober 2007 Robert Schilling

CreditMetrics. Portfoliokreditrisko Seminar. Korrelation und Asset Value Ansatz. 17. Oktober 2007 Robert Schilling Korrelation und Ansatz Portfoliokreditrisko Seminar 7. Oktober 007 Robert Schilling Seminarleitung: PD Dr. Rafael Weißbach Universität Mannheim Berechnung des Exposures Schätzung der Volatilität Schätzung

Mehr

6.2 Regressionsanalyse

6.2 Regressionsanalyse c-kennzahlensystem (ROCI) 6. Regressionsanalyse Die Regressionsanalyse zählt zu den wichtigsten Analysemethoden des Kommunikationscontrollings und hat ihre tiefen Wurzeln in der Statistik. Im Rahmen des

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam. Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.de 1 Gliederung 7 Weitere Krigingverfahren 7.1 Simple-Kriging 7.2 Indikator-Kriging

Mehr

Statistische Auswertung der Daten von Blatt 13

Statistische Auswertung der Daten von Blatt 13 Statistische Auswertung der Daten von Blatt 13 Problemstellung 1 Graphische Darstellung der Daten 1 Diskussion der Normalverteilung 3 Mittelwerte und deren Konfidenzbereiche 3 Signifikanz der Behandlung

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

Fallstudie: Schadenshäufigkeiten bei Kfz-Versicherungen

Fallstudie: Schadenshäufigkeiten bei Kfz-Versicherungen Fallstudie: Schadenshäufigkeiten bei Kfz-Versicherungen Stefan Lang 12 Oktober 2005 WS 05/06 Datensatzbeschreibung (1) Daten Versicherungsdaten für Belgien ca 160000 Beobachtungen Ziel Analyse der Risikostruktur

Mehr

Studiendesign/ Evaluierungsdesign

Studiendesign/ Evaluierungsdesign Jennifer Ziegert Studiendesign/ Evaluierungsdesign Praxisprojekt: Nutzerorientierte Evaluierung von Visualisierungen in Daffodil mittels Eyetracker Warum Studien /Evaluierungsdesign Das Design einer Untersuchung

Mehr

Weiterbildungskurs Stochastik

Weiterbildungskurs Stochastik Hansruedi Künsch Seminar für Statistik Departement Mathematik, ETH Zürich 24. Juni 2009 Inhalt STATISTIK DER BINOMIALVERTEILUNG 1 STATISTIK DER BINOMIALVERTEILUNG 2 Fragestellungen Typische Fragestellungen

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Florian Frötscher und Demet Özçetin

Florian Frötscher und Demet Özçetin Statistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen, Probleme. Florian Frötscher und Demet Özçetin florian.froetscher@uni-hamburg.de SFB 538 Mehrsprachigkeit Max-Brauer-Allee 60

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/07 28.02.2007

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/07 28.02.2007 Wirtschaftswissenschaftliches Prüfungsamt DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 006/07 8.0.007 Lösung Prof. Dr. R Friedmann / Dr. R. Hauser Hinweise für die Klausurteilnehmer

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Vorlesung:Multivariate Analyseverfahren

Vorlesung:Multivariate Analyseverfahren Vorlesung:Multivariate Analyseverfahren Josef Brüderl, Oktober 24 Multivariate Verfahren sind statistische Verfahren zur Analyse der Beziehungsstruktur mehrerer Variablen. Man kann multivariate Verfahren

Mehr