Zeitreihen. Statistik II

Größe: px
Ab Seite anzeigen:

Download "Zeitreihen. Statistik II"

Transkript

1 Statistik II

2 Wiederholung Literatur -Daten Trends und Saisonalität Fehlerstruktur Statistik II (1/31)

3 Wiederholung Literatur -Daten Trends und Saisonalität Fehlerstruktur Statistik II (1/31)

4 Zum Nachlesen Wiederholung Literatur Wooldridge ch 10.1 & 10.2 Statistik II (2/31)

5 Literatur Für nächste Woche Einfache für Paneldaten Wooldridge ch (im Reader) Statistik II (3/31)

6 -Daten Was sind? Bisher: Fälle Länder, Parteien, Städte, Personen... Unabhängig voneinander erhoben, in der Regel durch Zufallsverfahren aus Population (Grundgesamtheit) ausgewählt Jeder Fall hat Ordnungsnummer (Index) n: y 1, y 5, y 27, y n... Reihenfolge im Datensatz beliebig Statistik II (4/31)

7 -Daten Was sind? Bisher: Fälle Länder, Parteien, Städte, Personen... Unabhängig voneinander erhoben, in der Regel durch Zufallsverfahren aus Population (Grundgesamtheit) ausgewählt Jeder Fall hat Ordnungsnummer (Index) n: y 1, y 5, y 27, y n... Reihenfolge im Datensatz beliebig Datenmatrix kann umsortiert werden (Spalten und Zeilen) Statistik II (4/31)

8 -Daten Inwiefern sind anders? beziehen sich auf ein Objekt (z. B. ein politisches System) Beobachtungen sind nicht voneinander unabhängig Statistik II (5/31)

9 -Daten Inwiefern sind anders? beziehen sich auf ein Objekt (z. B. ein politisches System) Beobachtungen sind nicht voneinander unabhängig Reihenfolge der Beobachtungen im Datensatz ist nicht beliebig, sondern durch Kalenderzeit vorgegeben Spalten der Datenmatrix können umsortiert werden, Zeilen nicht Statistik II (5/31)

10 -Daten Inwiefern sind anders? beziehen sich auf ein Objekt (z. B. ein politisches System) Beobachtungen sind nicht voneinander unabhängig Reihenfolge der Beobachtungen im Datensatz ist nicht beliebig, sondern durch Kalenderzeit vorgegeben Spalten der Datenmatrix können umsortiert werden, Zeilen nicht Beobachtungen haben Ordnungsnummer (Index) t, beginnend mit t = 1 (erste Beobachtung) Abstände zwischen Beobachtungen sind (normalerweise) gleich groß Statistik II (5/31)

11 -Daten Abstände Typischerweise an Kalenderzeit orientiert In der Politikwissenschaft gängige Abstände: Tage Wochen Monate Quartale Jahre (Legislaturperioden) Statistik II (6/31)

12 -Daten Abstände Typischerweise an Kalenderzeit orientiert In der Politikwissenschaft gängige Abstände: Tage (tracking polls im Wahlkampf) Wochen Monate Quartale Jahre (Legislaturperioden) Statistik II (6/31)

13 -Daten Abstände Typischerweise an Kalenderzeit orientiert In der Politikwissenschaft gängige Abstände: Tage (tracking polls im Wahlkampf) Wochen (Anzahl terroristischer Anschläge im Irak) Monate Quartale Jahre (Legislaturperioden) Statistik II (6/31)

14 -Daten Abstände Typischerweise an Kalenderzeit orientiert In der Politikwissenschaft gängige Abstände: Tage (tracking polls im Wahlkampf) Wochen (Anzahl terroristischer Anschläge im Irak) Monate (Anteil der Parteiidentifizierer in Deutschland) Quartale Jahre (Legislaturperioden) Statistik II (6/31)

15 -Daten Abstände Typischerweise an Kalenderzeit orientiert In der Politikwissenschaft gängige Abstände: Tage (tracking polls im Wahlkampf) Wochen (Anzahl terroristischer Anschläge im Irak) Monate (Anteil der Parteiidentifizierer in Deutschland) Quartale (Wirtschaftsleistung und Zufriedenheit mit US- Präsident) Jahre (Legislaturperioden) Statistik II (6/31)

16 -Daten Abstände Typischerweise an Kalenderzeit orientiert In der Politikwissenschaft gängige Abstände: Tage (tracking polls im Wahlkampf) Wochen (Anzahl terroristischer Anschläge im Irak) Monate (Anteil der Parteiidentifizierer in Deutschland) Quartale (Wirtschaftsleistung und Zufriedenheit mit US- Präsident) Jahre (Zustimmung zur EU und politische Variablen) (Legislaturperioden) Statistik II (6/31)

17 -Daten Abstände Typischerweise an Kalenderzeit orientiert In der Politikwissenschaft gängige Abstände: Tage (tracking polls im Wahlkampf) Wochen (Anzahl terroristischer Anschläge im Irak) Monate (Anteil der Parteiidentifizierer in Deutschland) Quartale (Wirtschaftsleistung und Zufriedenheit mit US- Präsident) Jahre (Zustimmung zur EU und politische Variablen) (Legislaturperioden) (Entwicklung von Parteiprogrammen über die Zeit) Statistik II (6/31)

18 -Daten Abstände Typischerweise an Kalenderzeit orientiert In der Politikwissenschaft gängige Abstände: Tage (tracking polls im Wahlkampf) Wochen (Anzahl terroristischer Anschläge im Irak) Monate (Anteil der Parteiidentifizierer in Deutschland) Quartale (Wirtschaftsleistung und Zufriedenheit mit US- Präsident) Jahre (Zustimmung zur EU und politische Variablen) (Legislaturperioden) (Entwicklung von Parteiprogrammen über die Zeit) Beispiel: US-Präsident Statistik II (6/31)

19 -Daten Presidential Approval & Unemployment Presidential Approval Do you approve or disapprove of the way is handling his job as President? Statistik II (7/31)

20 -Daten Presidential Approval & Unemployment Presidential Approval Do you approve or disapprove of the way is handling his job as President? Wieviel Prozent Zustimmung zur Amtsführung? Statistik II (7/31)

21 -Daten Presidential Approval & Unemployment Presidential Approval Do you approve or disapprove of the way is handling his job as President? Wieviel Prozent Zustimmung zur Amtsführung? % Approval % Unemployed Kalenderzeit t q q q Statistik II (7/31)

22 -Daten Lags und Leads Lag: Wert aus Vergangenheit (früherer Zeitpunkt) (Lead: Wert aus Zukunft) Statistik II (8/31)

23 -Daten Lags und Leads Lag: Wert aus Vergangenheit (früherer Zeitpunkt) (Lead: Wert aus Zukunft) Bsp.: Zum Zeitpunkt t = 19 Ist das erste Lag der Arbeitslosenquote (Vorquartal, t 1) = 2.7 Das zweite Lag der Arbeitslosenquote (t 2) = 2.8 % Unemployed Kalenderzeit t q q q Statistik II (8/31)

24 -Daten Wie kommen zustande? Normale Regression (über Stichproben) 1. Stichprobe wird zufällig aus Grundgesamtheit ausgewählt 2. Eine Stichprobe, die auch anders aussehen könnte 3. Mathematisches Modell der Stichprobenziehung Inferenzstatistik 4. Rückschluß auf wahre Parameter in Grundgesamtheit Statistik II (9/31)

25 -Daten Wie kommen zustande? Normale Regression (über Stichproben) 1. Stichprobe wird zufällig aus Grundgesamtheit ausgewählt 2. Eine Stichprobe, die auch anders aussehen könnte 3. Mathematisches Modell der Stichprobenziehung Inferenzstatistik 4. Rückschluß auf wahre Parameter in Grundgesamtheit analyse 1. Datengenerierender Prozeß (DGP) erzeugt historischen Ablauf 2. Eine Zeitreihe, die auch anders hätte aussehen können 3. Mathematisches Modell des Prozesses (Inferenzstatistik) 4. Rückschluß auf wahre Parameter des Prozesses Statistik II (9/31)

26 -Daten Wie kommen zustande? Normale Regression (über Stichproben) 1. Stichprobe wird zufällig aus Grundgesamtheit ausgewählt 2. Eine Stichprobe, die auch anders aussehen könnte 3. Mathematisches Modell der Stichprobenziehung Inferenzstatistik 4. Rückschluß auf wahre Parameter in Grundgesamtheit analyse 1. Datengenerierender Prozeß (DGP) erzeugt historischen Ablauf 2. Eine Zeitreihe, die auch anders hätte aussehen können 3. Mathematisches Modell des Prozesses (Inferenzstatistik) 4. Rückschluß auf wahre Parameter des Prozesses Stärkere Annahmen, u. a. über Stabilität des DGP Statistik II (9/31)

27 -Daten Statisches Modell Lineare Beziehung zwischen y und x Schätzung des Modells Nicht auf Grundlage von unabhängigen Fällen Sondern auf Grundlage von zeitlich gestaffelten Beobachtungen am selben Objekt (z. B. USA) Veränderungen in x haben unmittelbaren Effekt auf y Unemployment approval (economic voting) Statistik II (10/31)

28 -Daten Statisches Modell Lineare Beziehung zwischen y und x Schätzung des Modells Nicht auf Grundlage von unabhängigen Fällen Sondern auf Grundlage von zeitlich gestaffelten Beobachtungen am selben Objekt (z. B. USA) Veränderungen in x haben unmittelbaren Effekt auf y Unemployment approval (economic voting) Statisches Modell approval t =β 0 + β 1 unemployment t + ɛ t y t =β 0 + β 1 x 1,t + ɛ t Statistik II (10/31)

29 -Daten Lineare Beziehung x und y unemrate approval Fitted values Statistik II (11/31)

30 -Daten Implikation statisches Modell. reg approval unemrate Source SS df MS Number of obs = 148 F( 1, 146) = 0.85 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] unemrate _cons Zu jedem Zeitpunkt t... Ist Zustimmung zur Amtsführung eine lineare Funktion der ALQ ( unemrate) Z. B. Zunahme ALQ um zwei Prozentpunkte Statistik II (12/31)

31 -Daten Implikation statisches Modell. reg approval unemrate Source SS df MS Number of obs = 148 F( 1, 146) = 0.85 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] unemrate _cons Zu jedem Zeitpunkt t... Ist Zustimmung zur Amtsführung eine lineare Funktion der ALQ ( unemrate) Z. B. Zunahme ALQ um zwei Prozentpunkte sofortige Abnahme Zustimmung um 1.2 Punkte Plausibel? Statistik II (12/31)

32 -Daten (Finite) Distributed Lag Model Veränderungen in x brauchen Zeit, um auf y zu wirken y eine Funktion von x heute plus vergangene 1, 2,... Werte von x (Lags) Anzahl der vergangenen Zeitpunkte, die wir berücksichtigen können, endlich (finit) Im Text: andere Bezeichung für Koeffizienten der Lags, um Sache klarer zu machen Statistik II (13/31)

33 -Daten (Finite) Distributed Lag Model FDL mit zwei Lags y t = β 0 + δ 0 x t + δ 1 x t 1 + δ 2 x t 2 + ɛ t approval t = β 0 + δ 0 unemployment t + δ 1 unemployment t 1 + δ 2 unemployment t 2 + ɛ t Statistik II (13/31)

34 -Daten (Finite) Distributed Lag Model Temporäre Zunahme der Arbeitslosigkeit Zeitpunkt t Effekt erst drei Quartale später (t + 3) abgeklungen δ 0 : impact propensity oder impact multiplier Permanente Zunahme der Arbeitslosigkeit: (Permanente) Veränderung von y braucht drei Quartale um sich aufzubauen Graphische Darstellung von δ 0, δ 1, δ 2 : Verteilung (distributed lag model) Gesamteffekt der Veränderung: Summe von δ 0, δ 1, δ 2 : long-run propensity oder long-run multiplier Statistik II (13/31)

35 -Daten (Finite) Distributed Lag Model. tset date time variable: date, 1949q1 to 1985q4 delta: 1 quarter. reg approval unemrate L1.unemrate L2.unemrate Source SS df MS Number of obs = 146 F( 3, 142) = 0.40 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] unemrate L L _cons Langfristiger Gesamteffekt einer Zunahme der ALQ um einen Punkt? Statistik II (13/31)

36 -Daten (Finite) Distributed Lag Model. tset date time variable: date, 1949q1 to 1985q4 delta: 1 quarter. reg approval unemrate L1.unemrate L2.unemrate Source SS df MS Number of obs = 146 F( 3, 142) = 0.40 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] unemrate L L _cons Langfristiger Gesamteffekt einer Zunahme der ALQ um einen Punkt? = Statistik II (13/31)

37 -Daten Approval & unemployment: lags. list date approval unemrate L1.unemrate L2.unemrate in 1/8,clean L. L2. date approval unemrate unemrate unemrate q q q q q q q q Statistik II (14/31)

38 -Daten Verzögerter Effekt der Arbeitslosigkeit Annahme: Modell ist korrekt, d. h. approval t = alq t alq t 1 1 alq t 2 ALQ einmalig 4 Prozent, sonst 2 Statistik II (15/31)

39 -Daten Verzögerter Effekt der Arbeitslosigkeit Annahme: Modell ist korrekt, d. h. approval t = alq t alq t 1 1 alq t 2 ALQ einmalig 4 Prozent, sonst 2 L. L2. date approval alq alq alq Statistik II (15/31)

40 -Daten Verzögerter Effekt der Arbeitslosigkeit Annahme: Modell ist korrekt, d. h. approval t = alq t alq t 1 1 alq t 2 ALQ 2 Prozent, dann dauerhafter Anstieg auf 4 Prozent Statistik II (15/31)

41 -Daten Verzögerter Effekt der Arbeitslosigkeit Annahme: Modell ist korrekt, d. h. approval t = alq t alq t 1 1 alq t 2 ALQ 2 Prozent, dann dauerhafter Anstieg auf 4 Prozent L. L2. date approval alq alq alq Statistik II (15/31)

42 -Daten Trends Annahme: die beobachteten x und y Werte werden zufällig vom DGP hervorgebracht Deshalb können wir sie ähnlich wie Stichprobe behandeln Tatsächlich: Trends Beispiel x und y nehmen beide über Zeit zu Regression von y auf x zeigt positiven Effekt, selbst wenn Korrelation 0 oder schwach negativ Drittvariablenproblem Drittvariablenkontrolle durch Einschluß Kalenderzeit Beispiel: Presidential Approval und Verbraucherpreise (CPI) Statistik II (16/31)

43 -Daten Presidential Approval und CPI. reg approval cpi Source SS df MS Number of obs = 148 F( 1, 146) = 9.76 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] cpi _cons Statistik II (17/31)

44 -Daten Presidential Approval und CPI. reg approval date Source SS df MS Number of obs = 148 F( 1, 146) = 9.23 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] date _cons reg cpi date Source SS df MS Number of obs = 148 F( 1, 146) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = cpi Coef. Std. Err. t P> t [95% Conf. Interval] date _cons Statistik II (17/31)

45 -Daten Presidential Approval und CPI. reg approval cpi date Source SS df MS Number of obs = 148 F( 2, 145) = 5.04 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] cpi date _cons Statistik II (17/31)

46 -Daten Presidential Approval und CPI. reg approval cpi Source SS df MS Number of obs = 148 F( 1, 146) = 9.76 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] cpi _cons Statistik II (17/31)

47 -Daten Presidential Approval und CPI. reg approval cpi date Source SS df MS Number of obs = 148 F( 2, 145) = 5.04 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] cpi date _cons Effekt des CPI nur halb so stark und nicht mehr signifikant, wenn für gemeinsamen Trend kontrolliert wird Kontrolle für Trends Entweder separate Regressionen von x und y auf Zeit, dann Regression mit Residuen rechnen Oder einfach multivariate Regression Äquivalent Statistik II (17/31)

48 -Daten Saisonalität In vielen ökonomischen Saisonalität (Zyklen) Arbeitslosigkeit im Winter höher Mehr Autos, Fahrräder etc. verkauft im Sommer Anstieg Ölpreis im Herbst Saisonalität in politikwissenschaftlichen weniger klar, aber Midterm-Effekt in amerikanischen Wahlen Beliebtheit der Regierungsparteien in Deutschland über BTW- Wahlzyklus Häufung von Terrorakten zu Jahrestagen/Festen Ggf. z. B. durch Dummies modellieren, um Verzerrungen zu vermeiden Statistik II (18/31)

49 -Daten Saisonalität: CPI und Approval. reg cpi _I* date Source SS df MS Number of obs = 148 F( 4, 143) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = cpi Coef. Std. Err. t P> t [95% Conf. Interval] _Iquarter_ _Iquarter_ _Iquarter_ date _cons Statistik II (19/31)

50 -Daten Saisonalität: CPI und Approval. reg cpi _I* date Source SS df MS Number of obs = 148 F( 4, 143) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = cpi Coef. Std. Err. t P> t [95% Conf. Interval] _Iquarter_ _Iquarter_ _Iquarter_ date _cons reg approval honeymoon date Source SS df MS Number of obs = 148 F( 2, 145) = 7.87 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] honeymoon date _cons Statistik II (19/31)

51 -Daten Recap: Schätzverfahren Welche Eigenschaften sollen Schätzverfahren haben? 1. Möglichst unverzerrt (wenig bias) 2. Möglichst wenig Varianz der Schätzungen (relative Effizienz) 3. Konsistenz (durch größere Fallzahlen beliebig kleine Abweichungen von wahren Werten) Statistik II (20/31)

52 -Daten Recap: Schätzverfahren Welche Eigenschaften sollen Schätzverfahren haben? 1. Möglichst unverzerrt (wenig bias) 2. Möglichst wenig Varianz der Schätzungen (relative Effizienz) 3. Konsistenz (durch größere Fallzahlen beliebig kleine Abweichungen von wahren Werten) Statistik II (20/31)

53 -Daten Recap: Schätzverfahren Welche Eigenschaften sollen Schätzverfahren haben? 1. Möglichst unverzerrt (wenig bias) 2. Möglichst wenig Varianz der Schätzungen (relative Effizienz) 3. Konsistenz (durch größere Fallzahlen beliebig kleine Abweichungen von wahren Werten) Wiederholte Stichprobenziehung (Umfang n) zufällige Verteilung von Schätzungen Mittelwert der Schätzungen stimmt mit wahrem Parameter in Grundgesamtheit überein Systematische Abweichung: bias (Mittelwert wahrer Parameter) Statistik II (20/31)

54 -Daten Recap: Schätzverfahren Welche Eigenschaften sollen Schätzverfahren haben? 1. Möglichst unverzerrt (wenig bias) 2. Möglichst wenig Varianz der Schätzungen (relative Effizienz) 3. Konsistenz (durch größere Fallzahlen beliebig kleine Abweichungen von wahren Werten) Wiederholte Stichprobenziehung (Umfang n) zufällige Verteilung von Schätzungen Unter verschiedenen Schätzverfahren das mit der geringsten Streuung der Schätzungen auswählen (Relativ) effizientes Verfahren Statistik II (20/31)

55 -Daten Recap: Schätzverfahren Welche Eigenschaften sollen Schätzverfahren haben? 1. Möglichst unverzerrt (wenig bias) 2. Möglichst wenig Varianz der Schätzungen (relative Effizienz) 3. Konsistenz (durch größere Fallzahlen beliebig kleine Abweichungen von wahren Werten) Trade-off zwischen Effizienz und möglichst wenig bias Gemeinsame Größe Mean Squared Error (MSE) (MSE) = (bias(ˆβ)) 2 + Varianz(ˆβ) Statistik II (20/31)

56 -Daten Recap: Schätzverfahren Welche Eigenschaften sollen Schätzverfahren haben? 1. Möglichst unverzerrt (wenig bias) 2. Möglichst wenig Varianz der Schätzungen (relative Effizienz) 3. Konsistenz (durch größere Fallzahlen beliebig kleine Abweichungen von wahren Werten) Was passiert bei steigendem Stichprobenumfang? Hinreichende Bedingung für Konsistenz Wenn Stichprobenumfang gegen geht Gehen bias und Varianz der Schätzungen gegen null D. h. die Wahrscheinlichkeit einer relevanten Abweichung zwischen Schätzung und wahrem Wert geht gegen null Statistik II (20/31)

57 -Daten Recap: Voraussetzungen für OLS Wann ist OLS unverzerrt, effizient und konsistent? (Gauß-Markov-Bedingungen): 1. y intervallskaliert und unbeschränkt, Varianz aller x, keine perfekte Multikollineariät 2. Keine Autokorrelation der zufälligen Einflüsse ɛ, d. h. für zwei Beobachtungen i und h sind ɛ i und ɛ h bei wiederholter Stichprobenziehung unkorreliert 3. Kein Zusammenhang zwischen ɛ und x-variablen, d. h. 3.1 Konditionaler Mittelwert von ɛ = 0 für alle Werte von x 3.2 Konstante konditionale Varianz von ɛ (Homoskedastizität) für alle Werte von x 4. (Normalverteilung von ɛ wird nur für Berechnung Standardfehler gebraucht, kein Problem bei großen Stichproben) OLS = BLUE: Best Linear Unbiased Estimator Statistik II (21/31)

58 -Daten mit daten Grundproblem: Fälle sind nicht zufällig ausgewählt, sondern zeitlich strukturiert Fiktives Beispiel: nationale Bildungsausgaben (x) und nationaler Schulleistungstests (y), jährliche Messung Typische : 1. (Zusammenhang zwischen Variablen bzw. Verteilung einer Variablen ändert sich über die Zeit ((Non-)Stationarität)) 2. (Extreme Autokorrelation einer x-variablen) 3. Heteroskedastizität (Varianz von ɛ nicht konstant) 4. Abhängigkeit zwischen x und ɛ 5. Autokorrelation von ɛ Statistik II (22/31)

59 -Daten mit daten Grundproblem: Fälle sind nicht zufällig ausgewählt, sondern zeitlich strukturiert Fiktives Beispiel: nationale Bildungsausgaben (x) und nationaler Schulleistungstests (y), jährliche Messung Typische : 1. (Zusammenhang zwischen Variablen bzw. Verteilung einer Variablen ändert sich über die Zeit ((Non-)Stationarität)) 2. (Extreme Autokorrelation einer x-variablen) 3. Heteroskedastizität (Varianz von ɛ nicht konstant) 4. Abhängigkeit zwischen x und ɛ 5. Autokorrelation von ɛ Statistik II (22/31)

60 -Daten Heteroskedastizität Höhere Bildungsausgaben Bessere Testergebnisse Tests werden sorgfältiger durchgeführt weniger zufällige Varianz Abhängigkeit der Varianz von ɛ vom Niveau von x Standardfehler zu optimistisch Mögliche Lösungen Qualität der Testdurchführung direkt messen (möglicherweise aber hoch mit x korreliert) Robuste Standardfehler berechnen lassen Statistik II (23/31)

61 -Daten Endogenität Idealerweise: Alle Werte von x komplett von aktuellen, vergangenen, zukünftigen Werten von ɛ unabhängig (strikt exogen) D. h. Gedankenexperiment: DGP würde sehr häufig wiederholt Werte für z. B. xt und ɛ t 1 würden notiert Korrelation zwischen beiden? Endogenität im Beispiel leicht möglich Zufälliger negativer ɛ t 1 (z. B. Fußball-WM 2014) beeinflußt Leistungen im Test 2014 (y t 1 ) Panische Erhöhung der Bildungsausgaben in 2015 (xt ) Zusammenhang zwischen x und ɛ; x ist nicht exogen Bias, aber möglicherweise noch konsistent besondere Statistik II (24/31)

62 -Daten Autokorrelation von ɛ In sind die Werte von ɛ häufig (positiv) mit sich selbst korreliert Neue Show mit G. Jauch führt zu besonderen Anstrengungen zum Zeitpunkt t ɛ t > 0, y t ungewöhnlich hoch Ein Jahr später: positiver Effekt der Show abgeschwächt, aber noch vorhanden ɛ t > ɛ t+1 > 0 Allgemein: ɛt = ρɛ t 1 + u t mit ρ < 1 Statistik II (25/31)

63 -Daten Autokorrelation von ɛ Positive Autokorrelation der zufälligen Einflüsse ( Fehler, ɛ) Statistik II (25/31)

64 -Daten Autokorrelation von ɛ In sind die Werte von ɛ häufig (positiv) mit sich selbst korreliert Neue Show mit G. Jauch führt zu besonderen Anstrengungen zum Zeitpunkt t ɛ t > 0, y t ungewöhnlich hoch Ein Jahr später: positiver Effekt der Show abgeschwächt, aber noch vorhanden ɛ t > ɛ t+1 > 0 Allgemein: ɛt = ρɛ t 1 + u t mit ρ < 1 OLS immer noch konsistent und unverzerrt, aber nicht mehr effizient R 2 zu hoch, Signifikanztests nicht mehr gültig Statistischer Test (Durbin-Watson-Test und Alternativen) Ggf. besonderes Modell schätzen Statistik II (25/31)

65 -Daten Presidential Approval. reg approval honeymoon date Source SS df MS Number of obs = 148 F( 2, 145) = 7.87 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = approval Coef. Std. Err. t P> t [95% Conf. Interval] honeymoon date _cons estat durbina Durbin s alternative test for autocorrelation lags(p) chi2 df Prob > chi H0: no serial correlation Statistik II (26/31)

66 -Daten Presidential Approval. prais approval honeymoon date,robust Iteration 0: rho = Iteration 1: rho = Iteration 2: rho = Iteration 3: rho = Iteration 4: rho = Prais-Winsten AR(1) regression -- iterated estimates Linear regression Number of obs = 148 F( 3, 145) = Prob > F = R-squared = Root MSE = Semirobust approval Coef. Std. Err. t P> t [95% Conf. Interval] honeymoon date _cons rho Durbin-Watson statistic (original) Durbin-Watson statistic (transformed) Statistik II (26/31)

67 -Daten (1.) Differenzen mit starken Trends machen bei Schätzung Oft ist nicht Niveau, sondern Veränderung interessant Differenzen (gegenüber Vorperiode) für abhängige und/oder unabhängige Variablen In Stata: D.-Operator Statistik II (27/31)

68 -Daten (1.) Differenzen. list date approval D.approval cpi D.cpi in 1/6,clean D. D. date approval approval cpi cpi q q q q q q Statistik II (27/31)

69 -Daten Veränderung approval / Veränderung CPI D.approval D.cpi Statistik II (28/31)

70 -Daten Veränderung approval / Zeit D.approval q1 1955q1 1960q1 1965q1 1970q1 1975q1 1980q1 1985q1 date Statistik II (29/31)

71 -Daten Finales (?) Modell. prais D.approval honeymoon D.cpi date Iteration 0: rho = Iteration 1: rho = Iteration 2: rho = Iteration 3: rho = Iteration 4: rho = Prais-Winsten AR(1) regression -- iterated estimates Source SS df MS Number of obs = F( 3, 143) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = D.approval Coef. Std. Err. t P> t [95% Conf. Interval] honeymoon cpi D date _cons rho Durbin-Watson statistic (original) Durbin-Watson statistic (transformed) Statistik II (30/31)

72 sind anders: Kein Stichprobenziehung Nur ein Objekt wird beobachtet Viele Informationen über dieses Objekt sind schwach Beobachtungen sind voneinander abhängig Effektive Fallzahl kleiner als n Gleichzeitig informativer als Querschnittsdaten: Dynamik Sehr sorgfältige Analyse notwendig Statistik II (31/31)

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Wiederholung Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell

Mehr

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse Multiple Regression II: Signifikanztests,, Multikollinearität und Kohortenanalyse Statistik II Übersicht Literatur Kausalität und Regression Inferenz und standardisierte Koeffizienten Statistik II Multiple

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

3. Einführung in die Zeitreihenanalyse

3. Einführung in die Zeitreihenanalyse 3. Einführung in die Zeitreihenanalyse Dr. Johann Burgstaller Finance Department, JKU Linz (Dieser Foliensatz wurde zuletzt aktualisiert am 25. Dezember 2007.) Dr. Johann Burgstaller IK Empirische Kapitalmarktforschung

Mehr

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Lösungsskizze

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Lösungsskizze Lehrstuhl für Statistik und empirische irtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im ach Ökonometrie im S 20/2 Lösungsskizze Aufgabe (.5 Punkte) Sie verfügen über einen Datensatz, der Informationen

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Fallbeispiel 5: Humankapital und Returns to Education. Seite 1

Fallbeispiel 5: Humankapital und Returns to Education. Seite 1 Fallbeispiel 5: Humankapital und Returns to Education Seite 1 Gliederung Einführung: Wirkungsanalysen in der Wirtschaftspolitik I. Theoretischer Teil 1 Humankapital 2 Returns to Education: Schooling Model

Mehr

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 8. Februar 2007 Hinweise:

Mehr

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Aufgabe 1: Betrachtet wird folgendes Modell zur Erklärung des Managergehalts salary durch den Umsatz sales, die Eigenkapitalrendite roe und die

Mehr

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Andreas Berlin 14. Juli 2009 Bachelor-Seminar: Messen und Statistik Inhalt: 1 Aspekte einer Messung 2 Mess-System-Analyse 2.1 ANOVA-Methode 2.2 Maße

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

Univariate Lineare Regression. (eine unabhängige Variable)

Univariate Lineare Regression. (eine unabhängige Variable) Univariate Lineare Regression (eine unabhängige Variable) Lineare Regression y=a+bx Präzise lineare Beziehung a.. Intercept b..anstieg y..abhängige Variable x..unabhängige Variable Lineare Regression y=a+bx+e

Mehr

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen. Das folgende Modell ist ein GARCH(1,1)-Modell:

Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen. Das folgende Modell ist ein GARCH(1,1)-Modell: Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen LV-Leiterin: Univ.Prof.Dr. Sylvia Frühwirth-Schnatter 1 Wahr oder falsch? 1. Das folgende Modell ist ein GARCH(1,1)-Modell: Y

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Fallstudie: Schadenshäufigkeiten bei Kfz-Versicherungen

Fallstudie: Schadenshäufigkeiten bei Kfz-Versicherungen Fallstudie: Schadenshäufigkeiten bei Kfz-Versicherungen Stefan Lang 12 Oktober 2005 WS 05/06 Datensatzbeschreibung (1) Daten Versicherungsdaten für Belgien ca 160000 Beobachtungen Ziel Analyse der Risikostruktur

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

PRAKTIKUM Experimentelle Prozeßanalyse 2. VERSUCH AS-PA-2 "Methoden der Modellbildung statischer Systeme" Teil 2 (für ausgewählte Masterstudiengänge)

PRAKTIKUM Experimentelle Prozeßanalyse 2. VERSUCH AS-PA-2 Methoden der Modellbildung statischer Systeme Teil 2 (für ausgewählte Masterstudiengänge) FACHGEBIET Systemanalyse PRAKTIKUM Experimentelle Prozeßanalyse 2 VERSUCH AS-PA-2 "Methoden der Modellbildung statischer Systeme" Teil 2 (für ausgewählte Masterstudiengänge) Verantw. Hochschullehrer: Prof.

Mehr

Lineare Modelle in R: Einweg-Varianzanalyse

Lineare Modelle in R: Einweg-Varianzanalyse Lineare Modelle in R: Einweg-Varianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon in der Vorlesung wollen wir hier zur Illustration der Einweg-Analyse die logarithmierten Ausgaben der

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Fallbeispiel: Kreditscoring

Fallbeispiel: Kreditscoring Fallbeispiel: Kreditscoring Stefan Lang 14. Juni 2005 SS 2005 Datensatzbeschreibung (1) Ziel Untersuchung der Bonität eines Kunden in Abhängigkeit von erklärenden Variablen Zielvariable Bonität des Kunden:

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions

Mehr

Multivariate Zeitreihenanalyse mit EViews 4.1

Multivariate Zeitreihenanalyse mit EViews 4.1 Multivariate Zeitreihenanalyse mit EViews 4.1 Unterlagen für LVen des Instituts für Angewandte Statistic (IFAS) Johannes Kepler Universität Linz Stand: 30. Mai 2005, Redaktion: Frühwirth-Schnatter 1 Deskriptive

Mehr

Vorlesung:Multivariate Analyseverfahren

Vorlesung:Multivariate Analyseverfahren Vorlesung:Multivariate Analyseverfahren Josef Brüderl, Oktober 24 Multivariate Verfahren sind statistische Verfahren zur Analyse der Beziehungsstruktur mehrerer Variablen. Man kann multivariate Verfahren

Mehr

Log-lineare Analyse I

Log-lineare Analyse I 1 Log-lineare Analyse I Einleitung Die log-lineare Analysemethode wurde von L.A. Goodman in den 60er und 70er Jahren entwickelt. Sie dient zur Analyse von Zusammenhängen in mehrdimensionalen Kontingenztafeln

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

BEDIENUNGSANLEITUNG FÜR AMOS (Letzte Änderung: Mittwoch, 10. Februar 2001)

BEDIENUNGSANLEITUNG FÜR AMOS (Letzte Änderung: Mittwoch, 10. Februar 2001) AMOS - Bedienungsanaleitung 1 BEDIENUNGSANLEITUNG FÜR AMOS (Letzte Änderung: Mittwoch, 10. Februar 2001) A. Aufbau einer Inputdatei (Excel-Arbeitsblatt), welche eine Kovarianz- bzw. Korrelationsmatrix

Mehr

Abschlussklausur (60 Minuten), 15. Juli 2014

Abschlussklausur (60 Minuten), 15. Juli 2014 Prof. Dr. Amelie Wuppermann Volkswirtschaftliche Fakultät Universität München Sommersemester 2014 Empirische Ökonomie 1 Abschlussklausur (60 Minuten), 15. Juli 2014 Bearbeitungshinweise Die Bearbeitungszeit

Mehr

Binäre abhängige Variablen

Binäre abhängige Variablen Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Regression mit Gretl Eine erste Einführung 1

Regression mit Gretl Eine erste Einführung 1 Kurzeinführung in Gretl S. 1 Regression mit Gretl Eine erste Einführung 1 Installation: Gretl für das entsprechende Betriebssystem herunterladen und die Setup-Datei ausführen. Hinweis: Für die Benutzung

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Grundlagen von Versuchsmethodik und Datenanalyse

Grundlagen von Versuchsmethodik und Datenanalyse Grundlagen von Versuchsmethodik und Datenanalyse Der Anfang: Hypothesen über Ursache-Wirkungs-Zusammenhänge Ursache Wirkung Koffein verbessert Kurzzeitgedächtnis Gewaltfilme führen zu aggressivem Verhalten

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

adjusted R 2 korrigiertes Bestimmtheitsmaß, korrigiertes R 2 Bias, Verzerrung coefficient of determination Bestimmtheitsmaß, R 2

adjusted R 2 korrigiertes Bestimmtheitsmaß, korrigiertes R 2 Bias, Verzerrung coefficient of determination Bestimmtheitsmaß, R 2 acceptance region Annahmebereich adjusted R 2 korrigiertes Bestimmtheitsmaß, korrigiertes R 2 alternative hypothesis Alternativhypothese asymptotic distribution asymptotische Verteilung asymptotic normal

Mehr

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert

Mehr

Lösung zu Kapitel 11: Beispiel 1

Lösung zu Kapitel 11: Beispiel 1 Lösung zu Kapitel 11: Beispiel 1 Eine Untersuchung bei 253 Personen zur Kundenzufriedenheit mit einer Einzelhandelskette im Südosten der USA enthält Variablen mit sozialstatistischen Daten der befragten

Mehr

Prüfen von Mittelwertsunterschieden: t-test

Prüfen von Mittelwertsunterschieden: t-test Prüfen von Mittelwertsunterschieden: t-test Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) t-test

Mehr

Varianzanalyse * (1) Varianzanalyse (2)

Varianzanalyse * (1) Varianzanalyse (2) Varianzanalyse * (1) Einfaktorielle Varianzanalyse (I) Die Varianzanalyse (ANOVA = ANalysis Of VAriance) wird benutzt, um Unterschiede zwischen Mittelwerten von drei oder mehr Stichproben auf Signifikanz

Mehr

ChangePoint-Analysen - ein Überblick

ChangePoint-Analysen - ein Überblick ChangePoint-Analysen - ein Überblick Gliederung Motivation Anwendungsgebiete Chow Test Quandt-Andrews Test Fluktuations-Tests Binary Segmentation Recursive circular and binary segmentation algorithm Bayesscher

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Untersuchungen zum Thema Tracking Error

Untersuchungen zum Thema Tracking Error Untersuchungen zum Thema Tracking Error J. Fulmek 24. August 2003 1 Einleitung Im Folgenden werden folgende Punkte untersucht: 1. verschiedene in der Literatur übliche Definitionen des Tracking Errors

Mehr

Klausur STATISTIK 2 für Diplom VWL

Klausur STATISTIK 2 für Diplom VWL Klausur STATISTIK 2 für Diplom VWL Name, Vorname: Matrikel-Nr. Die Klausur enthält zwei Typen von Aufgaben: Teil A besteht aus Fragen mit mehreren vorgegebenen Antwortvorschlägen, von denen mindestens

Mehr

Commercial Banking. Kreditportfoliosteuerung

Commercial Banking. Kreditportfoliosteuerung Commercial Banking Kreditportfoliosteuerung Dimensionen des Portfoliorisikos Risikomessung: Was ist Kreditrisiko? Marking to Market Veränderungen des Kreditportfolios: - Rating-Veränderung bzw. Spreadveränderung

Mehr

Multivariate Analyseverfahren

Multivariate Analyseverfahren Multivariate Analyseverfahren Logistische Regression Prof. Dr. Stein 14.01.2014 & 20.01.2014 1 / 62 Inhaltsverzeichnis 1 Grundidee 2 3 4 5 2 / 62 Der Erklärungsgegenstand Soziale Forschungsgegenstände

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Andreas Berlin 14. Juli 009 Bachelor-Seminar: Messen und Statistik Inhalt: 1 Aspekte einer Messung Mess-System-Analyse.1 ANOVA-Methode. Maße für

Mehr

T-TEST BEI EINER STICHPROBE:

T-TEST BEI EINER STICHPROBE: Kapitel 19 T-Test Mit Hilfe der T-TEST-Prozeduren werden Aussagen über Mittelwerte getroffen. Dabei wird versucht, aus den Beobachtungen einer Stichprobe Rückschlüsse auf die Grundgesamtheit zu ziehen.

Mehr

Quantitative Methoden der Bildungsforschung

Quantitative Methoden der Bildungsforschung Glieung Wieholung Korrelationen Grundlagen lineare Regression Lineare Regression in SPSS Übung Wieholung Korrelationen Standardisiertes Zusammenhangsmaß (unstandardisiert: Kovarianz) linearer Zusammenhang

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Grundzüge der Ereignisdatenanalyse

Grundzüge der Ereignisdatenanalyse Grundzüge der Ereignisdatenanalyse Regressionsmodelle Sommersemester 2009 Regressionsmodelle Event History Analysis (1/48) Übersicht Wiederholung Exponential- und Weibull-Modell Weitere Modelle Regressionsmodelle

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 2 Multivariate Verfahren Musterlösung Aufgabe 1 (28 Punkte) Der Marketing-Leiter einer Lebensmittelherstellers möchte herausfinden, mit welchem Richtpreis eine neue Joghurt-Marke auf

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

EINFACHE LINEARE REGRESSION MODUL 13 PROSEMINAR DESKRIPTIVE STATISTIK ANALYSE UND DARSTELLUNG VON DATEN I GÜNTER HAIDER WS 1999/2000

EINFACHE LINEARE REGRESSION MODUL 13 PROSEMINAR DESKRIPTIVE STATISTIK ANALYSE UND DARSTELLUNG VON DATEN I GÜNTER HAIDER WS 1999/2000 INSTITUT FÜR ERZIEHUNGSWISSENSCHAFT - UNIVERSITÄT SALZBURG PROSEMINAR DESKRIPTIVE STATISTIK ANALYSE UND DARSTELLUNG VON DATEN I GÜNTER HAIDER WS 1999/2 MODUL 13 EINFACHE LINEARE REGRESSION Erziehungswissenschaft/Haider

Mehr

Stochastische Prozesse und Zeitreihenmodelle

Stochastische Prozesse und Zeitreihenmodelle Kapitel 12 Stochastische Prozesse und reihenmodelle [ Stochastische Prozesse und reihenmodelle ] Einleitung:.com-Blase an der NASDAQ Department of Statistics and Mathematics WU Wien c 2008 Statistik 12

Mehr

Kommentierter SPSS-Output für die multiple Regressionsanalyse (SPSS-Version 17)

Kommentierter SPSS-Output für die multiple Regressionsanalyse (SPSS-Version 17) R.Niketta Multiple Regressionsanalyse Kommentierter SPSS-Output für die multiple Regressionsanalyse (SPSS-Version 17) Daten: Selbstdarstellung und Kontaktsuche in studi.vz (POK VIII, AG 3) Fragestellung:

Mehr

von Peter Zimmermann 462 Seiten, Uhlenbruch Verlag, 1997 EUR 98,- inkl. MwSt. und Versand ISBN 3-9804400-6-0

von Peter Zimmermann 462 Seiten, Uhlenbruch Verlag, 1997 EUR 98,- inkl. MwSt. und Versand ISBN 3-9804400-6-0 Reihe Portfoliomanagement, Band 7: SCHÄTZUNG UND PROGNOSE VON BETAWERTEN Eine Untersuchung am deutschen Aktienmarkt von Peter Zimmermann 462 Seiten, Uhlenbruch Verlag, 1997 EUR 98,- inkl. MwSt. und Versand

Mehr

Allgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch

Allgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 9.1 Allgemeine Regressionsanalyse Daten (X j, Y j ), j = 1,..., N unabhängig Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl.

Mehr

Übersicht. VL Forschungsmethoden. Ereignisdatenanalyse

Übersicht. VL Forschungsmethoden. Ereignisdatenanalyse VL Forschungsmethoden Ereignisdatenanalyse 1 2 3 4 5 Übersicht VL Forschungsmethoden Event Data (1/45) Harold Macmillan, PM 1957-1963 The greatest challenge in politics: events, my dear boy, events Was

Mehr

Biostatistische Studienplanung II. Dr. Matthias Kohl SIRS-Lab GmbH

Biostatistische Studienplanung II. Dr. Matthias Kohl SIRS-Lab GmbH Biostatistische Studienplanung II Dr. Matthias Kohl SIRS-Lab GmbH Inhalt Lineare Modelle: Definition und Beispiele KQ- und robuste Schätzer Diagnostik Ausblick: Mixed-Effects Definition des linearen Modells

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Modellierung von Korrelationen zwischen Kreditausfallraten für Kreditportfolios. Bernd Rosenow, 3. Kölner Workshop Quantitative Finanzmarktforschung

Modellierung von Korrelationen zwischen Kreditausfallraten für Kreditportfolios. Bernd Rosenow, 3. Kölner Workshop Quantitative Finanzmarktforschung Modellierung von Korrelationen zwischen Kreditausfallraten für Kreditportfolios Bernd Rosenow Rafael Weißhaupt Frank Altrock Universität zu Köln West LB AG, Düsseldorf Gliederung Beschreibung des Datensatzes

Mehr

Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00.

Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00. 1 Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00. Bitte unbedingt beachten: a) Gewertet werden alle 9 gestellten Aufgaben. b) Lösungswege sind anzugeben. Die Angabe des Endergebnisses

Mehr

Zeitreihenanalyse. Teil III: Nichtlineare Zeitreihenmodelle. Prof. Dr. W. Zucchini, Dr. O. Nenadić, A. Schlegel. Göttingen, Januar 2008 DAX

Zeitreihenanalyse. Teil III: Nichtlineare Zeitreihenmodelle. Prof. Dr. W. Zucchini, Dr. O. Nenadić, A. Schlegel. Göttingen, Januar 2008 DAX Zeitreihenanalyse Teil III: Nichtlineare Zeitreihenmodelle Prof. Dr. W. Zucchini, Dr. O. Nenadić, A. Schlegel DAX -10-5 0 5 10 0 200 400 600 800 1000 trading day Göttingen, Januar 2008 Inhaltsverzeichnis

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler DAS THEMA: INFERENZSTATISTIK II INFERENZSTATISTISCHE AUSSAGEN Standardfehler Konfidenzintervalle Signifikanztests Standardfehler der Standardfehler Interpretation Verwendung 1 ZUR WIEDERHOLUNG... Ausgangspunkt:

Mehr

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge 2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten

Mehr

Neuerungen in Minitab 16

Neuerungen in Minitab 16 Neuerungen in Minitab 16 minitab@additive-net.de - Telefon: 06172 / 5905-30 Willkommen zu Minitab 16! Die neueste Version der Minitab Statistical Software umfasst mehr als siebzig neue Funktionen und Verbesserungen,

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung Die Messung Skalenniveaus 2 Univariate deskriptive Statistik 3 Multivariate Statistik 4 Regression 5 Ergänzungen Grundbegriffe Statistische Einheit,

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Prof. Dr. P. von der Lippe Statistik I NK SS 2002 Seite 1

Prof. Dr. P. von der Lippe Statistik I NK SS 2002 Seite 1 Prof. Dr. P. von der Lippe Statistik I NK SS 2002 Seite 1 Aufgabe 1 a) BWL-Student S hat von seinem Lieblingsonkel 10.000 geschenkt bekommen mit der Auflage damit etwas Vernünftiges zu machen. Nachdem

Mehr

Interdependenzen von Hedge Funds zu Aktienund Rentenmärkten

Interdependenzen von Hedge Funds zu Aktienund Rentenmärkten Interdependenzen von Hedge Funds zu Aktienund Rentenmärkten Korrelations- und Betaanalyse Interdependenzen in Extremsituationen Diversifikationspotenziale Inhalt I) Hintergrund der Analyse der Interdependenzen

Mehr

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen Ergebnisse 77 5 Ergebnisse Das folgende Kapitel widmet sich der statistischen Auswertung der Daten zur Ü- berprüfung der Hypothesen. Die hier verwendeten Daten wurden mit den in 4.3 beschriebenen Instrumenten

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

Klausur Sommersemester 2010

Klausur Sommersemester 2010 Klausur Sommersemester 2010 Lehrstuhl: Wirtschaftspolitik Prüfungsfach: Empirische Wirtschaftsforschung Prüfer: Prof. Dr. K. Kraft Datum: 04.08.2010 Hilfsmittel: Nicht-programmierbarer Taschenrechner Klausurdauer:

Mehr

Veranstaltungsort Bildungsherberge der Studierendenschaft der FernUniversität Hagen

Veranstaltungsort Bildungsherberge der Studierendenschaft der FernUniversität Hagen Bildungsurlaub-Seminare: Lerninhalte und Programm Seminartitel SPSS für Psychologen/innen (BH15113) Termin Mo, den 18.05.bis Fr, den 22.05.2015 (40 UStd.) Veranstaltungsort Bildungsherberge der Studierendenschaft

Mehr

V A R I A N Z A N A L Y S E

V A R I A N Z A N A L Y S E V A R I A N Z A N A L Y S E Ziel / Funktion: statistische Beurteilung des Einflusses von nominal skalierten (kategorialen) Faktoren auf intervallskalierte abhängige Variablen Vorteil: die Wirkung von mehreren,

Mehr

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Univariate Varianz- und Kovarianzanlyse, Multivariate Varianzanalyse und Varianzanalyse mit Messwiederholung finden sich unter

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

1 wenn i weiblich, w i = 0 sonst.

1 wenn i weiblich, w i = 0 sonst. Kapitel 10 Multikollinearität God abhors a naked singularity. (Stephen Hawking) 10.1 Problem Von Multikollinearität, bzw. Kollinearität, spricht man, wenn zwei oder mehrere erklärende x Variablen hoch

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

Kapitel 7: Varianzanalyse mit Messwiederholung

Kapitel 7: Varianzanalyse mit Messwiederholung Kapitel 7: Varianzanalyse mit Messwiederholung Durchführung einer einfaktoriellen Varianzanalyse mit Messwiederholung 1 Durchführung einer zweifaktoriellen Varianzanalyse mit Messwiederholung auf einem

Mehr

1. Biometrische Planung

1. Biometrische Planung 1. Biometrische Planung Die biometrische Planung ist Teil der Studienplanung für wissenschaftliche Studien, in denen eine statistische Bewertung von Daten erfolgen soll. Sie stellt alle erforderlichen

Mehr

Kapitel 3. Erste Schritte der Datenanalyse. 3.1 Einlesen und Überprüfen der Daten

Kapitel 3. Erste Schritte der Datenanalyse. 3.1 Einlesen und Überprüfen der Daten Kapitel 3 Erste Schritte der Datenanalyse 3.1 Einlesen und Überprüfen der Daten Nachdem die Daten erfasst worden sind, etwa mit Hilfe eines Fragebogens, ist die nächste Frage, wie ich sie in den Rechner

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen Univariate/ multivariate Ansätze Klaus D. Kubinger Effektgrößen Rasch, D. & Kubinger, K.D. (2006). Statistik für das Psychologiestudium Mit Softwareunter-stützung zur Planung und Auswertung von Untersuchungen

Mehr

FDI Location choices: Evidence from French first-time movers

FDI Location choices: Evidence from French first-time movers FDI Location choices: Evidence from French first-time movers Vivien Procher, Ruhr Graduate School in Economics Außenwirtschaft in Zeiten der Globalisierung Möglichkeiten und Grenzen der statistischen Messung

Mehr