Analyse von Querschnittsdaten. Signifikanztests I Basics

Transkript

1 Analyse von Querschnittsdaten Signifikanztests I Basics

2 Warum geht es in den folgenden Sitzungen? Datum Vorlesung Einführung Beispiele Daten Variablen Kontinuierliche Variablen Bivariate Regression Kontrolle von Drittvariablen Multiple Regression Generalisierung Statistische Inferenz Signifikanztests I Signifikanztests II Spezifikation der unabhängigen Variablen Spezifikation der Regressionsfunktion Heteroskedastizität kategoriale Variablen Regression mit Dummy-Variablen Logistische Regression 2

3 Gliederung 1. Wozu Stichprobenverteilung? 2. Bestimmung des Standardfehlers 3. Test- und Schätzverteilungen 4. Hypothesentests einzelner Regressionskoeffizienten 5. Konfidenzintervalle für einzelne Regressionskoeffizienten 6. Test des Modellfits 3

4 Test von Hypothesen Stichprobenverteilung für µ=0 density Nähe des Zentrums: hoch wahrscheinliche Ergebnisse Man sagt daher: Abweichung des Ergebnisses kann auch Zufall sein. Rechts vom roten Strich: Ergebnisse mit geringer Wahrscheinlichkeit Man vermutet daher: Ein solches Ergebnis ist nicht mehr durch Zufall erklärbar. Es deutet auf eine signifikante Abweichung hin. 4

5 Schätzung unbekannter Parameter Stichprobenverteilung Einerseits (GG Stp) (1-α) Prozent aller Stichprobenstatistiken liegen im Intervall von... bis... Andererseits (Stp GG) (1-α) Prozent der Konfidenzintervalle, die man in allen denkbaren Stichproben berechnen kann, beinhalten den wahren Parameter der Grundgesamtheit. 5

6 Was benötigt man zur Definition der Stichprobenverteilung? Density Zentrum der Stichprobenverteilung 2. Streuung der Verteilung 3. Form der Verteilung _b[income] Für OLS- Schätzungen gilt : ˆ β ~ Normal( β, Var( ˆ β )) 6

7 Gliederung 1. Wozu Stichprobenverteilung? 2. Bestimmung des Standardfehlers a. Simulationsexperiment b. Analytische Lösung 3. Test- und Schätzverteilungen 4. Hypothesentests einzelner Regressionskoeffizienten 5. Konfidenzintervalle für einzelne Regressionskoeffizienten 6. Test des Modellfits 7

8 Analyse der Lebenszufriedenheit St. Regression: eine kleine Insel im Südpazifik mit 665 Einwohnern Lebenszufriedenheit (Index 1-20) Determinanten: Haushaltseinkommen, Berufsprestige, Ausbildungsdauer, Kirchgangshäufigkeit, Ortsgröße Messfehler und weitere Einflüsse sind unabhängig von diesen Determinanten: u korreliert mit keiner der fünf Variablen Frage: Ist der folgende in der Grundgesamtheit gültige Zusammenhang zwischen Lebenszufriedenheit und Einkommen, Prestige usw. auch in einer Zufallsstichprobe beobachtbar? y = x x x x x5 + u 8

9 Grundgesamtheit: Korrelationen satisfac income prestige educ attend size error satisfac 1.00 income prestige educ attend size error n=665 (gss1978.dta) Die unabhängigen Variablen x (=1,, k) korrelieren unterschiedlich hoch miteinander. Die stochastische Komponente u (Variable error) korreliert nicht mit den unabhängigen Variablen. 9

10 Simulationsexperiment (St. Regression, Lebenszufriedenheit, gss1978.dta) Standardabweichung der geschätzten Regressionskoeffizienten in 1000 Replikationen income size income size income size St ichp ro b enumf ang St ichp ro b enumf ang St ichp ro b enumf ang R > 2 2 income R size u größere Streuung income größere Streuung s(u)=0,5090 alle x mit s=1 s(u)=1,0000 alle x mit s=1 s(u)=0,5090 income mit s=2 sonstige x mit s=1 10

11 Gliederung 1. Wozu Stichprobenverteilung? 2. Bestimmung des Standardfehlers a. Simulationsexperiment b. Analytische Lösung 3. Test- und Schätzverteilungen 4. Hypothesentests einzelner Regressionskoeffizienten 5. Konfidenzintervalle für einzelne Regressionskoeffizienten 6. Test des Modellfits 11

12 Voraussetzung: Homoskedaszität? Var ( u x, K, ) = σ 1 x k 2 Homoskedazität Heteroskedazität Aussage über stochastischen Term u des Modells 12

13 Zweck der Annahme Wenn Homoskedaszität gegeben ist, dann lässt sich der Standardfehler eines Regressionskoeffizienten analytisch bestimmen. Wooldridge Theorem 3.2 (WO 96) Es gibt eine Formel! Quadrat des Standardfehlers bezeichnet man als Varianz. 13

14 Varianz der OLS-Schätzer Var( ˆ β ) = 2 σ SST (1 R 2 ) mit SST = n i= 1 ( x i x ) 2 Varianz ist abhängig von (WO 96, Theorem 3.2): Varianz der Fehlerterme (und implizit der Fallzahl) Streuung der eweiligen unabhängigen Variablen Korrelationder eweiligen unabhängigen Variablen mit allen anderen unabhängigen Variablen (R 2 ist der Determinationskoeffizient der Regression von x auf alle anderen unabhängigen Variablen) 14

15 Problem: Varianz σ 2 stochastische Komponente u unbekannt Varianz σ 2 ebenfalls unbekannt Annahme der Varianzhomogenität hilft auch 2 nicht weiter: Var( u x, x, K, = σ 1 2 x k ) Notwendigkeit der Schätzung Verwende Residuum als Schätzer für ˆ σ 2 ˆ σ = = 1 n k ˆ σ 2 1 SSR n 1 n 2 uˆ i = i= 1 k uˆ (Standardfehler der Regression) u : i = y i yˆ... der Regression insgesamt, nicht eines Regressionskoeffizienten! i 15

16 Standardfehler eines Regressionskoeffizienten (theoretischer) geschätzter Standardfehler ˆ σ sd( β ) = SST (1 R 2 ) Standardfehler ˆ ˆ σ se( β ) = SST (1 R 2 ) Verwendung eines geschätzten Standardfehlers führt zu zusätzlichen Unsicherheiten bei statistischer Inferenz 16

17 Homoskedaszität 17

19 Normalverteilung 19

20 Zweck der Annahme Welche Schätz- und Testverteilungen sollen verwendet werden? Bei normalverteilten u: Normalverteilung, T- Verteilung, F-Verteilung Wenn die Annahme nicht gegeben ist, es sich aber um eine große Stichprobe handelt, kann man trotzdem näherungsweise diese Verteilungen verwenden. Begründung: zentraler Grenzwertsatz 20

21 Testverteilung Regressionskoeffizienten Theoretischer Standardfehler (Normalverteilung) ˆ β ~ Normal( β, Var( ˆ β )) ˆ β β sd( ˆ β ) Normal(0,1) Geschätzter Standardfehler (vorsichtigere Testverteilung: T-Verteilung) ˆ β β se( ˆ β ) ~ T ( n k 1) ~ 21

23 Einseitiger Test: T-Test 1. Nullhypothese : kein Effekt ( β Alternativhypothese: positiver Effekt ( β 2.Signifikanzniveau : z.b. α = 3. kritischer Wert : c = t 4. Teststatistik in der Stichprobe : t = 5. Entscheidung t t > c H c H α, n-k-1 widerlegt nicht widerlegt 0, 05 = 0) ( α verwenden) ˆ β β se( ˆ β ) > 0) = ˆ β 0 se( ˆ β ) 23

24 Einseitiger Test: noch besser 1. Nullhypothese :"kein Effekt"( β Alternativhypothese: positiver Effekt ( β 2.Signifikanzniveau : z.b. α = 3. kritischer Wert : c = t 4. Teststatistik in der Stichprobe : t 5. Entscheidung t t > c c H H 0 0 widerlegt 1-α, n-k-1 nicht widerlegt 1 0, 05 0) ( α verwenden) = 1 > ˆ β β se( ˆ β ) 0) = ˆ β 0 se( ˆ β ) Null- und Alternativhypothese müssen den gesamten Wertebereich abdecken! 24

25 Effekt der Berufserfahrung exper (n=526, wage1.dta) density Kritischer Wert P(T>c)=0,05 Der kritische Wert (rot) trennt den Ablehnungsbereich rechts (5%) vom Annahmebereich links (95%) t density Überschreitungswahrscheinlichkeit P(T>t) t Die Teststatistik (rot) liegt im Ablehnungsbereich. Die Überschreitungswahrscheinlichkeit (Fläche rechts davon: 0,9%) entspricht dem p-wert und ist kleiner als das Signifikanzniveau (5%). siehe auch Example 4.1 (WO 123) 25

26 Interpretation (z.b. für α =0,05) H 0 widerlegt Die Hypothese, dass die Variable... keinen Einfluss hat, wurde mit einer Irrtumswahrscheinlichkeit von fünf Prozent widerlegt. kurz: Der Effekt der Variablen... ist signifikant (α =0,05). H 0 nicht widerlegt Die Hypothese, dass die Variable... keinen Einfluss hat, konnte mit einer Irrtumswahrscheinlichkeit von fünf Prozent nicht widerlegt werden. kurz: Der Effekt der Variablen... ist nicht signifikant (α =0,05). 26

27 Zweiseitiger Test: T-Test 1. Nullhypothese : kein Effekt ( β Alternativhypothese: Effekt existiert ( β 2.Signifikanzniveau : z.b. α = 3. kritischer Wert : c = t 4. Teststatistik in der Stichprobe : t = 5. Entscheidung t t > c H c H α / 2, n-k-1 widerlegt nicht widerlegt 0, 05 = 0) ( α / 2 verwenden) ˆ β β se( ˆ β ) 0) = ˆ β 0 se( ˆ β ) 27

28 Beispiel Effekt Fehlzeiten (n=141, gpa1.dta) density Zweiseitiger Ablehnungsbereich bei alpha=0,05 Der Ablehnungsbereich liegt unterhalb des linken und oberhalb des rechten roten Striches (insgesamt 5%) t density Überschreitungswahrscheinlichkeit P(T>t) t siehe auch Example 4.3 (WO 128) Die Teststatistik (rot) liegt im Ablehnungsbereich. Die Überschreitungswahrscheinlichkeit (Fläche rechts davon: 99,9%) entspricht noch nicht dem p-wert. p entspricht der Fläche links des roten und rechts des 28 grünen Strichs (also 0,2%)..

30 Konfidenzintervall eines Regressionskoeffizienten Interpretation für α=0,05 Mit 95% Wahrscheinlichkeit liegt der Effekt der Variablen... zwischen <untere Grenze> und <obere Grenze>. ˆ β c se( ) < kritischer Wert : c = ˆ β β < t ˆ β + c se( 1 α / 2, n k 1 ˆ β ) 30

31 Interpretation (z.b. für 1-α =0,95) kurz Der Effekt der Variablen... liegt mit 95% Wahrscheinlichkeit zwischen... und... noch besser mit Einleitung Wenn sich die Variable... um eine <Einheit> erhöht, verringert/erhöht sich die abhängige Variable um <Einheiten>. Wenn man den Stichprobenfehler berücksichtigt, liegt dieser Effekt mit 95% Wahrscheinlichkeit zwischen... und... 31

33 Test des Modellfits: F-Test 1. Nullhypothese : keine Variable hat Effekt ( β Alternativhypothese: mind. eine Variable hat Effekt ( β 1 0) 2.Signifikanzniveau : z.b. α = 0, kritischer Wert : c = SSE k 4. Teststatistik in der Stichprobe : f = SSR ( n k 5. Entscheidung f f 0 K β > c H c H α, k, n-k-1 widerlegt nicht widerlegt f ( α verwenden) 1 = K = β = 1) = 0) n i= 1 ( yˆ n i= 1 i ( yˆ y i i ) 2 y) 2 k ( n k 1) 33

34 Interpretation (z.b. für α =0,05) H 0 widerlegt Die Hypothese, dass keine der unabhängigen Variablen... einen Einfluss hat, wurde mit einer Irrtumswahrscheinlichkeit von fünf Prozent widerlegt. kurz: Der Anteil erklärter Varianz des Modells... ist signifikant (von Null verschieden) (α =0,05). H 0 nicht widerlegt Die Hypothese, dass keine der unabhängigen Variablen... einen Einfluss hat, konnte mit einer Irrtumswahrscheinlichkeit von fünf Prozent nicht widerlegt werden. kurz: Der Anteil erklärter Varianz des Modells... ist nicht signifikant (von Null verschieden) (α =0,05). 34

35 Zum Schluss

36 Zusammenfassung Tests Voraussetzungen Stichprobenverteilung Schätzverfahren Zentrum ( wahrer Wert des Regressionskoeffizienten) Streuung (Standardfehler des Regressionskoeffizienten) Verteilungsform (Normalverteilung) unverzerrte Schätzung Homoskedastizität Normalverteilung der stochastischen Komponente T-Test einzelner Regressionskoeffizienten F-Test des Modellfits Konfidenzintervall des Regressionskoeffizienten 36

37 Wichtige Fachausdrücke Deutsch Englisch Deutsch Englisch homoskedasticity Homoskedastizität Nullhypothese null hypothesis Standardfehler der Regression standard error of the estimate root mean squared error Signifikanzniveau Alternativhypothese alternative hypothesis significance level Standardfehler (Regressionskoeffizient) standard error Teststatistik test statistic 37

38 Weiterführende Literatur Wooldridge leitet im zweiten Teil von Kapitel 3 (Abschnitt 3.4ff., WO ) die Varianz eines OLS-Schätzers ab, wozu er die Annahme der Homoskedaszität benötigt. Kapitel 4 (WO ) behandelt Schätz- und Testverfahren, wenn die stochastische Komponente normal verteilt ist. Kapitel 5 (WO ) behandelt den Fall nicht normal verteilter stochastischer Komponenten in großen Stichproben. 38

39 Stata-Befehle display invttail(522,.05) display ttail(522, 2.4) display invftail(3, 9,.05) display Ftail(3, 137, 13.9) display _b[exper] display _se[exper] kritischer Wert c einer T-Verteilung für df=522 Freiheitsgrade und alpha=0,05 Überschreitungswahrscheinlichkeit (p-wert) eines t- Wertes t=2,4 bei df=522 Freiheitsgraden kritischer Wert c einer F-Verteilung für df1=3 und df2=9 Freiheitsgrade und alpha=0,05 Überschreitungswahrscheinlichkeit (p-wert) eines f- Wertes f=13,9 bei df1=3 und df2=137 Freiheitsgraden intern gespeicherter Regressionskoeffizient der Variablen exper intern gespeicherter Standardfehler des Regressionskoeffizienten der Variablen exper 39

40 Stata-Befehle display e(rss) ereturn list intern gespeicherte Ergebnisse einer Regression (z.b. residual sum of squares) vollständige Liste aller intern gespeicherten Ergebnisse einer Regression 40