Analyse von Querschnittsdaten. Signifikanztests I Basics
|
|
- Ingelore Wetzel
- vor 5 Jahren
- Abrufe
Transkript
1 Analyse von Querschnittsdaten Signifikanztests I Basics
2 Warum geht es in den folgenden Sitzungen? Datum Vorlesung Einführung Beispiele Daten Variablen Kontinuierliche Variablen Bivariate Regression Kontrolle von Drittvariablen Multiple Regression Generalisierung Statistische Inferenz Signifikanztests I Signifikanztests II Spezifikation der unabhängigen Variablen Spezifikation der Regressionsfunktion Heteroskedastizität kategoriale Variablen Regression mit Dummy-Variablen Logistische Regression 2
3 Gliederung 1. Wozu Stichprobenverteilung? 2. Bestimmung des Standardfehlers 3. Test- und Schätzverteilungen 4. Hypothesentests einzelner Regressionskoeffizienten 5. Konfidenzintervalle für einzelne Regressionskoeffizienten 6. Test des Modellfits 3
4 Test von Hypothesen Stichprobenverteilung für µ=0 density Nähe des Zentrums: hoch wahrscheinliche Ergebnisse Man sagt daher: Abweichung des Ergebnisses kann auch Zufall sein. Rechts vom roten Strich: Ergebnisse mit geringer Wahrscheinlichkeit Man vermutet daher: Ein solches Ergebnis ist nicht mehr durch Zufall erklärbar. Es deutet auf eine signifikante Abweichung hin. 4
5 Schätzung unbekannter Parameter Stichprobenverteilung Einerseits (GG Stp) (1-α) Prozent aller Stichprobenstatistiken liegen im Intervall von... bis... Andererseits (Stp GG) (1-α) Prozent der Konfidenzintervalle, die man in allen denkbaren Stichproben berechnen kann, beinhalten den wahren Parameter der Grundgesamtheit. 5
6 Was benötigt man zur Definition der Stichprobenverteilung? Density Zentrum der Stichprobenverteilung 2. Streuung der Verteilung 3. Form der Verteilung _b[income] Für OLS- Schätzungen gilt : ˆ β ~ Normal( β, Var( ˆ β )) 6
7 Gliederung 1. Wozu Stichprobenverteilung? 2. Bestimmung des Standardfehlers a. Simulationsexperiment b. Analytische Lösung 3. Test- und Schätzverteilungen 4. Hypothesentests einzelner Regressionskoeffizienten 5. Konfidenzintervalle für einzelne Regressionskoeffizienten 6. Test des Modellfits 7
8 Analyse der Lebenszufriedenheit St. Regression: eine kleine Insel im Südpazifik mit 665 Einwohnern Lebenszufriedenheit (Index 1-20) Determinanten: Haushaltseinkommen, Berufsprestige, Ausbildungsdauer, Kirchgangshäufigkeit, Ortsgröße Messfehler und weitere Einflüsse sind unabhängig von diesen Determinanten: u korreliert mit keiner der fünf Variablen Frage: Ist der folgende in der Grundgesamtheit gültige Zusammenhang zwischen Lebenszufriedenheit und Einkommen, Prestige usw. auch in einer Zufallsstichprobe beobachtbar? y = x x x x x5 + u 8
9 Grundgesamtheit: Korrelationen satisfac income prestige educ attend size error satisfac 1.00 income prestige educ attend size error n=665 (gss1978.dta) Die unabhängigen Variablen x (=1,, k) korrelieren unterschiedlich hoch miteinander. Die stochastische Komponente u (Variable error) korreliert nicht mit den unabhängigen Variablen. 9
10 Simulationsexperiment (St. Regression, Lebenszufriedenheit, gss1978.dta) Standardabweichung der geschätzten Regressionskoeffizienten in 1000 Replikationen income size income size income size St ichp ro b enumf ang St ichp ro b enumf ang St ichp ro b enumf ang R > 2 2 income R size u größere Streuung income größere Streuung s(u)=0,5090 alle x mit s=1 s(u)=1,0000 alle x mit s=1 s(u)=0,5090 income mit s=2 sonstige x mit s=1 10
11 Gliederung 1. Wozu Stichprobenverteilung? 2. Bestimmung des Standardfehlers a. Simulationsexperiment b. Analytische Lösung 3. Test- und Schätzverteilungen 4. Hypothesentests einzelner Regressionskoeffizienten 5. Konfidenzintervalle für einzelne Regressionskoeffizienten 6. Test des Modellfits 11
12 Voraussetzung: Homoskedaszität? Var ( u x, K, ) = σ 1 x k 2 Homoskedazität Heteroskedazität Aussage über stochastischen Term u des Modells 12
13 Zweck der Annahme Wenn Homoskedaszität gegeben ist, dann lässt sich der Standardfehler eines Regressionskoeffizienten analytisch bestimmen. Wooldridge Theorem 3.2 (WO 96) Es gibt eine Formel! Quadrat des Standardfehlers bezeichnet man als Varianz. 13
14 Varianz der OLS-Schätzer Var( ˆ β ) = 2 σ SST (1 R 2 ) mit SST = n i= 1 ( x i x ) 2 Varianz ist abhängig von (WO 96, Theorem 3.2): Varianz der Fehlerterme (und implizit der Fallzahl) Streuung der eweiligen unabhängigen Variablen Korrelationder eweiligen unabhängigen Variablen mit allen anderen unabhängigen Variablen (R 2 ist der Determinationskoeffizient der Regression von x auf alle anderen unabhängigen Variablen) 14
15 Problem: Varianz σ 2 stochastische Komponente u unbekannt Varianz σ 2 ebenfalls unbekannt Annahme der Varianzhomogenität hilft auch 2 nicht weiter: Var( u x, x, K, = σ 1 2 x k ) Notwendigkeit der Schätzung Verwende Residuum als Schätzer für ˆ σ 2 ˆ σ = = 1 n k ˆ σ 2 1 SSR n 1 n 2 uˆ i = i= 1 k uˆ (Standardfehler der Regression) u : i = y i yˆ... der Regression insgesamt, nicht eines Regressionskoeffizienten! i 15
16 Standardfehler eines Regressionskoeffizienten (theoretischer) geschätzter Standardfehler ˆ σ sd( β ) = SST (1 R 2 ) Standardfehler ˆ ˆ σ se( β ) = SST (1 R 2 ) Verwendung eines geschätzten Standardfehlers führt zu zusätzlichen Unsicherheiten bei statistischer Inferenz 16
17 Homoskedaszität 17
18 Gliederung 1. Wozu Stichprobenverteilung? 2. Bestimmung des Standardfehlers 3. Test- und Schätzverteilungen 4. Hypothesentests einzelner Regressionskoeffizienten 5. Konfidenzintervalle für einzelne Regressionskoeffizienten 6. Test des Modellfits 18
19 Normalverteilung 19
20 Zweck der Annahme Welche Schätz- und Testverteilungen sollen verwendet werden? Bei normalverteilten u: Normalverteilung, T- Verteilung, F-Verteilung Wenn die Annahme nicht gegeben ist, es sich aber um eine große Stichprobe handelt, kann man trotzdem näherungsweise diese Verteilungen verwenden. Begründung: zentraler Grenzwertsatz 20
21 Testverteilung Regressionskoeffizienten Theoretischer Standardfehler (Normalverteilung) ˆ β ~ Normal( β, Var( ˆ β )) ˆ β β sd( ˆ β ) Normal(0,1) Geschätzter Standardfehler (vorsichtigere Testverteilung: T-Verteilung) ˆ β β se( ˆ β ) ~ T ( n k 1) ~ 21
22 Gliederung 1. Wozu Stichprobenverteilung? 2. Bestimmung des Standardfehlers 3. Test- und Schätzverteilungen 4. Hypothesentests einzelner Regressionskoeffizienten 5. Konfidenzintervalle für einzelne Regressionskoeffizienten 6. Test des Modellfits 22
23 Einseitiger Test: T-Test 1. Nullhypothese : kein Effekt ( β Alternativhypothese: positiver Effekt ( β 2.Signifikanzniveau : z.b. α = 3. kritischer Wert : c = t 4. Teststatistik in der Stichprobe : t = 5. Entscheidung t t > c H c H α, n-k-1 widerlegt nicht widerlegt 0, 05 = 0) ( α verwenden) ˆ β β se( ˆ β ) > 0) = ˆ β 0 se( ˆ β ) 23
24 Einseitiger Test: noch besser 1. Nullhypothese :"kein Effekt"( β Alternativhypothese: positiver Effekt ( β 2.Signifikanzniveau : z.b. α = 3. kritischer Wert : c = t 4. Teststatistik in der Stichprobe : t 5. Entscheidung t t > c c H H 0 0 widerlegt 1-α, n-k-1 nicht widerlegt 1 0, 05 0) ( α verwenden) = 1 > ˆ β β se( ˆ β ) 0) = ˆ β 0 se( ˆ β ) Null- und Alternativhypothese müssen den gesamten Wertebereich abdecken! 24
25 Effekt der Berufserfahrung exper (n=526, wage1.dta) density Kritischer Wert P(T>c)=0,05 Der kritische Wert (rot) trennt den Ablehnungsbereich rechts (5%) vom Annahmebereich links (95%) t density Überschreitungswahrscheinlichkeit P(T>t) t Die Teststatistik (rot) liegt im Ablehnungsbereich. Die Überschreitungswahrscheinlichkeit (Fläche rechts davon: 0,9%) entspricht dem p-wert und ist kleiner als das Signifikanzniveau (5%). siehe auch Example 4.1 (WO 123) 25
26 Interpretation (z.b. für α =0,05) H 0 widerlegt Die Hypothese, dass die Variable... keinen Einfluss hat, wurde mit einer Irrtumswahrscheinlichkeit von fünf Prozent widerlegt. kurz: Der Effekt der Variablen... ist signifikant (α =0,05). H 0 nicht widerlegt Die Hypothese, dass die Variable... keinen Einfluss hat, konnte mit einer Irrtumswahrscheinlichkeit von fünf Prozent nicht widerlegt werden. kurz: Der Effekt der Variablen... ist nicht signifikant (α =0,05). 26
27 Zweiseitiger Test: T-Test 1. Nullhypothese : kein Effekt ( β Alternativhypothese: Effekt existiert ( β 2.Signifikanzniveau : z.b. α = 3. kritischer Wert : c = t 4. Teststatistik in der Stichprobe : t = 5. Entscheidung t t > c H c H α / 2, n-k-1 widerlegt nicht widerlegt 0, 05 = 0) ( α / 2 verwenden) ˆ β β se( ˆ β ) 0) = ˆ β 0 se( ˆ β ) 27
28 Beispiel Effekt Fehlzeiten (n=141, gpa1.dta) density Zweiseitiger Ablehnungsbereich bei alpha=0,05 Der Ablehnungsbereich liegt unterhalb des linken und oberhalb des rechten roten Striches (insgesamt 5%) t density Überschreitungswahrscheinlichkeit P(T>t) t siehe auch Example 4.3 (WO 128) Die Teststatistik (rot) liegt im Ablehnungsbereich. Die Überschreitungswahrscheinlichkeit (Fläche rechts davon: 99,9%) entspricht noch nicht dem p-wert. p entspricht der Fläche links des roten und rechts des 28 grünen Strichs (also 0,2%)..
29 Gliederung 1. Wozu Stichprobenverteilung? 2. Bestimmung des Standardfehlers 3. Test- und Schätzverteilungen 4. Hypothesentests einzelner Regressionskoeffizienten 5. Konfidenzintervalle für einzelne Regressionskoeffizienten 6. Test des Modellfits 29
30 Konfidenzintervall eines Regressionskoeffizienten Interpretation für α=0,05 Mit 95% Wahrscheinlichkeit liegt der Effekt der Variablen... zwischen <untere Grenze> und <obere Grenze>. ˆ β c se( ) < kritischer Wert : c = ˆ β β < t ˆ β + c se( 1 α / 2, n k 1 ˆ β ) 30
31 Interpretation (z.b. für 1-α =0,95) kurz Der Effekt der Variablen... liegt mit 95% Wahrscheinlichkeit zwischen... und... noch besser mit Einleitung Wenn sich die Variable... um eine <Einheit> erhöht, verringert/erhöht sich die abhängige Variable um <Einheiten>. Wenn man den Stichprobenfehler berücksichtigt, liegt dieser Effekt mit 95% Wahrscheinlichkeit zwischen... und... 31
32 Gliederung 1. Wozu Stichprobenverteilung? 2. Bestimmung des Standardfehlers 3. Test- und Schätzverteilungen 4. Hypothesentests einzelner Regressionskoeffizienten 5. Konfidenzintervalle für einzelne Regressionskoeffizienten 6. Test des Modellfits 32
33 Test des Modellfits: F-Test 1. Nullhypothese : keine Variable hat Effekt ( β Alternativhypothese: mind. eine Variable hat Effekt ( β 1 0) 2.Signifikanzniveau : z.b. α = 0, kritischer Wert : c = SSE k 4. Teststatistik in der Stichprobe : f = SSR ( n k 5. Entscheidung f f 0 K β > c H c H α, k, n-k-1 widerlegt nicht widerlegt f ( α verwenden) 1 = K = β = 1) = 0) n i= 1 ( yˆ n i= 1 i ( yˆ y i i ) 2 y) 2 k ( n k 1) 33
34 Interpretation (z.b. für α =0,05) H 0 widerlegt Die Hypothese, dass keine der unabhängigen Variablen... einen Einfluss hat, wurde mit einer Irrtumswahrscheinlichkeit von fünf Prozent widerlegt. kurz: Der Anteil erklärter Varianz des Modells... ist signifikant (von Null verschieden) (α =0,05). H 0 nicht widerlegt Die Hypothese, dass keine der unabhängigen Variablen... einen Einfluss hat, konnte mit einer Irrtumswahrscheinlichkeit von fünf Prozent nicht widerlegt werden. kurz: Der Anteil erklärter Varianz des Modells... ist nicht signifikant (von Null verschieden) (α =0,05). 34
35 Zum Schluss
36 Zusammenfassung Tests Voraussetzungen Stichprobenverteilung Schätzverfahren Zentrum ( wahrer Wert des Regressionskoeffizienten) Streuung (Standardfehler des Regressionskoeffizienten) Verteilungsform (Normalverteilung) unverzerrte Schätzung Homoskedastizität Normalverteilung der stochastischen Komponente T-Test einzelner Regressionskoeffizienten F-Test des Modellfits Konfidenzintervall des Regressionskoeffizienten 36
37 Wichtige Fachausdrücke Deutsch Englisch Deutsch Englisch homoskedasticity Homoskedastizität Nullhypothese null hypothesis Standardfehler der Regression standard error of the estimate root mean squared error Signifikanzniveau Alternativhypothese alternative hypothesis significance level Standardfehler (Regressionskoeffizient) standard error Teststatistik test statistic 37
38 Weiterführende Literatur Wooldridge leitet im zweiten Teil von Kapitel 3 (Abschnitt 3.4ff., WO ) die Varianz eines OLS-Schätzers ab, wozu er die Annahme der Homoskedaszität benötigt. Kapitel 4 (WO ) behandelt Schätz- und Testverfahren, wenn die stochastische Komponente normal verteilt ist. Kapitel 5 (WO ) behandelt den Fall nicht normal verteilter stochastischer Komponenten in großen Stichproben. 38
39 Stata-Befehle display invttail(522,.05) display ttail(522, 2.4) display invftail(3, 9,.05) display Ftail(3, 137, 13.9) display _b[exper] display _se[exper] kritischer Wert c einer T-Verteilung für df=522 Freiheitsgrade und alpha=0,05 Überschreitungswahrscheinlichkeit (p-wert) eines t- Wertes t=2,4 bei df=522 Freiheitsgraden kritischer Wert c einer F-Verteilung für df1=3 und df2=9 Freiheitsgrade und alpha=0,05 Überschreitungswahrscheinlichkeit (p-wert) eines f- Wertes f=13,9 bei df1=3 und df2=137 Freiheitsgraden intern gespeicherter Regressionskoeffizient der Variablen exper intern gespeicherter Standardfehler des Regressionskoeffizienten der Variablen exper 39
40 Stata-Befehle display e(rss) ereturn list intern gespeicherte Ergebnisse einer Regression (z.b. residual sum of squares) vollständige Liste aller intern gespeicherten Ergebnisse einer Regression 40
Analyse von Querschnittsdaten. Signifikanztests I Basics
Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004
MehrAnalyse von Querschnittsdaten. Spezifikation der unabhängigen Variablen
Analyse von Querschnittsdaten Spezifikation der unabhängigen Variablen Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Annahmen gegeben? kategoriale Variablen Datum 3.0.004 0.0.004
MehrAnalyse von Querschnittsdaten. Statistische Inferenz
Analyse von Querschnittsdaten Statistische Inferenz Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004 03.11.2004
MehrAnalyse von Querschnittsdaten. Signifikanztests II Advanced Stuff
Analyse von Querschnittsdaten Signifikanztests II Advanced Stuff Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum..4..4 7..4..4..4 7..4 4..4..4
MehrVorlesung 3: Schätzverfahren
Vorlesung 3: Schätzverfahren 1. Beispiel: General Social Survey 1978 2. Auswahl einer Zufallsstichprobe und Illustration des Stichprobenfehlers 3. Stichprobenverteilung eines Regressionskoeffizienten 4.
MehrAnalyse von Querschnittsdaten. Signifikanztests II Advanced Stuff
Analyse von Querschnittsdaten Signifikanztests II Advanced Stuff Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 9..5 6..5..5 9..5 6..5..5..5
MehrVorlesung 4: Spezifikation der unabhängigen Variablen
Vorlesung 4: Spezifikation der unabhängigen Variablen. Fehlspezifikation der unabhängigen Variablen. Auswirkungen einer Fehlspezifikation a. auf die Erwartungstreue der Schätzung b. auf die Effizienz der
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur
MehrAnalyse von Querschnittsdaten. Spezifikation der Regressionsfunktion
Analse von Querschnittsdaten Spezifikation der Regressionsfunktion Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Annahmen gegeben? kategoriale Variablen Datum 9..5 6..5..5 9..5 6..5..5..5
MehrProf. Dr. Marc Gürtler WS 2015/2016. Prof. Dr. Marc Gürtler. Klausur zur 10/12 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft
Prof. Dr. Marc Gürtler WS 015/016 Prof. Dr. Marc Gürtler Klausur zur 10/1 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft Lösungsskizze Prof. Dr. Marc Gürtler WS 015/016 Aufgabe 1: (11+5+1+8=56
MehrAnalyse von Querschnittsdaten. Heteroskedastizität
Analyse von Querschnittsdaten Heteroskedastizität Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Annahmen gegeben? kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004 03.11.2004
MehrI.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03
I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03 Vorlesung: 12.11.2002 He uses statistics as a drunken man use lampposts - for support rather than for illumination. Andrew Lang Dr. Wolfgang Langer
MehrÜbung V Lineares Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung
MehrStatistischer Rückschluss und Testen von Hypothesen
Statistischer Rückschluss und Testen von Hypothesen Statistischer Rückschluss Lerne von der Stichprobe über Verhältnisse in der Grundgesamtheit Grundgesamtheit Statistischer Rückschluss lerne aus Analyse
MehrJost Reinecke. 7. Juni 2005
Universität Bielefeld 7. Juni 2005 Testtheorie Test für unabhängige Stichproben Test für abhängige Stichproben Testtheorie Die Testtheorie beinhaltet eine Reihe von Testverfahren, die sich mit der Überprüfung
Mehr3.3 Konfidenzintervalle für Regressionskoeffizienten
3.3 Konfidenzintervalle für Regressionskoeffizienten Konfidenzintervall (Intervallschätzung): Angabe des Bereichs, in dem der "wahre" Regressionskoeffizient mit einer großen Wahrscheinlichkeit liegen wird
MehrWS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X.
Fragenkatalog zur Übung Methoden der empirischen Sozialforschung WS 2014/15 Hier finden Sie die denkbaren Fragen zum ersten Teil der Übung. Das bedeutet, dass Sie zu diesem Teil keine anderen Fragen im
Mehr1 Beispiel zur Methode der kleinsten Quadrate
1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25
Mehrx t2 y t = 160, y = 8, y y = 3400 t=1
Aufgabe 1 (25 Punkte) 1. Eine Online Druckerei möchte die Abhängigkeit des Absatzes gedruckter Fotos vom Preis untersuchen. Dazu verwendet die Firma das folgende lineare Regressionsmodell: wobei y t =
MehrZur Erinnerung: Annahmen
Zur Erinnerung: Annahmen Vorlesung 6: Heteroskedastizität. Beispiele mit heteroskedastischen Fehlertermen. Auswirkungen von Heteroskedastizität auf OLS-Schätzungen. Wie erkennt man das Vorliegen von Heteroskedastizität?
MehrMathematische und statistische Methoden II
Statistik & Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte
Mehr4.1. Nullhypothese, Gegenhypothese und Entscheidung
rof. Dr. Roland Füss Statistik II SS 8 4. Testtheorie 4.. Nullhypothese, Gegenhypothese und Entscheidung ypothesen Annahmen über die Verteilung oder über einzelne arameter der Verteilung eines Merkmals
Mehr4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers
4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis
MehrEmpirische Wirtschaftsforschung
Empirische Wirtschaftsforschung Prof. Dr. Bernd Süßmuth Universität Leipzig Institut für Empirische Wirtschaftsforschung Volkswirtschaftslehre, insbesondere Ökonometrie 1 4. Basiskonzepte der induktiven
MehrPrognoseintervalle für y 0 gegeben x 0
10 Lineare Regression Punkt- und Intervallprognosen 10.5 Prognoseintervalle für y 0 gegeben x 0 Intervallprognosen für y 0 zur Vertrauenswahrscheinlichkeit 1 α erhält man also analog zu den Intervallprognosen
MehrLineare Regression mit einem Regressor: Einführung
Lineare Regression mit einem Regressor: Einführung Quantifizierung des linearen Zusammenhangs von zwei Variablen Beispiel Zusammenhang Klassengröße und Testergebnis o Wie verändern sich Testergebnisse,
Mehr3 Grundlagen statistischer Tests (Kap. 8 IS)
3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung
MehrKonfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt
Konfidenzintervalle Annahme: X 1,..., X n iid F θ. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt P θ (U θ O) = 1 α, α (0, 1). Das Intervall [U, O] ist ein Konfidenzintervall
MehrTrim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19
Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist
MehrSchätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II
Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Wiederholung Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte
MehrWiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36)
Statistik I Sommersemester 2009 Statistik I I (1/36) Wiederholung Grenzwertsatz Konfidenzintervalle Logik des 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 Statistik I I (2/36) Zum Nachlesen Agresti/Finlay: Kapitel 6+7
MehrKapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell
Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften
MehrSchätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief
Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte : Schätzung Statistik
MehrÜbungsblatt 10: Lineare Regression (Sitzung 11)
1 Übungsblatt 10: Lineare Regression (Sitzung 11) Aufgabe 1 a) Nach welchem Kriterium wird die Regressionsgerade zur Vorhersage von Y-Werten festgelegt? b) Was sind die Gemeinsamkeiten und Unterschiede
Mehr3 Konfidenzintervalle
3 Konfidenzintervalle Konfidenzintervalle sind das Ergebnis von Intervallschätzungen. Sicheres Wissen über Grundgesamtheiten kann man anhand von Stichproben nicht gewinnen. Aber mit Hilfe der Statistik
MehrPrüfgröße: Ist die durch eine Schätzfunktion zugeordnete reelle Zahl (etwa Mittelwert 7 C).
Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Aus praktischen Gründen
MehrStatistische Tests (Signifikanztests)
Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)
Mehr9 Prinzipien der statistischen Hypothesenprüfung
9 Prinzipien der statistischen Hypothesenprüfung Prinzipien der statistischen Hypothesenprüfung Bei der Schätzung eines Populationsparamters soll dessen Wert aus Stichprobendaten erschlossen werden. Wenn
Mehr2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht
43 Signifikanztests Beispiel zum Gauß-Test Bei einer Serienfertigung eines bestimmten Typs von Messgeräten werden vor der Auslieferung eines jeden Gerätes 10 Kontrollmessungen durchgeführt um festzustellen,
MehrWie liest man Konfidenzintervalle? Teil I. Premiu m
Wie liest man Konfidenzintervalle? Teil I Premiu m Was sind Konfidenzintervalle? Ein Konfidenzintervall (KI) ist ein Maß für die Unsicherheit bezüglich einer Schätzung eines Effekts. Es ist ein Intervall
MehrHypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren
Hypothesenprüfung Teil der Inferenzstatistik Befaßt sich mit der Frage, wie Hypothesen über eine (in der Regel unbekannte) Grundgesamtheit an einer Stichprobe überprüft werden können Behandelt werden drei
MehrAufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie WS 2014/15. ( = 57 Punkte)
Aufgabe 3 (6 + 4 + 8 + 4 + 10 + 4 + 9 + 4 + 8 = 57 Punkte) Hinweis: Beachten Sie die Tabellen mit Quantilen am Ende der Aufgabenstellung! Mit Hilfe eines multiplen linearen Regressionsmodells soll auf
MehrStatistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!
Statistik 2 1. Klausur Sommersemester 2013 Hamburg, 26.07.2013 A BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Punkt- und Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr.
MehrStatistisches Testen
Statistisches Testen Universität Duisburg-Essen, Fak. 4, FG Instrumentelle Analytik 7. Juni 2007 Statistisches Testen Inhaltsverzeichnis Schätzverfahren und Testverfahren sind Anwendungen der Stichprobentheorie.
MehrBereiche der Statistik
Bereiche der Statistik Deskriptive / Exploratorische Statistik Schließende Statistik Schließende Statistik Inferenz-Statistik (analytische, schließende oder konfirmatorische Statistik) baut auf der beschreibenden
MehrX =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode?
Aufgabe 1 (25 Punkte) Zur Schätzung der Produktionsfunktion des Unternehmens WV wird ein lineares Regressionsmodell der Form angenommen. Dabei ist y t = β 1 + x t2 β 2 + e t, t = 1,..., T (1) y t : x t2
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test
Mehr3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft
3. Das Prüfen von Hypothesen Hypothese?! Stichprobe 3.1. Signifikanztests in der Wirtschaft Prüfung, ob eine (theoretische) Hypothese über die Verteilung eines Merkmals X und ihre Parameter mit einer (empirischen)
MehrStatistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
MehrStatistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management
für Betriebswirtschaft und internationales Management Sommersemester 2015 Prof. Dr. Stefan Etschberger Hochschule Augsburg Testverteilungen Chi-Quadrat-Verteilung Sind X 1,..., X n iid N(0; 1)-verteilte
MehrStatistik II Übung 4: Skalierung und asymptotische Eigenschaften
Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden
MehrGrundlagen der schließenden Statistik
Grundlagen der schließenden Statistik Schätzer, Konfidenzintervalle und Tests 1 46 Motivation Daten erhoben (Umfrage, Messwerte) Problem: Bei Wiederholung des Experiments wird man andere Beobachtungen
MehrFallzahlplanung bei unabhängigen Stichproben
Fallzahlplanung bei unabhängigen Stichproben Seminar Aktuelle biometrische Probleme Benjamin Hofner benjamin.hofner@stat.uni-muenchen.de 12. Januar 2005 Übersicht 1. Einführung und Grundlagen der Fallzahlplanung
MehrInferenz im multiplen Regressionsmodell
1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall
Mehr7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.
7. Übung: Aufgabe 1 b), c), e) Aufgabe a), c), e) Aufgabe 3 c), e) Aufgabe 4 b) Aufgabe 5 a) Aufgabe 6 b) Aufgabe 7 e) Aufgabe 8 c) Aufgabe 9 a), c), e) Aufgabe 10 b), d) Aufgabe 11 a) Aufgabe 1 b) Aufgabe
MehrAufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten:
Aufgabe 1 (8=2+2+2+2 Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten: Die Zufallsvariable X bezeichne die Note. 1443533523253. a) Wie groß ist h(x 5)? Kreuzen
MehrEinführung in Web- und Data-Science
Einführung in Web- und Data-Science Prof. Dr. Ralf Möller Universität zu Lübeck Institut für Informationssysteme Tanya Braun (Übungen) P-Wert (einseitiger Ablehnungsbereich) Hypothesentest H 0 vs. H 1
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Punkt- und Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr.
Mehr11. Übungsblatt zur Vorlesung Ökonometrie SS 2014
Universität des Saarlandes Lehrstab Statistik Dr. Martin Becker Dipl.-Kfm. Andreas Recktenwald 11. Übungsblatt zur Vorlesung Ökonometrie SS 2014 Aufgabe 45 Die in Aufgabe 43 getroffene Annahme heteroskedastischer
MehrDipl.-Volksw. Markus Pullen Wintersemester 2012/13
Statistische Auswertungen mit R Universität Kassel, FB 07 Wirtschaftswissenschaften Dipl.-Volksw. Markus Pullen Wintersemester 2012/13 Beispiele 8. Sitzung Konfidenzintervalle, Hypothesentests > # Anwendungsbeispiel
MehrEinführung in die Induktive Statistik: Testen von Hypothesen
Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte
MehrANOVA und Transformationen. Statistik II
und Statistik II Wiederholung Literatur Statistik II und (1/28) Literatur Zum Nachlesen Agresti ch. 12 (nur bis Seite 381) Agresti ch. 13 (nur bis Seite 428) Statistik II und (2/28) Literatur für nächste
Mehr5. Seminar Statistik
Sandra Schlick Seite 1 5. Seminar 5. Seminar Statistik 30 Kurztest 4 45 Testen von Hypothesen inkl. Übungen 45 Test- und Prüfverfahren inkl. Übungen 45 Repetitorium und Prüfungsvorbereitung 15 Kursevaluation
MehrDr. H. Grunert Schließende Statistik Vorlesungscharts. Vorlesung 7. Schätzverfahren
Vorlesungscharts Vorlesung 7 Schätzverfahren Konstruktion von Konfidenzintervallen Konfidenzintervalle für den Erwartungswert normalverteilter Grundgesamtheiten Konfidenzintervalle für Anteilswerte Seite
MehrANOVA und Transformationen
und Statistik II Literatur Statistik II und (1/28) Literatur Zum Nachlesen Agresti ch. 12 (nur bis Seite 381) Agresti ch. 13 (nur bis Seite 428) Statistik II und (2/28) Literatur Literatur für nächste
MehrLehrstuhl für Statistik und emp. Wirtschaftsforschung, Prof. R. T. Riphahn, Ph.D. Bachelorprüfung, Praxis der empirischen Wirtschaftsforschung
Lehrstuhl für Statistik und emp. Wirtschaftsforschung, Prof. R. T. Riphahn, Ph.D. Bachelorprüfung, Praxis der empirischen Wirtschaftsforschung Aufgabe 1: [14,5 Punkte] Sie interessieren sich für die Determinanten
MehrMethodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 10 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre I Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 25.9.13 Psychologie als Wissenschaft
MehrSchätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO
Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung
MehrÜbungsaufgaben zu Statistik II
Übungsaufgaben zu Statistik II Prof. Dr. Irene Prof. Dr. Albrecht Ungerer Die Kapitel beziehen sich auf das Buch: /Ungerer (2016): Statistik für Wirtschaftswissenschaftler Springer Gabler 4 Übungsaufgaben
MehrHandelt es sich bei den folgenden um diskrete oder stetige Zufallsvariablen?
1. Handelt es sich bei den folgenden um diskrete oder stetige Zufallsvariablen? a.) Anzahl der Kunden, die an der Kasse in der Schlange stehen. b.) Die Menge an Energie, die pro Tag von einem Energieversorgungsunternehmen
MehrPrüfung aus Statistik 2 für SoziologInnen
Prüfung aus Statistik 2 für SoziologInnen 11. Oktober 2013 Gesamtpunktezahl =80 Name in Blockbuchstaben: Matrikelnummer: Wissenstest (maximal 16 Punkte) Kreuzen ( ) Sie die jeweils richtige Antwort an.
MehrKonkretes Durchführen einer Inferenzstatistik
Konkretes Durchführen einer Inferenzstatistik Die Frage ist, welche inferenzstatistischen Schlüsse bei einer kontinuierlichen Variablen - Beispiel: Reaktionszeit gemessen in ms - von der Stichprobe auf
MehrT-Test für unabhängige Stichproben
T-Test für unabhängige Stichproben Wir gehen von folgendem Beispiel aus: Wir erheben zwei Zufallstichproben, wobei nur die Probanden der einen Stichprobe einer speziellen experimentellen Behandlung (etwa
Mehr9 Prinzipien der statistischen Hypothesenprüfung
9 Prinzipien der statistischen Hypothesenprüfung Prinzipien der statistischen Hypothesenprüfung Bei der Schätzung eines Populationsparamters soll dessen Wert aus Stichprobendaten erschlossen werden. Wenn
MehrLehrstuhl für Statistik und emp. Wirtschaftsforschung, Prof. R. T. Riphahn, Ph.D. Bachelorprüfung, Praxis der empirischen Wirtschaftsforschung
Lehrstuhl für Statistik und emp. Wirtschaftsforschung, Prof. R. T. Riphahn, Ph.D. Bachelorprüfung, Praxis der empirischen Wirtschaftsforschung Aufgabe 1: [14,5 Punkte] Sie interessieren sich für die Determinanten
MehrTeil XII. Einfache Lineare Regression. Woche 10: Lineare Regression. Lernziele. Zusammenfassung. Patric Müller
Woche 10: Lineare Regression Patric Müller Teil XII Einfache Lineare Regression ETHZ WBL 17/19, 03.07.2017 Wahrscheinlichkeit und Statistik Patric Müller WBL 2017 Wahrscheinlichkeit
MehrMacht des statistischen Tests (power)
Macht des statistischen Tests (power) Realer Treatment ja Ergebnis der Studie H 0 verworfen statistisch signifikant O.K. Macht H 0 beibehalten statistisch nicht signifikant -Fehler Effekt nein -Fehler
MehrMacht des statistischen Tests (power)
Macht des statistischen Tests (power) Realer Treatment ja Ergebnis der Studie H 0 verworfen statistisch signifikant O.K. Macht H 0 beibehalten statistisch nicht signifikant -Fehler Effekt nein -Fehler
MehrGrundlagen sportwissenschaftlicher Forschung Deskriptive Statistik 2 Inferenzstatistik 1
Grundlagen sportwissenschaftlicher Forschung Deskriptive Statistik 2 Inferenzstatistik 1 Dr. Jan-Peter Brückner jpbrueckner@email.uni-kiel.de R.216 Tel. 880 4717 Rückblick: Besonders wichtige Themen Wissenschaftstheoretischer
MehrLean Body Mass [kg] Estimate Std. Error t value Pr(> t ) (Intercept) ??? lbm <2e-16 ***
Körperkraft [Nm] 0 50 100 150 200 250 0 20 40 60 80 Lean Body Mass [kg] Dieses Quiz soll Ihnen helfen, den R Output einer einfachen linearen Regression besser zu verstehen (s. Kapitel 5.4.1) Es wurden
MehrKurs Empirische Wirtschaftsforschung
Kurs Empirische Wirtschaftsforschung 5. Bivariates Regressionsmodell 1 Martin Halla Institut für Volkswirtschaftslehre Johannes Kepler Universität Linz 1 Lehrbuch: Bauer/Fertig/Schmidt (2009), Empirische
MehrProf. Regina T. Riphahn, Ph.D. WS 04/05 Abschlussklausur zur Veranstaltung "Einführung in die Ökonometrie" am 24. Februar 2005,
Prof. Regina T. Riphahn, Ph.D. WS 4/5 Abschlussklausur zur Veranstaltung "Einführung in die Ökonometrie" am 24. Februar 25, 9.-1.3 Uhr Erlaubte Hilfsmittel: Tabelle der statistischen Verteilungen, 4 DIN
MehrBereiche der Statistik
Bereiche der Statistik Deskriptive / Exploratorische Statistik Schließende Statistik Schließende Statistik Inferenz-Statistik (analytische, schließende oder konfirmatorische Statistik) baut auf der beschreibenden
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 16. Januar 2013 1 Allgemeine Hypothesentests Nullhypothese und Alternative Beispiel: Blutdrucksenker Testverfahren
MehrMultivariate Verfahren
Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie
MehrSchließende Statistik
Schließende Statistik Die schließende Statistik befasst sich mit dem Rückschluss von einer Stichprobe auf die Grundgesamtheit (Population). Die Stichprobe muss repräsentativ für die Grundgesamtheit sein.
MehrBeispiel: Multiples Modell/Omitted Variable Bias I
4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss
MehrHypothesen über die Grundgesamtheit. Aufgabenstellung der Testtheorie Hypothesen (Annahmen, Vermutungen oder
Hypothesen über die Grundgesamtheit Aufgabenstellung der Testtheorie Hypothesen (Annahmen, Vermutungen oder Behauptungen) über die unbekannte Grundgesamtheit anhand einer Stichprobe als richtig oder falsch
MehrHypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15
Hypothesentests für Erwartungswert und Median für D-UWIS, D-ERDW, D-USYS und D-HEST SS15 Normalverteilung X N(μ, σ 2 ) : «X ist normalverteilt mit Erwartungswert μ und Varianz σ 2» pdf: f x = 1 2 x μ exp
Mehr3.Wiederholung: Toleranzbereiche Für EX Geg:
3.Wiederholung: Toleranzbereiche Für EX Geg: Vl. 24.2.2017 Schätzfunktion für Güte: Ist X Problem: Feb 17 13:21 > Wir berechnen Bereiche (Toleranzbereiche) für sind untere und obere Grenzen, berechnet
MehrÜbung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010
MehrMaster of Science in Pflege
Master of Science in Pflege Modul: Statistik Einführung in die schliessende Statistik Oktober 212 Prof. Dr. Jürg Schwarz Folie 2 Programm 31. Oktober 212: Vormittag (9.15 12.3) Vorlesung - Einführung,
MehrAllgemein zu Hypothesentests: Teststatistik. OLS-Inferenz (Small Sample) Allgemein zu Hypothesentests
OLS-Inferenz (Small Sample) K.H. Schild 3. Mai 017 Allgemein zu Hypothesentests: Teststatistik Konstruktion eines Hypothesentests erfolgt meistens über eine Teststatistik Eine Teststatistik T ist eine
Mehr