2.3 Intervallschätzung

Ähnliche Dokumente
1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung

Vorlesung: Statistik II für Wirtschaftswissenschaft

2.2 Punktschätzung. Gegeben sei die in Kapitel 2.1 beschriebene Situation, also eine i.i.d. Stichprobe X 1,...,X n eines Merkmales X.

Statistik I für Betriebswirte Vorlesung 14

6. Schätzverfahren für Parameter

Kapitel 3 Schließende Statistik

Mathematik für Biologen

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Einführung in die Induktive Statistik: Testen von Hypothesen

Willkommen zur Vorlesung Statistik (Master)

3 Grundlagen statistischer Tests (Kap. 8 IS)

Schließende Statistik

Vorlesung: Statistik II für Wirtschaftswissenschaft

Übungsaufgaben zu Statistik II

Zentraler Grenzwertsatz/Konfidenzintervalle

5. Spezielle stetige Verteilungen

Kapitel 2 Wahrscheinlichkeitsrechnung

Statistische Tests für unbekannte Parameter

Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung

3 Statistische Schätzungen

Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK

2 Aufgaben aus [Teschl, Band 2]

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Klausur zu Statistik II

Klassifikation von Signifikanztests

Webinar Induktive Statistik. - Wahrscheinlichkeitsrechnung - Stichprobentheorie

Wahrscheinlichkeitstheorie und Statistik vom

Statistische Intervalle

Übung zu Empirische Ökonomie für Fortgeschrittene SS 2009

ETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig)

1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp

8. Konfidenzintervalle und Hypothesentests

Statistik und Wahrscheinlichkeitsrechnung

7.2 Moment und Varianz

Zufallsvariablen [random variable]

Biostatistik, Winter 2011/12

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen

Mathematische und statistische Methoden II

Lösungen zur Klausur WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK (STOCHASTIK)

3 Konfidenzintervalle

Übungen zur Vorlesung Wirtschaftsstatistik Konfidenzintervalle Aufgabe 11.1 NewYorkTimes, Monday, May17,2010:

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1

1 Dichte- und Verteilungsfunktion

0, t 0,5

Statistik II für Betriebswirte Vorlesung 1

Spezielle stetige Verteilungen

Statistik-Übungsaufgaben

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Mathematik für Naturwissenschaften, Teil 2

Demokurs. Modul Grundlagen der Wirtschaftsmathematik Grundlagen der Statistik

9 Die Normalverteilung

Jost Reinecke. 7. Juni 2005

Kapitel 12 Stetige Zufallsvariablen Dichtefunktion und Verteilungsfunktion. stetig. Verteilungsfunktion

Klausur (Modulprüfung) zum Lehrerweiterbildungskurs Stochastik am von 10:00 bis 11:00 Uhr

Prüfgröße: Ist die durch eine Schätzfunktion zugeordnete reelle Zahl (etwa Mittelwert 7 C).

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Definition Sei X eine stetige Z.V. mit Verteilungsfunktion F und Dichte f. Dann heißt E(X) :=

Grundgesamtheit und Stichprobe

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

I. Deskriptive Statistik 1

Klausur zum Fach GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK. für Studierende der INFORMATIK

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003

Grundgesamtheit und Stichprobe

5. Schließende Statistik Einführung

Kapitel XI - Operationscharakteristik und Gütefunktion

Vertiefung der. Wirtschaftsmathematik. und Statistik (Teil Statistik)

STATISTIK 1 - BEGLEITVERANSTALTUNG

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

3.4 Asymptotische Evaluierung von Sch atzer Konsistenz Konsistenz Definition 3.4.1: konsistente Folge von Sch atzer

Mathematik für Biologen

Übungen mit dem Applet Vergleich von zwei Mittelwerten

30. März Ruhr-Universität Bochum. Methodenlehre II, SS Prof. Dr. Holger Dette

Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36)

Klausur Stochastik und Statistik 31. Juli 2012

Teil 3: Schließende Statistik

3.1 Punktschätzer für Mittelwert µ und Varianz σ 2. Messungen x 1,..., x N, die unabhängig voneinander auf gleiche Weise gewonnen worden sind

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

Inhaltsverzeichnis. 2 Kurzbeschreibung von SPSS Der SPSS-Dateneditor Statistische Analysen mit SPSS DieDaten...

Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007

6. Stochastische Modelle II: Stetige Wahrscheinlichkeitsverteilungen, insbesondere Normalverteilungen

2 Zufallsvariable, Verteilungen, Erwartungswert

10,24 ; 10,18 ; 10,28 ; 10,25 ; 10,31.

Wir gehen wieder von einem allgemeinen (parametrischen) statistischen Modell aus, (

- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden.

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Konfidenzintervall für den Anteilswert θ. Konfidenzintervalle. Jost Reinecke. Universität Bielefeld. 13. Juni 2005

die wir als Realisationen von unabhängig und identisch verteilten Zufallsvariablen

7.5 Erwartungswert, Varianz

Statistik. R. Frühwirth Teil 1: Deskriptive Statistik. Statistik. Einleitung Grundbegriffe Merkmal- und Skalentypen Aussagen und

Stetige Verteilungen Rechteckverteilung

Dipl.-Volksw. Markus Pullen Wintersemester 2012/13

1 Erwartungswert und Kovarianzmatrix von Zufallsvektoren

Grundlegende Eigenschaften von Punktschätzern

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

10. Die Normalverteilungsannahme

Transkript:

2.3.1 Motivation und Hinführung Bsp. 2.11. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler 2009 war genau 33.7%. Wie groß ist die Wahrscheinlichkeit, in einer Zufallsstichprobe von 1000 Personen genau einen relativen Anteil von 33.7% von rot-grün Anhängern erhalten zu haben? D.h., mit Wahrscheinlichkeit von etwa 97.3%, verfehlt der Schätzer den wahren Wert. Hat man ein stetiges Merkmal, so ist sogar P ( X = a) =0für jedes a, d.h. der wahre Wert wird mit Wahrscheinlichkeit 1 verfehlt. 2 Induktive Statistik 243

Konsequenzen: Insbesondere Vorsicht bei der Interpretation knapper Ergebnisse (z.b. Anteil 50.2%) Suche Schätzer mit möglichst kleiner Varianz, um im Durchschnitt möglichst nahe dran zu sein Es ist häufig auch gar nicht nötig, sich genau auf einen Wert festzulegen. Oft reicht die Angabe eines Intervalls, von dem man hofft, dass es den wahren Wert überdeckt: Intervallschätzung Symmetrische Intervallschätzung basierend auf einer Schätzfunktion T = g(x 1,...,X n ): I(T )=[T a, T + a] 2 Induktive Statistik 244

Trade off bei der Wahl von a: Wie soll man a wählen? Typisches Vorgehen: Man gebe sich durch inhaltliche Überlegungen einen Sicherheitsgrad (Konfidenzniveau) γ vor. Dann konstruiert man das Intervall so, dass es mindestens mit der Wahrscheinlichkeit γ den wahren Parameter überdeckt. 2 Induktive Statistik 245

2.3.2 Definition von Konfidenzintervallen: Gegeben sei eine i.i.d. Stichprobe X 1,...,X n zur Schätzung eines Parameters ϑ und eine Zahl γ (0; 1). Ein zufälliges Intervall C(X 1,...,X n ) heißt Konfidenzintervall zum Sicherheitsgrad γ (Konfidenzniveau γ), falls für jedes ϑ gilt: Bem. 2.12. P ϑ (ϑ C(X 1,...,X n ) ) γ. }{{} zufälliges Intervall Die Wahrscheinlichkeitsaussage bezieht sich auf das Ereignis, dass das zufällige Intervall den festen, wahren Parameter überdeckt. Streng genommen darf man im objektivistischen Verständnis von Wahrscheinlichkeit nicht von der Wahrscheinlichkeit sprechen, dass ϑ in dem Intervall liegt, da ϑ nicht zufällig ist und somit keine Wahrscheinlichkeitsverteilung besitzt. (Ein Zurückziehen auf subjektive Wahrscheinlichkeiten führt aber auch Widersprüche. 2 Induktive Statistik 246

Typischerweise konstruiert man Konfidenzintervalle symmetrisch um einen Schätzer T. Es sind aber auch manchmal z.b. einseitige Konfidenzintervalle, etwa der Form [ X, X + b], sinnvoll 2 Induktive Statistik 247

2.3.3 Konstruktion von Konfidenzintervallen Für die Konstruktion praktische Vorgehensweise: Suche Zufallsvariable Z ϑ, die den gesuchten Parameter ϑ enthält und deren Verteilung aber nicht mehr von dem Parameter abhängt, ( Pivotgröße, dt. Angelpunkt). Dann wähle den Bereich C Z so, dass P ϑ (Z ϑ C Z )=γ und löse nach ϑ auf. 2 Induktive Statistik 248

Konfidenzintervall für den Mittelwert eines normalverteilten Merkmals bei bekannter Varianz: X 1,...,X n i.i.d. Stichprobe gemäß X i N(μ, σ 2 ), wobei σ 2 bekannt sei. Ceterisparibus-Analyse : Alle Größen bis auf eine festhalten, diese variieren. 2 Induktive Statistik 249

Bem. 2.13. Je größer σ, desto größer das Intervall! Je größer γ, desto größer z1+γ 2 Je größer n und damit n, desto schmaler ist das Intervall Kann man zur Stichprobenplanung verwenden! 2 Induktive Statistik 250

Konfidenzintervall für den Mittelwert eines normalverteilten Merkmals bei unbekannter Varianz: Neben dem Erwartungswert ist auch σ 2 unbekannt und muss entsprechend durch den UMVU-Schätzer S 2 = 1 n 1 n (X i X) 2, i=1 (mit S = S 2 ) geschätzt werden. Allerdings ist Z = X μ S n jetzt nicht mehr normalverteilt, denn S ist zufällig. Wir führen deshalb ein neues Verteilungsmodell ein. 2 Induktive Statistik 251

t-verteilung: Gegeben sei eine i.i.d. Stichprobe X 1,...,X n mit X i N(μ, σ 2 ). Dann heißt die Verteilung von Z = X μ S n t-verteilung (oder Student-Verteilung) mit ν = n 1 Freiheitsgraden. In Zeichen: Z t(ν). Wichtige Werte der t-verteilung sind tabelliert. Angegeben sind, für verschiedene δ, die Lösung t δ der Gleichung P (Z t (ν) δ )=δ, wobei t (ν) δ von der Anzahl ν der Freiheitsgrade abhängt. t δ ist das δ-quantil der entsprechenden t-verteilung (analog zu z δ als Quantil der Standardnormalverteilung). Die Dichte einer t-verteilung ist der Dichte der Standardnormalverteilung sehr ähnlich: Sie ist auch symmetrisch um 0, besitzt aber etwas höhere Dichte für extreme Werte ( schwerere Enden ). 2 Induktive Statistik 252

f(x) 0.4 0.3 0.2 0.1 0.0-4 -2 0 2 4 x Dichten von t-verteilungen für ν =1( ), =2( ), =5(- - -) und =20( ) Freiheitsgrade. 2 Induktive Statistik 253

Je größer ν ist, umso ähnlicher sind sich die t(ν)-verteilung und die Standardnormalverteilung. Für ν sind sie gleich, ab ν =30gilt der Unterschied als vernachlässigbar. Konfidenzintervall zum Konfidenzniveau γ: 2 Induktive Statistik 254

Bem. 2.14. Es gelten analoge Aussagen zum Stichprobenumfang und Konfidenzniveau wie bei bekannter Varianz. Für jedes γ (und jedes ν) gilt Je größer ν, umso kleiner ist der Unterschied. Für n 30 rechnet man einfach auch bei der t-verteilung mit z1+γ. 2 2 Induktive Statistik 255

Bsp. 2.15. Eine Maschine füllt Gummibärchen in Tüten ab, die laut Aufdruck 250g Füllgewicht versprechen. Wir nehmen im folgenden an, dass das Füllgewicht normalverteilt ist. Bei 16 zufällig aus der Produktion herausgegriffenen Tüten wird ein mittleres Füllgewicht von 245g und eine Stichprobenstreuung (Standardabweichung) von 10g festgestellt. a) Berechnen Sie ein Konfidenzintervall für das mittlere Füllgewicht zum Sicherheitsniveau von 95%. b) Wenn Ihnen zusätzlich bekannt würde, dass die Stichprobenstreuung gleich der tatsächlichen Streuung ist, wäre dann das unter a) zu berechnende Konfidenzintervall für das mittlere Füllgewicht breiter oder schmäler? Begründen Sie ihre Antwort ohne Rechnung. 2 Induktive Statistik 256

Bsp. 2.16. [Klausurergebnisse (Fiktives Beispiel)] i punkte i punkte i punkte i punkte i punkte i punkte 1 16.5 7 27.5 13 23 19 14 25 19.5 31 35.5 2 16.5 8 22 14 15 20 21 26 18 32 12.5 3 25.5 9 16.5 15 31 21 19.5 27 37.5 33 25 4 25 10 8 16 26 22 17.5 28 15.5 34 25.5 5 20.5 11 33.5 17 13.5 23 36 29 7.5 35 18.5 6 27.5 12 19.5 18 24 24 31.5 30 18 Mittelwert und Varianz der Grundgesamtheit (alle 35 Klausuren): ˆμ = punkte =21.81 ˆσ 2 = s 2 punkte =7.56 2 Wir ziehen insgesamt 80 Stichproben vom Umfang n =5, n =10, n =20, n =35 und bestimmen Konfidenzintervalle zum Niveau 95%. 2 Induktive Statistik 257

95% KI s, Stichprobenumfang n=5 5 10 15 20 25 30 35 40 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 Stichprobe 95% KI s, Stichprobenumfang n=5 5 10 15 20 25 30 35 40 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 Stichprobe Punktzahl der Klausur Statistik I: Konfidenzintervalle für 80 Stichproben mit jeweiligem Stichprobenumfang n =5(oben) und n =10(unten). 2 Induktive Statistik 258

95% KI s, Stichprobenumfang n=20 5 10 15 20 25 30 35 40 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 Stichprobe 95% KI s, Stichprobenumfang n=35 5 10 15 20 25 30 35 40 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 Stichprobe Punktzahl der Klausur Statistik I: Konfidenzintervalle für 80 Stichproben mit jeweiligem Stichprobenumfang n =20(oben), n =35(unten). 2 Induktive Statistik 259

95% KI s, Stichprobenumfang n=5 5 10 15 20 25 30 35 40 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 Stichprobe 95% KI s, Stichprobenumfang n=5, Varianz bekannt 5 10 15 20 25 30 35 40 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 Stichprobe Punktzahl der Klausur Statistik I: Konfidenzintervalle für 80 Stichproben mit Stichprobenumfang n =5. Oben ist die Varianz unbekannt, unten als bekannt vorausgesetzt. 2 Induktive Statistik 260

Ergebnis: Die Breite der Konfidenzintervalle nimmt mit wachsendem n ab. Nicht alle Konfidenzintervalle enthalten den wahren Mittelwert μ =23.1 (per Konstruktion mit Wahrscheinlichkeit 5%). Die Intervalle mit bekannter Varianz sind im Mittel enger. Die Intervalle mit bekannter Varianz sind immer gleich lang. 2 Induktive Statistik 261

Approximative Konfidenzintervalle: Ist der Stichprobenumfang groß genug, so kann wegen des zentralen Grenzwertsatzes das Normalverteilungs-Konfidenzintervall auf den Erwartungswert beliebiger Merkmale (mit existierender Varianz) angewendet werden. Man erhält approximative Konfidenzintervalle, die meist auch der Berechnung mit Software zugrundeliegen Beispiel: Konfidenzintervall für den Anteil π: Seien X 1,...,X n i.i.d. mit X i = { 1 0, P(X i =1)=π. Beispiel Wahlumfrage: Seien n = 500, X =46.5% und γ = 95%. Inhaltliche Bemerkung 2 Induktive Statistik 262