Stichproben Parameterschätzung Konfidenzintervalle:

Ähnliche Dokumente
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Testen von Hypothesen:

Wahrscheinlichkeitsverteilungen

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X.

Statistik I für Betriebswirte Vorlesung 14

2.3 Intervallschätzung

7. Grenzwertsätze. Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012

Modellanpassung und Parameterschätzung. A: Übungsaufgaben

Statistik Einführung // Stichprobenverteilung 6 p.2/26

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management

Statistische Tests für unbekannte Parameter

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung

Verteilung von Summen

Klassifikation von Signifikanztests

Willkommen zur Vorlesung Statistik (Master)

Übungsaufgaben zu Statistik II

Mathematik für Biologen

5. Stichproben und Statistiken

Chi-Quadrat-Verteilung

von x-würfeln bei wachsendem n? Zur Beantwortung führen wir ein Simulationsexperiment durch.

0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1

5. Spezielle stetige Verteilungen

Vorlesung: Statistik II für Wirtschaftswissenschaft

1 Dichte- und Verteilungsfunktion

70 Wichtige kontinuierliche Verteilungen

2 Aufgaben aus [Teschl, Band 2]

Klausur (Modulprüfung) zum Lehrerweiterbildungskurs Stochastik am von 10:00 bis 11:00 Uhr

Wichtige Definitionen und Aussagen

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen. Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung

Willkommen zur Vorlesung Statistik (Master)

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Statistisches Testen

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

2. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017

Schließende Statistik

Kapitel 3 Schließende Statistik

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Lösungen zu Übungsblatt 9 Höhere Mathematik2/Stochastik 2 Master KI/PI

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Wahrscheinlichkeit und Statistik: Zusammenfassung

Statistik und Wahrscheinlichkeitsrechnung

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38

Willkommen zur Vorlesung Statistik (Master)

10,24 ; 10,18 ; 10,28 ; 10,25 ; 10,31.

Stetige Verteilungen, Unabhängigkeit & ZGS

Statistik-Klausur vom

Hypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

Zeigen Sie mittles vollständiger Induktion, dass für jede natürliche Zahl n 1 gilt: k = n (n + 1) 2

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015

3 Konfidenzintervalle

3 Grundlagen statistischer Tests (Kap. 8 IS)

Zufallsvariablen [random variable]

3 Statistische Schätzungen

Biostatistik, Sommer 2017

Fit for Abi & Study Stochastik

Zentraler Grenzwertsatz/Konfidenzintervalle

Jost Reinecke. 7. Juni 2005

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen

Kapitel VII - Funktion und Transformation von Zufallsvariablen

Aufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten:

Statistik II. Statistische Tests. Statistik II

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Übung zu Empirische Ökonomie für Fortgeschrittene SS 2009

Definition Sei X eine stetige Z.V. mit Verteilungsfunktion F und Dichte f. Dann heißt E(X) :=

Webinar Induktive Statistik. - Wahrscheinlichkeitsrechnung - Stichprobentheorie

Konfidenzintervalle so einfach wie möglich erklärt

Statistik II. IV. Hypothesentests. Martin Huber

Grundbegriffe der Stochastik II

Die Familie der χ 2 (n)-verteilungen

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2002

6. Schätzverfahren für Parameter

Stochastik für die Naturwissenschaften

Kapitel 12 Stetige Zufallsvariablen Dichtefunktion und Verteilungsfunktion. stetig. Verteilungsfunktion

von x-würfeln bei wachsendem n? Zur Beantwortung führen wir ein Simulationsexperiment durch.

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

Klausur Mathematik 2, Teil Statistik und Finanzmathematik Lösungen

Statistische Methoden in den Umweltwissenschaften

Stetige Standardverteilungen

Wahrscheinlichkeitsfunktion. Binomialverteilung. Binomialverteilung. Wahrscheinlichkeitshistogramme

Kapitel 10 Mittelwert-Tests Einstichproben-Mittelwert-Tests 10.2 Zweistichproben Mittelwert-Tests

1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Kapitel 12 Stetige Zufallsvariablen Dichtefunktion und Verteilungsfunktion. stetig. Verteilungsfunktion

Klausur zu Statistik II

Der Erwartungswert E[g(X)] von g(x) ist definiert. g(x k )w(x = x k ),

Zeigen Sie mittles vollständiger Induktion, dass für jede natürliche Zahl n 1 gilt: n (2k 1) = n 2.

Statistik-Übungsaufgaben

Statistik II. IV. Hypothesentests. Martin Huber

1.5 Erwartungswert und Varianz

Einführung in die Induktive Statistik: Testen von Hypothesen

Klausur zur Vorlesung

Einführung in Quantitative Methoden


I. Deskriptive Statistik 1

Vergleich von Gruppen I

Grundlagen der Mathematik II (LVA U)

Transkript:

Stichproben Parameterschätzung Konfidenzintervalle: Beispiel Wahlprognose: Die Grundgesamtheit hat einen Prozentsatz p der Partei A wählt. Wenn dieser Prozentsatz bekannt ist, dann kann man z.b. ausrechnen, mit welcher Wahrscheinlichkeit in einer zufällig ausgewählten Gruppe von n Personen der relative Anteil r n der A-WählerInnen im Intervall [p ε ; p + ε] liegt. Oder zwischen welchen Grenzen [p ε ; p + ε] mit 99%iger Wahrscheinlichkeit der relative Anteil der A-WählerInnen liegen wird. Z.B.: Wir wissen, dass 30% der Bevölkerung A-Wähler sind. 50 Personen werden zufällig ausgewählt. Wie groß ist die Wahrscheinlichkeit, dass der relative Anteil der A-Wähler unter den 50 ausgewählten Personen zwischen 29 und 33% liegt? Bei der Wahlprognose ist es genau umgekehrt: Man kennt den Anteil p der A-WählerInnen in der Bevölkerung nicht. Man befragt n Personen, bestimmt den relativen Anteil r n der A-WählerInnen und möchte Aussagen über den relativen Anteil p der A-Wähler in der gesamten Bevölkerung machen. Es ist intuitiv klar, (1) dass der relative Anteil r n in der Stichprobe ungefähr dem relativen Anteil in der Gesamtbevölkerung entspricht. Wir können also den Anteil p der A- WählerInnen in der Gesamtbevölkerung durch den relativen Anteil r n der A-WählerInnen in der Stichprobe schätzen. (2) dass die Schätzung des unbekannten Anteils p umso genauer wird, je größer die Stichprobe ist. Das Ergebnis der Wahlprognose wird also ein Intervall liefern, das mit einer gewissen Genauigkeit den Anteil p der A-WählerInnen in der Grundgesamtheit voraussagt. Z.B.: Mit 99%iger Wahrscheinlichkeit liegt der Anteil p der A-WählerInnen eines Landes zwischen 37,5 und 40,2%. Das Ergebnis wird also ein Intervall [r n ε ; r n + ε] in dem der relative Anteil der Grundgesamtheit mit Wahrscheinlichkeit γ liegt. Ein solches Intervall heißt γ-konfidenzintervall.

Wir wollen die Aussagen (1) und (2) allgemein zeigen: Sei X eine Zufallsvariable, die eine bestimmte Größe misst (z.b.: das Gewicht eines Menschen) Wir wollen das Durchschnittsgewicht µ der Gesamtbevölkerung schätzen und ziehen dazu eine Stichprobe mit Größe n. Wir berechnen das arithmetische Mittel aus den Stichprobenwerten X = und berechnen dessen Erwartungswert: E( X) = Wenn wir viele Stichproben ziehen, dann ist der Durchschnitt der Stichprobenmittelwerte gleich dem Erwartungswert der Grundgesamtheit. Damit ist gezeigt, dass (1) zurecht angenommen werden darf. Var( X) = Damit ist (2) gezeigt. Wir können daher für das arithmetische Mittel einer zufälligen Stichprobe folgende wichtige Ergebnisse notieren: Sind X 1,...,X n unabhängige Zufallsvariable mit E(X i ) = µ und Var(X i ) = σ 2 i = 1,...,n dann gilt: E( X) = und Var( X) =

Spezialfall: Normalverteilte Zufallsvariable: ( ) Sind alle X i X i N(µ,σ 2 ), dann gilt: X N µ, σ 2 n normalverteilt mit Zentraler Grenzwertsatz: Folgen alle X i derselben Verteilung (aber nicht der Normalverteilung), dann unterscheidet ( ) sich bei hinreichend großem n die Verteilung von X kaum von N µ, σ 2 n Konfidenzintervall für den Erwartungswert einer normalverteilten Zufallsvariable bei bekannter Varianz σ 2 : Sei X der Mittelwert einer Stichprobe mit Größe n und σ 2 die Varianz der Zufallsvariable. Wir wissen, dass der Mittelwert der Stichprobe Für die Standardnormalverteilung gilt: ( ) P z = 1 α verteilt ist. ( ) Wenn wir X N µ, σ 2 n standardisieren, dann gilt: ( P ) = 1 α Jetzt können wir die Doppelungleichung im Inneren umformen und es entsteht: ( ) P = 1 α Anders aus gedrückt: Der Erwartungswert µ der Zufallsvariable X liegt mit Wahrscheinlichkeit (1 α) im Intervall: Möchte man wissen, wie groß die Stichprobe sein muss, um ein (1 α) Konfidenzintervall mit einer bestimmten Höchstlänge zu bekommen, so gilt:

Beispiel 1: Eine Maschine erzeugt Würste. Der Sollwert µ für die Masse der Würste kann an der Maschine eingestellt werden. Die Masse der von dieser Maschine produzierten Würste ist normalverteilt mit dem eingestellten Sollwert µ und einer Standardabweichung σ = 6g, weil die Maschine nicht genauer arbeiten kann. Die Maschine ist auf µ =250 g eingestellt. Es gibt Beschwerden von Konsumenten, die behaupten, die Würste seien zu leicht. Der Wursthersteller möchte überprüfen, ob die Maschine korrekt arbeitet und macht eine Stichprobe indem er 25 Würste abwiegt. Der Mittelwert der Stichprobe ergibt 247 g. (a) Gib ein 95%-Konfidenzintervall für das Durchschnittsgewicht der Würste von dieser Maschine an! D.h.: Ein 95%-Konfidenzintervall für den µ-wert mit dem die Maschine tatsächlich arbeitet (b) Bestimme die Stichprobengröße für ein 99%-Konfidenzintervall mit 3 g Breite für den Test der Abfüllanlage!

Beispiel 2: Für die Wahl in einer Stadt mit 1,5 Millionen Einwohnern wird eine Prognose erstellt. Dazu werden 400 zufällig ausgewählte Personen befragt. 125 Personen haben angegeben Partei A wählen zu wollen. (a) Gib an zwischen welchen Werten der Anteil der A-Wähler der Stadt mit i. 95%iger ii. 99%iger Wahrscheinlichkeit liegen wird! (95%-Konfidenzintervall und 99%-Konfidenzintervall) (b) Wieviele Personen müsste man befragen, um den Anteil der A- Wähler mit i. 95%iger ii. 99%iger auf 1% bzw. ±2% genau vorauszusagen.

Exkurs: Verteilung des Mittelwerts einer normalverteilten Zufallsvariable bei unbekannter Varianz Ist die Varianz einer normalverteilten Zufallsvariable unbekannt, so kann sie mit der empirischen Varianz Sn 1 2 = 1 n n 1 (X i X) 2 i=1 geschätzt werden. Man kann zeigen, dass E ( S 2 n 1) = σ 2 Standardisiert man die Zufallsvariable X wie eine normalverteilte Zufallsvariable, so entsteht die Zufallsvariable T = X µ = X µ S 2 n mit s = n n 1 s 1 n 1 n (X i X) 2 i=1 Die Zufallsvariable T folgt der sogenannten Studentverteilung mit d f = n 1 Freiheitsgraden. (Kurz: t n 1 -Verteilung) Die t n -Verteilungen sind symmetrisch und werden mit großem n der N(0, 1) Verteilung sehr ähnlich.

Beispiel 3: Ein Konsument schreibt eine Woche lang die auf ganze Euro gerundete Summe für seine täglichen Einkäufe auf und möchte daraus abschätzen, welchen Betrag er pro Jahr für tägliche Konsumgüter ausgibt. Folgende Summen sind entstanden: 27, 38, 21, 55, 31 X = 34.4 s = (34.4 27) 2 + (34.4 38) 2 + (34.4 21) 2 + (34.4 55) 2 + (34.4 31) 2 4 = 13.069 (a) Gib ein 90%-Konfidenzintervall für die täglichen Ausgaben des Konsumenten an! (b) Gib ein 95%-Konfidenzintervall für die täglichen Ausgaben des Konsumenten an! (c) Schätze die jährlichen Ausgaben ab!

Exkurs: Konfidenzintervall für die Differenz zweier Erwartungswerte von Sei normalverteilten ZV bei bekannten Varianzen σ 1 und σ 2 E( X 1 ) = µ 1, E( X 2 ) = µ 2 Var( X 1 ) = σ 2 1 n 1, Var( X 2 ) = σ 2 2 n 2 Mit den Rechenregeln für Zufallsvariablen erhalten wir: E( X 1 X 2 ) = E( X 1 ) E( X 2 ) = µ 1 µ 2 Var( X 1 X 2 ) = Var( X 1 ) +Var( X 1 ) = σ 2 1 n 1 + σ 2 2 n 2 σ D = σ 2 1 n 1 + σ 2 2 n 2... Standardabweichung der Differenz der Stichprobenmittelwerte Weil X 1 und X 2 normalverteilt sind, ist die Differenz der Stichprobenmittelwerte ( X 1 X 2 ) N( X 1 X 2,σ 2 D) Wir können in die Formel für das Konfidenzintervall für den Erwartungswert einer normalverteilten Zufallsvariable mit bekannter Varianz einsetzen und erhalten für ein (1 α)-konfidenzintervall für (µ 1 µ 2 ): [ ( X 1 X ( 2 ) Q N 1 α ) σ D, ( X 1 X ( 2 ) Q N 1 α ) ] σ D 2 2 Bemerkung: Auf Grund des zentralen Grenzwertsatzes kann bei großen n 1 und n 2 die Voraussetzung dass die ZV normalverteilt sind, entfallen.

Beispiel 4: Um herauszufinden, ob die Kopfhaardichte von Schwarzhaarigen oder von Blonden höher ist wurde bei 10 blonden und 12 schwarzhaarigen Personen jeweils die Anzahl der Haare auf einem cm 2 an einer bestimmten Stelle des Kopfs gezählt. Die Ergebnisse sind in der folgenden Tabelle zusammengefasst: X s 2 Schwarzhaarige 174, 204, 196, 195, 180, 206, 176, 200, 209, 186, 182, 199 192.25 147.8 Blonde 199, 229, 200, 203, 224, 200, 182, 190, 182, 193 200.2 247.1 Gib ein 95%-Konfidenzintervall für den Erwartungswert der Differenz der Mittelwerte an!