von x-würfeln bei wachsendem n? Zur Beantwortung führen wir ein Simulationsexperiment durch.

Ähnliche Dokumente
Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Ein möglicher Unterrichtsgang

$ % + 0 sonst. " p für X =1 $

13.5 Der zentrale Grenzwertsatz

R ist freie Software und kann von der Website.

Bei vielen Zufallsexperimenten interessiert man sich lediglich für das Eintreten bzw. das Nichteintreten eines bestimmten Ereignisses.

5. Schließende Statistik Einführung

Beispiel Zusammengesetzte Zufallsvariablen

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = ,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Genexpression. Expression eines einzelnen Gens. Expressionsmessung. Genexpressionsmessung. Transkription (Vorgang) Genexpression

9. Schätzen und Testen bei unbekannter Varianz

RUPRECHTS-KARLS-UNIVERSITÄT HEIDELBERG

Statistische Thermodynamik I Lösungen zur Serie 1

Statistik II für Betriebswirte Vorlesung 3

Übungsrunde 7, Gruppe 2 LVA , Übungsrunde 7, Gruppe 2, Markus Nemetz, markus.nemetz@tuwien.ac.at, TU Wien, 11/2006

1 Verteilungen und ihre Darstellung

Übungen zur Mathematik für Pharmazeuten

Ausarbeitung des Seminarvortrags zum Thema

Monte-Carlo Simulation

Computational Finance

Zufallsgrößen. Vorlesung Statistik für KW Helmut Küchenhoff

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

11 Diskrete Zufallsvariablen

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Klausur: Einführung in die Statistik

Sozialwissenschaftliche Methoden und Statistik I

Nachholklausur STATISTIK II

3.3. Aufgaben zur Binomialverteilung

MA Projekt: Langfristige Kapitalmarktsimulation

Klausur Statistik Lösungshinweise

Statistische Auswertung der Daten von Blatt 13

Monty Hall-Problem. Wochen 3 und 4: Verteilungen von Zufallsvariablen. Lernziele. Diskrete Verteilungen

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

Mathematische und statistische Methoden II

Teil I Beschreibende Statistik 29

Stichprobenauslegung. für stetige und binäre Datentypen

q = 1 p = k k k = 0, 1,..., = [ ] = 0.678

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

4. Versicherungsangebot


Statistik im Versicherungs- und Finanzwesen

Statistik im Bachelor-Studium der BWL und VWL

Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall

Aufgabe 1 10 ECTS. y i x j gering mittel hoch n i Hausrat KFZ Unfall Reiserücktritt n j

Statistik I für Betriebswirte Vorlesung 5

Konfidenzintervalle so einfach wie möglich erklärt

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Analyse von Zeitreihen in der Umweltphysik und Geophysik Stochastische Prozesse

Statistik - Fehlerrechnung - Auswertung von Messungen

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

Forschungsstatistik I

Betriebswirtschaftliche Blätter Fachzeitschrift

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50, ,5 51,7 48,8

Die Binomialverteilung

Grundlagen Wahrscheinlichkeitsrechnung, Statistik

Beispiel: Sonntagsfrage. Einführung in die induktive Statistik. Statistische Tests. Statistische Tests

Einführung in die Statistik

Die Pareto Verteilung wird benutzt, um Einkommensverteilungen zu modellieren. Die Verteilungsfunktion ist

Kursthemen 12. Sitzung. Spezielle Verteilungen: Warteprozesse. Spezielle Verteilungen: Warteprozesse

Musterlösung zum Projekt 3: Splice Sites

Bisher angenommen: jeder Spieler kennt alle Teile des Spiels. - Diskontfaktor des Verhandlungspartners

Gesucht: wie viele Mitarbeiter sind max. durch Ziffernfolge unterscheidbar. Lösung: Möglichkeiten; Reihenfolge und MIT Zurücklegen- also = = 6561


Anleitung zum Physikpraktikum für Oberstufenlehrpersonen Fehlerrechnung und Statistik (FR) Herbstsemester 2015

Statistik II für Betriebswirte Vorlesung 2

i x k k=1 i u i x i v i 1 0, ,08 2 0, ,18 3 0, ,36 4 0, ,60 5 1, ,00 2,22 G = n 2 n i=1

MATHEMATISCHE ANALYSE VON ALGORITHMEN

Bestimmen der Wahrscheinlichkeiten mithilfe von Zählstrategien

y P (Y = y) 1/6 1/6 1/6 1/6 1/6 1/6

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Präsenzübungsaufgaben zur Vorlesung Elementare Sachversicherungsmathematik

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Statistischer Mittelwert und Portfoliorendite

Beispiele zur UE Wirtschaftsstatistik 1 bei Nagel

Stochastische Eingangsprüfung,

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/

TI-84 im Mathematikunterricht Stand:

Versuch: Zufälliges Ziehen aus der Population

Materialien zur Vorlesung. Rendite und Risiko

Klassische Risikomodelle

Einführung in die Geostatistik (2) Fred Hattermann (Vorlesung), Michael Roers (Übung),

Jetzt lerne ich Stochastik für die Oberstufe

9. StatistischeTests. 9.1 Konzeption

Willkommen zur Vorlesung Statistik (Master)

Monte Carlo Simulation (Grundlagen)

Überblick über die Tests

Analog definiert man das Nichteintreten eines Ereignisses (Misserfolg) als:

Kugel-Fächer-Modell. 1fach. 3fach. Für die Einzelkugel gibt es 3 Möglichkeiten. 6fach. 3! Möglichkeiten

Varianzanalyse ANOVA

Stetige Verteilungsmodelle

Monte Carlo Methoden in Kreditrisiko-Management

1. Einführung in die Statistik. 2. Wohin geht die Reise? Worum geht es?

Standardab er des. Testwert = % Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere

15.4 Diskrete Zufallsvariablen

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

Gewinnchancen und Gewinnerwartung

1 Von den Ereignissen U und V eines Zufallsexperiments kennt man die Eigenschaften (1) bis (3) :

Kapitel 13 Häufigkeitstabellen

Transkript:

Zentraler Grenzwertsatz Die Normalverteilung verdankt ihre universelle theoretische und praktische Bedeutung dem zentralen Grenzwertsatz. Unabhängig von der konkreten k Ausgangsverteilung konvergiert nämlich die Verteilungsfunktion einer Summe gegen die Normalverteilung. (sehr grob formuliert) Ist die Anzahl der Summanden (n) hinreichend groß, so kann in der Prais die Verteilung einer Summe durch die Normalverteilung approimiert werden. Die Frage, ab wann n hinreichend groß ist, hängt von der gewünschten Genauigkeit und der Form der Ausgangsverteilung ab. Statistik für SoziologInnen 1 Zentraler Grenzwertsatz Verteilung von Summen Beispiel: Würfelwurf Frage: Wie verhält sich die Verteilung der Augensumme von -Würfeln bei wachsendem n? Zur Beantwortung führen wir ein Simulationseperiment durch. 6 Würfe mit 1 Würfel 6 Würfe mit 2 Würfel 6 Würfe mit 3 Würfel etc. http://www.stat.sc.edu/~west/javahtml/clt.html Statistik für SoziologInnen 2 Zentraler Grenzwertsatz

Augensumme von 1 Wuerfel - n=6 2 4 6 8 1 1 2 3 4 5 6 Wahrscheinlichkeitsfunktion der Augensumme Statistik für SoziologInnen 3 Zentraler Grenzwertsatz Augensumme von 2 Wuerfel - n=6 2 4 6 8 2 4 6 8 1 12 Wahrscheinlichkeitsfunktion der Augensumme Statistik für SoziologInnen 4 Zentraler Grenzwertsatz

Augensumme von 3 Wuerfel - n=6 2 4 6 8 5 1 15 Wahrscheinlichkeitsfunktion der Augensumme Statistik für SoziologInnen 5 Zentraler Grenzwertsatz Augensumme von 5 Wuerfel - n=6 2 4 6 1 15 2 25 Wahrscheinlichkeitsfunktion der Augensumme Statistik für SoziologInnen 6 Zentraler Grenzwertsatz

4 5 Augensumme von 1 Wuerfel - n=6 1 2 3 2 25 3 35 4 45 5 Wahrscheinlichkeitsfunktion der Augensumme Statistik für SoziologInnen 7 Zentraler Grenzwertsatz 8 1 Augensumme von 5 Wuerfel - n=6 2 4 6 14 16 18 2 Wahrscheinlichkeitsfunktion der Augensumme Statistik für SoziologInnen 8 Zentraler Grenzwertsatz

Zentraler Grenzwertsatz Seien X 1, X 2,..., X n identisch verteilte, unabhängige Zufallsvariablen mit E(X i ) = und V(X i ) = ²> Dann gilt für die Verteilung Summe S n = X 1 + X 2 +... + X n Erwartungswert E(S n ) = n und Varianz V(S n ) = n². Statistik für SoziologInnen 9 Zentraler Grenzwertsatz Zentraler Grenzwertsatz Seien X 1, X 2,..., X n identisch verteilte, unabhängige Zufallsvariablen mit E(X i ) = und V(X i ) = ²> Dann konvergiert die Verteilung der standardisierten Summe X n i Z n n 2 mit wachsendem n gegen eine Normalverteilung mit Erwartungswert E(Z n ) = und Varianz V(Z n ) = 1. Z n ~ N(, 1²) Statistik für SoziologInnen 1 Zentraler Grenzwertsatz

Beispiel Wahrscheinlichkeitsfunktion für die Anzahl der Verkäufe pro Tag eines bestimmten Produkts sei bekannt,5,4 X 1 2 3,3,2 Prob,4,3,2,1,1 Wie ist die Anzahl der Verkäufe pro 1 Tage (X1) verteilt, wenn die einzelnen Verkaufstage als unabhängig angesehen werden können? X1=X 1 +X 2 +...X 1 1 2 3 Statistik für SoziologInnen 11 Zentraler Grenzwertsatz Beispiel (Fortsetzung) X 1 2 3 Prob,4,3,2,1 X*Prob 3,3 4,4,3 ==> E(X)=1 X²*Prob,3,8,9 ==> E(X²)=2 V(X) = 2-1² = 1 E(X1)=1 V(X1)=1 X1~N(1, 1) z.b.: P(X1>12) = 1-F N ((12-1)/1) = 1-F N (2)=,23 Statistik für SoziologInnen 12 Zentraler Grenzwertsatz

Beispiel (Fortsetzung) Wie lautet das zentrale Schwankungsintervall, für das gilt, dass der Verkauf an 1 Tagen mit einer Wahrscheinlichkeit von 5% in diesem Intervall zu liegen kommt? P( u <X1< o )=,5 P(z,25 <(X1-1)/1<z,75 )=,5 P(-,674<(X1-1)/1<,674)=,5 93,26,5 16,74 P(93,26<X<16,74)=,5 Statistik für SoziologInnen 13 Zentraler Grenzwertsatz Anwendung des zentralen Grenzwertsatzes auf Mittelwert Seien X 1, X 2,..., X n identisch verteilte, unabhängige Zufallsvariablen mit E(X i ) = und V(X i ) = ²> Dann gilt für die Verteilung des arithmetischen Mittels n = 1/n(X 1 + X 2 +... + X n ) Erwartungswert E( n ) = und Varianz V( n ) = ²/n. i) Auch das arithmetisch Mittel ist dann eine Zufallsvariable ii) Die Standardabweichung des arithm. Mittels wird auch Standardfehler bezeichnet Statistik für SoziologInnen 14 Zentraler Grenzwertsatz

Anwendung des zentralen Grenzwertsatzes auf Mittelwert Seien X 1, X 2,..., X n identisch verteilte, unabhängige Zufallsvariablen mit E(X i ) = und V(X i ) = ²> Dann konvergiert die Verteilung des standardisierten Mittelwertes 1 Xi n Zn 2 2 / n /nn mit wachsendem n gegen eine Normalverteilung mit Erwartungswert E(Z n ) = und Varianz V(Z n ) = 1. Z n ~ N(, 1²) Statistik für SoziologInnen 15 Zentraler Grenzwertsatz Standardfehler Die Varianz bzw. die Standardabweichung des arithmetischen Mittels ergibt sich also durch: 2 2 / n 2 / n / n Der Mittelwert schwankt weniger stark als die Einzelwerte Die Standardabweichung des Mittelwertes wird auch als Standardfehler (standard error) bezeichnet. Wurzel-n Gesetz: Doppelte Genauigkeit benötigt vierfachen Stichprobenumfang! Statistik für SoziologInnen 16 Zentraler Grenzwertsatz

Beispiel (1) Canadian Survey of Labour and Income Dynamics Stundenlohn von n = 4.147 Angestellten Frequency 2 4 6 8 1 12 Min. 23 2.3 1st Qu. 9.23 Median 14.9 Mean 15.55 3rd Qu. 19.8 Ma. 49.92 1 2 3 4 5 Lohn Statistik für SoziologInnen 17 Zentraler Grenzwertsatz Beispiel (2) Var(Lohn) = 62,14 Std.Abw.(Lohn) = 7,88 VC = 5,7% 3 4 5 1 2 Gedanken-Eperiment: Angenommen anstelle der Gesamtheit hätten wir nur 1 Stichprobe des Umfangs von n=1 Was könnten wir daraus über den Durchschnittslohn lernen? Statistik für SoziologInnen 18 Zentraler Grenzwertsatz

Eine konkrete Stichprobe sample(lohn, 1) 7. 28.32 14.89 23.81 9.2 28.8 7.8 2. 24.96 1. 13.6 11.5 11.71 6.3 25.8 1. 9.49 13.9 23.81 25.81 11.52 6.49 6.75 28.32 21.94 29.24 17.76 19.2 15.12 13. 13.44 16.3 27.36 18.25 29.54 11.43 14.21 17. 33.18 6.65 9.25 14.73 9.1 4.2 16.22 6.35 41.28 7. 9.61 24. 18.57 1.11 6.97 2.88 23.46 12.65 14.85 12. 19.68 18.2 19.84 28.56 27.9 14. 6.8 21.6 14.4 14. 11.64 39. 11.9 19.2 12. 1. 9.33 17.4 18. 21.88 13.56 22.77 6.7 15. 7.4 2.64 2. 3.88 25.6 19.68 7.45 36.25 13.62 14.36 19.2 1.56 7.5 18.92 17.55 6.5 14.51 11.5 Mean = 16.5651 Wir haben für die Stichprobe zufällig n=1 von 4.147 Personen ausgewählt. Der Stichprobenmittelwert liegt rund 1$ über dem wahren Mittelwert. Offensichtlich waren in dieser konkreten Stichprobe gut verdienende Personen überrepräsentiert. Was würde passieren, wenn wir nicht eine Stichprobe sondern viele verschiedene Stichproben ziehen würden? Wir bekommen dann natürlich viele verschiedene Stichprobenmittelwerte! Statistik für SoziologInnen 19 Zentraler Grenzwertsatz Wiederholte Stichproben In der Folge betrachten wir 1. zufällige Stichproben vom Umfang n=1. Jeder dieser Stichproben liefert natürlich im allgemeinen einen individuellen id Wert für den Durchschnittslohn. h h Aus der Analyse dieser 1. verschiedenen Schätzwerte für den Durchschnittslohn können wir allgemeine Eigenschaften erkennen, die die zuvor dargestellten theoretischen Ergebnisse bestätigen und transparent machen. In der Prais liegt ja nur eine Stichprobe vor, weshalb wir uns auf die Theorie verlassen müssen! Statistik für SoziologInnen 2 Zentraler Grenzwertsatz

Analyse von 1. Stichproben mit Umfang n=1 Density.5.1.2.3.4. Histogramm der 1. Mittelwerte Min. 13.37 Mean 15.5353 Ma. 18.77 Var.6 Stand.Abw..77 13 14 15 16 17 18 19 sm Statistik für SoziologInnen 21 Zentraler Grenzwertsatz Analyse von 1. Stichproben mit Umfang n=1 Im Durchschnitt treffen wir mit unseren Stichproben den unbekannten Durchschnittslohn der Gesamtheit (15,55) mit 15,53 sehr genau. Im Einzelfall einer Stichprobe können wir aber auch deutlich daneben liegen (13,37 bis 18,77), daher sollten wir bei einer Stichprobe nicht einfach nur den Mittelwert kommunizieren, sondern auch die Unsicherheit aufgrund der Tatsache, dass es ein Stichprobenergebnis ist. Die Verteilung der arithmetischen Mittelwerte entspricht einer Normalverteilung. Die Standard-Abweichung der Mittelwerte (,77) bezeichnen wir als Standardfehler. Er erlaubt uns zu quantifizieren, wie genau wir mit einer Stichprobe von n Elementen liegen. Beachte: die Standard-Abweichung der Einzelwerte beträgt 7.88. Die Formel für den Standardfehler ist die Standard-Abweichung der Einzelwerte dividiert durch die Wurzel aus dem Stichprobenumfang 7,78/Wurzel(1)=,778 was sehr nahe an unserem Wert liegt Statistik für SoziologInnen 22 Zentraler Grenzwertsatz

Beispiel Das mittlere Haushaltseinkommen in einer Stadt betrage 32.6,- mit einer Standardabweichung von 6.2,-. Für eine empirische Untersuchung wird eine Zufallsstichprobe von n=4 Haushalten gezogen. g Wie hoch ist die Wahrscheinlichkeit, in der Stichprobe ein mittleres Jahreseinkommen von weniger als 32.,- zu beobachten? 4 N(32.6;6.2² / 4) E ( ) 32.6 V ( ) 6.2² / 4 96.1 4 4 96.1 31 32. 32.6 P ( 4 32.) ( ) ( 1,935),26 31 Beachte: Einkommen sind typischerweise rechtsschief verteilt, dennoch können wir unter der Annahme von n identisch verteilten unabhängigen Realisierungen einer ZV für das arithmetische Mittel die Normalverteilung heranziehen Statistik für SoziologInnen 23 Zentraler Grenzwertsatz Beispiel Wie hoch ist die Wahrscheinlichkeit, in der Stichprobe von n=4 Haushalten ein mittleres Jahreseinkommen zu beobachten, dass nur um 5 vom wahren Wert in der Grundgesamtheit abweicht? [- also zwischen 32.1,- und 33.1,- zu liegen kommt] 4 N(32.6;6.2² / 4) E ( ) 32.6 V ( ) 6.2² / 4 96.1 4 4 96.1 31 33.1 32.6 32.1 32.6 P (32.1 4 33.1) ( ) ( ) 31 31 (1,613) ( 1,613),893 http://onlinestatbook.com/stat_sim/sampling_dist/inde.html Statistik für SoziologInnen 24 Zentraler Grenzwertsatz

Beispiel Wie hoch ist die Wahrscheinlichkeit, in der Stichprobe von n=4 Haushalten ein mittleres Jahreseinkommen zu beobachten, dass nur um 25 vom wahren Wert in der Grundgesamtheit abweicht? [- also zwischen 32.35,- und 32.85,- zu liegen kommt] 4 N(32.6;6.2² / 4) E ( ) 32.6 V ( ) 6.2² / 4 96.1 4 4 96.1 31 32.85 32.6 32.35 32.6 P (32.3535 4 32.85) ( ) ( ) 31 31 (,86) (,86),58 Statistik für SoziologInnen 25 Zentraler Grenzwertsatz Gesetz der großen Zahlen Eng verwandt mit dem zentralen Grenzwertsatz ist, das Gesetz der großen Zahl Das schwache Gesetz der großen Zahlen lautet: P ( ) für n n Vereinfacht formuliert bedeutet das Gesetz der großen Zahlen, dass mit wachsendem n (Stichprobenumfang), die Wahrscheinlichkeit für eine Abweichung des Stichprobenmittelwertes vom Erwartungswert der Grundgesamtheit (), welche absolut größer als ist, gegen null geht. Statistik für SoziologInnen 26 Zentraler Grenzwertsatz

Beispiel: durchschnittliche Lottozahl Beim Lotto 6 aus 45 werden die Zahlen 1-45 gleichverteilt gezogen. Der Mittelwert einer Ziehung liegt theoretisch bei 23 [(45+1)/2] Bei einzelnen Ziehungen schwankt dieser Mittelwert deutlich. Der Mittelwert über alle 9 Ziehungen des Jahres 23 beträgt 23,7. Der Mittelwert über alle 1218 Ziehungen beträgt 23,9. LOTTO Zahlen 23 Datum Rd Zahlen Mittelwert 1.1. Mi 6 7 13 15 23 33 16,17 5.1. So 5 13 19 25 4 41 23,83 8.1. Mi 7 1 12 22 34 43 21,33 12.1. So 2 7 12 25 4 42 21,33 15.1. Mi 12 14 16 24 31 34 21,83 19.1. So 8 13 28 32 34 39 25,67 22.1. Mi 8 1 2 23 38 41 23,33 26.1. So 17 18 29 38 4 44 31, 29.1. Mi 6 7 12 18 3 43 19,33 2.2. So 2 3 13 15 3 36 16,5 5.2. Mi 3 9 14 18 28 3 17, 9.2. So 17 19 27 31 4 45 29,83 12.2. Mi 4 11 24 33 34 41 24,5 16.2. So 7 8 12 19 25 38 18,17 19.2. Mi 2 5 19 29 4 44 23,17 Statistik für SoziologInnen 27 Zentraler Grenzwertsatz Grenzwertsatz von De Moivre und Laplace Falls X binomialverteilt ist mit den Parametern n und p [es sei also X~Bi(n, p)] so gilt: X np np ( 1p) N(,) 1 Die Güte der Anpassung hängt dabei von n und p ab. (Wenn p nahe 1/2 und n möglichst groß ist, so steigt die Güte) Faustregel: np>1 und n(1-p)>1 Statistik für SoziologInnen 28 Zentraler Grenzwertsatz

.8 1. n= 1 p=.5..2.4.6 2 4 6 8 1 Statistik für SoziologInnen 29 Zentraler Grenzwertsatz.8 1. Im Vergleich zum vorherigen Bild hat sich die Anpassung verbessert. n= 2 p=.5..2.4.6 4 6 8 1 12 14 16 Statistik für SoziologInnen 3 Zentraler Grenzwertsatz

.4.6.8 1. n= 2 p=.1 Im Vergleich zum vorherigen Bild hat sich die Anpassung wieder verschlechtert..2 1 2 3 4 5 6 Statistik für SoziologInnen 31 Zentraler Grenzwertsatz n= 1 p=.1.4.6.8 1. Sehr gute Anpassung..2 5 1 15 2 Statistik für SoziologInnen 32 Zentraler Grenzwertsatz

Beispiel: Prognose des Rücklaufs Bei einer bestimmten schriftlichen Befragung weiß man aus Erfahrung, dass etwa 2% der Befragten tatsächlich antworten. Es werden n=5. Fragebogen g versandt. X sei die Anzahl der Antworter Var(X)=5.*,2*,8 X~N(1., 8) Std.Abw. =28 Mehr als 1. Antworten: P(X>1.) =,5 Mehr als 1.2 Antworten: P(X>1.2) =, 95% Intervall für die Anzahl der zu erwartenden Antworten: P(1-1,96*28<X<1+1,96*28) =,95 P(945<X<155) =,95 Statistik für SoziologInnen 33 Zentraler Grenzwertsatz y.12.14.4.6.8.1..2 n= 5 p=.2 y.8 1. 2.4.6..2 n= 5 p=.2 95 1 15 95 1 15 Statistik für SoziologInnen 34 Zentraler Grenzwertsatz

.4 n= 5 p=.2.8 1. n= 5 p=.2 y..1.2.3 y..2.4.6 7 8 9 1 11 12 13 7 8 9 1 11 12 13 Statistik für SoziologInnen 35 Zentraler Grenzwertsatz.12.14 n= 5 p=.2.8 1. n= 5 p=.2..2..2 y.4.6.8.1 y.4.6 5 1 15 5 1 15 Statistik für SoziologInnen 36 Zentraler Grenzwertsatz

.4 n= 5 p=.2.8 1. n= 5 p=.2....2 y 1.2.3 y.4.6-2 -1 1 2 3 4-2 -1 1 2 3 4 Statistik für SoziologInnen 37 Zentraler Grenzwertsatz Stetigkeitskorrektur 5, np 5, np PX ( ) np( 1 p) np( 1 p) bzw. 5, np PX ( ) np( 1 p) Bei der Approimation der Binomialverteilung (diskrete ZV) durch die Normalverteilung (stetgige ZV) ist eine Stetigkeitskorrektur (Kontinuitätskorrektur) zu berücksichtigen. Statistik für SoziologInnen 38 Zentraler Grenzwertsatz

Beispiel: In einer Bevölkerung sind 6% der Bürger für die Einführung eines neuen Gesetzes. Wie wahrscheinlich ist es, genau 5 Befürworter in einer Stichprobe vom Umfang n=1 zu haben? Binomialverteilung PX ( ) *, *,, 1 5 5 5 6 4 13 5 Normalverteilung 5. 5 6 5. 5 6 PX ( 5) 24 24 ( 1939, ) ( 2, 143), 262, 16, 12 Statistik für SoziologInnen 39 Zentraler Grenzwertsatz Beispiel: In einer Bevölkerung sind 6% der Bürger für die Einführung eines neuen Gesetzes. Wie groß ist die Wahrscheinlichkeit, dass sich in einer Stichprobe von 1 (1) Personen, weniger als 5 (5) Befürworter des Gesetzes finden? a) Binomialverteilung mit n=1 und p=.6 P(X<5)=P(X=) + P(X=1) +... + P(X=4)=.+ +.22 +.11+ 11+.42+ 42+.111=.166 (Eaktes Ergebnis durch Einsetzen in die Formel der Binomialverteilung) Statistik für SoziologInnen 4 Zentraler Grenzwertsatz

Beispiel: b) Bei einer Stichprobe von n=1 gibt es 2 Lösungswege: b1) Einsetzen in die Formel der Binomialverteilung mit n=1 und p=.6 P(X<5)=P(X=) + P(X=1) +... + P(X=49)=.168 b2) Approimation durch Normalverteilung X~N(6; 24) n.p=1*,6=6 np(1p)=6* n.p.(1-p)=6,4=24 Wurzel(n.p.(1-p))=4,899 P(X 49) = F N ((49+,5-6)/4,899)= F N (-2,14)=,16 Statistik für SoziologInnen 41 Zentraler Grenzwertsatz,3,3,25,25,2,2,15,15,1,1,5 1 2 3 4 5 6 7 8 9 1,5, 6 12 18 24 3 36 42 48 54 6 66 72 78 84 9 96 Normalverteilung Binomialverteilung Anzahl Prob. kum. Prob. Anzahl kum. Prob. 49,,68,168 49,,124 49,5,16 5,,13,271 5,,26 Statistik für SoziologInnen 42 Zentraler Grenzwertsatz

Bernoullis Gesetz der großen Zahlen Überträgt man das schwache Gesetz der großen Zahlen auf die n-malige Durchführung eines Bernouilli-Eperimentes mit konstanter Wahrscheinlichkeit p, dann gilt für die relative Häufigkeit f n : P( f p ) für n n Vereinfacht formuliert bedeutet dies, dass mit wachsendem n (Stichprobenumfang), die Wahrscheinlichkeit für eine Abweichung der relativen Häufigkeit von der konstanten Erfolgswahrscheinlichkeit, welche absolut größer als ist, gegen null geht. Statistik für SoziologInnen 43 Zentraler Grenzwertsatz Gesetz der großen Zahlen Das Gesetz der großen Zahlen besagt, dass sich die relative Häufigkeit der Erfolge bei Wiederholung eines Bernoulli-Zufallseperiments immer weiter an die theoretisch ti h erwartete t Erfolgswahrscheinlichkeit h li hk it p annähert, je häufiger das Zufallseperiment durchgeführt wird. Beachte: Dies gilt nicht für die absolute Anzahl der Erfolge! Sei X n die Anzahl der Erfolge bei n unabhängigen Wiederholungen, so gilt V(X n )=n.p.(1-p). Sei f n die relative Häufigkeit der Erfolge bei n unabhängigen Wiederholungen, so gilt f n =X n /nv(f n )=p.(1-p)/n Statistik für SoziologInnen 44 Zentraler Grenzwertsatz

Kein absoluter Ausgleich Entwicklung des Anteils der Erfolge 7,% 65,% 6,% 55,% 5,% 45,% Die Schwankungsbreite für die absolute Abweichung nimmt beständig zu. 4,% 35,% beobachteter Anteil UG ANTEIL OG ANTEIL 6 Entwicklung der Anzahl der Erfolge 3,% 2 4 6 8 1 12 5 Die relative Häufigkeit it wird immer genauer. Anzahl der Erfolge 4 3 2 1 beobachtete Anzahl UG ANZAHL OG ANZAHL ERWARTUNG 4 8 12 Anzahl der Münzwürfe Statistik für SoziologInnen 45 Zentraler Grenzwertsatz,5 5, 4,,25 3, 2, 1,,, -1, -,25-2, -3, relative Abweichung absolute Abweichung -4, -,5-5, 2 4 6 8 1 12 Statistik für SoziologInnen 46 Zentraler Grenzwertsatz