Zenraler Grenzwertsatz

Ähnliche Dokumente
Prof. Dr. Roland Füss Statistik II SS 2008

Klausur vom

Eingangsprüfung Stochastik,

Konvergenz von Folgen reeller Zufallsvariablen

Einführung in die Stochastik 10. Übungsblatt

4 Konvergenz von Folgen

Testen statistischer Hypothesen

Praktikum Vorbereitung Fertigungsmesstechnik Statistische Qualitätskontrolle

$Id: reihen.tex,v /06/14 13:59:06 hk Exp $

Aussage über die Verteilung Summen und Durchschnitte beliebig verteilter Zufallsvariablen

7. Grenzwertsätze Grenzwertsätzen Zentraler Grenzwertsatz Gesetz der großen Zahlen Tschebyscheffsche Ungleichung

TECHNISCHE UNIVERSITÄT MÜNCHEN

Zahlenfolgen und Konvergenzkriterien

Kapitel 5: Schließende Statistik

Kapitel 11. Zentrale Grenzwertsätze Lokaler Grenzwertsatz von Moivre-Laplace

Einführung in die Statistik

Übungsblatt 9 zur Vorlesung. Statistische Methoden

Statistik Einführung // Konfidenzintervalle für einen Parameter 7 p.2/39

Die erste Zeile ("Nummerierung") denkt man sich also dazu. Häufig wird eine Indexschreibweise benutzt um ein Folgenglied zu kennzeichnen.

Tutorium Mathematik I, M Lösungen

Aufgaben und Lösungen Ausarbeitung der Übungsstunde zur Vorlesung Analysis I

Übungsblatt 1 zur Vorlesung Angewandte Stochastik

6. Übungsblatt Aufgaben mit Lösungen + Selbsttest-Auflösung

Musterlösung zu Blatt 8 der Vorlesung Analysis I WS08/09

Aufgaben und Lösungen Weihnachtsgeschenke zur Vorlesung Analysis I

Nachklausur - Analysis 1 - Lösungen

1.2. Taylor-Reihen und endliche Taylorpolynome

n (n + 1) = 1(1 + 1)(1 + 2) 3 Induktionsschritt: Angenommen die Gleichung gilt für n N. Dann folgt: 1 2 = 2 =

Pflichtlektüre: Kapitel 10 Grundlagen der Inferenzstatistik

Übungen zur Infinitesimalrechnung 2, H.-C. Im Hof 19. März Blatt 4. Abgabe: 26. März 2010, Nachmittag. e x2 dx + e x2 dx = 2 e x2 dx

2 Vollständige Induktion

5.3 Wachstum von Folgen

2.3 Kontingenztafeln und Chi-Quadrat-Test

15.4 Diskrete Zufallsvariablen

Konfidenzintervall_fuer_pi.doc Seite 1 von 6. Konfidenzintervall für den Anteilswert π am Beispiel einer Meinungsumfrage

6 Folgen. 6.4 Folgen reeller Zahlen. Mathematik für Informatiker B, SS 2012 Dienstag 5.6. $Id: folgen.tex,v /06/05 11:12:18 hk Exp $

Stochastik für WiWi - Klausurvorbereitung

Kovarianz und Korrelation

Statistische Modelle und Parameterschätzung

Güteeigenschaften von Schätzern

Nennenswertes zur Stetigkeit

Methoden zur Konstruktion von Schätzern

von solchen Abbildungen. Eine solche Folge bestimmt für jedes x M die Folge der Werte f n. Schreibt man dies noch einmal formal hin, so erhält man:

Kapitel 4: Stationäre Prozesse

TESTEN VON HYPOTHESEN

Es werden 120 Schüler befragt, ob sie ein Handy besitzen. Das Ergebnis der Umfrage lautet: Von 120 Schülern besitzen 99 ein Handy.

i=0 a it i das erzeugende Polynome von (a 0,..., a j ).

Statistik I Februar 2005

Übungen zur Vorlesung Funktionentheorie Sommersemester Musterlösung zu Blatt 0

2 Differentialrechnung und Anwendungen

Grenzwertsätze, Gesetze der Großen Zahl(en)

Wissenschaftliches Arbeiten Studiengang Energiewirtschaft

Momente der Logarithmischen Normalverteilung

Seminar: Randomisierte Algorithmen Routenplanung in Netzwerken

14 Statistische Beziehungen zwischen nomi nalen Merkmalen

Evaluierung einer Schulungsmaßnahme: Punktezahl vor der Schulung Punktezahl nach der Schulung. Autoritarismusscore vor/nach Projekt

Übung zur Vorlesung Statistik I WS Übungsblatt 8

1 Lösungen zu Analysis 1/ 12.Übung

Aufgaben zu Kapitel 8

Übungen mit dem Applet Taylor-Entwickung von Funktionen

Maximum Likelihood Version 1.6

1. Zahlenfolgen und Reihen

Kapitel 1. Einige Begriffe aus der Asymptotik. 1.1 Wiederholung

5.7. Aufgaben zu Folgen

SBP Mathe Aufbaukurs 1. Absolute und relative Häufigkeit. Das arithmetische Mittel und seine Eigenschaften. Das arithmetische Mittel und Häufigkeit

Übungen zur Vorlesung Funktionentheorie Sommersemester Musterlösung zu Blatt 11. c n (z a) n,

Wahrscheinlichkeit & Statistik

AT AB., so bezeichnet man dies als innere Teilung von

Wir weisen die Gültigkeit der 4Axiome der sigma-algebra für die Potenzmenge einer endlichen Menge A nach!

Übungsblatt 5 zur Vorlesung. Statistische Methoden

1 Analysis T1 Übungsblatt 1

Der χ 2 Test. Bei Verteilungen Beantwortung der Frage, ob eine gemessene Verteilung Gauß- oder Poisson-verteilt ist oder nicht?

Vorkurs Mathematik für Informatiker Folgen

Einführung in die Grenzwerte

4. Die Menge der Primzahlen. Bertrands Postulat

Stochastik I (Statistik)

Prof. Dr. Holger Dette Musterlösung Statistik I Sommersemester 2009 Dr. Melanie Birke Blatt 5

Kapitel 6: Statistische Qualitätskontrolle

Dr. Jürgen Senger INDUKTIVE STATISTIK. Wahrscheinlichkeitstheorie, Schätz- und Testverfahren

Korrelationsanalyse zwischen kategorischen Merkmalen. Kontingenztabellen. Chi-Quadrat-Test

7. Potenzreihen und Taylor-Reihen

(4) = 37,7 % mit 37,7 % Wahrscheinlichkeit sind es höchstens 4 Fahrräder, das ist recht hoch; man kann also die Behauptung nicht wirklich ablehnen.

Einführung in die induktive Statistik. Inferenzstatistik. Konfidenzintervalle. Friedrich Leisch

α : { n Z n l } n a n IR

Übungen mit dem Applet Fourier-Reihen

Methoden: Heron-Verfahren, Erweiterung von Differenzen von Quadratwurzeln

Beispiel: p-wert bei Chi-Quadrat-Anpassungstest (Grafik) Auftragseingangsbeispiel, realisierte Teststatistik χ 2 = , p-wert: 0.

3 Kritischer Bereich zum Niveau α = 0.10: K = (χ 2 k 1;1 α, + ) = (χ2 5;0.90, + ) = (9.236, + ) 4 Berechnung der realisierten Teststatistik:

Konvergenz von Punktprozessen

Klassifizierung der Verteilungen. Streuung der diskreten Verteilung

Übungsaufgaben zur Vorlesung ANALYSIS I (WS 12/13) Serie 10

Aufgaben und Lösungen der Probeklausur zur Analysis I

Stichproben im Rechnungswesen, Stichprobeninventur

Statistik mit Excel Themen-Special. Peter Wies. 1. Ausgabe, Februar 2014 W-EX2013S

Klausur 1 über Folgen

Statistische Tests zu ausgewählten Problemen

Kontingenztabellen. Chi-Quadrat-Test. Korrelationsanalyse zwischen kategorischen Merkmalen. 1. Unabhängigkeitstest

Satz Ein Boolescher Term t ist eine Tautologie genau dann, wenn t unerfüllbar ist.

Mathematik für Maschinenbauer, Bauingenieure und Umwelttechniker III. R. Verfürth

Höhere Mathematik I für die Fachrichtung Physik

Transkript:

Zeraler Grezwertsatz Ato Klimovsky Zetraler Grezwertsatz. Kovergez i Verteilug. Normalapproximatio. I diesem Abschitt beschäftige wir us mit der folgede Frage. Frage: Wie sieht die Verteilug eier Summe der ZVe S für großes aus? Everyoe believes i the [ormal] law of errors: the mathematicias, because they thik it is a experimetal fact; ad the experimeters, because they suppose it is a theorem of mathematics. Gabriel Lippma. Eie Atwort liefert der zetrale Grezwertsatz. Dieser ist eie Präzisierug des GGZ. Beispiel (Soziologische Umfrage). Sei p der Ateil vo alle Wähler, die eie bestimmte Kadidate uterstütze. Der Ateil p ist ubekat bevor das edgültige Wahlergebis bekat ist. Um trotzte eie Idee zu habe darüber, wie groß p ist, mache wir eie Umfrage bei zufällig ausgewählte Wähler 2. Wir modelliere die zufällig ausgewählte Wähler als uabhägig ud gleichverteilt ausgewählte Persoe aus der Gesamtpopulatio. D.h. die Atwort jeder ausgewählte Perso ist eie uabhägige Beroulli ZV X i mit Erfolgswahrscheilichkeit p ud Variaz σ 2 = p( p). Wir wolle de empirische Mittelwert X als eie Abschätzug vo p beutze. Die Ugleichug vo Tschebyscheff liefert 2 Aus Kostegrüde solle wir so klei wie möglich halte. Adererseits muss so gewählt werde, dass wir mit eier hohe Wahrscheilichkeit eie gute Abschätzug vo p bekomme. P{ X p ε} p( p) ε 2. () Die like Seite vo der Ugleichug () sieht scho mal gar icht so schlecht aus. Allerdigs gibt es ei Problem mit der Ugleichug (). Nämlich, dass das p ubekat ist. Dieses Problem köe wir mit der folgede Beobachtug umgehe Somit max p( p) = /4. (2) p [0,] P{ X p ε} 4ε 2. (3) Z.b. erhalte wir aus (3) für ε = 0, ud = 00 P{ X p ε} = 0, 25. (4) 4 00 (0, ) 2 I Worte sagt us (4) folgedes. Bei eier Stichprobe vom Umfag = 00 ist die Wahrscheilichkeit, dass usere empirische

zeraler grezwertsatz 2 Abschätzug X ei Fehler größer 0, hat, kleier als 0, 25 ist. Aderes ausgedrückt wird i eiem viertel aller Fälle ei Fehler vo midestes 0% gemacht 3. Vorbereituge Lemma 0.. Sei {X i } eie Folge vo u.i.v. ZV mit Var[X ] = σ 2 < ud E[X] = µ. Es gilt 3 Natürlich gilt dies uter Aahme, dass X i u.i.v. Beroulli ZVe sid. Diese Aahme soll sehr wohl bezweifelt werde! I Wirklichkeit köe ZV X i Abhägig sei ud müsse icht ubedigt die gleiche Verteilug habe! E[S ] = µ (5) Var[S ] = σ 2 (6) Lemma 0.2 (Stadardisierug). Gegebe ist eie ZV X. Defiiere Y := X E[X]. (7) Var[X] Da gilt E[Y] = 0 ud Var[Y] =. 4 Zetraler Grezwertsatz: Formulierug 4 Diese werte vom Erwartugswert = 0 ud der Variaz = heiße Stadardwerte. Frage. Wie sieht die Verteilug eier stadardisierte Summe S vo u.i.v. ZVe für großes N aus? Theorem 0. (zetraler Grezwertsatz). Sei {X i } eie Folge vo u.i.v. ZV mit Var[X ] = σ 2 < ud E[X] = µ. Sei σ 2 = 0. Da gilt für alle x R { } S µ P σ x 2π x e y2 /2 dy =: Φ(x). (8) I Wörter besagt der zetrale Grezwertsatz, dass die Verteilugsfuktio der stadardisierte Summe S (like Seite) gege die Verteilugsfuktio der Normalverteilug 5 mit dem Erwartugswert 0 ud Variaz (rechte Seite) kovergiert, als groß wird. Normalapproximatio. Der zetrale Grezwertsatz ist eie relativ allgemeie Aussage. Wir habe ichts außer Uabhägigkeit, Idetischverteiltheit ud Existez der edliche Variaz für die Summade {X i } ageomme. Uter diese Voraussetzuge sagt us der zetrale Grezwertsatz, dass die stadardisierte Summe S ist im Grezwert stadard-omalverteilt. Geauer gesagt gilt folgedes:. Die Verteilug vo S kozetriert sich um µ. (Dies kee wir scho aus dem Gesetz der große Zahle.) 5 Die Verteilugsfuktio ist icht i eier geschlossee Form darstellbar. Es gibt aber sehr detaillierte Tabelle bzw. Stadardbefehle i ihrer Liebligs-Programmiersprache, die diese Fuktio präzise ausreche. 0.0 0.2 0.4 0.6 0.8 0 2 3 4 5 Abbildug : Histogramm eier stadardisierte Stichprobe vo 300 Realisieruge aus der Expoetiell- Verteilug (graue Balke, likssteil) vergliche mit der Stadardormalverteilug (blaue Kurve).

zeraler grezwertsatz 3 2. Die Schwakuge (= Fluktuatioe) vo S um µ sid vo der Größeordug. 3. Die asymptotische ( ) Verteilug dieser Fluktuatioe ist Gauß sch. Dies gilt (uter de geate Voraussetzuge) uabhägig vo der Verteilug der Summade! 2 0 2 3 4 0.0 0. 0.2 0.3 0.4 Iformelle Prozedur der Normalapproximatio. Seie die Voraussetzuge vom Theorem 0. erfüllt. Für groß geug ka ma die Wahrscheilichkeit P{S x} approximativ ausreche i dem ma S approximativ als Gauß sch betrachtet! Ud zwar wie folgt. Abbildug 2: Histogramm der stadardisierte Summe vo 5 uabh. Expoetial-Verteilte ZV (graue Balke, liksteil) vergliche mit der mit der Stadardormalverteilug (blaue Kurve). Bereche de Erwartugswert µ ud die Variaz σ 2 vo S. 2. Bereche de stadardisierte Wert vo x z := x µ σ. (9) 0.0 0. 0.2 0.3 0.4 3. Beutze die folgede Approximatio 6 : P{S x} Φ(z). (0) Bemerkug. ZGS ka zusammebreche falls eier vo de Voraussetzuge schwer verletzt sid: 2 0 2 3 Abbildug 3: Histogramm der stadardisierte Summe vo 20 uabh. expoetial-verteilte ZV (graue Balke, etwas liksteil) vergliche mit der mit der Stadard-Normalverteilug (blaue Kurve) Es ka sei, dass die ZVe {X i } abhägig sid. Es ka sei, dass die Variaz vo X uedlich 7 ist. Es ka sei, dass die ZVe {X i } icht idetisch-verteilt sid. Die Normalapproximatio ka außerdem schlecht sei, falls klei ist, oder falls die Verteilug vo X asymmetrisch oder multimodal oder diskret ist, oder falls x weit weg vo der Hauptmasse der Verteilug vo X ist. Beispiel (Soziologische Umfrage: Fortsetzug). Nu wolle wir P{ X p ε} mit Hilfe vom ZGS (approximativ!) abschätze. Wir verfahre, wie obe bei der Normalapproximatio beschriebe ist. Erstes wolle wir die Wahrscheilichkeit, für die wir us iteressiere, über die Wahrscheilichkeit auf der like Seite vom (0) darstelle. Es gilt 0.0 0. 0.2 0.3 0.4 2 0 2 3 Abbildug 4: Histogramm der stadardisierte Summe vo 50 uabh. expoetial-verteilte ZV (graue Balke, fast Symmetrisch) vergliche mit der mit der Stadard- Normalverteilug (blaue Kurve) 6 Vorsicht: dies ist eie Faustregel. Keie rigorose Aussage. Sehe folgede Vorbehalte zur Awedbarkeit! 7 Ei aderer Trivialfall, der icht vom ZGS abgedeckt ist, ist der Fall mit σ 2 = 0. Was bedeutet dies für die ZV X? X p = (X p) = Y i, ()

zeraler grezwertsatz 4 wobei Y i := (X i p). Beachte, dass E[Y i ] = 0. Ferer gilt P{ X p ε} = P{ = P{ Y i ε} + P{ Y i ε} Y i ε} [Symmetrie der Normalverteilug] 2P{ = 2( P{ Y i ε}). Y i ε} (2) Nu verfahre wir ach der obe beschriebee Normalapproximatio- Prozedur:. E[Y ] = 0, Var[Y ] = p( p)/ 2. 2. z = ε p( p). 3. P{ Y i ε} Φ(z) = Φ(ε p( p) ) Φ(2ε ), da p( p) 4 ist. Nu folgt aus (2) ud 3. P{ X p ε} 2( Φ(2ε )) (3) Zum Vergleich mit (4) setze wir = 00 ud ε = 0, i (3) ei ud bekomme P{ X 00 p 0, } 2 2Φ(2 0, 00) 0, 046, (4) wobei i der letzte Gleichug habe wir de ugefähre umerische Wert 8 der Fuktio Φ(x) a der Stelle x = 2 0, 00 = 2 eigesetzt (Φ(2) 0, 9772). Example 0. (de Moivre-Laplace Approximatio der Biomialverteilug). Sei S die Biomialverteilug mit de Parameter N ud p (0, ). I diesem Fall ist X Beroulli-verteilt mit der Erfolgswahrscheilichkeit p. Wir erier us a die Momete der Beroulli ZV: E[X ] = p ud Var[X ] = p( p). Somit gilt ach ZGS (Theorem 0.) für hireiched 9 großes N ( ) ( ) l p k p P{k S l} Φ Φ, (5) p( p) p( p) wobei k, l Z +. Die Kovergezart i (8) hat eie Name. 8 Zum umerische Ausreche vo Φ(x) gibt es etsprechede Befehle i Ihrer Liebligs-Programmiersprache. 0.00 0.0 0.20 0.30 0 2 3 4 5 6 7 8 9 0 Abbildug 5: Histogramm der Biomial-Verteilug (die graue Balke) für = 0 ud p = 0, 5 ud die Dichte der Normalverteilug (die rote Glockekurve) mit µ = 5, 5 ud σ = 2, 5. 9 Für icht allzu großes N ist P{k S l} ( ) ( ) l + Φ 2 p k Φ 2 p p( p) p( p) eie etwas bessere Approximatio als (5). Geau dies habe wir auf der Abbildug 5 gemacht (µ = 0 0, 5 + 0, 5 = 5, 5).

zeraler grezwertsatz 5 Defiitio 0. (Verteilugskovergez). Sei {X } eie Folge vo ZVe ud X eie ZV. Wir sage, dass {X } gege X kovergiert, falls lim F X (x) = F X (x), x S R, (6) wobei F X ud F X die Verteilugsfuktioe vo der ZVe X ud X sid ud S R die Mege aller Pukte auf R ist, wo die Verteilugsfuktio F X stetig ist. Notatio. Kovergiert X gege X i Verteilug, so schreibe wir: X D X. (7) Bemerkug. Verteilugskovergez ist lediglich eie Aussage über die Verteiluge vo de ZVe ud icht über ihre Realisieruge. Elemetare Poisso-Approximatio: seltee Ereigisse Wir erier us a die folgede Aussage. Sei S Bi(, λ/), für λ R + ud N groß geug 0. Da gilt 0 So dass λ/ [0, ]. Demzufolge S lim P{S = k} = λk k! e λ, (8) D Y, wobei Y Pois(λ). (Warum?) Bemerkug. Die Poisso-Approximatio fuktioiert i der Situatio, wo wir viele Summade habe, die mit eier kleie Wahrscheilichkeit O( ) icht Null sid. Allerdigs sid diese Summade selber O(). Bei der Normal-Approximatio sid die Summade klei O( /2 ), dafür dürfe sie alle = 0 sei. Frage. Wie sieht die Poisso-Verteilug für großes λ aus? Atwort. Die Normalapproximatio suggeriert: 0.00 0.0 0.20 0 5 0 5 20 25 Abbildug 6: Die Wahrscheilichkeitsfuktio der Biomial-Verteilug (schwarze Säule) für = 00 ud p = 5/00 ud die Wahrscheilichkeitsfuktio der Poisso-Verteilug (rote Kurve) mit µ = 5. Sehr gute Approximatio! Pois(λ) λ λ Dies ist i der Tat der Fall (s. Übug). D N (0, ). (9) λ Example 0.2 (Stirlig-Formel). Frage: Wie schell wächst!, we? Atwort: Sei {X i } eie Folge vo uabhägige Pois()- verteilte ZVe. Es gilt S = X i Pois(). (20)

zeraler grezwertsatz 6 Nach (9) köe wir die Normalapproximatio awede. Seie ZV N Pois() ud X N (µ, σ 2 ), wobei σ 2 ud µ vom Teil (a) sid. Aus (a) folgt (Normalapproximatio!) P{N = } = P{ 0.5 N + 0.5} P{ 0.5 X + 0.5}. (2) Um die Stirlig-Formel herzuleite, vergleiche die like ud die rechte Seite vo (2). [XXX] Literatur Götz Kerstig ad Ato Wakolbiger. Elemetare Stochastik. Spriger, 200.