Zeraler Grezwertsatz Ato Klimovsky Zetraler Grezwertsatz. Kovergez i Verteilug. Normalapproximatio. I diesem Abschitt beschäftige wir us mit der folgede Frage. Frage: Wie sieht die Verteilug eier Summe der ZVe S für großes aus? Everyoe believes i the [ormal] law of errors: the mathematicias, because they thik it is a experimetal fact; ad the experimeters, because they suppose it is a theorem of mathematics. Gabriel Lippma. Eie Atwort liefert der zetrale Grezwertsatz. Dieser ist eie Präzisierug des GGZ. Beispiel (Soziologische Umfrage). Sei p der Ateil vo alle Wähler, die eie bestimmte Kadidate uterstütze. Der Ateil p ist ubekat bevor das edgültige Wahlergebis bekat ist. Um trotzte eie Idee zu habe darüber, wie groß p ist, mache wir eie Umfrage bei zufällig ausgewählte Wähler 2. Wir modelliere die zufällig ausgewählte Wähler als uabhägig ud gleichverteilt ausgewählte Persoe aus der Gesamtpopulatio. D.h. die Atwort jeder ausgewählte Perso ist eie uabhägige Beroulli ZV X i mit Erfolgswahrscheilichkeit p ud Variaz σ 2 = p( p). Wir wolle de empirische Mittelwert X als eie Abschätzug vo p beutze. Die Ugleichug vo Tschebyscheff liefert 2 Aus Kostegrüde solle wir so klei wie möglich halte. Adererseits muss so gewählt werde, dass wir mit eier hohe Wahrscheilichkeit eie gute Abschätzug vo p bekomme. P{ X p ε} p( p) ε 2. () Die like Seite vo der Ugleichug () sieht scho mal gar icht so schlecht aus. Allerdigs gibt es ei Problem mit der Ugleichug (). Nämlich, dass das p ubekat ist. Dieses Problem köe wir mit der folgede Beobachtug umgehe Somit max p( p) = /4. (2) p [0,] P{ X p ε} 4ε 2. (3) Z.b. erhalte wir aus (3) für ε = 0, ud = 00 P{ X p ε} = 0, 25. (4) 4 00 (0, ) 2 I Worte sagt us (4) folgedes. Bei eier Stichprobe vom Umfag = 00 ist die Wahrscheilichkeit, dass usere empirische
zeraler grezwertsatz 2 Abschätzug X ei Fehler größer 0, hat, kleier als 0, 25 ist. Aderes ausgedrückt wird i eiem viertel aller Fälle ei Fehler vo midestes 0% gemacht 3. Vorbereituge Lemma 0.. Sei {X i } eie Folge vo u.i.v. ZV mit Var[X ] = σ 2 < ud E[X] = µ. Es gilt 3 Natürlich gilt dies uter Aahme, dass X i u.i.v. Beroulli ZVe sid. Diese Aahme soll sehr wohl bezweifelt werde! I Wirklichkeit köe ZV X i Abhägig sei ud müsse icht ubedigt die gleiche Verteilug habe! E[S ] = µ (5) Var[S ] = σ 2 (6) Lemma 0.2 (Stadardisierug). Gegebe ist eie ZV X. Defiiere Y := X E[X]. (7) Var[X] Da gilt E[Y] = 0 ud Var[Y] =. 4 Zetraler Grezwertsatz: Formulierug 4 Diese werte vom Erwartugswert = 0 ud der Variaz = heiße Stadardwerte. Frage. Wie sieht die Verteilug eier stadardisierte Summe S vo u.i.v. ZVe für großes N aus? Theorem 0. (zetraler Grezwertsatz). Sei {X i } eie Folge vo u.i.v. ZV mit Var[X ] = σ 2 < ud E[X] = µ. Sei σ 2 = 0. Da gilt für alle x R { } S µ P σ x 2π x e y2 /2 dy =: Φ(x). (8) I Wörter besagt der zetrale Grezwertsatz, dass die Verteilugsfuktio der stadardisierte Summe S (like Seite) gege die Verteilugsfuktio der Normalverteilug 5 mit dem Erwartugswert 0 ud Variaz (rechte Seite) kovergiert, als groß wird. Normalapproximatio. Der zetrale Grezwertsatz ist eie relativ allgemeie Aussage. Wir habe ichts außer Uabhägigkeit, Idetischverteiltheit ud Existez der edliche Variaz für die Summade {X i } ageomme. Uter diese Voraussetzuge sagt us der zetrale Grezwertsatz, dass die stadardisierte Summe S ist im Grezwert stadard-omalverteilt. Geauer gesagt gilt folgedes:. Die Verteilug vo S kozetriert sich um µ. (Dies kee wir scho aus dem Gesetz der große Zahle.) 5 Die Verteilugsfuktio ist icht i eier geschlossee Form darstellbar. Es gibt aber sehr detaillierte Tabelle bzw. Stadardbefehle i ihrer Liebligs-Programmiersprache, die diese Fuktio präzise ausreche. 0.0 0.2 0.4 0.6 0.8 0 2 3 4 5 Abbildug : Histogramm eier stadardisierte Stichprobe vo 300 Realisieruge aus der Expoetiell- Verteilug (graue Balke, likssteil) vergliche mit der Stadardormalverteilug (blaue Kurve).
zeraler grezwertsatz 3 2. Die Schwakuge (= Fluktuatioe) vo S um µ sid vo der Größeordug. 3. Die asymptotische ( ) Verteilug dieser Fluktuatioe ist Gauß sch. Dies gilt (uter de geate Voraussetzuge) uabhägig vo der Verteilug der Summade! 2 0 2 3 4 0.0 0. 0.2 0.3 0.4 Iformelle Prozedur der Normalapproximatio. Seie die Voraussetzuge vom Theorem 0. erfüllt. Für groß geug ka ma die Wahrscheilichkeit P{S x} approximativ ausreche i dem ma S approximativ als Gauß sch betrachtet! Ud zwar wie folgt. Abbildug 2: Histogramm der stadardisierte Summe vo 5 uabh. Expoetial-Verteilte ZV (graue Balke, liksteil) vergliche mit der mit der Stadardormalverteilug (blaue Kurve). Bereche de Erwartugswert µ ud die Variaz σ 2 vo S. 2. Bereche de stadardisierte Wert vo x z := x µ σ. (9) 0.0 0. 0.2 0.3 0.4 3. Beutze die folgede Approximatio 6 : P{S x} Φ(z). (0) Bemerkug. ZGS ka zusammebreche falls eier vo de Voraussetzuge schwer verletzt sid: 2 0 2 3 Abbildug 3: Histogramm der stadardisierte Summe vo 20 uabh. expoetial-verteilte ZV (graue Balke, etwas liksteil) vergliche mit der mit der Stadard-Normalverteilug (blaue Kurve) Es ka sei, dass die ZVe {X i } abhägig sid. Es ka sei, dass die Variaz vo X uedlich 7 ist. Es ka sei, dass die ZVe {X i } icht idetisch-verteilt sid. Die Normalapproximatio ka außerdem schlecht sei, falls klei ist, oder falls die Verteilug vo X asymmetrisch oder multimodal oder diskret ist, oder falls x weit weg vo der Hauptmasse der Verteilug vo X ist. Beispiel (Soziologische Umfrage: Fortsetzug). Nu wolle wir P{ X p ε} mit Hilfe vom ZGS (approximativ!) abschätze. Wir verfahre, wie obe bei der Normalapproximatio beschriebe ist. Erstes wolle wir die Wahrscheilichkeit, für die wir us iteressiere, über die Wahrscheilichkeit auf der like Seite vom (0) darstelle. Es gilt 0.0 0. 0.2 0.3 0.4 2 0 2 3 Abbildug 4: Histogramm der stadardisierte Summe vo 50 uabh. expoetial-verteilte ZV (graue Balke, fast Symmetrisch) vergliche mit der mit der Stadard- Normalverteilug (blaue Kurve) 6 Vorsicht: dies ist eie Faustregel. Keie rigorose Aussage. Sehe folgede Vorbehalte zur Awedbarkeit! 7 Ei aderer Trivialfall, der icht vom ZGS abgedeckt ist, ist der Fall mit σ 2 = 0. Was bedeutet dies für die ZV X? X p = (X p) = Y i, ()
zeraler grezwertsatz 4 wobei Y i := (X i p). Beachte, dass E[Y i ] = 0. Ferer gilt P{ X p ε} = P{ = P{ Y i ε} + P{ Y i ε} Y i ε} [Symmetrie der Normalverteilug] 2P{ = 2( P{ Y i ε}). Y i ε} (2) Nu verfahre wir ach der obe beschriebee Normalapproximatio- Prozedur:. E[Y ] = 0, Var[Y ] = p( p)/ 2. 2. z = ε p( p). 3. P{ Y i ε} Φ(z) = Φ(ε p( p) ) Φ(2ε ), da p( p) 4 ist. Nu folgt aus (2) ud 3. P{ X p ε} 2( Φ(2ε )) (3) Zum Vergleich mit (4) setze wir = 00 ud ε = 0, i (3) ei ud bekomme P{ X 00 p 0, } 2 2Φ(2 0, 00) 0, 046, (4) wobei i der letzte Gleichug habe wir de ugefähre umerische Wert 8 der Fuktio Φ(x) a der Stelle x = 2 0, 00 = 2 eigesetzt (Φ(2) 0, 9772). Example 0. (de Moivre-Laplace Approximatio der Biomialverteilug). Sei S die Biomialverteilug mit de Parameter N ud p (0, ). I diesem Fall ist X Beroulli-verteilt mit der Erfolgswahrscheilichkeit p. Wir erier us a die Momete der Beroulli ZV: E[X ] = p ud Var[X ] = p( p). Somit gilt ach ZGS (Theorem 0.) für hireiched 9 großes N ( ) ( ) l p k p P{k S l} Φ Φ, (5) p( p) p( p) wobei k, l Z +. Die Kovergezart i (8) hat eie Name. 8 Zum umerische Ausreche vo Φ(x) gibt es etsprechede Befehle i Ihrer Liebligs-Programmiersprache. 0.00 0.0 0.20 0.30 0 2 3 4 5 6 7 8 9 0 Abbildug 5: Histogramm der Biomial-Verteilug (die graue Balke) für = 0 ud p = 0, 5 ud die Dichte der Normalverteilug (die rote Glockekurve) mit µ = 5, 5 ud σ = 2, 5. 9 Für icht allzu großes N ist P{k S l} ( ) ( ) l + Φ 2 p k Φ 2 p p( p) p( p) eie etwas bessere Approximatio als (5). Geau dies habe wir auf der Abbildug 5 gemacht (µ = 0 0, 5 + 0, 5 = 5, 5).
zeraler grezwertsatz 5 Defiitio 0. (Verteilugskovergez). Sei {X } eie Folge vo ZVe ud X eie ZV. Wir sage, dass {X } gege X kovergiert, falls lim F X (x) = F X (x), x S R, (6) wobei F X ud F X die Verteilugsfuktioe vo der ZVe X ud X sid ud S R die Mege aller Pukte auf R ist, wo die Verteilugsfuktio F X stetig ist. Notatio. Kovergiert X gege X i Verteilug, so schreibe wir: X D X. (7) Bemerkug. Verteilugskovergez ist lediglich eie Aussage über die Verteiluge vo de ZVe ud icht über ihre Realisieruge. Elemetare Poisso-Approximatio: seltee Ereigisse Wir erier us a die folgede Aussage. Sei S Bi(, λ/), für λ R + ud N groß geug 0. Da gilt 0 So dass λ/ [0, ]. Demzufolge S lim P{S = k} = λk k! e λ, (8) D Y, wobei Y Pois(λ). (Warum?) Bemerkug. Die Poisso-Approximatio fuktioiert i der Situatio, wo wir viele Summade habe, die mit eier kleie Wahrscheilichkeit O( ) icht Null sid. Allerdigs sid diese Summade selber O(). Bei der Normal-Approximatio sid die Summade klei O( /2 ), dafür dürfe sie alle = 0 sei. Frage. Wie sieht die Poisso-Verteilug für großes λ aus? Atwort. Die Normalapproximatio suggeriert: 0.00 0.0 0.20 0 5 0 5 20 25 Abbildug 6: Die Wahrscheilichkeitsfuktio der Biomial-Verteilug (schwarze Säule) für = 00 ud p = 5/00 ud die Wahrscheilichkeitsfuktio der Poisso-Verteilug (rote Kurve) mit µ = 5. Sehr gute Approximatio! Pois(λ) λ λ Dies ist i der Tat der Fall (s. Übug). D N (0, ). (9) λ Example 0.2 (Stirlig-Formel). Frage: Wie schell wächst!, we? Atwort: Sei {X i } eie Folge vo uabhägige Pois()- verteilte ZVe. Es gilt S = X i Pois(). (20)
zeraler grezwertsatz 6 Nach (9) köe wir die Normalapproximatio awede. Seie ZV N Pois() ud X N (µ, σ 2 ), wobei σ 2 ud µ vom Teil (a) sid. Aus (a) folgt (Normalapproximatio!) P{N = } = P{ 0.5 N + 0.5} P{ 0.5 X + 0.5}. (2) Um die Stirlig-Formel herzuleite, vergleiche die like ud die rechte Seite vo (2). [XXX] Literatur Götz Kerstig ad Ato Wakolbiger. Elemetare Stochastik. Spriger, 200.