5 Die Poisson-Approximation

Ähnliche Dokumente
Differentialgleichungen


1 Stochastische Konvergenz 2. 2 Das Gesetz der grossen Zahlen 4. 3 Der Satz von Bernoulli 6

Abiturprüfung Mathematik 2014 Baden-Württemberg Allgemeinbildende Gymnasien Wahlteil Analytische Geometrie / Stochastik Aufgabe B 1 - Lösungen

Stochastik I. Vorlesungsmitschrift

12.6 Aufgaben zur Laplace-Transformation

Stochastische Modelle der aktuariellen Risikotheorie Eine mathematische Einführung. Lösungen ausgewählter Aufgaben und zusätliche Aufgaben

Statistische Analyse von Messergebnissen

Definition. Wichtige Beziehungen. Geometrische Konstruktion

Beispiellösungen zu Blatt 84

2.2 Binomialverteilung, Hypergeometrische Verteilung, Poissonverteilung

7.5 Erwartungswert, Varianz

a) Geben Sie einen geeigneten Ergebnisraum Ω an. Wieviele Elemente hat dieser?

Greensche Funktion. Frank Essenberger FU Berlin. 30.September Nomenklatur 1. 2 Greensche Theoreme 1. 3 Anwendung in der Elektrostatik 2

Definition Sei X eine stetige Z.V. mit Verteilungsfunktion F und Dichte f. Dann heißt E(X) :=

Einfacher loop-shaping Entwurf

PHYSIK Wurfbewegungen 1

10. Äquivalenzen zur Riemannschen Vermutung

TECHNIKEN ZUR BERECHNUNG DER DIMENSION

3. Kombinatorik und Wahrscheinlichkeit

Geometrie KL.7/8 Begründungsbasis I

Varianz und Kovarianz

7.2 Moment und Varianz

Stochastik und Statistik für Ingenieure Vorlesung 4

2 Zufallsvariable, Verteilungen, Erwartungswert

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

2.6.1 Definition und Darstellung Ausspähen von Graphen Minimal spannende Bäume Kürzeste Pfade 2.6.

Beweis: Mit Hilfe des Satzes von der totalen Wahrscheinlichkeit folgt, dass

Übungen zur Vorlesung PN1 Lösung Übungsblatt 12 Besprechung am

Stochastische Überraschungen beim Spiel BINGO

2 Aufgaben aus [Teschl, Band 2]

Partialbruchzerlegung in oder

Lösungen ausgewählter Übungsaufgaben zum Buch. Elementare Stochastik (Springer Spektrum, 2012) Teil 3: Aufgaben zu den Kapiteln 5 und 6

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen

Geometrie-Dossier Der Satz des Pythagoras

Vier-Felder-Tafel. Medizinische Tests sind grundsätzlich mit zwei Fehlern behaftet: 1. Erkrankte werden als gesund, 2. Gesunde als krank eingestuft.

Zufallsvariablen [random variable]

PHYSIK Geradlinige Bewegungen 3

Physikpraktikum. Versuch 2) Stoß. F α F * cos α

3 Bedingte Wahrscheinlichkeit, Unabhängigkeit

Anliegen: Beschreibung von Versuchsergebnissen mit Zahlen, um mit Zahlen bzw. bekannten Funktionen rechnen zu können.

Stochastik. 1. Wahrscheinlichkeitsräume

13.1 Die Laplace-Transformation

Benutzerhinweise für den PU Bayes-Korrektor V1.0

Beobachten und Messen mit dem Mikroskop

Prof. Liedl Lösung Blatt 8. Übungen zur Vorlesung PN1. Lösung zum Übungsblatt 8. Besprochen am

Stochastik für die Naturwissenschaften

7. Reglerentwurf im Frequenzbereich

Autonome Mobile Systeme

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

Satz 16 (Multiplikationssatz)

4 Diskrete Wahrscheinlichkeitsverteilungen

Motivation. Benötigtes Schulwissen. Übungsaufgaben. Wirtschaftswissenschaftliches Zentrum 10 Universität Basel. Statistik

Stochastik für die Naturwissenschaften

Unabhängigkeit KAPITEL 4

4 Messbare Funktionen

Gesetze der großen Zahlen

Mathematik für Naturwissenschaftler I WS 2009/2010

Klausur zur Wahrscheinlichkeitstheorie für Lehramtsstudierende

9 Konvergenz und absolute Konvergenz von Reihen

Energiefreisetzung In der Sonne, wie in allen anderen Sternen auch, wird die Energie durch Kernfusion freigesetzt. Wasserstoffkerne(Protonen) können

Schwache Konvergenz von W-Verteilungen auf der Zahlengeraden

Wahrscheinlichkeitstheorie Kapitel V - Stetige Verteilungen

Grundlagen der Mathematik II (LVA U)

Schätzer und Konfidenzintervalle

Figurierte Zahlen, Urnen und Kugelfarben

Beispiel 1 Modellbildung und Identifikation

Klassifikation von Signifikanztests

20.4 Gleichmäßige Konvergenz von Folgen und Reihen von Funktionen

Kapitel 5 KONVERGENZ

3 Markov-Eigenschaft der Brownschen Bewegung

Paarweise Unabhängigkeit vs. Unabhängigkeit

7. Die Brownsche Bewegung

Unabhängige Zufallsvariablen

16.3 Rekurrente und transiente Zustände

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr

Zufallsgröße X : Ω R X : ω Anzahl der geworfenen K`s

Diskrete Verteilungen

Stetige Verteilungen Rechteckverteilung

6. Klasse 1. Schularbeit Gruppe A + 40.! Bestimme das Monotonieverhalten und berechen den Grenzwert! 4 Punkte

Masse und Geschwindigkeit von Neutrinos

Richtungsweisend für Universalbanken


Einführung in die Statistik Kapitel 6: Crash-Course in Statistik: Testtheorie

Zahlen und metrische Räume

Satz 18 (Satz von der totalen Wahrscheinlichkeit)

Klausur zum Fach GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK. für Studierende der INFORMATIK

PHYSIK Gekoppelte Bewegungen 2

= (n 2 ) 1 (Kurzschreibweise: a n = n 2 ) ergibt die Zahlenfolge 1, 4, 9, 16, 25, 36,.

Wahrscheinlichkeitstheorie und Statistik vom

3. Prozesse mit kontinuierlicher Zeit

6 Komplexe Integration

Stochastik für die Naturwissenschaften

Kapitel 5. Vektorräume mit Skalarprodukt

Zahlen und metrische Räume

ETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig)

Mathematik für Biologen

2 Folgen und Reihen. 2.1 Folgen in C Konvergenz von Folgen. := f(n)

Diskrete Wahrscheinlichkeitstheorie - Probeklausur

Transkript:

5 Die Poion-Approximation Im vierten Kapitel hatten wir mit der Normalverteilung die icherlich wichtigte und meittudierte Verteilung der W.-Theorie kennengelernt und geehen, daß man diee al Lime eine geeignet kalierten Binomialverteilung erhalten kann. In dieem Kapitel werden wir eine weitere zentrale Verteilung kennenlernen, die ich ebenfall al Lime einer (natürlich ander kalierten) Binomialverteilung chreiben läßt. Wir wollen diee Verteilung an einem Beipiel kennenlernen. Da Experiment von Rutherford und Geiger In einem bekannten Experiment beobachteten die Phyiker Rutherford und Geiger den Zerfall einer radioaktiven Subtanz. Genauer tudierten ie die Emiion von α-teilchen eine radioaktiven Präparate in n = 2608 Zeitabchnitten von 7.5 Sekunden. Die folgende Tabelle gibt die Veruchergebnie wieder. Hierbei teht n i für jede natürliche i für die Anzahl der Zeitabchnitte, in denen genau i α-teilchen emittiert wurden, r i bezeichnet die relativen Häufigkeiten dieer Zeitabchnitte. i n i r i 0 57 0.02186 1 203 0.0778 2 383 0.1469 3 525 0.2013 4 532 0.2040 5 408 0.1564 6 273 0.1047 7 139 0.0533 8 45 0.0173 9 27 0.0103 10 10 0.0038 11 4 0.0015 12 0 0 13 1 0.0004 14 1 0.0004 Offenichtlich ind diee Daten weit davon entfernt von einer Normalverteilung zu tammen. Wir benötigen vielmehr eine Verteilung, die die Enden, d.h. die großen Zahlen mit einem ehr viel kleineren Gewicht verieht. Eine olche Verteilung it die Poion- Verteilung. (5.1) Definition. Sei λ > 0 eine reelle Zahl. Eine Zufallgröße X mit X(Ω) = N 0 und der Verteilung π λ gegeben durch heißt Poion-verteilt mit Parameter λ > 0. π λ = e λ k! λk, k N 0, 51

Zunächt bemerken wir, daß die Poion-Verteilung auf den natürlichen Zahlen, incl. der Null N 0 konzentriert it. Deweiteren überzeugt man ich rach, daß π λ = e λ it. π λ it alo tatächlich eine Wahrcheinlichkeit. λ k k! = e λ e λ = 1 Der Erwartungwert dieer Verteilung it leicht zu berechnen: kπ λ = e λ k λk k! = e λ λ λ k 1 (k 1)! = e λ λ Eine Poion-verteilte Zufallgröße hat alo Erwartungwert λ. λ k k! = e λ λe +λ = λ. Al nächte wollen wir die Varianz aurechnen: E(X 2 ) = k 2 π λ = e λ k 2λk k! = e λ (k(k 1) + k) λk k! = e λ λ k+2 k! + λ = λ 2 + λ. Somit gilt V (X) = E(X 2 ) (EX) 2 = λ 2 + λ λ 2 = λ. Wir faen diee beiden Fettellungen noch einmal in folgendem Lemma zuammen. (5.2) Lemma. Erwartungwert und Varianz einer Poion-verteilten Zufallgröße ind gleich dem Parameter λ. Wir wollen nun einmal die eingang gezeigten Daten au Rutherford Experiment mit denen einer Poionverteilung vergleichen. Dabei tellt ich die Frage, wie wir den Parameter λ am gechickteten wählen. Vor dem Hintergrund de Geetze der großen Zahlen, nach dem man eine mittlere Zahl emittierter Teilchen erwarten kann, die nahe am Erwartungwert liegt und Lemma (5.2) it eine gute Wahl die, λ al die durchchnittliche Anzahl der Emiionen zu wählen. Diee betrug im Experiment von Rutherford und Geiger a = 10097 2608 3.87. Die nächte Tabelle zeigt den Vergleich der relativen Häufigkeiten r k au dem Experiment von Rutherford und Geiger mit den Wahrcheinlichkeiten π λ einer Poionverteilung zum Parameter λ = 3.87. 52

k r k π λ 0 0.0219 0.0208 1 0.0778 0.0807 2 0.1469 0.1561 3 0.2013 0.2015 4 0.2040 0.1949 5 0.1564 0.1509 6 0.1047 0.0973 7 0.0533 0.0538 8 0.0173 0.0260 9 0.0103 0.0112 10 0.0038 0.0043 11 0.0015 0.0015 12 0 0.0005 13 0.0004 0.0002 14 0.0004 4 10 5 Die beobachteten relativen Häufigkeiten differieren alo von den durch die entprechende Poion-Verteilung vorhergeagten Werten nur um wenige Tauendtel. Warum die ein plauible Ergebni it, oll am Ende diee Kapitel in einem Satz geklärt werden, der zeigen wird, daß viele Prozee, die einer Reihe von Anforderungen genügen, eine Poion- Approximation erlauben. Grundlage diee Satze it eine Fetellung darüber, wie genau ich die Binomialverteilung b( ; n, p) für kleine Parameter p und große n durch die Poionverteilung π λ approximieren läßt. Wieder bleibt da Problem, λ zu wählen. Wir löen e o, daß wir λ o betimmen, daß die Erwartungwerte der Binomialverteilung und der Poionverteilung übereintimmen, daß alo λ = np it. Wir wollen alo zeigen: b(k; n, p) liegt nahe bei π λ für λ = np. Um da zu präziieren, benötigen wir ein Maß für den Abtand zweier Wahrcheinlichkeiten. Die wird in unerem Fall gegeben ein durch (n, p) := b(k; n, p) π np. (n, p) läßt ich ähnlich auf für den Abtand beliebiger anderer Wahrcheinlichkeiten definieren und heißt Abtand der totalen Variation. Wir zeigen da folgende Reultat, da ogar noch weentlich weitreichender it al uner oben geteckte Ziel: (5.3) Satz. E eien X 1,...,X n unabhängige Zufallvariablen, definiert auf einem gemeinamen Wahrcheinlichkeitraum, mit X i = 1) = p i und X i = 0) = 1 p i mit 0 < p i < 1 für alle i = 1,...,n. Sei X = X 1 + + X n und λ = p 1 + + p n, dann gilt: X = k) π λ 2 p 2 i. i=1 E folgt alo im Fall p = p 1 = = p n : 53

(5.4) Satz. Für alle n N und p (0, 1) gilt (n, p) 2np 2. Die Schranken in den Sätzen (5.3) und (5.4) ind natürlich nur intereant, fall n i=1 p2 i klein wird bzw. p 2 klein wird gegen n. Offenbar benötigt man in Satz (5.4) dazu mindeten p 1 n, d.h. die Wahrcheinlichkeit eine Einzelerfolge wird klein mit n. Au dieem Grund heißt die Poion-Verteilung auch Verteilung eltener Ereignie. Inbeondere folgt der ogenannte Poionche Grenzwertatz, der von Siméon Deni Poion (1781-1840) im Jahre 1832 entdeckt wurde: (5.5) Satz. (Grenzwertatz von Poion) It λ > 0 und gilt np n λ > 0 für n, o gilt für jede k N 0 : lim n b(k; n, p n) = π λ. (5.5) folgt ofort au (5.4): Au np n λ folgt p n 0 für n und np 2 n 0. Ferner it b(k; n, p) π np (n, p) für jede k N 0. Demzufolge gilt Wegen π npn π λ folgt (5.5). lim b(k; n, p n) π npn = 0. n Offenbar untercheidet ich (5.4) von (5.5) dadurch, daß die Auage von (5.4) auch im Fall, wo np 2 n 0, np n gilt, von Interee it (z.b. p n = 1/n 2/3 ). Der wichtigte Vorzug von (5.3) und (5.4) im Vergleich zu (5.5) it jedoch, daß eine ganz konkrete Approximationchranke vorliegt. Dafür it Satz (5.3) auch chwieriger zu beweien al (5.5) (den wir hier allerding nur al Korollar au Satz (5.4) ableiten wollen). Bevor wir den Bewei von Satz (5.3) geben, tellen wir einen wichtigen Apekt der Poionverteilung bereit: (5.6) Propoition. X und Y eien unabhängig und Poion-verteilt mit Parametern λ beziehungweie µ > 0. Dann it X + Y Poion-verteilt mit Parameter λ + µ. Bewei. Für n N 0 gilt: X + Y = n) = = = X = k, Y = n k) X = k)y = n k) (Unabhängigkeit) λ k µ n k k! (n k)! e λ e µ = 1 n! = 1 n! (λ + µ)n e (λ+µ) = π λ+µ (n). ( ( ) n )λ k µ n k e (λ+µ) k 54

(5.7) Bemerkung. Per Induktion folgt ofort, daß die Summe von endlich vielen unabhängigen Poion-verteilten Zufallgrößen wieder Poion-verteilt it, wobei der Parameter ich al Summe der Einzelparameter ergibt. Bewei von Satz 5.3. Der Bewei de Satze (5.3) verwendet eine Technik, die man Kopplung (coupling) nennt. Dabei verwenden wir weentlich, daß bei der Berechnung de Abtand X = k) π λ die Größen X = k) bzw. π λ zwar die Verteilungen von Zufallvariablen ind, daß aber in die Berechnung der zugrunde liegende W.-Raum nicht eingeht. Wir können alo einen W.-Raum und Zufallvariablen mit den gegebenen Verteilungen o wählen, daß ie für unere Zwecke beonder geeignet ind und da bedeutet, daß ie ich bei gegebener Verteilung möglicht wenig untercheiden. Konkret kontruieren wir: Sei Ω i = { 1, 0, 1, 2,...}, P i (0) = 1 p i und P i = e p i p k k! i für k 1 owie P i ( 1) = 1 P i (0) k 1 P i = e p i (1 p i ). Nach Kontruktion ind omit (Ω i, P i ) W.-Räume. Betrachte dann den Produktraum (Ω, P) der (Ω i, P i ) im Sinne der Definition (2.13). Wir etzen für ω Ω { 0, fall ωi = 0, X i (ω) := 1, ont, und { k, fall ωi = k, k 1, Y i (ω) := 0, ont. Dann haben nach Definition die Zufallgrößen X i die geforderte Verteilung: X i = 1) = p i und X i = 0) = 1 p i. Sie ind weiter nach Definition de Produktraume unabhängig. Die Y i ind nach Definition Poion-verteilt zum Parameter p i und ebenfall unabhängig. Alo folgt mit Propoition (5.6), daß Y = Y 1 + +Y n Poion-verteilt it zum Parameter λ. Nun timmen die Zufallgrößen in den Werten 0 und 1 überein, und e it X i = Y i ) = P i (0) + P i (1) = (1 p i ) + e p i p i, und omit X i Y i ) = p i (1 e p i ) p 2 i, denn für x > 0 gilt 1 e x x. Damit folgt = X = k) π λ = X = k) Y = k) X = k = Y ) + X = k Y ) (X = k = Y ) + X k = Y )) X = k Y ) + X k = Y ) = 2X Y ) 2 X i Y i ) 2 i=1 p 2 i. i=1 Da beweit Satz (5.3). 55

Nun können wir auch klären, warum die Ergebnie im Experiment von Rutherford und Geiger o ertaunlich nahe an den Vorheragen einer Poion Verteilung lagen. Die gechieht im Rahmen de ogenannten Poionchen Punktprozee. Der Poionche Punktprozeß (Poion point proce) Wir kontruieren ein mathematiche Modell für auf einer Zeitache zufällig eintretende Vorkommnie. Beipiele ind etwa: Ankommende Anrufe in einer Telefonzentrale, Regitrierung radioaktiver Teilchen in einem Geigerzähler, Impule in einer Nervenfaer etc. Die Zeitache ei (0, ), und die,,vorkommnie eien einfach zufällige Punkte auf dieer Ache. Die Kontruktion eine unterliegenden Wahrcheinlichkeitraume it leider etwa aufwendig und oll hier einfach weggelaen werden (wir glauben hier einfach mal, daß man da kann). It I = (t, t + ] ein halboffene Intervall, o bezeichnen wir mit N I die zufällige Anzahl der Punkte in I. N I it alo eine Zufallgröße mit Werten in N 0. Statt N (0,t] chreiben wir auch einfach N t. 0 zufällige Punkte An uner Modell tellen wir eine Anzahl von Bedingungen (P1) bi (P5), die für Anwendungen oft nur teilweie realitich ind. (P1) Die Verteilung von N I hängt nur von der Länge de Intervall I ab. Ander augedrückt: Haben die beiden Intervalle I, I dieelbe Länge, o haben die Zufallgrößen N I und N I dieelbe Verteilung. Man bezeichnet da auch al (zeitliche) Homogenität de Punktprozee. (P2) Sind I 1, I 2,...,I k paarweie dijunkte Intervalle, o ind N I1, N I2,..., N Ik unabhängige Zufallgrößen. (P3) Für alle I (tet mit endlicher Länge) exitiert EN I. Um Trivialitäten zu vermeiden, fordern wir: (P4) E exitiert ein Intervall I mit N I > 0) > 0. Au (P1), (P3), (P4) laen ich chon einige Schlüe ziehen: Sei λ(t) = EN t 0. Offenichtlich gilt λ(0) = 0, denn N 0 etzen wir natürlich 0. Die Anzahl der Punkte in einer Vereinigung dijunkter Intervalle it natürlich die Summe für die Einzelintervalle. Inbeondere gilt: N t+ = N t + N (t,t+]. Demzufolge: λ(t + ) = λ(t) + EN (t,t+], 56

wa wegen (P1) it. = λ(t) + λ() Nach einem Satz au der Analyi, der hier nicht bewieen werden oll, muß eine derartige Funktion linear ein, da heißt, e exitiert λ 0 mit λ() = λ. λ = 0 können wir wegen (P4) ofort auchließen. In dieem Fall müßte nach (P1) EN I = 0 für jede Intervall gelten. Die widerpricht offenichtlich (P4). Für kleine Intervalle it die Wahrcheinlichkeit dafür, daß überhaupt ein Punkt in dieem Intervall liegt, klein. E gilt nämlich: N I 1) = N I = k) kn I = k) = EN I und demzufolge N (t,t+ε] 1) λε für alle t, ε 0. Unere letzte Forderung beagt im weentlichen, daß ich je zwei Punkte eparieren laen, e alo keine Mehrfachpunkte gibt. Dazu ei für T > 0 dann beagt unere Forderung (P5): (P5) D T α n ) n 0 für jede Nullfolge α n und jede endliche T. D T (ω) := inf t, T { t : N t N 1} Natürlich haben wir in keiner Weie belegt, daß eine Familie von Zufallgrößen N I mit den Eigenchaften (P1) (P5) al mathematiche Objekt exitiert. Wir können die im Rahmen dieer Vorleung nicht tun. Wir können jedoch nachweien, daß für einen Punktprozeß, der (P1) bi (P5) erfüllt, die N I alle Poion-verteilt ein müen: (5.8) Satz. Sind (P1) bi (P5) erfüllt, o ind für alle t, 0 die Zufallgrößen N (t,t+] Poion-verteilt mit Parameter λ. Bewei. Wegen (P1) genügt e, N = N (0,] zu betrachten. Wir halten > 0 fet. Für k N, 1 j k, definieren wir Für jede fete k ind die X j X j X j := := N ((j 1)/k,j/k] { 1, fall X j 1, 0, fall X j = 0. nach (P2) unabhängig und die X j damit ebenfall. Wir tellen einige einfach zu verifizierende Eigenchaften dieer Zufallgrößen zuammen: k N = X j. j=1 57

Sei := k j=1 Demzufolge gilt für jede m N: Sei p k = X i X j. Dann gilt für jede mögliche Konfiguration der Punkte: N. m) N m). (5.1) = 1) = X i 1) = N /k 1). it binomialverteilt mit Parameterk, p k. (5.2) Wir verwenden nun (P5), um nachzuweien, daß ich für große k nur wenig von N untercheidet. In der Tat bedeutet ja N, daß e mindeten ein Intervall der Länge 1/k gibt, in dem 2 Punkte liegen, alo Wegen (P5) folgt { für k. Für m N und k N gilt: N } {D 1/k}. N ) D 1/k) 0 (5.3) N = m) N = m) = m, = N ) = m) N ) = m, = N ) + = m) + N ). N ) Unter Benutzung von (5.2) und (5.3) folgt: und analog Wir zeigen nun: N = m) = lim = m) = lim b(m; k, p k ) (5.4) k k kp k = E N m) = lim m). (5.5) k = lim kp k = λ. (5.6) k j = j) = l). j=1 l=1 l) it nach (5.1) nicht größer al N l) und trebt nach (5.5) für k gegen diee obere Grenze. Nach einem Satz über reelle Zahlenfolgen (fall nicht bekannt oder vergeen: Übungaufgabe!) folgt darau lim kp k = lim k k l=1 l) = N l) = EN = λ. l=1 Damit it (5.6) gezeigt. Uner Satz folgt nun au (5.4), (5.6) und dem Satz (5.5). 58