13 Diskrete Verteilungen DiscreteEmpiricalPDF@daten_, z_d := Module@8n, min, max, uni<, n = Length@datenD; min = Min@datenD; max=max@datend; uni=union@datend; If@MemberQ@daten, zd, BinCounts@daten, 8min, max + 1<D@@Position@uni, zd@@1, 1DDDDê n, 0D êê ND Wir haben bereits erwähnt, dass in der Verteilung Z einer Zufallsvariablen Z die gesamte Information über ihr zufälliges Verhalten enthalten ist. Damit ist die Verteilung Z einer Zufallsvariablen Z einer der fundamentalen Begriffe der Stochastik. Nun sind aber Verteilungen von Zufallsvariablen relativ komplizierte mathematische Gebilde, nämlich Abbildungen, die jeder (vernünftigen) Menge BŒ eine reelle Zahl zuordnen und dabei die in Satz 12.2.2 angeführten Eigenschaften besitzen. Will man mit Verteilungen - also mit W-Maßen auf - rechnen, so muss man mit diesen Verteilungen effizient arbeiten können. Dazu ist beispielsweise notwendig, eine Verteilung leicht und übersichtlich angeben und für beliebige Mengen BŒ die Wahrscheinlichkeit @BD leicht berechnen zu können. Wir werden uns in diesem Abschnitt mit der Frage befassen, wie dies bei diskreten Verteilungen geschehen kann. 13.1 Verteilungsdichten diskreter Verteilungen Wir beginnen mit einer zentralen Eigenschaft diskreter Verteilungen (vergleiche dazu Beispiel 12.2.3): 13.1.1 Bemerkung: Ist eine diskrete Verteilung mit dem Träger Œ, so gilt für alle BŒ @BD= @B D= zœb @8z<D Die diskrete Verteilung ist somit durch die Wahrscheinlichkeiten @8z<D mit zœ vollständig bestimmt. Wir nehmen diese Erkenntnis zum Anlass und definieren: 13.1.2 Definition: Unter der Verteilungsdichte (Probability Density Function oder kurz PDF) einer diskreten Verteilung mit dem Träger Œ versteht man die Abbildung : Ø mit @zd=; @8z<D für zœ 0 sonst Wegen Bemerkung 13.1.1 ist die diskrete Verteilung durch ihre Verteilungsdichte vollständig bestimmt. Die folgende Zeichnung zeigt die Verteilungsdichte einer diskreten Verteilung. Die Punkte an den Stellen zœ entsprechen dabei den Wahrscheinlichkeiten @zd= @8z<D.
50 13_Verteilungsdichten_diskreter_Verteilungen.nb 13.1.3 Bemerkung: Für die Verteilungsdichte einer diskreten Verteilung gilt a) Für alle zœ ist @zd= @8z<D 0; b) Die Summe über alle Werte @zd mit zœ ergibt den Wert 1, es gilt also zœ @zd=1
13_Verteilungsdichten_diskreter_Verteilungen.nb 51 Diese beiden Eigenschaften sind charakteristisch in dem Sinn, dass jede Funktion : Ø mit diesen Eigenschaften als Verteilungsdichte einer diskreten Verteilung aufgefasst werden kann. Man nennt diese beiden Eigenschaften daher die charakteristischen Eigenschaften der Verteilungsdichte einer diskreten Verteilung. 13.2 Verteilungsdichten in Mathematica Mit dem folgenden Befehl lässt sich die Verteilungsdichte einer in Mathematica implementierten diskreten Verteilungen (numerisch und formelmäßig) auswerten: à PDF@distribution, zd wertet die Verteilungsdichte der diskreten Verteilung distribution an der Stelle z aus. Man beachte, dass die Verteilungsdichte einer diskreten Verteilung keine reelle Funktion im Sinn von Mathematica ist und sich damit auch nicht! mit Hilfe von Plot zeichnen lässt. Will man die Verteilungsdichte einer diskreten Verteilung graphisch veranschaulichen, so verwende man dazu den Befehl ListPlot. Wir wollen nun die Verteilungsdichten der wichtigsten in Mathematica implementierten diskreten Verteilungen analysieren. Unser Ziel besteht darin, diese Verteilungsdichten formelmäßig explizit anzugeben und mit Hilfe von ListPlot und Manipulate auf dynamische Weise graphisch darzustellen. 13.2.1 Beispiel: Man ermittle die Verteilungsdichte der diskreten Gleichverteilung @8m, n<d mit den Parametern m<nœ und zeichne diese Verteilungsdichte. Lösung: Wegen DistributionDomain@DiscreteUniformDistribution@8m, n<dd PDF@DiscreteUniformDistribution@8m, n<d, zd Range@m, nd 1 1 m + n besitzt die diskrete Gleichverteilung @8m, n<d die Verteilungsdichte 1êHn-m+1L für zœ8m, m+1,, n< @zd=; 0 sonst Mit Hilfe von Manipulate lässt sich die Verteilungsdichte der diskreten Gleichverteilung @8m, n<d für beliebige Werte von m und n auf dynamische Weise graphisch darstellen (wobei noch die Abfrage m n eingebaut wurde):
52 13_Verteilungsdichten_diskreter_Verteilungen.nb Manipulate@If@m n, ListPlot@Table@8z, PDF@DiscreteUniformDistribution@8m, n<d, zd<, 8z, -21, 21<D, PlotStyle Æ PointSize@0.03D, Filling Æ Axis, AspectRatio Æ 0.4, AxesOrigin Æ 8-21, 0<, PlotRange Æ All, AxesLabel Æ 8z, @zd<, ImageSizeÆ8200, 100<D, "m>n"d, 8m, -20, 20, 1, Appearance Æ "Labeled"<, 8n, -20, 20, 1, Appearance Æ "Labeled"<D m -10 n 4 13.2.2 Beispiel: Man ermittle die Verteilungsdichte der Binomialverteilung @n, pd mit den Parametern nœ und 0 p 1 und zeichne diese Verteilungsdichte. Lösung: Wegen DistributionDomain@BinomialDistribution@n, pdd PDF@BinomialDistribution@n, pd, zd Range@0, nd H1 pl n z p z Binomial@n, zd besitzt die Binomialverteilung @n, pd die Verteilungsdichte @zd= Kn z O pz H1- pl n-z für zœ80, 1, 2,, n< 0 sonst Mit Hilfe von Manipulate lässt sich die Verteilungsdichte der Binomialverteilung @n, pd für beliebige Werte von n und p auf dynamische Weise graphisch darstellen:
13_Verteilungsdichten_diskreter_Verteilungen.nb 53 Manipulate@ListPlot@Table@8z, PDF@BinomialDistribution@n, pd, zd<, 8z, -1, 41<D, PlotStyle Æ PointSize@0.03D, Filling Æ Axis, AspectRatio Æ 0.4, AxesOrigin Æ 8-1, 0<, PlotRange Æ All, AxesLabel Æ8z, @zd<, ImageSize Æ 8200, 100<D, 8n, 1, 40, 1, Appearance Æ "Labeled"<, 8p, 0.1, 0.9, Appearance Æ "Labeled"<D n 18 p 0.677 13.2.3 Beispiel: Man ermittle die Verteilungsdichte der negativen Binomialverteilung @n, pd mit den Parametern nœ und 0 p 1 und zeichne diese Verteilungsdichte. 13.2.4 Beispiel: Man ermittle die Verteilungsdichte der hypergeometrischen Verteilung @n, n suc, n tot D mit den Parametern n, n suc, n tot œ und max@n, n suc D n tot und zeichne diese Verteilungsdichte. 13.2.5 Beispiel: Man ermittle die Verteilungsdichte der Poissonverteilung @ld mit dem Parameter l>0 und zeichne diese Verteilungsdichte. Lösung: Wegen DistributionDomain@PoissonDistribution@lDD PDF@PoissonDistribution@lD, zd Range@0, D λ λ z z! besitzt die Poissonverteilung @ld die Verteilungsdichte @zd=: -l l z êz! für zœ80, 1, 2, < 0 sonst Mit Hilfe von Manipulate lässt sich die Verteilungsdichte der Poissonverteilung @ld für beliebige Werte von l auf dynamische Weise graphisch darstellen:
54 13_Verteilungsdichten_diskreter_Verteilungen.nb Manipulate@ListPlot@Table@8z, PDF@PoissonDistribution@lD, zd<, 8z, -1, 40<D, PlotStyle -> PointSize@0.03D, Filling -> Axis, AspectRatio Æ 0.4, AxesOrigin Æ 80, 0<, PlotRange Æ All, AxesLabel Æ8z, @zd<, ImageSize Æ 8200, 100<D, 8l, 0.01, 20, Appearance Æ "Labeled"<D l 14.76
13_Verteilungsdichten_diskreter_Verteilungen.nb 55 13.3 Verteilungsdichten diskreter Zufallsvariablen Bisher haben wir uns mit den Verteilungsdichten von diskreten Verteilungen beschäftigt. Nun wollen wir uns mit den Verteilungsdichten Z von diskreten Zufallsvariablen Z befassen. 13.3.1 Definition: Unter der Verteilungsdichte Z einer diskreten Zufallsvariablen Z versteht man die Verteilungsdichte der Verteilung Z von Z, also die Abbildung Z : Ø mit Z @zd= @8Z = z<d für zœ Z 0 sonst Wegen Bemerkung 13.1.1 ist die Verteilung Z der diskreten Zufallsvariablen Z durch ihre Verteilungsdichte Z bereits vollständig bestimmt. An Hand von Beispielen werden wir nun zeigen, wie sich die Verteilungsdichte Z einer diskreten Zufallsvariablen Z ermitteln lässt. Es werden sich dabei auch Verteilungsdichten ergeben, welche nicht in Mathematica implementiert sind. Wir werden zeigen, wie sich diese Verteilungsdichten unter Verwendung von Mathematica behandeln lassen. 13.3.2 Beispiel: In Urne I befinden sich 3 rote und 7 schwarze Kugeln. In Urne II befindet sich 7 rote und 3 schwarze Kugeln. Aus diesen Urnen wird nun obwechselnd (beginnend mit Urne I) so lange jeweils eine Kugel gezogen, bis erstmals eine rote Kugel gezogen wird. Beobachtet wird die Anzahl X (bzw Y) der dabei aus der ersten (bzw zweiten) Urne gezogenen Kugeln. Man ermittle die Verteilungsdichte X (bzw Y ) und stelle die Ergebnisse als Histogramm dar, für den Fall, a) dass die Kugeln jeweils zurück gelegt werden, b) dass die Kugeln nicht zurück gelegt werden. Lösung: i) Wir bezeichnen mit A i das Ereignis beim i-ten Zug wird aus Urne I zum ersten Mal eine rote Kugel gezogen und mit B i das Ereignis beim i-ten Zug wird aus Urne II zum ersten Mal eine rote Kugel gezogen. Die Ereignisse A 1, A 2,... und B 1, B 2,... sind offenbar vollständig unabhängig. a) Es wird angennomen, daß die Kugeln jeweils zurück gelegt werden, so folgt @A i D= @AD= 3 10, @B id= @BD= 7, i=1, 2, 3,... 10 ii) Die Zufallsvariable X kann die Werte xœ X :=81, 2, 3,...< annehmen und ist damit diskret. Für die Menge 8X = k< erhält man also @8X = 1<D= @A BD= @AD+ @BD- @AD @BD @8X = 2<D= @A c B c HA BLD=H1- @ADLH1- @BDLH @AD+ @BD- @AD @BD... @8X = k<d= @ k-1 i=0 HA c B c L i HA BLD=@H1 - @ADLH1 - @BDLD k-1 H @AD+ @BD- @AD @BDL Also gilt für die Verteilungsdichte X von X X @xd= X @8X = x<d= @H1- @ADLH1- @BDLDx-1 H @AD+ @BD- @AD @BDL für xœ X :=81, 2, 3,...<, 0 sonst. Die Zufallsvariable Y kann die Werte yœ Y :=80, 1, 2,...< annehmen und ist damit auch diskret. Für die Menge 8Y = k< erhält man also @8Y = 0<D= @AD
56 13_Verteilungsdichten_diskreter_Verteilungen.nb @8Y = 1<D= @HA c BL HA c B c ALD=H1- @ADLH @AD+ @BD- @AD @BDLL;... @8Y = k<d= @ k-1 i=0 HA c B c L i HA c L HA BLD=H1 - @ADL k H1 - @BDL k-1 H @AD+ @BD- @AD @BDL Also gilt für die Verteilungsdichte Y von Y Y @yd= Y @8Y = y<d= H1- @ADLy H1- @BDL y-1 H @AD+ @BD- @AD @BDL für yœ Y :=80, 1, 2,...<, 0 sonst. iii) Die Verteilungsdichte lässt sich in Mathematica eingeben pa@n_, k_d := kên; pb@n_, k_d :=Hn - klên; f@x_, n_, k_d := 0 ê; Or@x < 1, NumberQ@xD && Not@IntegerQ@xDDD f@x_, n_, k_d :=HH1-pa@n, kdlh1 - pb@n, kdll x-1 Hpa@n, kd+pb@n, kd - pa@n, kd pb@n, kdl; TableForm@Table@8f@x, 10, 3D, x<, 8x, 1, 6<D, TableHeadings -> 8None, 8"Wahrscheinlichkeit", "X"<<D êê N Wahrscheinlichkeit X 0.79 1. 0.1659 2. 0.034839 3. 0.00731619 4. 0.0015364 5. 0.000322644 6. pa@n_, k_d := kên; pb@n_, k_d :=Hn - klên; g@y_, n_, k_d := 0 ê; Or@NumberQ@yD && Not@IntegerQ@yDDD g@y_, n_, k_d :=H1-pa@n, kdl y H1 - pb@n, kdl y-1 Hpa@n, kd+pb@n, kd - pa@n, kd pb@n, kdl; g@0, n_, k_d := pa@n, kd; TableForm@Table@8g@y, 10, 3D, y<, 8y, 0, 6<D, TableHeadings -> 8None, 8"Wahrscheinlichkeit", "Y"<<D êê N Wahrscheinlichkeit Y 0.3 0. 0.553 1. 0.11613 2. 0.0243873 3. 0.00512133 4. 0.00107548 5. 0.000225851 6. und für beliebige Wert von n und k auch graphisch durch ein Balkendiagramm darstellen:
13_Verteilungsdichten_diskreter_Verteilungen.nb 57 ManipulateAIfAk n, ListPlotA8Table@8x, f@x, n, kd<, 8x, 1, 10<D, Table@8y, g@y, n, kd<, 8y, 0, 10<D<, PlotStyle Æ PointSize@0.03D, Filling Æ Axis, AspectRatio Æ 0.4, AxesOrigin Æ 8-1, 0<, PlotRange Æ All, AxesLabel Æ9x, X @xd=, ImageSizeÆ8200, 100<E, "k>n"e, 8n, 2, 50, 1, Appearance Æ "Labeled"<, 8k, 1, 50, 1, Appearance Æ "Labeled"<E n 17 k 5 iv) Wir können auch überprüfen, ob diese Funktion Z für beliebige Werte von n tatsächlich eine diskrete Verteilungsdichte ist, ob also stets die Beziehungen gilt. n x=1 X @xd=1und n y=0 Y @yd=1 Sum@f@x, 10, 3D, 8x, 1, <D g@0, 10, 3D + Sum@g@y, 10, 3D, 8y, 1, <D 1 1 b) Es wird angennomen, daß die Kugeln nicht zurück gelegt werden. ii) Die Zufallsvariable X kann die Werte xœ X :=81, 2, 3, 4< annehmen und ist damit diskret. Für die Menge 8X = 1< erhält man also @8X = 1<D= @A 1 B 1 D= @A 1 D+ @B 1 D- @A 1 D @B 1 D @8X = 2<D= AA 1 c B1 c HA2 B 2 LE=H1- @A 1 DLH1- @B 1 DLH @A 2 D+ @B 2 D- @A 2 D @B 2 DL... k-1 @8X = k<d= A k-1 i=1 IAi c Bi c M IAk B k ME= H1- @Ai DLH1- @B i DLI AA k E+ AB k E- AA k E AB k EM, i=1 wobei AA k E= 3 11-k und AB k E= 7 11-k Also gilt für die Verteilungsdichte X von X X @xd= k-1 H1- @Ai DLH1- @B i DLH @A x D+ @B x D- @A x D @B x DL, für xœ X :=81, 2, 3, 4<, i=1 0 sonst. Die Zufallsvariable Y kann die Werte yœ Y :=80, 1, 2, 3, 4< annehmen und ist damit diskret. Für die Menge 8Y = 0< erhält man also
58 13_Verteilungsdichten_diskreter_Verteilungen.nb @8Y = 0<D= @A 1 D @8Y = 1<D= AIA 1 c B1 M IA 1 c B1 c A2 ME=H1- @A 1 DLH @A 2 D+ @B 1 D- @A 2 D @B 1 DL... @8Y = k<d= A k-1 i=1 IAi c Bi c M Ak c IAk+1 B k ME= k-1 H1- @Ai DLH1- @B i DLI1- AA k EMI AA k+1 E+ AB k E- AA k+1 E AB k EM i=1 Also gilt für die Verteilungsdichte Y von Y Y @yd= k-1 H1- @Ai DLH1- @B i DLI1- AA k EMI AA k+1 E+ AB k E- AA k+1 E AB k EM, für yœ Y :=80, 1, 2, 3, 4<, i=1 0 sonst, wobei AA k E= 3 11-k und AB k E= 7 11-k. iii) Die Verteilungsdichte lässt sich in Mathematica eingeben pa@j_, n_, k_d := kêhn + 1- jl; pb@j_, n_, k_d := Hn-kLêHn+1-jL; f@x_, n_, k_d := 0 ê; Or@x > n, NumberQ@xD && Not@IntegerQ@xDDD f@x_, n_, k_d := Product@H1-pa@i, n, kdlh1 - pb@i, n, kdl, 8i, 1, x-1<d* Hpa@x, n, kd + pb@x, n, kd - pa@x, n, kd pb@x, n, kdl; tf@n_, k_d := TableForm@Table@8f@x, n, kd, x<, 8x, 1, k+1<d, TableHeadings -> 8None, 8"Wahrscheinlichkeit", "X"<<D; tf@10, 3D êê N Wahrscheinlichkeit X 0.79 1. 0.178889 2. 0.0286806 3. 0.00243056 4. pa@j_, n_, k_d := kêhn + 1- jl; pb@j_, n_, k_d := Hn-kLêHn+1-jL; g@y_, n_, k_d := 0 ê; Or@y > n - 1, NumberQ@yD && Not@IntegerQ@yDDD g@y_, n_, k_d := Product@H1-pa@i, n, kdlh1 - pb@i, n, kdl, 8i, 1, y - 1<D*H1 - pa@y, n, kdl* Hpa@y + 1, n, kd + pb@y, n, kd-pa@y + 1, n, kd pb@y, n, kdl; g@0, n_, k_d = pa@1, n, kd; tg@n_, k_d := TableForm@Table@8g@y, n, kd, y<, 8y, 0, k+1<d, TableHeadings -> 8None, 8"Wahrscheinlichkeit", "Y"<<D; tg@10, 3D êê N Wahrscheinlichkeit Y 0.3 0. 0.56 1. 0.120556 2. 0.0180556 3. 0.00138889 4. und für beliebige Wert von n und k auch graphisch durch ein Balkendiagramm darstellen:
13_Verteilungsdichten_diskreter_Verteilungen.nb 59 ManipulateAIfAk n, ListPlotA8Table@8x, f@x, n, kd<, 8x, 1, 4<D, Table@8y, g@y, n, kd<, 8y, 0, 4<D<, PlotStyle Æ PointSize@0.03D, Filling Æ Axis, AspectRatio Æ 0.4, AxesOrigin Æ 8-1, 0<, PlotRange Æ All, AxesLabel Æ9x, X @xd=, ImageSizeÆ8200, 100<E, "k>n"e, 8n, 2, 50, 1, Appearance Æ "Labeled"<, 8k, 1, 50, 1, Appearance Æ "Labeled"<E n 26 k 15 iv) Wir können auch überprüfen, ob diese Funktione X und Y für beliebige Wert von n tatsächlich diskrete Verteilungsdichte sind, ob also stets die Beziehungen n x=1 X @xd=1und n x=1 Y @yd=1 gelten. Sum@f@x, 10, 3D, 8x, 1, 4<D g@0, 10, 3D + Sum@g@y, 10, 3D, 8y, 1, 4<D 1 1 13.3.3 Beispiel: Unser Zufallsexperiment besteht im Werfen von zwei homogenen Würfeln. Mit der Zufallsvariablen Z wird die dabei auftretenden Augensumme bezeichnet. Man analysiere die Verteilungsdichte Z von Z. Lösung: a) Als Ereignisraum für unser Zufallsexperiment bietet sich die Menge (vgl dazu Beispiel 3.2.2 und Besipiel 12.2.3) W=88x 1, x 2 < x i œ81, 2, 3, 4, 5, 6<< an, wobei alle Realisierungen gleichwahrscheinlich sind. b) Bei der Zufallsvariablen Z handelt es sich um die Abbildung Z :WØ mit Z@8x 1, x 2 <D= x 1 + x 2 Die Zufallsvariable Z kann offenbar nur die Werte zœ Z =82, 3,, 12< annehmen uns ist damit diskret. Für alle zœ Z entspricht das Ereignis 8Z = z< der Menge 8Z = z<=88x 1, x 2 <œw x 1 + x 2 = z< Also gilt für die Verteilungsdichte Z von Z
60 13_Verteilungsdichten_diskreter_Verteilungen.nb Z @zd= @8Z = z<d= Z Hz-1Lê6 2 für zœ82, 3,..., 7< H13-zLë6 2 für zœ88, 9,..., 12< 0 sonst fd1@z_d := 0 ê; Or@z < 2, z > 12, NumberQ@zD && Not@IntegerQ@zDDD fd1@z_d :=Hz-1Lê 6 ^2 ê; 2 z 7 fd1@z_d :=H13-zLê 6 ^2 ê; 8 z 12 ListPlot@Table@8z, fd1@zd<, 8z, 2, 12<D, PlotStyle Æ PointSize@0.03D, Filling Æ Axis, AspectRatio Æ 0.4, AxesOrigin Æ 8-1, 0<, PlotRange Æ All, AxesLabelÆ8z, @zd<, ImageSize Æ8200, 100<D 13.3.4 Beispiel: Durch einen Kanal werden n unabhängige Kodeworte übertragen (vgl. Beispiel 11.2.5). Die Wahrscheinlichkeit dafür, dass das Kodewort richtig empfangen wird, ist 0.9. Mit der Zufallsvariablen Z wird die Anzahl der Kodeworten, die richtig empfangen wurden, bezeichnet. Man analysiere die Verteilungsdichte Z von Z. Lösung: Die Zufallsvariable Z kann offenbar nur die Werte zœ Z =81, 2,, n< annehmen uns ist damit diskret. Aus dem Beispiel Z @zd= @8Z = z<d= H n z L 0.9z 0.1 n-z für zœ Z 0 sonst Diese Verteilungsdichte lässt sich mühelos in Mathematica eingeben fd1@z_, n_, p_d := 0 ê; Or@z < 1, z > n, NumberQ@zD && Not@IntegerQ@zDDD fd1@z_, n_, p_d := Binomial@n, zd p^zh1 - pl^hn - zl und mit Hilfe von Manipulate für beliebige Werte von p und n auf dynamische Weise graphisch darstellen:
13_Verteilungsdichten_diskreter_Verteilungen.nb 61 Manipulate@ListPlot@Table@8z, fd1@z, n, pd<, 8z, 1, 50<D, PlotStyle Æ PointSize@0.03D, Filling Æ Axis, AspectRatio Æ 0.4, AxesOrigin Æ 8-1, 0<, PlotRange Æ All, AxesLabel Æ8z, @zd<, ImageSize Æ 8200, 100<D, 8n, 1, 50, 1, Appearance Æ "Labeled"<, 8p, 0, 0.99, Appearance Æ "Labeled"<D n 24 p 0.613 Gelegentlich bereitet die theoretische Berechnung der Verteilungsdichte einer diskreten Zufallsvariablen Probleme. In diesen Fällen kann es sinnvoll sein, diese Verteilungsdichte durch Simulation näherungsweise zu ermitteln. Man erzeugt dazu eine genügend große Anzahl (vergleiche dazu unsere Faustregel) von Realisierungen dieser Zufallsvariablen Z und ermittelt von diesem Datenmaterial daten unter Verwendung des Befehls DiscreteEmpiricalPDF die diskrete empirische Verteilungsdichte. Für alle zœ stellt die diskrete empirische Verteilungsdichte `Z@zD=relative Häufigkeit des Ereignisses8z< im Datenmaterial daten eine gute Näherung für die gesuchte Verteilungsdichte der diskreten Zufallsvariablen Z dar.
62 13_Verteilungsdichten_diskreter_Verteilungen.nb à DiscreteEmpiricalPDF@daten, zd ordnet jedem zœ die relative Häufigkeit des Ereignisses 8z< im Datenmaterial daten zu. 13.3.5 Beispiel: Aus einer Urne mit s=8 schwarzen, r= 6 roten und g=4 grünen Kugeln werden so lange Kugeln gezogen und nach jedem Zug wieder zurückgelegt, bis erstmals hintereinander zwei gleich gefärbte Kugeln gezogen werden (vergleiche dazu Beispiel 4.2.18). Die Zufallsvariable Z gibt an, wieviele Züge dazu notwendig sind. Man bestimme die Verteilungsdichte Z von Z und ermittle damit die Wahrscheinlichkeit dafür, dass maximal m = 5 Züge notwendig sind, bis erstmals hintereinander zwei gleich gefärbte Kugeln gezogen werden. Lösung: a) Die Zufallsvariable Z kann nur Werte zœ Z =82, 3, < annehmen und ist damit diskret. Die exakte Berechnung der Wahrscheinlichkeiten Z @zd= @8Z = z<d für zœ Z ist kompliziert. Wir wollen deshalb diese Wahrscheinlichkeiten näherungsweise durch Simulation ermitteln, indem wir (analog zu Beispiel 4.2.18) viele mögliche Realisierungen dieser Zufallsvariablen Z erzeugen und von diesem Datenmaterial anschließend die relativen Häufigkeiten aller Werte zœ Z ermitteln. b) Wir simulieren dazu zuerst die Farbe farbe der gezogenen Kugel, ermitteln damit n=10 4 mögliche Zugserien, bestimmen für jede dieser Zugserien die Anzahl der Züge, welche notwendig sind, bis erstmals zweimal hintereinander Kugeln der gleichen Farbe gezogen werden und nennen dieses Datenmaterial daten: s = 8; r = 6; g = 4; n = 10 4 ; farbe@s_, r_, g_d := Which@x=RandomInteger@81, s + r + g<d; x s, schwarz, x s+r, rot, x>s+r, gründ daten = Table@For@zug = Table@farbe@s, r, gd, 82<D, zugp-1t =!= zugp-2t, zug = Append@zug, farbe@s, r, gddd; Length@zugD, 8n<D; c) Mit dem Befehl DiscreteEmpiricalPDF ermitteln wir nun die diskrete empirische Verteilungsdichte der Zufallsvariablen Z (dabei ist zu beachten, dass diese diskrete empirische Verteilungsdichte vom Datenmaterial daten abhängt und sich mit jedem neuen Aufruf von daten daher geringfügig ändern wird) fd4@z_d := DiscreteEmpiricalPDF@daten, zd und zeichnen diese diskrete empirische Verteilungsdichte: ListPlot@Table@8z, fd4@zd<, 8z, 0, 20<D, PlotStyle Æ PointSize@0.03D, Filling Æ Axis, AspectRatio Æ 0.4, AxesOrigin Æ 80, 0<, PlotRange Æ All, AxesLabelÆ8z, @zd<, ImageSize Æ8200, 100<D d) Für die Wahrscheinlichkeit dafür, dass maximal m = 5 Züge notwendig sind, bis erstmals hintereinander zwei gleich gefärbte Kugeln gezogen werden, gilt somit (näherungsweise)
13_Verteilungsdichten_diskreter_Verteilungen.nb 63 m=5; Sum@fd4@zD, 8z, 2, m<d êê N 0.8218 Clear@s, r, g, n, x, zug, farbe, daten, m, fd4d