Zufallsvariablen und ihre Verteilungen

Ähnliche Dokumente
Wahrscheinlichkeitsverteilungen

Grundbegriffe der Wahrscheinlichkeitstheorie

6. Stochastische Modelle II: Stetige Wahrscheinlichkeitsverteilungen, insbesondere Normalverteilungen

5 Binomial- und Poissonverteilung

WAHRSCHEINLICHKEIT. Erinnere dich

Glücksrad-Aufgabe. Das Glücksrad ist in 2 Sektoren mit den Zahlen 1 (Winkel 120 ) und 2 eingeteilt.

Klausur zur Wahrscheinlichkeitstheorie für Lehramtsstudierende

Inferenzstatistik (=schließende Statistik)


Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Binomialverteilung und Bernoulli- Experiment

Beispielaufgaben Binomialverteilung Lösungen

Programm. Wiederholung. Gleichverteilung Diskrete Gleichverteilung Stetige Gleichverteilung. Binomialverteilung. Hypergeometrische Verteilung

Universität Basel Wirtschaftswissenschaftliches Zentrum. Zufallsvariablen. Dr. Thomas Zehrt

Pflichtteilaufgaben zu Stochastik (Pfadregeln, Erwartungswert, Binomialverteilung) Baden-Württemberg

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

Polizeidienst-Aufgabe Abiturprüfung Bayern LK 2003

Erwartungswert, Varianz und Standardabweichung einer Zufallsgröße. Was ist eine Zufallsgröße und was genau deren Verteilung?

Konfidenzintervall für den Anteilswert θ. Konfidenzintervalle. Jost Reinecke. Universität Bielefeld. 13. Juni 2005

Fit for Abi & Study Stochastik

825 e 290 e 542 e 945 e 528 e 486 e 675 e 618 e 170 e 500 e 443 e 608 e. Zeichnen Sie das Box-Plot. Sind in dieser Stichprobe Ausreißer vorhanden?

TESTEN VON HYPOTHESEN

Stochastik. 1 Grundlagen

Wahrscheinlichkeitsverteilungen

Basistext - Wahrscheinlichkeitsrechnung

Sigma-Umgebung. Vergleichen wir die beiden Binomialverteilungen: n = 30 p = 0,5. n = 20 p = 0,75

Stoffverteilungsplan Mathematik Leistungskurs. Lambacher Schweizer Stochastik ISBN Klassenarbeit

Kapitel VI - Lage- und Streuungsparameter

Ü b u n g s b l a t t 15

Erwartungswert, Umgebungswahrscheinlichkeiten und die Normalverteilung

1 Grundlagen Wahrscheinlichkeitsrechung

Die Normalverteilung. Mathematik W30. Mag. Rainer Sickinger LMM, BR. v 0 Mag. Rainer Sickinger Mathematik W30 1 / 51

4.4 Punktschätzung. E(X 1 )+ +E(X n ) Var(ˆµ) = 1 n 2 ( Var(X1 )+ +Var(X n ) ) = 1 n 2nσ2 = σ2

SozialwissenschaftlerInnen II

SBP Mathe Aufbaukurs 1 # 0 by Clifford Wolf. SBP Mathe Aufbaukurs 1

Zufallsvariablen [random variable]

Klausur zur Wahrscheinlichkeitstheorie für Lehramtsstudierende

STOCHASTIK Die Binomialverteilung. Hartmut Meyer

Mathematik: Mag. Schmid Wolfgang & LehrerInnenteam Arbeitsblatt Semester ARBEITSBLATT 7-9. Was ist Wahrscheinlichkeit

WAHRSCHEINLICHKEITSLEHRE

SS 2017 Torsten Schreiber

Mathematik: LehrerInnenteam Arbeitsblatt Semester ARBEITSBLATT 12. Erwartungswert, Varianz und Standardabweichung

Abitur - Übung 1 Glege 9/11

Berechnung von W für die Elementarereignisse einer Zufallsgröße

Zufallsvariablen. Erwartungswert. Median. Perzentilen

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf. Vorlesung 04 Mathematische Grundlagen II,

P (X = 2) = 1/36, P (X = 3) = 2/36,...

Von der Normalverteilung zu z-werten und Konfidenzintervallen

Elemente der Stochastik (SoSe 2016) 9. Übungsblatt

5. Stochastische Modelle I: Diskrete Zufallsvariablen

Konfidenzintervalle. Einführung von Ac

Die Binomialverteilung

6.6 Poisson-Verteilung

2. Rechnen mit Wahrscheinlichkeiten

LANGFRISTIGE HAUSAUFGABE (STOCHASTIK)

Biometrieübung 5 Spezielle Verteilungen. 1. Anzahl von weiblichen Mäusen in Würfen von jeweils 4 Mäusen

Zufallsvariable X. 30 e. 40 e = 33,33...% 6

Unterrichtsplanung zur Einführung des Binomialkoeffizienten und der Binomialverteilung

Grundbegriffe der Wahrscheinlichkeitsrechnung

Diskrete Verteilungen

4b. Wahrscheinlichkeit und Binomialverteilung

Ringvorlesung Einführung in die Methoden der empirischen Sozialforschung II

Zufallsgröße X : Ω R X : ω Anzahl der geworfenen K`s

Wahrscheinlichkeit3 Binomialverteilung/Bernoulli-Formel

Zusammenfassung PVK Statistik

Statistik für Ingenieure Vorlesung 3

Es gibt insgesamt 14 Grundkompetenzpunkte: Je einen für jede der 12 Teil-1-Aufgaben und jede der beiden mit A gekennzeichnete Aufgaben aus Teil 2.

Wahrscheinlichkeitstheorie und Statistik

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments

Der Trainer einer Fußballmannschaft stellt die Spieler seiner Mannschaft auf. Insgesamt besteht der Kader seiner Mannschaft aus 23 Spielern.

Arbeitsblatt 27: Normalverteilung Kerzen

70 Wichtige kontinuierliche Verteilungen

Abiturvorbereitung Stochastik. neue friedländer gesamtschule Klasse 12 GB Holger Wuschke B.Sc.

Statistik 1 Beispiele zum Üben

Wahrscheinlichkeit und Statistik: Zusammenfassung

A: Beispiele Beispiel 1: Zwei Zufallsvariablen X und Y besitzen die beiden folgenden Wahrscheinlichkeitsfunktionen:

Marcel Dettling. GdM 2: LinAlg & Statistik FS 2017 Woche 11. Winterthur, 10. Mai Institut für Datenanalyse und Prozessdesign

Serie 9, Musterlösung

Elemente der Stochastik (SoSe 2016) 10. Übungsblatt

Klausur zur Wahrscheinlichkeitstheorie für Lehramtsstudierende

Exemplar für Prüfer/innen

Stochastik - Kapitel 2

Abitur 2009 Mathematik GK Stochastik Aufgabe C1

Ausgewählte spezielle Verteilungen

1 Stochastische Konvergenz 2. 2 Das Gesetz der grossen Zahlen 4. 3 Der Satz von Bernoulli 6

Diskrete Zufallsvariable*

Sprechstunde zur Klausurvorbereitung

Stoffverteilungsplan Mathematik Grundkurs. Lambacher Schweizer Stochastik ISBN Klassenarbeit

Statistisches Testen

Übung Zeigen Sie, dass dies als Grenzwert der Wahrscheinlichkeitsfunktion der Binomialverteilung mit

Unabhängigkeit KAPITEL 4

Marcus Hudec. Statistik 2 für SoziologInnen. Normalverteilung. Univ.Prof. Dr. Marcus Hudec. Statistik 2 für SoziologInnen 1 Normalverteilung

5. Spezielle stetige Verteilungen

Stetige Verteilungen. A: Beispiele Beispiel 1: a) In den folgenden Abbildungen sind die Dichtefunktionen von drei bekannten Verteilungen graphisch

Die ABSOLUTE HÄUFIGKEIT einer Merkmalsausprägung gibt an, wie oft diese in der Erhebung eingetreten ist.

Zufallsgröße: X : Ω R mit X : ω Anzahl der geworfenen K`s

Transkript:

Zufallsvariablen und ihre Verteilungen Beispiele von Zufallsvariablen Beispiel 1: Augenzahl eines Würfels Beim Werfen eines Würfels kann die Augenzahl die Werte 1, 2, 3, 4, 5, 6 annehmen. Bei einem idealen Würfel sind die Wahrscheinlichkeiten für das Auftreten dieser Werte gleich groß und in der folgenden Tabelle und in neben stehendem Stabdiagramm eingetragen. Augenzahl 1 2 3 4 5 6 Wahrscheinlichkeit 1 6 1 6 1 6 1 6 1 6 1 6 1 2 3 4 5 6 Beispiel 2: Augensumme zweier Würfel Beim Werfen zweier Würfel kann die Augenzahl jedes Würfels die Werte 1, 2, 3, 4, 5, 6 annehmen. Bildet man die Augensumme ergeben sich die in der Tabelle dargestellten Werte. Die Augensumme nimmt dabei die Werte 2, 3,, 12 an. Unter der Annahme, dass wir mit zwei idealen Würfeln spielen, d.h. die Augenzahlen 1, 2, 3, 4, 5, 6 sind für jeden Würfel gleich wahrscheinlich, treten die Werte der Augensumme mit unterschiedlichen Wahrscheinlichkeiten auf: Die Augensumme 2 tritt in den 36 möglichen Fällen nur 1-mal auf p2 1 36 die Augensumme 3 tritt in den 36 m;glichen Augenzahl des 2. Würfels Augenzahl des 1. Würfels 1 2 3 4 5 6 1 2 3 4 5 6 7 2 3 4 5 6 7 8 3 4 5 6 7 8 9 4 5 6 7 8 9 10 5 6 7 8 9 10 11 6 7 8 9 10 11 12 Fällen insgesamt 2-mal auf p2 2 36 Entsprechend ergeben sich für die weiteren möglichen Versuchsausfälle die in der folgenden Tabelle dargestellten Wahrscheinlichkeiten: Augensumme 2 3 4 5 6 7 8 9 10 11 12

Wahrscheinlichkeit 1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1 36 Entsprechend der Wahrscheinlichkeiten ergibt sich für die Augensumme das neben stehende Stabdiagramm 2 3 4 5 6 7 8 9 10 11 12 Beispiel 3: Anzahl von Kopf bei dreimaligem Münzwurf Eine Münze wird dreimal geworfen und es wird gezählt, wie oft dabei das Ereignis Kopf eintritt. Die Kopfanzahl kann damit die Werte 0, 1, 2, 3 annehmen. Zur Bestimmung der Wahrscheinlichkeiten für das Eintreten eines dieser Ereignisse bestimmen wir mit Hilfe eines Baumdiagrammes sämtliche Möglichkeiten von Versuchsausfällen. Es gibt genau 1 Möglichkeit, dass Kopf nicht vorkommt. Die Wahrscheinlichkeit für dieses Ereignis ist: p0 mal Kopf 1 2 1 2 1 2 1 8 Das Ereignis 1-mal Kopf kommt insgesamt 3-mal vor, entsprechend ergibt sich für dessen Wahrscheinlichkeit: p1 mal Kopf 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 3 8 Das Ereignis 2-mal Kopf tritt ebenfalls 3-mal auf, d.h. dessen Wahrscheinlichkeit ist: p2 mal Kopf 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 3 8 Das Ereignis 3-mal Kopf triff nur 1-mal auf, damit ist die Wahrscheinlichkeit für sein Eintreten: p3 mal Kopf 1 2 1 2 1 2 1 8 Mit diesen Ergebnissen lassen sich die Wahrscheinlichkeiten für das Ereignis Anzahl von Kopf in der folgenden Tabelle und dem folgenden Stabdiagramm darstellen: Anzahl Kopf 0 1 2 3

Wahrscheinlichkeit 1 8 3 8 3 8 1 8 0 1 2 3 Beispiel 4: Wurfanzahl bis zum ersten Sechser Ein Würfel wird solange geworfen, bis eine Sechs gewürfelt wird. Die Anzahl der dafür nötigen Würfe wird festgehalten. Sie kann die Werte 1, 2, 3, annehmen. Zur Bestimmung der Wahrscheinlichkeit für das Auftreten eines dieser Ereignisse zeichnen wir das folgende Baumdiagramm: Die Wahrscheinlichkeit, dass eine Sechs beim ersten Wurf kommt, ist: p6beim 1. Wurf 1 6 0,1667 Kommt die Sechs beim zweiten Wurf, erhalten wir die Wahrscheinlichkeit: p6beim 2.Wurf 5 6 1 6 0,1389 Die Wahrscheinlichkeit, dass die Sechs beim dritten Wurf kommt, errechnet sich aus: p6beim 3.Wurf 5 6 5 6 1 6 5 2 6 1 6 0,1157 Für die Wahrscheinlichkeit, dass die Sechs beim n-ten Wurf auftritt, kann die folgende Beziehung hergeleitet werden: p6beimn ten.wurf 5 6 n 1 1 6 Mit dieser Beziehung lassen sich nun die folgende Tabelle und das folgende Stabdiagramm für die Wahrscheinlichkeiten bilden: Wurfanzahl 1 2 3... n

Wahrscheinlichkeit 1 6 0,1667 5 6 1 6 0,1389 5 2 6 1... 0,1157 6 5 n 1 6 1 6 0,18 0,16 0,14 0,12 0,10 0,08 0,06 0,04 0,02 0,00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 In jedem der betrachteten Beispiele liegt ein Zufallsexperiment vor, in dem einer Variablen ein bestimmter Wert zugewiesen wird (z.b. dem Wurfergebnis zweier Würfel wird deren Augensumme zugewiesen). Da das Ergebnis eines derartigen Versuches vom Zufall abhängig ist, bezeichnet man die Variable eines derartigen Experimentes als Zufallsvariable. Eine Zufallsvariable ordnet jedem Ausfall eines Zufallsexperimentes eine reelle Zahl zu. Zufallsvariable werden mit Großbuchstaben (z.b. X, Y ) bezeichnet. Nimmt eine Zufallsvariable einen bestimmten Wert, z.b. a an, schreibt man X a. Mit p X a bezeichnet man jene Wahrscheinlichkeit, die dem Versuchsausfall a der Zufallsvariable X zugeordnet ist. Der Ausdruck p X a bedeutet entsprechend, die Wahrscheinlichkeit, dass X einen Wert a annimmt. Analog sind die Schreibweisen px a, p X a und p X a zu verstehen. Mit pa X b bezeichnet man die Wahrscheinlichkeit, dass die Variable X einen Wert zwischen a und b annimmt. Analog sind pa X b, pa X b und pa X b zu verstehen. Die Werte einer Zufallsvariablen müssen nicht unbedingt Zahlen sein. Betrachtet man die Augenfarbe von willkürlich ausgewählten Personen, dann nimmt die Zufallsvariable die Werte blau, grün, grau, etc. an. Man kann jedoch durch eine geeignete Zuordnugsvorschrift, jedem Wert der Zufallsvariablen eine eindeutige Zahl zuordnen. Wahrscheinlichkeitsverteilungen In den oben angeführten Beispielen haben wir für jeden Wert der betrachteten Zufallsvariablen eine Wahrscheinlichkeit bestimmt. Die Bestimmung der Wahrscheinlichkeiten erfolgte dabei über Tabellen, Baumdiagramme bzw. im Falle des

letzten Beispiels durch eine Formel. Zuordnungen, die den Werten von Zufallsvariablen bestimmte Wahrscheinlichkeiten zuordnen, werden als Wahrscheinlichkeitsverteilungen bezeichnet: Definition: Sei X eine Zufallsvariable, die die (endlich oder unendlich vielen) Werte a 1, a 2, a 3, annehmen kann. Wird jedem Wert a i eine Wahrscheinlichkeit p X a i zugeordnet, so wird diese Zuordnung als Wahrscheinlichkeitsverteilung von X bezeichnet. Manche Wahrscheinlichkeitsverteilungen haben auf Grund ihrer charakteristischen Form bestimmte Namen: Gleichverteilung (Beispiel 1) Dreiecksverteilung (Beispiel 2) Binomialverteilung (Beispiel 3) geometrische Verteilung (Beispiel 4) Zusammenhang zwischen Häufigkeitsverteilungen und Wahrscheinlichkeitsverteilungen Führen wir ein Zufallsexperiment durch, können wir die absoluten Häufigkeiten der Versuchsausfälle registrieren, bzw. aus den absoluten Häufigkeiten die relativen Häufigkeiten bestimmen. Damit erhält man ein (absolute bzw. relative) Häufigkeitsverteilung der Zufallsvariablen X. In der folgenden Abbildung sind die relativen Häufigkeitsverteilungen für die die Augensumme für n 20, n 100 bzw. n 10000 dargestellt. 2 3 4 5 6 7 8 9 10 11 12 2 3 4 5 6 7 8 9 10 11 12 2 3 4 5 6 7 8 9 10 11 12 Mit steigendem n nähern sich die relativen Häufigkeitswerte immer mehr den Wahrscheinlichkeiten px a an. Dies führt zum: Empirisches Gesetz der großen Zahl: Wird eine Versuchsserie zu je n Versuchen mehrfach durchgeführt und ist n groß, so weichen die einzelnen Häufigkeitsverteilungen nur wenig voneinander ab und schwanke

um die entsprechende Wahrscheinlichkeitsverteilung. Mittelwert und empirische Varianz einer Häufigkeitsverteilung Definition: Es seien a 1, a 2,, a k die möglichen Werte einer Zufallsvariablen X. Bei n -maliger Durchführung des Zufallsexperimentes ergebe sich eine Liste von n Variablenwerten, wobei der Wert a i mit der absoluten Häufigkeit H n a i bzw. mit der relativen Häufigkeit h n a i 1 i k auftritt. Man setzt: Mittelwert x der Liste: x a 1 H n a 1 a 2 H n a 2 a k H n a k n a 1 h n a 1 a 2 h n a 2 a k h n a k Empirische Varianz s 2 der Liste: s 2 a 1 x 2 H n a 1 a 2 x 2 H n a 2 a k x 2 H n a k n a 1 x 2 h n a 1 a 2 x 2 h n a 2 a k x 2 h n a k Empirische Standardabweichung s Varianz. der Liste: s ist die Wurzel aus der empirischen s s 2 Die oben angegebene Formel zur Berechnung der empirischen Varianz eignet sich gut als Streuungsmaß für die Häufigkeitsverteilung von X, für die praktische Berechnung ist allerdings die folgende Formel besser geeignet: Satz: Tritt jeder mögliche Wert a i einer Zufallsvariablen mit der absoluten Häufigkeit H n a i bzw. mit der relativen Häufigkeit h n a i auf( 1 i k ), so gilt: s 2 a 1 2 H n a 1 a 2 2 H n a 2 a k 2 H n a k n x 2 [a 1 2 h n a 1 a 2 2 h n a 2 a k 2 h n a k ] x 2

Erwartungswert und Varianz einer Zufallsvariablen Erwartungswert Das neben stehende Glücksrad ist in 4 Sektoren geteilt. Der relative Anteil eines Sektors an der Gesamtfläche ist in jedem Sektor eingetragen. Die Zahlen am Rande legen die Höhe des Gewinnes für jeden Sektor fest. Wird nun das Glücksrad sehr oft gedreht, stellt sich die Frage, wie hoch der mittlere Gewinn ausfallen wird? Es sei Gewinn die Zufallsvariable, die die Werte 0, 2, 5, 10 annehmen kann. Wird das Glücksrad n-mal gedreht, tritt jeder dieser Werte mit der relativen Häufigkeit h n 0, h n 2, h n 5 und h n 10 auf. Der Mittelwert x der Gewinne aller Spiele ist dann: x 0 h n 0 2 h n 2 5 h n 5 10 h n 10. Wenn n sehr groß ist, nähern sich die Werte der relativen Häufigkeiten den entsprechenden Wahrscheinlichkeiten: h n 0 0,4, h n 2 0,3, h n 5 0,2, h n 10 0,1 Im Durchschnitt werden wir bei jeder Drehung des Glücksrades mit einem Gewinn von zu rechnen haben. x 0 0,4 2 0,3 5 0,2 10 0,1 2,6 In einem Zufallsexperiment, dessen Zufallsvariable X die Werte a 1, a 2,, a k annehmen kann nähert sich große n der Mittelwert x dem Wert: a 1 pa 1 a 2 pa 2 a k pa k Definition: Es sei X eine Zufallsvariable mit den Werten a 1, a 2,, a k denen die Wahrscheinlichkeiten p 1, p 2,, p k zugeordnet sind. Dann nennt man E X a 1 p 1 a 2 p 2 a k p k den Erwartungswert von X

Der Erwartungswert einer Zufallsvariablen ist näherungsweise gleich dem Mittelwert einer sehr langen Liste von Variablenwerten. Varianz und Standardabweichung Ähnliches wie für den Mittelwert x einer Häufigkeitsverteilung gilt auch für die empirische Varianz. Führt man ein Zufallsexperiment sehr oft durch, nähern sich die relativen Häufigkeiten den Wahrscheinlichkeiten. Damit nähert sich die empirische Varianz s 2 a 1 x 2 h n a 1 a 2 x 2 h n a 2 a k x 2 h n a k immer mehr dem Ausdruck a 1 2 p 1 a 2 2 p 2 a k 2 p k Dieser Ausdruck wird als Varianz von X bezeichnet. Definition: Es sei X eine Zufallsvariable mit den Werten a 1, a 2,, a k denen die Wahrscheinlichkeiten p 1, p 2,, p k zugeordnet sind. Dann nennt man 2 V X a 1 2 p 1 a 2 2 p 2 a k 2 p k die Varianz von X Die Zahl V X heißt Standardabweichung von X. Die Varianz (Standardabweichung) einer Zufallsvariablen ist näherungsweise gleich der empirischen Varianz (empirischen Standardabweichung) einer sehr langen Liste von Variablenwerten. Ähnlich wie für die empirische Varianz gilt auch hie der Satz: Satz: Tritt jeder mögliche Wert a i einer Zufallsvariablen mit der Wahrscheinlichkeit p i auf ( 1 i k ), so gilt: 2 [a 1 2 p 1 a 2 2 p 2 a k 2 p k ] 2 Zehn Jugendliche nehmen an einem Test teil, bei dem 5 Begriffe zu erraten sind. Die Anzahlen der erratenen Begriffe sind in der folgenden Liste angegeben: 1, 3, 2, 2, 4, 5, 0, 4, 5, 4 1. Welche Werte kann die Zufallsvariable Anzahl erratener Begriffe annehmen?

Berechne die absoluten und relativen Häufigkeiten dieser Werte. 2. Berechne den Mittelwert x der Liste auf zwei Arten, einmal mit den absoluten und einmal mit den relativen Häufigkeiten. 3. Berechne die empirische Varianz s 2 der Liste nach der unten stehender Definition auf zwei Arten, einmal mit den absoluten und einmal mit den relativen Häufigkeiten. 4. Berechne die empirische Varianz s 2 der Liste nach dem folgenden Satz und vergleiche mit den Ergebnissen von 3) s 2 a 2 1 H n a 1 a 2 2 H n a 2 a 2 k H n a k x 2 n [a 2 1 h n a 1 a 2 2 h n a 2 a 2 k h n a k 2 ] x 2 5. Berechne die Standardabweichung s der Liste (ad 1: 0, 1, 2, 3, 4, 5 ad 2: x 3, ad 3: s 2 2,6, ad 4: s 2 2,6, ad 5: 2,6 ) Die SchülerInnen der Klassen 7a und 7b treten zu einem Mathematikwettbewerb an. Es sind sechs etwa gleich schwere Aufgaben zu lösen, wobei nur vollständig gelöste Aufgaben zählen. Die Anzahlen der gelösten Aufgaben sind für die einzelnen SchülerInnen in der folgenden Liste angegeben: 7a: 3, 3, 5, 1, 0, 1, 2, 4, 4, 2, 0, 3, 4, 1, 4, 5, 2, 6, 1, 4, 2, 3, 5, 4, 3 7b: 3, 4, 4, 6, 1, 2, 4, 2, 2, 0, 1, 3, 2, 6, 3, 1, 2, 5, 1, 3, 2, 3, 3 1. Stelle die Verteilung der relativen Häufigkeiten der Anzahl gelöster Aufgaben für jede Klasse durch ein Stabdiagramm dar. 2. Berechne für jede Klasse den Mittelwert, die empirische Varianz und die empirische Standardabweichung. 3. Welche Klasse hat besser abgeschnitten? Wie lassen sich die unterschiedlichen Standardabweichungen deuten? (ad 2: x a 2,88, x b 2,739 s a 2 2,586, s b 2 0,975 a 1,608, b 0,987, ad 3: in der Klasse 7a haben die Schüler im Schnitt mehr Aufgaben gelöst, allerdings ist die Standardabweichung für die Klasse 7b geringer, d.h. die Anzahl der gelösten Aufgaben weicht weniger stark vom Durchschnitt ab.) Ein Werkstück wurde mit zwei Waagen jeweils zehnmal gewogen. Dabei ergaben sich die folgenden, leicht schwankenden Messergebnisse (in Milligramm) 1. Waage: 42, 43, 43, 41, 42, 42, 42, 43, 43, 41 2. Waage: 43, 42, 42, 43, 42, 42, 41, 42, 42, 43 Zeige, dass beide Waagen das selbe mittlere Gewicht des Werkstückes liefern. Welche Waage kann man als genauer bezeichnen? Begründe! ( x 1 x 2 42,2 1 0,56, 2 0,36 )

Reißnägel der Marke A und B werden in Schachteln zu je 100 Stück verpackt, doch ergeben sich bei der Serienabfüllung leichte Schwankungen. Bei der Untersuchung von 20 Schachteln jeder Marke ergaben sich die folgenden absoluten Häufigkeiten: Marke A: Schachtelinhalt (Stück) 97 98 99 100 101 102 103 Absolute Häufigkeit 1 2 4 8 3 1 1 Marke B: Schachtelinhalt (Stück) 97 98 99 100 101 102 103 Absolute Häufigkeit 2 2 5 7 3 0 1 1. Berechne die relativen Häufigkeiten. 2. Berechne für beide Marken den Mittelwert, die empirische Varianz und die empirische Standardabweichung des Schachtelinhaltes. 3. Welche Marke soll man eher kaufen, wenn eine Schachtel der Marke A gleich teuer ist wie eine Schachtel der Marke B? Bei welcher Marke muss die Herstellerfirma eher mit einer Reklamation rechnen? Begründe die Antworten. ( x A 99,85, x B 99,55 A 1,828, B 1,948 ) Die Binomialkoeffizienten Betrachten wir ein Glücksrad, das in zwei Sektoren geteilt ist. Das rote Feld bezeichne dabei einen Treffer (T), entsprechend bezeichne das grüne Feld einen Nichttreffer (N). Drehen wir das Glücksrad nun z.b. viermal, erhalten wir vier Versuchsausfälle, die als Quadrupel (z.b. TTNT) angeschrieben werden können. Zur Beantwortung der Frage, wie viele mögliche Quadrupel gebildet werden können, betrachten wir das folgende Baumdiagramm:

In diesem Baumdiagramm entspricht jedem Treffer eine nach rechts führende, jedem Nichttreffer eine nach links führende Strecke. Jedem Versuchsausfall entspricht ein Weg von der Spitze bis zu einem Knoten ganz unten. Die Zahlen an den rot eingefärbten Knoten geben die Anzahl der möglichen Wege an, die von der Spitze zu diesem Knoten führen. Zu diesen Zahlen kommt man, indem man alle Wege, die zu einem Endknoten führen abzählt. Wird das Glücksrad allerdings öfter als 4-mal gedreht, wird das Abzählen der möglichen Wege sehr schnell unübersichtlich und mühsam. Es stellt sich die Frage, ob diese Zahlen auf einem anderen Weg bestimmt werden können. Dazu überlegen wir nochmals, wie man zu den Zahlen in der untersten Reihe kommen kann: zum ersten und zum letzten Knoten der letzten Zeile führt jeweils ein einziger Weg. Für den zweiten Knoten der letzten Zeile gibt es zwei Möglichkeiten: zum links darüber stehenden Knoten führt genau ein Weg. Durch Anhängen eines T's kommt man zum gewünschten Knoten. Die zweite Möglichkeit führt über den rechts darüber stehenden Knoten. Zu diesem Knoten führen 3 Wege und durch Anhängen eines N's kommen wir wieder zum gewünschten Knoten. Damit gibt es insgesamt 1 3 4 mögliche Wege. Durch analoge Schlüsse stellt man fest, dass zum 3. Knoten der letzten Zeile 3 3 6, zum 4. Knoten 3 1 4 Wege und zum letzten Knoten wieder genau ein Weg führen. Diese Überlegungen lassen sich in analoger Weise für jede beliebige Zeile anstellen, d.h. es gibt ein allgemeines Schema, mit dem das Baumdiagramm beliebig weit fortgesetzt werden kann: In jeder Zeile schreibt man am linken und am rechten Rand die Zahl 1. Die übrigen Zahlen ergeben sich aus der Summer der unmittelbar darüber stehenden Knoten. In der folgenden Abbildung wurde das Baumdiagramm bis zur 7-ten Zeile fortgesetzt. Dieses, beliebig weit fortsetzbare Schema, wird als Pascal'sches Dreick bezeichnet. n 1 1 1 n 2 1 2 1 n 3 1 3 3 1 n 4 1 4 6 4 1 n 5 1 5 10 10 5 1 n 6 1 6 15 20 15 6 1 n 7 1 7 21 35 35 21 7 1 Aus dem Pascal'schen Dreieck ist zu erkennen, dass der k-1 - te Knoten in der n-ten Zeile

angibt, wie viele n-tupel es gibt, in denen T k-mal vorkommt. In der dritten Zeile z.b. gibt der erste Knoten an, dass es 1 Tripel gibt, in dem T 0-mal vorkommt. Der zweite Knoten besagt, dass es 3 Tripel gibt, in denen T genau 1-mal vorkommt, der dritte Knote besagt, dass es ebenfalls 3 Tripel gibt, in denen T 2-mal vorkommt. Die vierte Knoten schließlich besagt, dass es genau 1 Tripel gibt in dem T 3- mal vorkommt. Für die Anzahl der n-tupel gibt es in der Mathematik ein eigenes Symbol: Definition: Die Anzahl der aus zwei Elementen (z.b. T und N) gebildeten n-tupel, in denen eines der beiden Elemente (z.b. T) genau k-mal vorkommt, bezeichnet man mit n [sprich: n über k] ( n 1, 0 k n ) k Die Zahlen n k heißen Binomialkoeffizienten. Berechnung der Binomialkoeffizienten Zur Berechnung der Binomialkoeffizienten kann prinzipiell das Pascal'sche Dreieck herangezogen werden, daneben gibt es aber auch die folgende Formel: n n n 1 n 2 n k 1 k k k 1 k 2 1 n! k! n k! Dabei ist n! 1 2 3 n Berechne 12 6, 17 11 und 19 5. (924, 12376, 11628) Wir betrachten sinnlose Wörter aus 10 Buchstaben, wobei nur die Buchstaben A und B verwendet werden, zum Beispiel AAABBABABB. Wie viele solche Wörter kann man bilden, wenn der Buchstaben A a. nie b. genau zweimal c. genau fünfmal d. genau siebenmal e. genau zehnmal vorkommen soll? (1, 45, 252, 120, 1)

Eine Münze wird zweimal geworfen. Bei jedem Wurf kann Kopf (K) oder Zahl (Z) kommen. a. Zeichne ein Diagramm b. Schreib alle Versuchsausfälle als Paare mit Hilfe der Elemente K und Z an (also KK, KZ, ). In wie vielen Versuchsausfällen kommt k genau 0-mal, 1-mal bzw. 2- mal vor? Wie kann man diese Anzahlen auch mit Hilfe der Binomialkoeffizienten berechnen? (ad b: in 1 Versuchsausfällen kommt K genau 0-mal vor, in 2 Versuchsausfällen kommt K genau 1-mal vor, in 1 Versuchsausfällen kommt K genau 2-mal vor) Eigenschaften der Binomialkoeffizienten Aus dem Pascal'schen Dreieck ist zu erkennen: 1. in jeder Zeile steht am linken und am rechten Rand die Zahl 1 2. Die Zahlen in einer Zeile sind symmetrisch angeordnet. Die erste Zahle ist gleich der letzten, die zweite ist gleich der vorletzten, usw. 3. ab der zweiten Zeile kann jede nicht am linke oder rechten Rand stehende Zahl als Summe der unmittelbar darüber stehenden Zahlen gebildet werden. Mit Hilfe des Symbols n k lassen sich diese Beobachtungen wie folgt formulieren: Satz: 1. Für all n N gilt: n 0 1 und n n 1 2. für all n N und alle k N mit 0 k n gilt: n k n n k 3. für all n N mit n 2 und alle k N mit 1 k n 1 gilt: n k n 1 k 1 n 1 k Der Binomiallehrsatz Die Bezeichnung Binomialkoeffizienten rührt daher, dass die Zahlen in den binomischen Formeln a b n vorkommen. Es gilt der folgende Satz: n k als Koeffizienten Satz (Binomiallehrsatz): für alle a, b R und alle n N gilt: a b n n 0 an b 0 n 1 an 1 b 1 n 2 an 2 b 2 n n a0 b n

Die Binomialverteilung Wir betrachten wieder ein Glücksrad, das in zwei Sektoren geteilt ist. Das rote Feld bezeichne dabei einen Treffer (T), entsprechend bezeichne das grüne Feld einen Nichttreffer (N). Das Glücksrad werde n- mal gedreht. Die absolute Häufigkeit der Anzahl der Treffer T kann dabei die Werte H 0,1, 2,...,n annehmen. Die Wahrscheinlichkeit für das Eintreten des Ereignisses T sei PT p, entsprechend ist die Wahrscheinlichkeit für das Eintreten von N p N 1 p. Wir fragen uns nun, mit welcher Wahrscheinlichkeit nimmt die Zufallsvariable Werte H 0,1, 2,...,n an. Zur Beantwortung dieser Frage betrachten wir das folgende Baumdiagramm. H die Einem Versuchsausfall H des Zufallsexperimentes, in dem das Glücksrad k-mal auf T stehen bleibt, entspricht einem Weg von der Spitze bis zu einem bestimmten Endknoten des Baumes. Auf diesem Weg, der aus n Strecken besteht, gibt es k T-Knoten und entsprechend n k N-Knoten. Zu jedem der T-Knoten führt eine Strecke, die mit der Wahrscheinlichkeit p eingeschlagen wird. Umgekehrt führt zu jedem N-Knoten eine Strecke, die mit der Wahrscheinlichkeit p N 1 p eingeschlagen wird. Für den vollständigen Weg ergibt sich damit die Wahrscheinlichkeit p k 1 p n k. Da es insgesamt n k solcher Wege gibt, erhalten wir für die Wahrscheinlichkeit ph k : ph k n k pk 1 p n k

Es gilt der folgende Satz: Satz: Bei einem Zufallsversuch trete ein Ereignis E (Treffer) mit der Wahrscheinlichkeit p ein. Der Versuch werde n-mal unter gleichen Bedingungen durchgeführt. Ist H die Anzahl der Versuch, bei denen E eintritt, dann gilt: ph k n k pk 1 p n k (für 0 k n ) Mit der Formel aus obigen Satz kann für jeden Wert k der Zufallsvariable H die zugehörige Wahrscheinlichkeit berechnet werden. Damit ist aber eine Wahrscheinlichkeitsverteilung festgelegt. Diese Wahrscheinlichkeitsverteilung hat einen eigenen Namen: Definition: Es sei H eine Zufallsvariable mit den möglichen Werten 0, 1, 2,..., n. Wird jedem dieser Werte die Wahrscheinlichkeit ph k n k pk 1 p n k mit 0 k n und 0 p 1 zugeordnet, dann bezeichnet man die dadurch festgelegte Wahrscheinlichkeitsverteilung als Binomialverteilung mit den Parametern n und p. Die Zufallsvariable nennt man binomialverteilt mit den Parametern n und p. Beispiel: Ein Münze wird zwölfmal geworfen. Wie groß ist die Wahrscheinlichkeit, dass a. genau viermal b. genau sechsmal c. genau achtmal Kopf kommt? Die Wahrscheinlichkeit, dass Kopf kommt, ist p Kopf 1 2, entsprechend ist die Wahrscheinlichkeit, eine Zahl zu werfen p Zahl 1 2 ad a) Die Anzahl n 12 ist die Anzahl der Würfe. k 4 bedeutet, dass Kopf in den 12 Würfen genau viermal vorkommen soll.

p H 4 12 4 1 4 2 495 1 4 2 495 1 12 2 0,1208 1 12 4 2 1 8 2 ad b) Die Anzahl n 12 ist die Anzahl der Würfe. k 6 bedeutet, dass Kopf in den 12 Würfen genau sechsmal vorkommen soll. p H 6 12 6 1 6 2 924 1 6 2 924 1 12 2 0,2256 1 12 6 2 1 6 2 ad c) Die Anzahl n 12 ist die Anzahl der Würfe. k 8 bedeutet, dass Kopf in den 12 Würfen genau sechsmal vorkommen soll. p H 8 12 8 1 8 2 495 1 8 2 495 1 12 2 0,1208 1 12 8 2 1 4 2 Beispiel: Eine Schülerin hat einen Wortschatz von 70% aller erlernten Vokabeln. Wie groß ist die Wahrscheinlichkeit, dass sie von 10 zufällig gewählten Vokabeln mindestens 8 weiß? Die Wahrscheinlichkeit, ein Vokabel zu wissen ist pv 70 100 0,7. Die Anzahl n 10 ist die Anzahl der abgefragten Vokabeln. Sollen unter den 10 abgefragten Vokabeln mindestens 8 richtig sein, haben wir zu berechnen: p H 8 ph 8 p H 9 ph 10.

Zunächst berechnen wir die Wahrscheinlichkeiten p H 8, p H 9, p H 10 : p H 8 10 8 0,78 0,3 10 8 p H 9 10 9 0,79 0,3 10 9 p H 10 10 0,710 0,3 10 10 45 0,7 8 0,3 2 0,23347 10 0,7 9 0,3 1 0,12106 1 0,7 10 0,3 0 0,02825 Insgesamt erhalten wir: ph 8 p H 8 ph 9 ph 10 0,23347 0,12106 0,02825 0,38278 Ein Würfel wird viermal geworfen. Wie groß ist die Wahrscheinlichkeit, dass die Augenzahl 6 a. nie b. genau einmal c. genau zweimal d. genau dreimal e. genau viermal kommt? (0.4823, 0.3858, 0.1157, 0.0154, 0.0008) Unter 30 Jugendlichen einer Schulklasse sind 2 Blauäugige. Es werden 5 Jugendliche aus dieser Klasse zufällig ausgewählt. Wie groß ist die Wahrscheinlichkeit, dass unter den ausgewählten Jugendlichen a. kein Blauäugiger b. genau 1 Blauäugiger c. genau 2 Blauäugige sind? (0.7082, 0.2529, 0.0361) Max spielt beim Roulette nur sogenannte einfache Chancen (Ereignisse mit der 18 Wahrscheinlichkeit, z.b. Rot oder Gerade ). Wie groß ist die Wahrscheinlichkeit, 37 dass Max unter 8 Spielen a. nie b. genau dreimal

c. genau sechsmal gewinnt? (0.0048, 0.2302, 0.0979) Bei einem Automaten gewinnt man in 30% der Spiele. Wie groß ist die Wahrscheinlichkeit, dass man a. bei 10 Spielen, b. bei 20 Spielen genau 8-mal gewinnt? (0.001447, 0.114397) Bei einer Fließbandproduktion sind ca. 5% der Produkte defekt. Zur Kontrolle werden 10 Produkte zufällig ausgewählt. Wie groß ist die Wahrscheinlichkeit, dass a. 0 Produkte b. genau 2 Produkte c. genau 3 Produkte defekt sind? ( 0.598737, 0.074635, 0.010475) Bei einer Prüfung sind 10 Fragen mit ja bzw. nein zu beantworten. Ein Schüler beantwortet die Fragen blind, d.h. er wählt die Antwort ja bzw. nein jeweils mit der gleichen Wahrscheinlichkeit 0,5. Wie groß ist die Wahrscheinlichkeit, dass er von 10 gestellten Fragen a. mindestens 5 b. mindestens 7 c. alle 10 richtig beantwortet? ( p H 5 0.62305, p H 7 0.17188, p H 10 0,00098 ) Erwartungswert und Varianz einer binomialverteilten Zufallsvariablen Die Herleitung der Formeln für den Erwartungswert und die Varianz der Binomialverteilung sind schwierig, daher wird der folgende Satz ohne Herleitung angegeben: Satz: Ist H eine binomialverteilte Zufallsvariable mit den Parametern n und p, dann gilt für den Erwartungswert und die Varianz von H : E H n p, 2 np n p Beispiel: Es wird 20-mal gewürfelt. Es sei H die Anzahl der erhaltenen Sechser. 1. Berechne den Erwartungswert, die Varianz 2 und die Standardabweichung von H.

2. Wie groß ist die Wahrscheinlichkeit, dass H größer als ist? Ist H eine binomialverteilte Zufallsvariable, dann gilt: ad 1) E H np 2 V H np 1 p Die Wahrscheinlichkeit, eine Sechs zu würfeln, ist p 1 6 0,166667. Die Anzahl n 10 ist die Anzahl der Würfe. Für den Erwartungswert und die Varianz erhalten wir dann: E H np 10 1 6 1,67 2 V H np 1 p 10 1 6 1 1 6 1,39 V H 1,39 1,18 ad 2) Für die Wahrscheinlichkeit, dass H ist, haben wir zu berechnen ph p H 1,667 1,179 ph 2,846 Die Anzahl der erhaltenen Sechser soll also > 2,846 sein, d.h. wir haben zu berechnen: p H 3 ph 4 p H 10. Diese Wahrscheinlichkeit lässt sich einfacher über die Gegenwahrscheinlichkeit berechnen: ph 2,846 1 ph 2,846 1 ph 0 ph 1 ph 2 Wir berechnen zunächst: ph 0 10 ph 1 10 ph 2 10 0 1 0 6 1 1 1 6 2 1 2 6 5 10 0 6 5 10 1 6 5 10 2 6 5 10 6 10 1 1 6 45 1 2 6 5 9 6 5 8 6 0,161506 0,323011 0,29071 Die gesuchte Wahrscheinlichkeit ergibt sich damit aus:

ph 2,846 1 ph 0 ph 1 ph 2 1 0,161506 0,323011 0,29071 0,224773 Eine Münze wird 6-mal geworfen. H sei die absolute Häufigkeit von Zahl. 1. Berechne den Erwartungswert, die Varianz 2 und die Standardabweichung von H. 2. Wie groß ist die Wahrscheinlichkeit, dass H größer als ist? (ad 1: 3, 1.5, ad 2: p H 0,984375 ) Jemand setzt beim Roulette 20-mal hintereinander auf Rot. Es sei H die Häufigkeit, mit der Rot eintritt. 1. Berechne den Erwartungswert, die Varianz 2 und die Standardabweichung von H. 2. Wie groß ist die Wahrscheinlichkeit, dass H ist? (ad 1: 9.7297, 2.2352, ad 2:) p H 0.6263 ) Normalverteilung: Bisher haben wir nur diskrete Verteilungen betrachtet, d.h. Zufallsexperimente, deren Ausgänge nur ganz bestimmte (meist ganzzahlige) Werte annehmen können. Variablen wie z.b. die Größe einer Person oder die Wartezeit auf einen Bus können aber jeden beliebigen Wert annehmen. Für derartige Variablen ist es sinnlos nach der Wahrscheinlichkeit für einen bestimmten Wert zu fragen. Die Wahrscheinlichkeit, dass ein Mensch 170,012345678901234...cm groß ist, ist 0. Sinnvoller ist es zu fragen, mit welcher Wahrscheinlichkeit eine Variable in einem bestimmten Intervall liegt, z.b. dass die Größe einer Person zwischen 170 und 175 cm liegt. Die wichtigste stetige Verteilung ist die Normalverteilung. Sie eignet sich als Näherung für viele Variablen, die in der Praxis auftreten. Eine Normalverteilung wird durch ihren Erwartungswert festgelegt. und ihre Standardabweichung

Der Graph der Normalverteilung ist die charakteristische Gauß'sche Glockenkurve. Sie liegt symmetrisch zu, hat dort einen Hochpunkt und bei ± Wendepunkte. Die Wahrscheinlichkeit, dass ein Wert in einem bestimmten Intervall [a; b ] liegt, entspricht der Fläche unter der Kurve in diesem Intervall. Die Fläche unter der gesamten Kurve entspricht einer Wahrscheinlichkeit von 100% und ist also 1. Faustregel: P x 2 3 68% P 2 x 2 0,95 95 % P 3 x 3 0,997 99,7% Das für die Berechnung der Wahrscheinlichkeit Pa x b benötigte Integral kann nur näherungsweise berechnet werden. Zu dessen Bestimmung stehen Tabellen zur Verfügung. In diesen Tabellen sind die Wahrscheinlichkeitswerte für die Normalverteilung mit Erwartungswert 0 und Standardabweichung 1 angegeben. Eine Normalverteilung mit Erwartungswert 0 und Standardabweichung 1 wird als standardisierte Normalverteilung Z bezeichnet.

Mit der Beziehung Z x kann jede Normalverteilung auf die standardisierte Normalverteilung transformiert werden. Mit dieser Transformation kann die Wahrscheinlichkeit für werden: Der Wert z gibt die Fläche links von P x a P Z z z mit z a z an. px a wie folgt berechnet Für negative Werte von z gilt wegen der Symmetrie der Glockenkurve: Z z z 1 z

Für die Wahrscheinlichkeit, dass Z z ist (Fläche rechts von z ) erhält man: Z z 1 z Für negative z ist Z z 1 z 1 [1 z] z Die Wahrscheinlichkeit, dass Z zwischen zwei gegebenen Werten liegt (Fläche zwischen z 1 und z 2 ) beträgt: z 1 Z z 2 z 2 z 1 Beispiel: Die Größe von 18-jährigen Burschen ist annähernd normalverteilt mit dem Erwartungswert 180 cm und der Standardabweichung 6cm. Wie groß ist die Wahrscheinlichkeit, dass ein 18-jähriger Bursche a. kleiner als 185 cm, b. größer als 185 cm, c. kleiner als 170 cm, d. zwischen 170 und 185 cm groß ist? Aus der Angabe wissen wir: 180, 6 ad a) Um P x 185 berechnen zu können, müssen wir x 185 zu z x 185 180 6 transformieren. Aus der Tabelle ergibt sich dann: 0,83 P x 185 P Z 0,83 0,83 0,79673 79,673 % ad b) Um P x 185 berechnen zu können, müssen wir x 185 zu z x 185 180 6 0,83

transformieren. Aus der Tabelle ergibt sich dann: P x 185 P Z 0,83 1 0,83 1 0,79673 0,20327 20,3% ad c) Um P x 170 berechnen zu können, müssen wir x 170 zu z x 170 180 6 transformieren. Aus der Tabelle ergibt sich dann: 1,67 P x 170 P Z 1,67 1 1,67 0,04746 4,7% ad d) Um P170 x 185 berechnen zu können, müssen wir x 1 170 und x 2 185 zu z 1 x 1 z 2 x 2 170 180 6 185 180 6 1,67 0,83 transformieren. Aus der Tabelle ergibt sich dann: P170 x 185 P 1,67 Z 0,83 0,83 1,67 0,83 1 1,67 0,79673 0,04746 0,74927 74,927% Umkehraufgaben In der Praxis stellt sich manchmal die Aufgabe, zu einer vorgegebenen Wahrscheinlichkeit den x- bzw. den z-wert zu finden. Besonders oft wird ein Bereich gesucht, in dem die Werte einer Variablen mit einer gewissen Wahrscheinlichkeit liegen, ein sogenannter Streubereich. Normalerweise wird dabei verlangt, dass der Erwartungswert in der Mitte dieses Bereiches liegt. Beispiel: In welchem um den Erwartungswert symmetrischen Bereich liegt die Größe von 90% aller 18-jährigen Burschen?

Sollen 90% aller Werte innerhalb des Bereichs liegen, müssen je 5% darüber und darunter liegen. Wir suchen also z 0,05 bzw. z 0,95. In der Tabelle finden wir 1,64 0,9495 1,65 0,9505 Der gesuchte Wert für z liegt also zwischen den Werten 1,64 und 1,65. Wir rechnen mit dem arithmetischen Mittel z 1,645. Zur Bestimmung der Intervallgrenzen formen wir die Standardisierungsformel um: Linke Intervallgrenze Rechte Intervallgrenze z x l z x l z x r z x r x l z x r z Als Intervallgrenzen erhalten wir damit: x l 180 1,645 6 170,13 x r 180 1,645 6 189,87 Es sind also 90% aller 18-jährigen Burschen ca. 170 190 cm groß. Annäherung der Binomialverteilung durch die Normalverteilung Die folgenden Bilder zeigen das Histogramm der Binomialverteilung für p 1 2

n 4, p 1 2 n 10, p 1 2 n 20, p 1 2 Es ist zu erkennen, dass der treppenförmige Graph der Binomialverteilung immer mehr zu einer Kurve wird, die einer Glockenform ähnlich ist. Mit zunehmendem n nähert sich die Kurve immer mehr der Normalverteilung. Diese hat den selben Erwartungswert und die selbe Standardabweichung. Für große n darf man die Binomialverteilung durch die Normalverteilung mit E H n p, 2 np n p annähern. Faustregel: die Annäherung ist für 3 erlaubt Hypothesen testen Zufall oder Gesetzmäßigkeit? Beispiel: Aus früheren Untersuchungen weiß man, dass die Zahncreme Strahleweiß bei 40% der Bevölkerung bekannt ist. Kürzlich hat die Herstellerfirma eine Werbekampagne in Auftrag gegeben. Die Marketingabteilung möchte nun wissen, ob der Bekanntheitsgrad des Produktes gestiegen ist. Dazu wird eine Befragung durchgeführt, bei der von 100 Befragten 45 angeben, die Zahncreme zu kennen. Kann man also sagen, dass die Kampagne erfolgreich war? 45 ist offensichtlich mehr als 40% von 100. Es könnte allerdings auch sein, dass sich der Bekanntheitsgrad der Zahncreme nicht geändert hat und in der Stichprobe zufällig mehr Personen das Produkt kannten, als zu erwarten war. Wir formulieren die Fragestellung etwas anders: Angenommen 40% der Bevölkerung kennen das Produkt. Wie hoch ist die Wahrscheinlichkeit, dass von 100 Personen mindestens 45 die Zahncreme kennen. Bei unserem Problem handelt es sich um eine Binomialverteilung mit p 0,4. Für und erhalten wir: n 100 und

n p 100 0,4 40 n p 1 p 100 0,4 0,6 4,899 Die Standardabweichung ist > 3, d.h. wir können die Binomialverteilung durch die Normalverteilung annähern: 45 40 z 4,899 1,021 p x 45 1 1,021 1 0,8461 0,154 15,4 % Es besteht also eine Wahrscheinlichkeit von 15,4%, dass das Befragungsergebnis zufällig zustande gekommen ist. Diese Wahrscheinlichkeit ist ziemlich hoch, man kann also nicht mit Sicherheit sagen, dass die Werbekampagne erfolgreich war. Zusammenfassung: Beim Testen von Hypothesen gehen wir von der Annahme aus, dass es keinen Effekt bzw. keinen Zusammenhang gibt. Diese Annahme wird als Nullhypothese bezeichnet. Unter Verwendung dieser Annahme berechnen wir nun die Wahrscheinlichkeit, dass das Untersuchungsergebnis zufällig so stark vom Erwartungswert ( ) abweicht. Ist diese Wahrscheinlichkeit genügend klein, können wir schließen, dass das Untersuchungsergebnis nicht durch Zufall zustande gekommen ist, sondern dass es tatsächlich eine Veränderung gegeben hat (Alternativhypothese). Die Nullhypothese wird abgelehnt (verworfen). Was heißt genügend klein? Meist entscheidet man sich für einen Grenzwert von 5%. Liegt die Wahrscheinlichkeit für einen Zufallstreffer darunter, bezeichnet man das Ergebnis als statistisch signifikant. Man kann diesen Zusammenhang auch so formulieren: die Wahrscheinlichkeit, dass man einen Zusammenhang annimmt, obwohl in Wirklichkeit kein Zusammenhang existiert (Irrtumswahrscheinlichkeit) ist kleiner als 5%. Scheint die Irrtumswahrscheinlichkeit von 5% zu hoch zu sein, kann man auch 1% bzw. 0,3% wählen. In letzterem Fall spricht man von einem hochsignifikantem Ergebnis. Beispiel: Der Zahnpastahersteller möchte die Untersuchung zum Bekanntheitsgrad des Produktes Strahleweiß mit 500 Teilnehmern wiederholen. Ab welchem Ergebnis wird die Nullhypothese der Bekanntheitsgrad ist 40% abgelehnt, wenn die Irrtumswahrscheinlichkeit höchstens 5% betragen soll? Zunächst berechnen wir und : n p 500 0,4 200 n p 1 p 500 0,4 0,6 120 Wenn die Nullhypothese richtig sein soll, müssen mindestens 95% der Ergebnisse im Intervall [ z ; z ] liegen. Wir müssen also z so bestimmen, dass ist. p z x z 0,95

Berechnung von p z x z : p z x z z z 0,95 z 1 z 0,95 2z 1 0,95 1 2z 1,95 2 z 0,975 z 1,96 Mit der Umkehrung der Standardisierungsformel erhalten wir: x l 200 120 1,96 178,529 x r 200 120 1,96 221,471 Die Nullhypothese wird abgelehnt, wenn entweder weniger als 178 oder mehr als 221 Befragte angeben, das Produkt zu kennen. WICHTIG: Angenommen 225 Befragte ( 45%) kennen das Produkt, dann können wir nicht sagen, mit 95% Wahrscheinlichkeit ist der Bekanntheitsgrad des Produktes gestiegen. Wir können nur sagen: falls der Bekanntheitsgrad des Produktes gleich geblieben ist, ist die Wahrscheinlichkeit für dieses Ergebnis weniger als 5%.