Binomialverteilung. Häufigkeit, mit der Ereignis A bei n unabhängigen Versuchen eintritt. Träger von X : X = {0, 1, 2,..., n}.

Ähnliche Dokumente
Wahrscheinlichkeitsfunktion. Binomialverteilung. Binomialverteilung. Wahrscheinlichkeitshistogramme

f(x) = P (X = x) = 0, sonst heißt Poisson-verteilt mit Parameter (oder Rate) λ > 0, kurz X P o(λ). Es gilt x x! 1 Wahrscheinlichkeitsrechnung 212

1.5.4 Quantile und Modi

0, sonst. heißt Poisson-verteilt mit Parameter (oder Rate) λ > 0, kurz X Po(λ). Es gilt. x! e λ, x {0, 1,...} 1 Wahrscheinlichkeitsrechnung 164

Vorlesung: Statistik II für Wirtschaftswissenschaft

1.5.4 Quantile und Modi. Bem [Quantil, Modus]

Vorlesung: Statistik II für Wirtschaftswissenschaft

Statistik für Ingenieure Vorlesung 5

Einführung in Quantitative Methoden

Blossfeld, Hamerle, Mayer (1986): Ereignisanalyse: Statistische Theorie und Anwendungen in den Wirtschafts- und Sozialwissenschaften. Campus.

5. Spezielle stetige Verteilungen

Mathematik für Biologen

DWT 1.4 Rechnen mit kontinuierlichen Zufallsvariablen 240/476 c Ernst W. Mayr

Biostatistik, Sommer 2017

Statistik I für Betriebswirte Vorlesung 5

Bestimmte Zufallsvariablen sind von Natur aus normalverteilt. - naturwissenschaftliche Variablen: originär z.b. Intelligenz, Körpergröße, Messfehler

Biostatistik, Winter 2011/12

7.5 Erwartungswert, Varianz

Mathematik für Biologen

Definition Sei X eine stetige Z.V. mit Verteilungsfunktion F und Dichte f. Dann heißt E(X) :=

Wirtschaftsmathematik

DWT 1.4 Rechnen mit kontinuierlichen Zufallsvariablen 234/467 Ernst W. Mayr

Wahrscheinlichkeitsverteilungen

Zufallsvariablen [random variable]

70 Wichtige kontinuierliche Verteilungen

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

DWT 3.3 Warteprobleme mit der Exponentialverteilung 275/467 Ernst W. Mayr

2.2 Binomialverteilung, Hypergeometrische Verteilung, Poissonverteilung

Statistik. Sommersemester Stefan Etschberger. für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik

Mathematik für Biologen

3 Stetige Zufallsvariablen

Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen. Statistik II

Wahrscheinlichkeitstheorie und Statistik

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation

Wahrscheinlichkeit und Statistik: Zusammenfassung

SozialwissenschaftlerInnen II

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

4. Verteilungen von Funktionen von Zufallsvariablen

6.6 Poisson-Verteilung

Statistik II für Studierende der Soziologie

Die Varianz (Streuung) Definition

1 Stochastische Konvergenz 2

Wichtige Begriffe und Sätze aus der Wahrscheinlichkeitsrechnung

Programm. Wiederholung. Gleichverteilung Diskrete Gleichverteilung Stetige Gleichverteilung. Binomialverteilung. Hypergeometrische Verteilung

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

Vorlesung 7b. Unabhängigkeit bei Dichten. und die mehrdimensionale Standardnormalverteilung

7.5 Erwartungswert, Varianz

ETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig)

Mathematik für Biologen

Statistik I für Betriebswirte Vorlesung 3

1 Stochastische Konvergenz 2. 2 Das Gesetz der grossen Zahlen 4. 3 Der Satz von Bernoulli 6

Psychologische Methodenlehre und Statistik I

Wichtige Definitionen und Aussagen

Satz 105 (Gedächtnislosigkeit) Beweis: Sei X exponentialverteilt mit Parameter λ. Dann gilt Pr[X > x + y X > y] = Pr[X > y] Pr[X > x + y] = Pr[X > y]

I Grundbegriffe 1 1 Wahrscheinlichkeitsräume Bedingte Wahrscheinlichkeiten und Unabhängigkeit Reellwertige Zufallsvariablen...

Normalverteilung. 1 2πσ. Gauß. 2 e 1 2 ((x µ)2 σ 2 ) Werkzeuge der empirischen Forschung. W. Kössler. Einleitung. Datenbehandlung. Wkt.

Statistics, Data Analysis, and Simulation SS 2017

Biostatistik, Sommer 2017

Kapitel VII - Funktion und Transformation von Zufallsvariablen

Wahrscheinlichkeitsrechnung und Statistik für Studierende der Informatik. PD Dr. U. Ludwig. Vorlesung 7 1 / 19

2 Aufgaben aus [Teschl, Band 2]

Stetige Standardverteilungen

1. Grundbegri e der Stochastik

Spezielle diskrete Verteilungen

Spezielle diskrete Verteilungen

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung

Mehrdimensionale Zufallsvariablen

Spezielle stetige Verteilungen

Stochastik. 1. Wahrscheinlichkeitsräume

Stetige Verteilungen, Unabhängigkeit & ZGS

Der Erwartungswert E[g(X)] von g(x) ist definiert. g(x k )w(x = x k ),

Kennwerteverteilungen von Häufigkeiten und Anteilen

Vorlesung: Statistik II für Wirtschaftswissenschaft

f Z (z) = 0 sonst = 1

Heute. Die Binomialverteilung. Poissonverteilung. Approximation der Binomialverteilung durch die Normalverteilung

Diskrete Strukturen II

Vorlesung 6b. Von der Binomial-zur Normalverteilung

1. Grundbegri e. T n i=1 A i = A 1 \ A 2 \ : : : \ A n alle A i treten ein. na = A das zu A komplementäre Ereignis; tritt ein, wenn A nicht eintritt.

Kapitel 9. Verteilungsmodelle. 9.1 Diskrete Verteilungsmodelle Die Gleichverteilung

Referenten: Gina Spieler, Beatrice Bressau, Laura Uhlmann Veranstaltung: Statistik für das Lehramt Dozent: Martin Tautenhahn

Statistik für Ingenieure Vorlesung 3

1.6 Wichtige Verteilungsmodelle

2.3 Intervallschätzung

Forschungsstatistik I

Willkommen zur Vorlesung Statistik (Master)

3. Gemeinsame und bedingte Verteilung, stochastische Unabhängigkeit

7.7 Spezielle diskrete Wahrscheinlichkeitsverteilungen

Wiederholung Analysis

Fit for Abi & Study Stochastik

Mathematik für Biologen

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Teil IV. Diskrete Verteilungen. Woche 3: Verteilungen. Diskrete Zufallsvariablen Wiederholung. Lernziele

Vorlesung 7a. Der Zentrale Grenzwertsatz

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Hypothesentests. 5 Regression

Stetige Verteilungen, Unabhängigkeit & ZGS

Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK

Transkript:

Binomialverteilung Konstruktionsprinzip: Ein Zufallsexperiment wird n mal unabhängig durchgeführt. Wir interessieren uns jeweils nur, ob ein bestimmtes Ereignis A eintritt oder nicht. X = Häufigkeit, mit der Ereignis A bei n unabhängigen Versuchen eintritt. Träger von X : X = {0, 1, 2,..., n}. Statistik II SoSe 2013 Helmut Küchenhoff (Institut für Statistik, LMU) 188

Wahrscheinlichkeitsfunktion Bezeichne π = P(A) die Wahrscheinlichkeit für A in einem Experiment. Das Ereignis X = x tritt z.b. auf, wenn in den ersten x Versuchen A eintritt und anschließend nicht mehr. Die Wahrscheinlichkeit dafür ist P(A 1... A x Ā x+1... Ā n ) = π }. {{.. π } (1 π)... (1 π) }{{} x mal n x mal = π x (1 π) n x. Insgesamt gibt es ( n x) Möglichkeiten für die Verteilung der x Erfolge (Auftreten von A) auf n Plätze. Damit gilt: ( ) n P(X = x) = π x (1 π) n x. x Statistik II SoSe 2013 Helmut Küchenhoff (Institut für Statistik, LMU) 189

Binomialverteilung Definition Eine Zufallsvariable heißt binomialverteilt mit den Parametern n und π, kurz X B(n, π), wenn sie die Wahrscheinlichkeitsfunktion ( ) n π x (1 π) n x, x = 0, 1,..., n f (x) = x 0, sonst besitzt. Die B(1, π)-verteilung heißt auch Bernoulliverteilung. Statistik II SoSe 2013 Helmut Küchenhoff (Institut für Statistik, LMU) 190

Wahrscheinlichkeitshistogramme Binomialverteilungen mit n = 10 π =0.1 π =0.25 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 0 1 2 3 4 5 6 7 8 9 10 0 0 1 2 3 4 5 6 7 8 9 10 π =0.5 π =0.75 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 0 1 2 3 4 5 6 7 8 9 10 0 0 1 2 3 4 5 6 7 8 9 10 Statistik II SoSe 2013 Helmut Küchenhoff (Institut für Statistik, LMU) 191

Erwartungswert und Varianz I Zur Berechnung von Erwartungswert und Varianz der Binomialverteilung ist folgende Darstellung hilfreich: X = X 1 +... + X n mit den binären Variablen { 1 falls A beim i-ten Versuch eintritt, X i = 0 sonst. Die X i sind stochastisch unabhängig mit E(X i ) = 0 P(X i = 0) + 1 P(X i = 1) = π Var(X i ) = E(Xi 2 ) (E(X i )) 2 = 1 P(X i = 1) π 2 = π(1 π). Statistik II SoSe 2013 Helmut Küchenhoff (Institut für Statistik, LMU) 192

Erwartungswert und Varianz I Erwartungswert der Binomialverteilung: E(X ) = E(X 1 +... + X n ) = E(X 1 ) +... + E(X n ) = nπ Die direkte Berechnung über E(X ) = n ( ) n i π i (1 π) n i =... = nπ i i=1 ist deutlich komplizierter! Varianz der Binomialverteilung: Var(X ) = Var(X 1 +...+X n ) = Var(X 1 )+...+Var(X n ) = nπ(1 π) Statistik II SoSe 2013 Helmut Küchenhoff (Institut für Statistik, LMU) 193

Beispiel: Wahlprognose 100 Wahlberechtigte werden befragt. 30% aller Wahlberechtigten wählen Partei S. Wie groß ist die Wahrscheinlichkeit, dass von den 100 Befragten mehr als 50 die Partei S wählen? X B(100, 0.3) P(X 50) = P(X = 50) + P(X = 51) +... + P(X = 100) ( ) 100 = 0.3 50 0.7 50 +... 50 = 0.0000206 Statistik II SoSe 2013 Helmut Küchenhoff (Institut für Statistik, LMU) 194

Eigenschaften der Binomialverteilung Symmetrieeigenschaft (vertausche Rolle von A und Ā): Sei X B(n, π) und Y = n X. Dann gilt Y B(n, 1 π). Summeneigenschaft: Seien X B(n, π) und Y B(m, π). Sind X und Y unabhängig, so gilt X + Y B(n + m, π) Wichtige Voraussetzung: Gleiches π Statistik II SoSe 2013 Helmut Küchenhoff (Institut für Statistik, LMU) 195

Poisson Verteilung (vgl. z.b. Fahrmeir et. al)) Eine weitere wichtige diskrete Verteilung ist die Poisson-Verteilung. Sie modelliert die Anzahl (eher seltener) Ereignisse in einem Zeitintervall (Unfälle, Todesfälle; Sozialkontakte, deviante Verhaltensmuster, etc.). Definition Eine Zufallsvariable X mit der Wahrscheinlichkeitsfunktion { λ x f (x) = P(X = x) = x! e λ, x {0, 1,...} 0, sonst heißt Poisson-verteilt mit Parameter (oder Rate) λ > 0, kurz X Po(λ). Es gilt E(X ) = λ, Var(X ) = λ Statistik II SoSe 2013 Helmut Küchenhoff (Institut für Statistik, LMU) 196

Poisson Modell als Verteilung seltener Ereignisse Die Poisson-Verteilung kann auch als Näherungsmodell für eine Binomialverteilung gesehen werden, wenn die Anzahl der Versuchswiederholungen n groß und die Trefferwahrscheinlichkeit π sehr klein ist (seltene Ereignisse!). Der Erwartungswert λ ist dann gleich n π. Es gilt also abgekürzt geschrieben X B(n, π) = X Po(n π) n groß π klein Hat man mehrere unabhängige Poisson-Prozesse, also dynamische Simulationen, bei denen die Ereignisanzahl Poisson-verteilt ist, also z.b. verschiedene deviante Verhaltensmuster, so ist die Gesamtanzahl der einzelnen Ereignisanzahlen wieder Poisson-verteilt: genauer gilt Statistik II SoSe 2013 Helmut Küchenhoff (Institut für Statistik, LMU) 197

Addition von Poisson-verteilten ZV Sind X Po(λ X ), Y Po(λ Y ) voneinander unabhängig, so gilt X + Y Po(λ X + λ Y ). Beachte, die Unabhängigkeit (genauer die Unkorreliertheit, siehe später) ist wesentlich. Hat man als Extremfall, z.b. zwei Ereignisse bei denen das eine das andere voraussetzt (Scheidungen, Scheidungen mit Streit um das Sorgerecht für Kinder), so ist die Gesamtzahl nicht mehr Poisson-verteilt. Es muss gelten, wenn X + Y Poisson-verteilt wäre: Var(X + Y ) = E(X + Y ) = E(X ) + E(Y ) = Var(X ) + Var(Y ), was aber bei abhängigen (korrelierten) X und Y verletzt ist. Statistik II SoSe 2013 Helmut Küchenhoff (Institut für Statistik, LMU) 198

Normalverteilung I Die Normalverteilung ist wohl das wichtigste Verteilungsmodell der Statistik, denn viele Zufallsvariablen sind (nach Transformation) (ungefähr) normalverteilt. beim Zusammenwirken vieler zufälliger Einflüsse ist der geeignet aggregierte Gesamteffekt oft approximativ normalverteilt (Zentraler Grenzwertsatz, Kap. 1.7). die asymptotische Grenzverteilung, also die Verteilung bei unendlich großem Stichprobenumfang, typischer statistischer Größen ist die Normalverteilung. Statistik II SoSe 2013 Helmut Küchenhoff (Institut für Statistik, LMU) 199

Normalverteilung II Statistik II SoSe 2013 Helmut Küchenhoff (Institut für Statistik, LMU) 200

Normalverteilung III Statistik II SoSe 2013 Helmut Küchenhoff (Institut für Statistik, LMU) 201

Definition Normalverteilung Definition Eine stetige Zufallsvariable X heißt normalverteilt mit den Parametern µ und σ 2, in Zeichen X N(µ, σ 2 ), wenn für ihre Dichte gilt: ( 1 f (x) = exp 1 ) (x µ)2, x R 2π σ 2σ2 und standardnormalverteilt, in Zeichen X N(0; 1), falls µ = 0 und σ 2 = 1 gilt (π ist hier die Kreiszahl π = 3.14...). Statistik II SoSe 2013 Helmut Küchenhoff (Institut für Statistik, LMU) 202

Grundlegende Eigenschaften a) Die Dichte der Standardnormalverteilung wird oft mit ϕ(x) bezeichnet, also ϕ(x) = 1 exp ( 12 ) x 2 2π und die zugehörige Verteilungsfunktion mit Φ(x) = x ϕ(u)du. b) Φ(x) lässt sich nicht in geschlossener Form durch bekannte Funktionen beschreiben = numerische Berechnung, Tabellierung. c) µ und σ 2 sind genau der Erwartungswert und die Varianz, also, wenn X Nµ, σ 2 ), dann E(X ) = µ und Var(X ) = σ 2. d) Die Dichte ist symmetrisch um µ, d.h. f (µ x) = f (µ + x). Statistik II SoSe 2013 Helmut Küchenhoff (Institut für Statistik, LMU) 203

Rechnen mit der Normalverteilung I Es gilt: Φ( x) = 1 Φ(x) (folgt aus der Symmetrie der Dichte). Tabelliert sind die Werte der Verteilungsfunktion Φ(z) = P(Z z) für z 0. Ablesebeispiel: Φ(1.75) = 0.9599 Funktionswerte für negative Argumente: Φ( z) = 1 Φ(z) Die z-quantile ergeben sich über die Umkehrfunktion. Beispielsweise ist z 0.9599 = 1.75 und z 0.9750 = 1.96. Statistik II SoSe 2013 Helmut Küchenhoff (Institut für Statistik, LMU) 204

Rechnen mit der Normalverteilung II Zentrale Idee: X zu standardnormalverteilter Zufallsvariable umformen, d.h. standardisieren. Dabei muss die rechte Seite analog mit transformiert werden: das heißt Wegen gilt dann X a X µ a µ X µ a µ σ σ P(X a) = P( X µ σ X µ σ N(0; 1) a µ σ ). P( X µ a µ σ σ ) = Φ(a µ σ ), so dass sich der folgende Zusammenhang ergibt: P(X a) = Φ( a µ σ ). Statistik II SoSe 2013 Helmut Küchenhoff (Institut für Statistik, LMU) 205

Beispiel: IQ Der IQ st so konstruiert, dass er in der Bevölkerung normalverteilt ist mit Erwartungswert 100 und Standardabweichung 15. P(IQ 110) =? P(IQ 70) = Wie groß ist q, damit gilt P(IQ q) = 0.01? Statistik II SoSe 2013 Helmut Küchenhoff (Institut für Statistik, LMU) 206

Abgeschlossenheit gegenüber Linearkombinationen Seien X 1 und X 2 unabhängig und X i N(µ i, σi 2 ), i = 1, 2. Ferner seien b, a 1, a 2 feste reelle Zahlen. Dann gilt Y 1 := a 1 X 1 + b N(a 1 µ 1 + b; a1σ 2 1) 2 Y 2 := a 1 X 1 + a 2 X 2 N(a 1 µ 1 + a 2 µ 2 ; a1σ 2 1 2 + a2σ 2 2). 2 Das Ergebnis lässt sich auf mehrere Summanden verallgemeinern. Statistik II SoSe 2013 Helmut Küchenhoff (Institut für Statistik, LMU) 207