12 Die Normalverteilung



Ähnliche Dokumente
6. Stochastische Modelle II: Stetige Wahrscheinlichkeitsverteilungen, insbesondere Normalverteilungen

Stetige Verteilungen. A: Beispiele Beispiel 1: a) In den folgenden Abbildungen sind die Dichtefunktionen von drei bekannten Verteilungen graphisch

Kapitel 2 Wahrscheinlichkeitsrechnung

Mathematik für Biologen

Kapitel VI - Lage- und Streuungsparameter

Zufallsvariablen [random variable]

Statistik I für Betriebswirte Vorlesung 5

5. Spezielle stetige Verteilungen

Kenngrößen von Zufallsvariablen

Mathematik für Biologen

Bestimmte Zufallsvariablen sind von Natur aus normalverteilt. - naturwissenschaftliche Variablen: originär z.b. Intelligenz, Körpergröße, Messfehler

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

70 Wichtige kontinuierliche Verteilungen

1 1 e x2 =2 d x 1. e (x2 +y 2 )=2 d x d y : Wir gehen nun zu Polarkoordinaten uber und setzen x := r cos und y := r sin.

Wahrscheinlichkeitstheorie und Statistik

Die tatsächlichen Breiten und Höhen der Säulen und damit der Flächeninhalt bleiben unverändert:

Mathematische und statistische Methoden II

5 Binomial- und Poissonverteilung

Die tatsächlichen Breiten und Höhen der Säulen und damit der Flächeninhalt bleiben unverändert:

Stetige Standardverteilungen

Statistik für Ingenieure Vorlesung 5

Stochastik. 1. Wahrscheinlichkeitsräume

Wichtige Begriffe und Sätze aus der Wahrscheinlichkeitsrechnung

Definition Sei X eine stetige Z.V. mit Verteilungsfunktion F und Dichte f. Dann heißt E(X) :=

Normalverteilung und Dichtefunktionen

13 Mehrdimensionale Zufallsvariablen Zufallsvektoren

Wirtschaftsmathematik

0 für t < für 1 t < für 2 t < für 3 t < für 4 t < 5 1 für t 5

DWT 1.4 Rechnen mit kontinuierlichen Zufallsvariablen 234/467 Ernst W. Mayr

Motivation. Benötigtes Schulwissen. Übungsaufgaben. Wirtschaftswissenschaftliches Zentrum 10 Universität Basel. Statistik

Beispiel: Zweidimensionale Normalverteilung I

Forschungsstatistik I

DWT 1.4 Rechnen mit kontinuierlichen Zufallsvariablen 240/476 c Ernst W. Mayr

5 Zufallsvariablen, Grundbegriffe

Einführung in Quantitative Methoden

Kapitel VII. Einige spezielle stetige Verteilungen

Kapitel VII - Funktion und Transformation von Zufallsvariablen

Fit for Abi & Study Stochastik

Grundbegriffe der Stochastik II

0, t 0,5

Spezielle stetige Verteilungen

Kapitel 12 Stetige Zufallsvariablen Dichtefunktion und Verteilungsfunktion. stetig. Verteilungsfunktion

Sigma-Umgebung. Vergleichen wir die beiden Binomialverteilungen: n = 30 p = 0,5. n = 20 p = 0,75

5. Stochastische Modelle I: Diskrete Zufallsvariablen

Referenten: Gina Spieler, Beatrice Bressau, Laura Uhlmann Veranstaltung: Statistik für das Lehramt Dozent: Martin Tautenhahn

I Grundbegriffe 1 1 Wahrscheinlichkeitsräume Bedingte Wahrscheinlichkeiten und Unabhängigkeit Reellwertige Zufallsvariablen...

STETIGE VERTEILUNGEN

P n (k) f(k) = 1 σ 2π e ) 2. σ 2π

SozialwissenschaftlerInnen II

Von der Normalverteilung zu z-werten und Konfidenzintervallen

Statistik 2 für SoziologInnen. Normalverteilung. Univ.Prof. Dr. Marcus Hudec. Themen dieses Kapitels sind:

Mathematische und statistische Methoden II

Wahrscheinlichkeit und Statistik: Zusammenfassung

Statistik I für Betriebswirte Vorlesung 3

Standardnormalverteilung

Folie zur Vorlesung Wahrscheinlichkeitsrechnung und Stoch. Prozesse

Übungsrunde 9, Gruppe 2 LVA , Übungsrunde 8, Gruppe 2, Markus Nemetz, TU Wien, 12/2006

Wiederholung Analysis

Kapitel 12 Stetige Zufallsvariablen Dichtefunktion und Verteilungsfunktion. stetig. Verteilungsfunktion

Wichtige Definitionen und Aussagen

8 Verteilungsfunktionen und Dichten

Marcus Hudec. Statistik 2 für SoziologInnen. Normalverteilung. Univ.Prof. Dr. Marcus Hudec. Statistik 2 für SoziologInnen 1 Normalverteilung

Marcus Hudec. Statistik 2 für SoziologInnen. Normalverteilung. Univ.Prof. Dr. Marcus Hudec. Statistik 2 für SoziologInnen 1 Normalverteilung

Vorlesung 5b. Zufallsvariable mit Dichten

Der Trainer einer Fußballmannschaft stellt die Spieler seiner Mannschaft auf. Insgesamt besteht der Kader seiner Mannschaft aus 23 Spielern.

Probeklausur zu Mathematik 3 für Informatik

Statistik. Sommersemester Stefan Etschberger. für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik

Wahrscheinlichkeitsrechnung und Statistik

Mathematica: u=5;s=1;plot[exp[-0.5((x-u)/s)^2],{x,0,10}] 76

6.6 Poisson-Verteilung

Statistik I für Betriebswirte Vorlesung 3

Statistik I für Betriebswirte Vorlesung 4

Vorlesung 5a. Zufallsvariable mit Dichten

Wichtige Begriffe und Sätze aus der Wahrscheinlichkeitsrechnung

1. Was ist eine Wahrscheinlichkeit P(A)?

Binomialverteilung. Häufigkeit, mit der Ereignis A bei n unabhängigen Versuchen eintritt. Träger von X : X = {0, 1, 2,..., n}.

Universität Basel Wirtschaftswissenschaftliches Zentrum. Zufallsvariablen. Dr. Thomas Zehrt

Grundlagen der Mathematik II (LVA U)

Beziehungen zwischen Verteilungen

Lösungsvorschläge zu Blatt 1 1) ZV X := Produkt der Augenzahlen bei einem Wurf mit 2 Würfeln. des Produktes Wurfergebnis P (X = k) 1 (1, 1) 1/36

Statistik 1 Beispiele zum Üben

Übung Zeigen Sie, dass dies als Grenzwert der Wahrscheinlichkeitsfunktion der Binomialverteilung mit

Normalverteilung. Erwartungswert, Median und Modus sind identisch. Symmetrieeigenschaft um den Erwartungswert

f(x) = P (X = x) = 0, sonst heißt Poisson-verteilt mit Parameter (oder Rate) λ > 0, kurz X P o(λ). Es gilt x x! 1 Wahrscheinlichkeitsrechnung 212

Statistik für Ingenieure Vorlesung 3

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...

13 Grenzwertsätze Das Gesetz der großen Zahlen

1 Vorbemerkungen 1. 2 Zufallsexperimente - grundlegende Begriffe und Eigenschaften 2. 3 Wahrscheinlichkeitsaxiome 4. 4 Laplace-Experimente 6

Biostatistik, Sommer 2017

Stochastik Approximationen der Binomialverteilung

Weierstraß-Institut für Angewandte Analysis und Stochastik Von der Binomialverteilung zur Normalverteilung

1. Grundbegri e der Stochastik

3. Gemeinsame und bedingte Verteilung, stochastische Unabhängigkeit

Ist die Funktion f : R R injektiv, hat den Definitionsbereich D und den Wertebereich W, so ist f : D W bijektiv. Dann heißt

7.5 Erwartungswert, Varianz

Mathematik für Biologen

Transkript:

12 Die Normalverteilung Die Normalverteilung ist eine der wichtigsten Wahrscheinlichkeitsverteilungen in der Praxis, weil aufgrund des sogenannten zentralen Grenzwertsatzes in vielen Situationen angenommen werden kann, dass experimentell gewonnene Messwerte zumindest näherungsweise als Werte von normalverteilten Zufallsvariablen aufgefasst werden können. 12.1 Die Dichtefunktion Die eindimensionale Verteilung mit der Dichte ϕx = 1 e 1 2 x2, x R heißt die standardisierte Normalverteilung oder N, 1-Verteilung. Die Funktion ϕ ist positiv und im Lebesgueschen wie im uneigentlich-riemannschen Sinn integrierbar sie wird für betragsmäßig große x durch 1/x 2 majorisiert. Zur Berechnung des Integrals benötigt man einen kleinen Trick. Man berechnet nicht ϕx dx sondern 2 ϕx dx = ϕx dx ϕy dy = ϕxϕy dy dx. Nach dem Satz von Fubini ist das letzte Integral gleich dem Bereichsintegral über den gesamten R 2 : ϕxϕy dx, y = 1 e 1 2x 2 +y 2 dx, y. R 2 R 2 Dieses Bereichsintegral wandeln wir durch Übergang zu Polarkoordinaten um: x = r cosφ = xr, φ, y = r sinφ = yr, φ. Der Integrationsbereich wird dadurch die Menge M = {r, φ : r <, φ < } = [, [,. Die Funktionaldeterminante ist x, y r, φ = x r y r x φ y φ = r. Wegen x 2 + y 2 = r 2 sin 2 φ + cos 2 φ = r 2 erhält man dadurch 1 e 1 2x 2 +y 2 1 dx, y = re 1 2 r2 dr, φ R 2 M 89

und weiter durch Übergang zum iterierten Integral 1 re 1 2 r2 dφ dr = 1 re 1 2 r2 dr Der Integrand des letzten Integrals besitzt die Stammfunktion e 1 2 r2 1 dφ = 1 re 1 2 r2 dr. so dass endlich 2 ϕx dx = 1 bzw. ϕx dx = 1. 12.2 Erwartungswert und Varianz der Zufallsvariable mit der standardisierten Normalverteilung Sei X eine Zufallsvariable mit der standardisierten Normalverteilung N, 1. Die Dichte dieser Verteilung ϕx = 1 e 1 2 x2 konvergiert für x ± so schnell gegen Null, dass die Funktionen x x k ϕx für alle k = 1, 2, 3,... im Lebesgueschen und im uneigentlich-riemannschen Sinn integrierbar sind. Die Funktion hx = xϕx ist eine ungerade Funktion, d.h. h x = hx. Das Integral einer derartigen Funktion über ein zum Nullpunkt symmetrisches Intervall a, a ist stets Null, so dass EX = und die Varianz V X gleich E X 2 ist. x ϕx = Zur Berechnung des E X 2 wenden wir die Regel der partiellen Integration auf den Integranden x 2 e x2 /2 = x xe x2 /2 an, wobei der Term in runden Klammern die Stammfunktion e x2 /2 besitzt. Damit ist E X 2 = 1 x xe x2 /2 dx = 1 { [ ] x e x2 /2 } e x2 /2 dx. Wie oben angemerkt, konvergiert die Funktion in eckigen Klammern für x ± gegen Null, so dass E X 2 = 1 e x2 /2 dx = ϕx dx = 1, denn das Integral einer Dichte über den gesamten Ergebnisraum hat stets den Wert 1. 9

12.3 Die Verteilungsfunktion der standardisierten Normalverteilung Die Verteilungsfunktion der standardisierten Normalverteilung erhält nahezu einheitlich in der Literatur das Symbol Φ: Φx = PX x = 1 x e 1 2 t2 dt. Dieses uneigentliche Integral ist jedoch nicht elementar lösbar, d.h. die Funktion Φ ist nicht durch endlich viele algebraische Konstruktionen elementarer Funktionen darstellbar. Die Werte dieser Funktion müssen daher mit speziellen Näherungsmethoden berechnet werden. Heutzutage findet man z.b. in MAPLE, MAXIMA und in anderen Software-Toolboxen die sog. Gaußsche Fehlerfunktion error function: R [ 1, 1] erf : x erfx = 2 x e t2 dt = 2 1 k x 2k+1 π π 2k + 1k!. und auch die Funktion erfcx = 1 erfx. Mit ihr kann man durch eine simple Variablentransformation die Verteilungsfunktion Φ Φx = 1 x 2 1 + erf 2 berechnen. Früher benutzte man eine Tabelle mit den auf das Intervall x beschränkten Funktionswerten der Verteilungsfunktion. Aus solcher Tabelle lassen sich dann die benötigte Funktionswerte von Φ mit Hilfe der folgenden Eigenschaften ablesen: ❶ Φ = 1 2. ❷ Für x kann der Funktionswert Φx direkt aus der Tabelle entnommen werden. Es gilt dabei stets Φx.5. ❸ Die Berechnung des Funktionswertes Φ x für x > erfolgt nach der Formel Spiegelsymmetrie Φ x = 1 Φx. ❹ P X x = 2Φx 1 = erf Wegen der Eigenschaft x 2. 1 P X 4 = 2Φ4 1 = erf k= 4 2.99 993 665 ist die Tabellierung meist nur auf 4 Stellen genau bis x = 3.99 91

12.4 Die allgemeine Normalverteilung Wenn die Zufallsvariable Y die standardisierte Normalverteilung N, 1 besitzt, dann hat die Zufallsvariable X = Y + µ mit reellen Parametern und µ die Verteilung P X mit der Dichtefunktion fx = 1 ϕ x µ = 1 2 e x µ2 2 2. Diese Verteilung heißt die Normalverteilung mit Parametern µ und 2 oder N µ, 2 - Verteilung. Die Gestalt der Dichtefunktion erinnert an eine Glocke. Man spricht daher auch häufig von der Gaußschen Glockenkurve. Der Graph von f ist achsensymmetrisch bezüglich der Geraden x = µ, der Graph von der entsprechenden Verteilungsfunktion F ist punktsymmetrisch zu Pµ,.5. 1 Das einzige Maximum liegt im Punkt x = µ mit dem Wert. Die beiden Wendepunkte liegen symmetrisch zum Maximum an den Stellen x = µ ±. Während der Parameter µ die Lage des Maximums festlegt, bestimmt der zweite Parameter Breite und Höhe der Glockenkurve. Dabei gilt: Je kleiner ist, umso höher liegt das Maximum und umso steiler fällt die Dichtekurve nach beiden Seiten ab. Den Erwartungswert und die Varianz von X berechnen wir über den Erwartungswert und die Varianz der N, 1-verteilten Zufallsvariablen Y : und EX = E Y + µ = EY + µ = µ V X = V Y + µ = 2 V Y = 2. Die in der Dichtefunktion auftretenden Parametr und µ sind also zugleich Kennwerte dieser allgemeinen Normalverteilung. Eine normalverteilte Zufallsvariable X mit den Parameter µ und läßt sich dabei stets mit Hilfe der linearen Transformation Substitution Y = 1 X µ in die Zufallsvariable Y mit der standardisierten Normalverteilung überführen sog. Standardisierung oder Umrechnung in Standardeinheiten. Umgekehrt, die Familie der Normalverteilungen ist aus der standardisierten Normalverteilung durch die lineare Transformation X = Y + µ erzeugbar. Genau diese für andere Verteilungsfamilien oft nicht erfüllte Eigenschaft macht die Handhabung der Normalverteilung besonders einfach, da nur die Funktionen Φ und ϕ erforderlich sind. 92

Bei einer normalverteilten Zufallsvariable X mit dem Erwartungswert µ und der Varianz 2 lassen sich die Wahrscheinlichkeiten wie folgt mit Hilfe der Verteilungsfunktion Φ der Standardnormalverteilung berechnen: ❶ PX x = Fx = Φ x µ ; ❷ PX x = 1 PX x = 1 Fx = 1 Φ x µ ❸ Pa X b = Fb Fa = Φ b µ Φ a µ. Wir berechnen noch die beideseitigen Ein-, Zwei,- und Drei-Sigma-Bereiche zum Erwartungswert symmetrische Konfidenzintervalle zu den Konfidenzniveaus 2Φk 1, k = 1, 2, 3 für die Nµ, 2 -verteilte Zufallsvariable X: P X µ k = P Y k = Φk Φ k = Φk 1 Φk = = 2Φk 1 = erf k 2 ;.682689 für k = 1,.9545 für k = 2,.9973 für k = 3. Damit liegen bei allen normalverteilten Zufallsvariablen etwa 68%, 95.5% bzw. 99.7% aller Realisierungen in den Ein-, Zwei, bzw. Drei-Sigma-Bereich 9. 12.5 Der Zentrale Grenzwertsatz Sei X 1, X 2, X 3,... eine Folge von Zufallsvariablen auf einem Wahrscheinlichkeitsraum Ω, A, P mit Verteilungsfunktionen F n x = P X n x. Konvergieren diese Verteilungsfunktionen für alle Argumente x gegen die Verteilungsfunktion der N, 1-Verteilung: lim F nx = Φx n so sagt man, dass für die Folge dieser Zufallsvariablen der Zentrale Grenzwertsatz gilt. Diese Art von Konvergenz bedeutet also nicht, dass die Funktionen X n in irgendeiner Weise gegen eine normalverteilte Grenzfunktion X konvergieren. Es bedeutet für die praktischen Anwendungen nur, dass man bei genügend großem n annehmen kann, dass die Verteilung der Zufallsvariable X n näherungsweise die standardisierte Normalverteilung ist. Der klassische Fall einer Folge, für die der zentrale Grenzwertsatz gilt, sind die normierten Partialsummen einer Folge X 1, X 2, X 3,... von stochastisch unabhängigen Zufallsvariablen, die alle die gleiche Verteilung besitzen. Die Partialsummen sind die Zufallsvariablen S n = X 1 + X 2 + + X n. 9 Bei Auswertung von Messreihen genügt es in der Regel, mit dem Zwei-Sigma-Bereich zu arbeiten. Der Ein-Sigma-Bereich ist oft mit zu großen Unsicherheiten behaftet Um auch kleinere Risiken auszuschliessen, kann man den Dre-Sigma-Bereich verwenden 93

Da die X k alle die gleiche Verteilung besitzen, haben sie auch alle den gleichen Erwartungswert und die gleiche Varianz: Für die Partialsummen folgt daraus E X k = µ und V X k = 2. µ n = E S n = E X 1 + E X 2 + + E X n = nµ und wegen der stochastischen Unabhängigkeit 2 n = V S n = V X 1 + V X 2 + + V X n = n 2. Von einer Folge von Zufallsvariablen mit unbeschränkt wachsenden Erwartungswerten und Varianzen kann man keine wie auch immer geartete Konvergenz erwarten. Sie lassen sich aber durch die schon bekannte lineare Transormation normieren. Die Zufallsvariablen Sn = S n µ n = S n nµ n n heißen die normierten Partialsummen der X k, und zwar deshalb, weil sie die Erwartungswerte E S n = E S n µ n n = und die Varianzen V S n = 1 n 2 V S n = 1 besitzen, also alle den gleichen Erwartungswert und die gleiche Varianz wie die N, 1- Verteilung. Für die Praxis, etwa bei der Fehlerrechnung, kann man diese mathematischen Aussagen salopp auf den gemeinsamen Nenner bringen, dass ein Messfehler immer dann näherungweise als normalverteilt angenommen werden darf, wenn er aus der Überlagerung vieler kleiner unabhängiger und nicht-systematischer Fehlerursachen resultiert, wobei keine dieser Ursachen dominierend ist. 12.6 Approximation der Binomialverteilung durch die Normalverteilung Eine Binomialverteilung Bn, p mit n Einzelexperimenten mit Wahrscheinlichkeit p läßt sich, für große Werte von n und p-werte, die sich deutlich von und 1 unterscheiden, 1 durch die allgemeine Normalverteilung N µ, 2 mit den Parametern µ = np und = npq = np1 p 1 für p-werte in der Nähe von und 1 kann man die Binomialverteilung durch die Poisson-Verteilung näherungsweise ersetzen vgl. Satz 7.15 94

approximieren. Diese Approximation ist gut für 2 = np1 p > 9 und wird mit zunehmenden n immer besser. Eine in der Praxis häufig verwendete Formel lautet: n p k 1 p n k Fk +.5 Fk.5 = Φ k oder a k b k +.5 np np1 p Φ k.5 np np1 p n p k 1 p n k b +.5 np a.5 np Fb+.5 Fa.5 = Φ Φ, k np1 p np1 p wobei F die Verteilungsfunktion der N µ, 2 -Verteilung und Φ die Verteilungsfunktion der Standardnormalverteilung ist. Dabei wurde eine sog. Stetigkeitskorrektur Verschiebung um jeweils.5 Einheiten nach außen vorgenommen. Die binomialverteilte Zufallsvariable ist nämlich eine diskrete Größe, erscheint jedoch in der Näherung durch die Normalverteilung als eine stetige Variable. 95