Mathematik für Biologen

Ähnliche Dokumente
Mathematik für Biologen

Mathematik für Biologen

Mathematik für Biologen

Mathematik für Biologen

Mathematik für Biologen

Mathematik für Biologen

Biostatistik, Sommer 2017

Mathematik für Biologen

Stetige Verteilungen, Unabhängigkeit & ZGS

Statistik für Ingenieure Vorlesung 5

Vorlesung: Statistik II für Wirtschaftswissenschaft

Wirtschaftsmathematik

Biostatistik, Sommer 2017

Stetige Verteilungen, Unabhängigkeit & ZGS

Der Erwartungswert E[g(X)] von g(x) ist definiert. g(x k )w(x = x k ),

Statistik. Sommersemester Stefan Etschberger. für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik

Zufallsvariablen [random variable]

Diskrete Verteilungen

Biostatistik, Winter 2011/12

Binomialverteilung. Häufigkeit, mit der Ereignis A bei n unabhängigen Versuchen eintritt. Träger von X : X = {0, 1, 2,..., n}.

Mathematik für Biologen

Mathematik für Biologen

f(x) = P (X = x) = 0, sonst heißt Poisson-verteilt mit Parameter (oder Rate) λ > 0, kurz X P o(λ). Es gilt x x! 1 Wahrscheinlichkeitsrechnung 212

70 Wichtige kontinuierliche Verteilungen

5 Binomial- und Poissonverteilung

Definition Sei X eine stetige Z.V. mit Verteilungsfunktion F und Dichte f. Dann heißt E(X) :=

Mathematik 3 für Informatik

Statistik I für Betriebswirte Vorlesung 4

Die Varianz (Streuung) Definition

1 Stochastische Konvergenz 2. 2 Das Gesetz der grossen Zahlen 4. 3 Der Satz von Bernoulli 6

Mathematik für Biologen

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Wahrscheinlichkeitsfunktion. Binomialverteilung. Binomialverteilung. Wahrscheinlichkeitshistogramme

Einführung in Quantitative Methoden

Lösungen zu Übungsblatt 9 Höhere Mathematik2/Stochastik 2 Master KI/PI

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation

Wahrscheinlichkeitstheorie und Statistik

Vorlesung: Statistik II für Wirtschaftswissenschaft

Wahrscheinlichkeitsrechnung und Statistik für Studierende der Informatik. PD Dr. U. Ludwig. Vorlesung 7 1 / 19

0, t 0,5

Kapitel 10 VERTEILUNGEN

Kapitel 9. Verteilungsmodelle. 9.1 Diskrete Verteilungsmodelle Die Gleichverteilung

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Zufallsvariable: Verteilungen & Kennzahlen

DWT 1.4 Rechnen mit kontinuierlichen Zufallsvariablen 240/476 c Ernst W. Mayr

Wahrscheinlichkeit und Statistik: Zusammenfassung

Wahrscheinlichkeitsverteilungen

Diskrete Verteilungen

Kapitel VII - Funktion und Transformation von Zufallsvariablen

1 Stochastische Konvergenz 2

Statistik I für Betriebswirte Vorlesung 4

Übung Zeigen Sie, dass dies als Grenzwert der Wahrscheinlichkeitsfunktion der Binomialverteilung mit

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

Stochastik. 1. Wahrscheinlichkeitsräume

Grundlagen der Wahrscheinlichkeitstheorie

Statistische Inferenz

ETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig)

7.5 Erwartungswert, Varianz

2.2 Binomialverteilung, Hypergeometrische Verteilung, Poissonverteilung

7.5 Erwartungswert, Varianz

Grundlagen der Mathematik II (LVA U)

Verteilung von Summen

Stochastik Serie 11. ETH Zürich HS 2018

Statistik I für Betriebswirte Vorlesung 5

Wahrscheinlichkeitstheorie. Alea iacta est!

5. Spezielle stetige Verteilungen

Biostatistik, Winter 2011/12

6.6 Poisson-Verteilung

Statistik I für Betriebswirte Vorlesung 3

Wichtige Begriffe und Sätze aus der Wahrscheinlichkeitsrechnung

Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen. Statistik II

Mathematica: u=5;s=1;plot[exp[-0.5((x-u)/s)^2],{x,0,10}] 76

DWT 1.4 Rechnen mit kontinuierlichen Zufallsvariablen 234/467 Ernst W. Mayr

Vorlesung 5a. Varianz und Kovarianz

Willkommen zur Vorlesung Statistik (Master)

Stochastik Musterlösung 4

Fit for Abi & Study Stochastik

Spezielle stetige Verteilungen

Statistik 1 Beispiele zum Üben

4.4 Punktschätzung. E(X 1 )+ +E(X n ) Var(ˆµ) = 1 n 2 ( Var(X1 )+ +Var(X n ) ) = 1 n 2nσ2 = σ2

Aufgabe 1 Wir werfen einen fairen Würfel einmal und ordnen den Augenzahlen Zufallsgrössen X und Y wie folgt zu:

Vorlesung 4b. Die Varianz

Wird ein Bernoulli- Versuch, bei dem die Trefferwahrscheinlichkeit p = 0,2 ist, n = 40 mal durchgeführt, dann erwarten wir im Mittel 8 Treffer.

Die tatsächlichen Breiten und Höhen der Säulen und damit der Flächeninhalt bleiben unverändert:

Willkommen zur Vorlesung Statistik (Master)

Stochastik Wiederholung von Teil 1

Zulassungsprüfung Stochastik,

Kapitel VII. Einige spezielle stetige Verteilungen

f Z (z) = 0 sonst = 1

Sind f X bzw. f Y die wie auf Folie 242 definierten Dichtefunktionen zur N(µ X, σx 2 )- bzw. N(µ Y, σy 2 )-Verteilung, so gilt (genau) im Fall ρ = 0

Stochastik und Statistik für Ingenieure Vorlesung 4

Die tatsächlichen Breiten und Höhen der Säulen und damit der Flächeninhalt bleiben unverändert:

Vorlesung 7a. Der Zentrale Grenzwertsatz

1 Dichte- und Verteilungsfunktion

Wahrscheinlichkeitsrechnung und Statistik

Transkript:

Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 17. November 2010

1 Gesetze Das Gesetz der seltenen Ereignisse Das schwache Gesetz der großen Zahl 2 Verteilungsfunktionen Definition Binomialverteilung Geometrische Verteilung Poissonverteilung 3 Stetige Zufallsvariable Standardisierte Verteilung Standard-Normalverteilung

Poissonverteilung Es sei λ > 0. Die Poissonverteilung zum Parameter λ ist definiert durch P λ (k) = λk k! e λ Unter den folgenden Voraussetzungen ist eine Zufallsvariable X poissonverteilt zum Parameter λ: X zählt das Auftreten eines Ereignisses pro Zähleinheit Im Mittel treten λ Ereignisse pro Zähleinheit auf Die Ereignisse beeinflussen sich nicht gegenseitig

Beispiel Tumor Ein Tumor aus 160 Zellen wird bestrahlt Im Mittel sterben 16 Tumorzellen pro Minute Mit welcher Wahrscheinlichkeit sterben 10 Zellen in der ersten Minute? Zwei Modelle sind angemessen Binomialverteilung Poissonverteilung

Beispiel Tumor: Rechnung mit Binomialverteilung Modell: 160 unabhängige ja/nein-experimente Erfolg : Tod der Tumorzelle Erfolgswahrscheinlichkeit im Einzelfall p = 0.1 Anzahl der Erfolge verteilt gemäß B 160, 0.1 Antwort: B 160, 0.1 (10) = 0.03113

Beispiel Tumor: Rechnung mit Poissonverteilung Modell: seltenes Ereignis, das im Mittel 16 mal pro Minute auftritt Parameter der Poissonverteilung ist λ = 16 Anzahl der Ereignisse pro Zähleinheit verteilt gemäß P 16 Antwort P 16 (10) = 1610 10! e 16 = 0.03410 Zum Vergleich B 160, 0.1 (10) = 0.03113

Vergleich Binomial- und Poissonverteilung 0.12 0.10 0.08 0.06 0.04 0.02 Binomialverteilung mit n=160, p=0.1 0.12 0.10 0.08 0.06 0.04 0.02 Poissonverteilung mit λ =16 0.00 0 5 10 15 20 25 30 35 40 0.00 0 5 10 15 20 25 30 35 40 Beide beschreiben einen Prozess mit 16 Erfolgen im Mittel. Der Unterschied ist, dass beim Poissonprozess die Anzahl der Erfolge potenziell unbeschränkt ist.

Vergleich Binomial- und Poissonverteilung, Fortsetzung B 40, 0.4 und P 16 besitzen ebenfalls beide den Erwartungswert 16 0.12 0.10 0.08 0.06 0.04 0.02 Binomialverteilung mit n=40, p=0.4 0.12 0.10 0.08 0.06 0.04 0.02 Poissonverteilung mit λ =16 0.00 0 5 10 15 20 25 30 35 40 0.00 0 5 10 15 20 25 30 35 40

Gesetz der seltenen Ereignisse Die Poisson-Verteilung P λ mit λ = n p ist eine sehr gute Annäherung an die Binomialverteilung B n,p, falls n 100 und n p 10. Im Beispiel waren n = 160 p = 0.1 Die Annäherung ist daher nur gut

Messwiederholungen Warum erhöhen mehrere Messungen die Genauigkeit? Warum braucht man 100-mal so viele Messungen, um die Genauigkeit zu verzehnfachen?

Rechenregeln für den Erwartungswert Für jede Zahl c und jede Zufallsvariable X ist E(c X ) = c E(X ) Für Zufallsvariablen X 1,..., X n ist E(X 1 + + X n ) = E(X 1 ) + + E(X n ) X und Y unabhängige Zufallsvariable. Dann E(X Y ) = E(X ) E(Y )

Rechenregeln für die Varianz Für jede Zahl a und jede Zufallsvariable X gilt Var(a + X ) = Var(X ) Für Zahl c und jede Zufallsvariable X gilt Var(c X ) = c 2 Var(X ) X und Y unabhängige Zufallsvariable. Dann Var(X + Y ) = Var(X ) + Var(Y )

Zwei unabhängige, identisch verteilte Zufallsvariable X 1 und X 2 seien unabhängige Zufallsvariable, die derselben Verteilung gehorchen (also z. B. Messwiederholungen). Sei Y = 1 2 (X 1 + X 2 ) der Durchschnittswert Der Erwartungswert von X 1 heiße µ, also E(X 1 ) = E(X 2 ) = µ Die Streuung von X 1 heiße σ, also Var(X 1 ) = Var(X 2 ) = σ 2 E(Y ) = 1 2 (E(X 1) + E(X 2 )) = µ Var(Y ) = ( ) 1 2 2 Var(X1 ) + ( ) 1 2 2 Var(X2 ) = 1 4 σ2 + 1 4 σ2 = 1 2 σ2 σ Also ist die Streuung von Y 2

Das schwache Gesetz der großen Zahl Mit ausreichend vielen Messwiederholungen lässt sich jede Genauigkeit erreichen Präziser: X 1,..., X n unabhängig, alle mit derselben Verteilung µ = E(X 1 ) = = E(X n ) und σ 2 = Var(X 1 ) = = Var(X n ) Y = 1 n (X 1 + + X n ) Y ist das arithmetische Mittel der X 1, X 2,..., X n Dann E(Y ) = µ und die Streuung von Y beträgt σ Y = σ n

Messwiederholungen: Beispiel 0 5 10 15 20 25 30 35 40 0 5 10 15 20 25 30 35 40 Links: Poissonverteilung P 16, Streuung ist 4 Rechts: Durchschnittswerte aus zehn P 16 -verteilten Zufallsvariablen, Streuung ist 4 10 = 1.26

Beispiel: α-strahler Ein Geigerzähler registriert pro Sekunde ungefähr 25 α-teilchen Dieser Wert soll so genau bestimmt werden, dass die Streuung des Mittelwerts Y unter 2.0 liegt Wie viele Einzelversuche von einer Sekunde Dauer sind erforderlich? Var(P λ ) = λ. Also hat jeder Einzelversuch die Streuung 25 = 5 Gleichung 5 n = 2.0 Also n = 2.5 und n = 6

Verteilungsfunktion X sei eine Zufallsvariable. Die Funktion F (x) = P(X x) ist die Verteilungsfunktion von X Die Verteilungsfunktion F (x) gibt an, mit welcher Wahrscheinlichkeit ein kleinerer Wert als x angenommen wird (x eingeschlossen) Datensatz empirische Häufigkeitsverteilung empirische Verteilungsfunktion Zufallsvariable Verteilung Verteilungsfunktion

Beispiel: Verteilungsfunktion von B 6,1/3 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0.00 0 1 2 3 4 5 6 1.0 0.8 0.6 0.4 0.2 0.0 1 0 1 2 3 4 5 6 7 Stabdiagramm und Graph der Verteilungsfunktion für B 6,1/3

Kumulierte Tabellen Kumulierte Tabellen der Binomialverteilung zeigen die Verteilungsfunktion Beispiel: 47 Versuche mit Erfolgswahrscheinlichkeit p = 0.88 im Einzelfall wurden gemacht. Mit welcher Wahrscheinlichkeit gelingen weniger als 44, aber mehr als 39, beide Grenzen eingeschlossen? P(39 X 44) = P(X 44) P(X 38) = F (44) F (38) = 0.93236 0.10408 = 0.82828

Tabelle der Werte r k=0 B n, p(k) für n = 47 r p 0.85 0.86 0.87 0.88 0.89 27 0. 00001 28 00002 00001 29 00008 00003 00001 30 00029 00012 00005 00002 00001 31 00093 00043 00018 00007 00002 32 00274 00137 00063 00026 00010 33 00742 00398 00199 00091 00038 34 01832 01060 00573 00286 00130 35 04128 02571 01503 00817 00408 36 08463 05663 03578 02115 01156 37 15768 11311 07707 04946 02957 38 26660 20441 14978 10408 06792 39 40904 33384 26208 19651 13952 40 57047 49285 41238 33208 25538 41 72665 65962 58411 50182 41543 42 85309 80597 74830 67964 60042 43 93639 91050 87606 83128 77447 44 97931 96887 95379 93236 90248 45 99552 99278 98847 98178 97153 46 99952 99917 99856 99754 99582

Geometrische Verteilung Die Verteilungsfunktion der geometrischen Verteilung kann man ausrechnen Sie beträgt für x 0 F (x) = 1 (1 p) j falls j x < j + 1 Beispiel: Mit welcher Wahrscheinlichkeit fällt beim Wurf eines fairen Würfels die erste 6 spätestens im fünften Wurf? Antwort: F (5) = 1 ( 1 1 6) 5 = 1 ( ) 5 5 = 0.5981 6

Verteilungsfunktion einer geometrischen Verteilung Wahrscheinlichkeit, dass erste 6 im k-ten Wurf auftritt 0.18 0.16 0.14 0.12 0.10 0.08 0.06 0.04 0.02 0.00 0 2 4 6 8 10 12 14 W'keit, dass erste 6 im k-ten Wurf oder frueher auftritt 1.0 0.8 0.6 0.4 0.2 0.0 0 5 10 15 20

Verteilungsfunktion einer Poissonverteilung Die Verteilungsfunktion einer Poissonverteilung kann man nicht geschlossen ausdrücken 1.0 0.8 0.6 0.4 0.2 0.0 0 5 10 15 20 25 30 35 40 0 5 10 15 20 25 30 35 Verteilung und Verteilungsfunktion der Poissonverteilung P 16

Die standardisierte Verteilung Die Zufallsvariable X besitze den Erwartungswert E(X ) = µ und die Varianz Var(X ) = σ 2 Setze Y = X µ σ Dann E(Y ) = 0 und Var(Y ) = 1 Y ist die standardisierte Zufallsvariable zu X

Standardisierte Binomialverteilungen 1.0 1.0 1.0 0.8 0.8 0.8 0.6 0.6 0.6 0.4 0.4 0.4 0.2 0.2 0.2 0.0 3 2 1 0 1 2 3 0.0 3 2 1 0 1 2 3 0.0 3 2 1 0 1 2 3 1.0 1.0 1.0 0.8 0.8 0.8 0.6 0.6 0.6 0.4 0.4 0.4 0.2 0.2 0.2 0.0 3 2 1 0 1 2 3 0.0 3 2 1 0 1 2 3 0.0 3 2 1 0 1 2 3 Verteilungsfunktionen der Standardisierungen von B n,p für p = 0.2 und n = 40, 80, 160, 320, 640 und 1280

Zentraler Grenzwertsatz Für jeden Parameterwert p konvergiert der Grenzprozess auf der letzten Folie gegen dieselbe Funktion. Diese Funktion heißt Verteilungsfunktion der Standard-Normalverteilung Sie wird mit Φ bezeichnet.

Verteilungsfunktion der Standard-Normalverteilung 1.0 0.8 0.6 0.4 0.2 0.0 3 2 1 0 1 2 3

Standard-normalverteilte Zufallsvariable X ist standard-normalverteilt, wenn P(X x) = Φ(x) für alle x in diesem Fall P(x < X y) = Φ(y) Φ(x) für alle x < y

Eigenschaften von Φ 0 < Φ(x) < 1 für alle Zahlen x Für x strebt Φ(x) gegen 1 Für x strebt Φ(x) gegen 0 Φ(0) = 1 2 Der Graph von Φ ist punktsymmetrisch am Punkt (0, 1 2 ), d. h. Φ( x) = 1 Φ(x) Die Verteilungsfunktion der Standard-Normalverteilung ist vertafelt

Tabelle der Standard-Normalverteilung, linke Seite u 0.00 0.01 0.02 0.03 0.04 0.0 0,500000 0,503989 0,507978 0,511966 0,515953 0.1,539828,543795,547758,551717,555670 0.2,579260,583166,587064,590954,594835 0.3,617911,621720,625516,629300,633072 0.4,655422,659097,662757,666402,670031 0.5,691462,694974,698468,701944,705401 0.6,725747,729069,732371,735653,738914 0.7,758036,761148,764238,767305,770350 0.8,788145,791030,793892,796731,799546 0.9,815940,818589,821214,823814,826391 1.0,841345,843752,846136,848495,850830 1.1,864334,866500,868643,870762,872857 1.2,884930,886861,888768,890651,892512 1.3,903200,904902,906582,908241,909877 1.4 0,919243 0,920730 0,922196 0,923641 0,925066

Tabelle der Standard-Normalverteilung, rechte Seite u 0.05 0.06 0.07 0.08 0.09 0.0 0,519939 0,523922 0,527903 0,531881 0,535856 0.1,559618,563559,567495,571424,575345 0.2,598706,602568,606420,610261,614092 0.3,636831,640576,644309,648027,651732 0.4,673645,677242,680822,684386,687933 0.5,708840,712260,715661,719043,722405 0.6,742154,745373,748571,751748,754903 0.7,773373,776373,779350,782305,785236 0.8,802337,805105,807850,810570,813267 0.9,828944,831472,833977,836457,838913 1.0,853141,855428,857690,859929,862143 1.1,874928,876976,879000,881000,882977 1.2,894350,896165,897958,899727,901475 1.3,911492,913085,914657,916207,917736 1.4 0,926471 0,927855 0,929219 0,930563 0,931888

Lesehinweise Auf dem Weblog gibt es die komplette Tabelle im Format A4 unter http://www.math.uni-duesseldorf.de/~braun/ bio1011/tabnorm.pdf Beispiel Φ(0.31) = 0.621720 Wegen der Punktsymmetrie, also wegen Φ( x) = 1 Φ(x) kann man die Tabelle auch für negative Argumente verwenden. Also beispielsweise Φ( 1.34) = 1 Φ(1.34) = 1 0.909877 = 0.090123 Durch Aufsuchen des Funktionswertes erhält man die Umkehrfunktion: Gesucht u mit Φ(u) = 0.79. Man liest ab: u = 0.81

Tabelle der Standard-Normalverteilung, linke Seite u 0.00 0.01 0.02 0.03 0.04 0.0 0,500000 0,503989 0,507978 0,511966 0,515953 0.1,539828,543795,547758,551717,555670 0.2,579260,583166,587064,590954,594835 0.3,617911,621720,625516,629300,633072 0.4,655422,659097,662757,666402,670031 0.5,691462,694974,698468,701944,705401 0.6,725747,729069,732371,735653,738914 0.7,758036,761148,764238,767305,770350 0.8,788145,791030,793892,796731,799546 0.9,815940,818589,821214,823814,826391 1.0,841345,843752,846136,848495,850830 1.1,864334,866500,868643,870762,872857 1.2,884930,886861,888768,890651,892512 1.3,903200,904902,906582,908241,909877 1.4 0,919243 0,920730 0,922196 0,923641 0,925066

Beispiel Normalverteilungen werden beispielsweise zur Modellierung von Messfehlern benutzt Beispiel: Die Wirkstoffkonzentration in einem Heilmittel soll 4g/l betragen. Herstellungsabhängig beträgt die Streuung 100mg/l Mit welcher Wahrscheinlichkeit liegt die Konzentration über 4.12g/l? Y sei die Konzentration in g/l Dann Y = 4 + 0.1 X, wobei X standard-normalverteilt ist Gesucht P(Y > 4.12) Das ist P(X > 1.2) = 1 P(X 1.2) = 1 Φ(1.2) = 1 0.884930 = 0.115070