Barbara Jakob Seminar: Statistische Methoden in der Infektionsepidemiologie

Größe: px
Ab Seite anzeigen:

Download "Barbara Jakob Seminar: Statistische Methoden in der Infektionsepidemiologie"

Transkript

1 Barbara Jakob Seminar: Statistische Methoden in der Infektionsepidemiologie Verzweigungsprozess-Modelle für surveillance von infektiösen Krankheiten, kontrolliert durch Massenimpfung Zusammenfassung: Massenimpfprogramme haben das Ziel, die effective reproduction number R einer Infektion < 1 zu halten. Wir beschreiben Methoden, wie man den Wert von R durch surveillance- Daten kontrollieren kann. Die Modelle basieren auf Verzweigungsprozessen, in denen R mit dem mittleren Schwellenwert identifiziert wird. Wir leiten anhand von Daten über Größe und Dauer des Ausbruchs unbedingte Likelihoods für die durchschnittliche Zahl der Nachkommen (offspring mean) her. Wir diskutieren Bayes sche Methoden, implementiert mit Metropolis-Hastings sampling und überprüfen die Gülitigkeit der Modelle durch Simulation. Die Methoden werden anhand von Daten über Masern in den USA illustriert. Inhaltsverzeichnis 1 Einleitung 2 2 Unbedingte Likelihoods Ausbruchsgröße Ausbruchsdauer Bayes-Inferenz Simulationen Reduzieren der Anfälligen Minder-Erfassung von Infizierten Beispiel: Masern in den USA Daten über Größe des Ausbruchs Daten über Dauer des Ausbruchs Diskussion 8 1

2 1 Einleitung Impfprogramme gehören zu den wichtigsten Möglichkeiten, infektiöse Krankheiten zu kontrollieren. z.b. wurden Masern in großen Teilen Europas und Amerikas ausgerottet. Lokale Ausrottung ist der notwendige Vorreiter der globalen Ausrottung. Globale Ausrottung einer Krankheit bedeutet, die Zahl der Infektionen auf Null zu reduzieren. Elimination dagegen ist die Unterbrechung der endemischen Übertragung. Dies kann man erreichen, indem man ein breites Gebiet durch Impfung abdeckt. Elimination wird am besten durch R charakterisiert, nämlich der durchschnittlichen Anzahl von infektiösen Individuen, die eine infektiöse Person während ihrer infektiösen Periode ansteckt. Elimination kann man dann definieren als R dauerhaft < 1. Ein wichtiges Ziel für die surveillance von Massenimpfungsprogrammen ist es, den Wert R über die Zeit hinweg zu kontrollierten. Gelangt R zu nah an die 1, muss eingegriffen werden. Neu ist, dass bei der surveillance von Impfprogrammen nicht nur die Erkrankungen betrachtet werden, sondern auch die Ausbrüche. Hier werden die statistischen Aspekte dieser neuen Beobachtungsmethode entwickelt. Diese Methoden basieren auf der Theorie von Verzweigungsprozessen. Da die Zahl der Anfälligen nicht mehr bekannt ist, sind Verzweigungsprozesse sehr gut geeignet für epidemiologische Beobachtungen, da sie nur Daten der erkrankten Fälle benötigen. Angewendet auf surveillance von Massenimpfungsprogrammen unter Eliminations-Bedingungen, sind sie von direktem praktischen Nutzen für die Gesundheit der Öffentlichkeit. Verzweigungsprozesse spielen eine wichtige Rolle in der Theorie über Epidemien. Sie vertiefen das Verständnis für das Schwellenverhalten von Epidemien, für die Berechnung des kritischen Schwellenwertes für Impfungen und bieten ein einfaches Modell für die frühen Stadien einer epidemischen Verbreitung. Verzweigungsprozesse werden also als statistische Modelle verwendet, mit denen man R schätzen kann. Hier wird beschrieben, wie man den Wert von R in obigem Kontext überwachen kann. Dazu verwendet man Daten über Dauer und Größe des Ausbruchs. Die resultierenden bedingten Likelihoods sind allerdings nicht geeignet für Folgerungen, ob R 1 oder R>1. Stattdessen verwendet man eine unbedingte Näherung, indem man zensierte Likelihoods verwendet. Man leitet surveillance-schwellen ab, die auf Likelihood Konfidenzintervallen für R basieren. Diese Likelihoods kann man auch in Verbindung mit der Bayes schen Näherung von Hyde verwenden, in der das Schwellenkriterium auf der a posterior Wahrscheinlichkeit beruht, dass R > 1. In der Anwendung wird die a posteriori Verteilung mit dem Metropolis- Hastings sampling evaluiert. 2 Unbedingte Likelihoods Die Verbreitung von Infektion wird durch die Mittelwerte eines homogenen Galton-Watson Verzweigungsprozesses approximiert. Wir nehmen also an, dass jeder Kranke zufällige Z andere infiziert. Die Verteilung von Z heißt offspring Verteilung. Für Poisson-offspring ist das P (Z = r) = θr r! e θ, für geometrischen offspring ist es P (Z = r) = θ r (1 θ), wobei θ der kanonische Parameter ist. Der offspring mean λ = E(Z) ist bei der Poisson-offspring- Verteilung = θ, bei der geometrischen = θ(1 θ) 1. Angewendet auf infektiöse Krankheiten entspricht λ dem R. Die Auslöschwahrscheinlichkeit eines Verzweigungsprozesses, der aus einem infektiösen Individuum entsteht, wird mit q(λ) bezeichnet (im folgenden schreiben wir q). Für λ 1, ist q(λ) = 1, für λ > 1, ist q(λ) < 1. 2

3 Standard Methoden für Schätzung von λ basieren auf der Likelihood bei gegebenen Beobachtungen eines Prozesses, bis hin zu einer vorher festgelegten Generation k > 0. Sei X k die gesamte Größe des Ausbruchs bis einschließlich der k-ten Generation. Der Ausbruch beginnt bei Generation Null, mit X 0 = s. Der ML-Schätzer von λ ist λ = X k s X k 1 Dieser ist konsistent und asymptotisch unverfälscht, wenn s. Für k ist der MLE inkonsistent. Wir beschäftigen uns nur mit dem Fall n. n ist die Zahl der Ausbrüche. In der Praxis werden die Verbreitungsgenerationen nicht genau beobachtet. Deshalb können X k und X k 1 für gegebenes k nicht vollständig erfasst werden, außer der Ausbruch endete in Generation k-1. In diesem Fall ist die Ausbruchsgröße X k = X k 1 = X. Es ist also sinnvoll, Inferenzen auf der Ausbruchsgröße X basieren zu lassen, da diese vollständig beobachtbar ist. Das Problem ist, wenn λ > 1, werden nicht alle Ausbrüche ausgelöscht, so dass X eine uneigentliche Verteilung ist. Um dies zu vermeiden, setzt man Auslöschung voraus. Wir entwickeln eine unbedingte Likelihood Näherung anhand von - möglicherweise zensierten - Beobachtungen über Größe und Dauer des Ausbruchs. Wir betrachten alle Ausbrüche (oder eine zufällige Stichprobe), die ihren Ursprung im Intervall [0, τ] haben. Für jeden solchen Ausbruch erhält man ein Tupel (S,T,X,U), wobei S 1 die Anfangszahl der Fälle, T [0, τ] das Intervall, in dem der Ausbruch begann, X S die Größe des Ausbruchs und U 0 die Dauer des Ausbruchs ist. Dabei ist X {s, s + 1,...} { } und U [0, ]. Beobachtungen können zensiert werden, z.b. Beobachtungen, die hinter einem Zeitpunkt ν τ liegen. Jede Beobachtung ist also entweder von der Form (S=s,T=t,X=x,U=u) für einen Ausbruch zu einer Zeit t in [0, τ], der vor dem Zeitpunkt ν endet, oder von der Form (S=s,T=t,X x ν, U ν t), falls der Ausbruch nicht vor dem Zeitpunkt ν beendet war, und insgesamt x ν Fälle bis zu diesem Zeitpunkt beobachtet wurden. Auch andere Zensurschemata sind möglich. Unabhängig vom Schema ist der Schlüsselpunkt, dass nicht-auslöschende Prozesse mit Wahrscheinlichkeit 1 zensiert werden. Ist λ deutlich < 1 kann man das surveillance-system so arrangieren, dass kaum zensiert wird. Da Zensur aber tatsächlich vorkommt, falls λ nahe bei 1 liegt oder größer ist, ist es wichtig, einen cohärenten Rahmen für die Inferenz zu schaffen. Für die folgenden auf Likelihood basierenden Analysen ist die surveillance-schwelle die obere 95% Likelihood Konfidenzgrenze für λ. Wenn diese 1 überschreitet, wird eingegriffen. Die Schätzung von λ basiert auf Beobachtungen über Größe X oder Dauer S des Ausbruchs. 2.1 Ausbruchsgröße Sei X die Größe eines Ausbruchs, der aus S=s Anfangsfällen entstanden ist. Ist z.b. die offspring Verteilung Poisson, folgt die totale Ausbruchsgröße der Borel-Tanner Verteilung: P (X = x; s) = sxx s 1 λ x s e xλ, (1) (x s)! Ist die offspring Verteilung die Geometrische, dann folgt die totale Ausbruchsgröße der Verteilung P (X = x; s) = s ( ) 2x s λ x s, x = s, s + 1,... (2) 2x s x s (1 + λ) 2x s 3

4 Diese Verteilungen sind definiert für X<. Man erweitert sie auf {s,s+1,...} { } indem man P (X = ; s) = 1 q(λ) s definiert. Sei X die Ausbruchsgröße, bei der die Beobachtung zensiert wird. Man nimmt an, P(X < ) = 1 und setzt c i = 1, falls X< X, c i = 0, falls X X. Bei gegebenen Beobachtungen (s 1, x 1, c 1 ),..., (s n, x n, c n ) bei einer Stichprobe von n Ausbrüchen ist die Likelihood für λ: L(λ; s, x, c) = n { ( P (X = x i ; s i ) c i i=1 x j 1 ) 1 cj } 1 P (X = j; s i ) j=s i Der MLE von λ ist asymptotisch unverfälscht und konsistent. λ kann jeden Wert zwischen [0, ) annehmen. Man interessiert sich für die Fisher-Information i(λ) von einem einzigen Ausbruch mit s=1. Figur 1 zeigt Graphen von i(λ) für 3 Zensurschemata, in denen Werte von X, die größer sind als feste Schwellenwerte x i, zensiert werden. Ohne Zensur ist der MLE λ = 1 ( s i )/( x i ), und x i ist suffizient. Vorausgesetzt, dass das Zensurschema so organisiert ist, dass selten zensiert wird, gibt es nur geringen Effizienzgewinn, wenn man die Information über die Dauer des Ausbruchs verwendet. 2.2 Ausbruchsdauer Wenn Y die Zahl der Generationen der Verbreitung bezeichnet, ausgehend von einer einzigen Anfangserkrankung in Generation Null, dann genügt seine Verteilungsfunktion f k = P (Y k) der rekursiven Beziehung f 0 = ϕ(0), f k+1 = ϕ(f k ) k = 0, 1, 2,... wobei ϕ(x) = A(xθ)/A(θ) die erzeugende Funktion der offspring Verteilung ist. Ist die offspring Verteilung eine Poisson-Verteilung mit λ 1, dann ist (3) f k = e λ E k (e λe λ ) (4) wobei E k (x) die iterierte Exponentialfunktion, E 0 (x) = 1, E k+1 (x) = x E k(x), bezeichnet. Ist die offspring Verteilung eine geometrische Verteilung mit λ < 1, dann ist Man definiert f k = 1 λk+1, k = 0, 1, 2,... (5) 1 λk+2 f,s = P (Y = S = s) = 1 q(λ) s um eigentliche Verteilungen auf Y, {0,1,2,...} { }, zu erhalten. Normalerweise kennt man aber die exakte Zahl der Generationen nicht. In Farrington und Grant (1999) wird eine einfache Analyse-Methode beschrieben, die generalisierte lineare Modelle benutzt, und darauf basiert, ob eine zweite Verbreitung erfolgt ist oder nicht. Diese läßt allerdings Informationen über die Dauer U des Ausbruchs außer acht, wobei U die Zeit zwischen dem Auftreten der Symptome bei der ersten Erkrankung und dem Auftreten der Symptome bei der letzten Erkrankung ist. Diese Daten hat man oftmals zur 4

5 Verfügung. Die Zahl der Generationen kann dann ungefähr ermittelt werden, indem man das Wissen über das mittlere serial Intervall verwendet, also das mittlere Intervall zwischen dem Auftreten von Symptomen bei einem Erkrankten und dem Auftreten der Symptome bei einem weiteren Erkrankten, der vom ersten infiziert wurde. Alternativ kann man eine stochastische Methode zur Ermittlung benutzen, um zufällige Variation innerhalb der serial Intervalle zuzulassen. Man nimmt an, dass die Intervalle h(z) verteilt sind. h n (z) bezeichne die Verteilung der Summe von n unabhängigen Intervallen. Allgemein soll die serial Intervall-Verteilung von λ abhängen. Man darf annehmen, dass die erste und letzte Erkrankung in einem Ausbruch notwendigerweise die sind, die von der maximalen Zahl der Verbreitungsgenerationen getrennt sind. Die Verteilung der Ausbruchsdauer U bei gegebenen s Anfangserkrankungen ist dann f(u; s) = p 0 (λ; s), u = 0 n=1 h n(u)p n (λ; s), 0 < u < 1 q(λ) s, u = wobei p n (λ; s) = f n,s f n 1,s die Massenfunktion der Verteilung für die Verbreitungsgenerationen ist, mit offspring mean λ, beginnend mit s Erkrankungen in Generation 0. Diese Methode erfordert Kenntnisse über die Verteilung h(x). ML-Schätzung von λ basiere also auf Beoboachtungen (s 1, u 1, c 1 ),..., (s n, u n, c n ) einer Stichprobe von n Ausbrüchen. Wie vorher sind die c i Zensurindikatoren: 1, wenn die Beobachtung unzensiert ist, 0, wenn sie zensiert ist. Die Likelihood ist also L(λ; s, u, c) = n { ( f(u i ; s i ) c i 1 i=1 u i 0 ) 1 ci } f(x; s i )dx Standart Likelihood Theorie greift wieder, und der MLE ist konsistent und asymptotisch unverfälscht für n. 2.3 Bayes-Inferenz Einer der Vorteile der Bayes-Näherung ist, dass sie die Berechnung der a posteriori Wahrscheinlichkeit für λ > 1 bei gegebener passender a priori Verteilung erlaubt. Bei gegebener a priori Verteilung π(λ) ist die a posteriori Verteilung von λ für Ausbruchsgröße oder -dauer f(λ) = L(λ)π(λ) 0 L(z)π(z)dz wobei L(λ) entweder die Likelihoods von (3) oder von (7) bezeichnet. Da die Berechnungen von sehr kompliziert sind, benutzt man Metropolis-Hastings sampling, um Gleichung (8) zu evaluieren. Heyde (1979) und Yanev und Tsokos (1999) verwenden konjugierte a priori Verteilungen. Für Verteilungen der Ausbruchsgröße werden sie am einfachsten durch den kanoischen Parameter θ ausgedrückt, nicht durch λ. Die konjugierten Verteilungen sind die Gamma- Verteilung für die Borel-Tanner und die Beta für die negative Binomial-Verteilung. Es gibt allerdings keine einfachen konjugierten Verteilungen für Verteilungen der Ausbruchsdauer. In jedem Fall würde es für die surveillance Anwendung Sinn machen, eine einzige a priori Verteilung für alle Modelle zu spezifizieren, die in gewissem Sinne neutral ist im Hinblick darauf, ob λ < 1 oder λ > 1. Da dies nicht möglich ist, schließen wir Konjugation aus. 5 (6) (7) (8)

6 Es scheint natürlich zu sein, eine a priori Verteilung zu wählen, für die die Verteilung von log(λ) symmetrisch ist. Wir wählen also a priori Verteilungen aus der lognormal Familie LN(z;µ; σ) exp{n(µ, σ 2 )}. Für µ=0 ist der Median 1. Die zugehörige a priori Verteilung π(z) = LN(z; 0, σ) ist neutral, da λ < 1 und λ > 1 dieselbe a priori Wahrscheinlichkeit 0.5 haben. 3 Simulationen Das Verzweigungsprozess-Modell bietet in großen Populationen nur eine Näherung für die Anfangsstufen bei der Verbreitung einer Infektion, da man der Verringerung der Anfälligenzahl bei fortschreitendem Ausbruch keine Beachtung schenkt. Generell wird die Abnahme der Anfälligen dazu führen, Ausbruchsgröße und -dauer zu begrenzen, und somit dazu, dass der geschätzte Wert für λ gegen 0 hin verfälscht wird. Wir erwarten, dass λ < 1 ist. Das Ziel ist es, zu signalisieren, wenn λ zu nahe an 1 gelangt. Ausbrüche werden normalerweise durch Ort-Zeit Häufungen von Infektionen innerhalb einer definierten Gemeinschaft, identifiziert, nicht durch Übertragungsketten. Allerdings kommt es vor, dass nicht alle Infektionen, die während eines Ausbruchs auftreten, erfasst werden. Solche Minder-Erfassung wird ebenso dazu führen, dass die Schätzer für λ, die auf Ausbruchsgröße und -dauer basieren, zur 0 hin verfälscht werden. In diesem Abschnitt untersuchen wir die Auswirkungen dieser Verfälschungen durch Simulation. 3.1 Reduzieren der Anfälligen Für die Simulationen wurde das Reed-Frost Modell benutzt. Jeder Ausbruch wurde simuliert, indem man ein einzelnes infektiöses Individuum in eine Population von Anfälligen der Größe m brachte. Die effektive Populationsgröße ist also m+1. Die Wahrscheinlichkeit, der Infektion zu entgehen wurde ρ = 1 λ/m gewählt. Gemäß Reed-Frost Modell ist die Zahl der Krankheiten, die in Generation k+1 auftreten, X k+1 Bin( m + 1 k 0 X i, 1 ρ X k ), mit X 0 = 1. Diese wurden iteriert, bis X k = 0 für ein k. Die totale Ausbruchsgröße für jeden Ausbruch war also X k und die Zahl der Verbreitungsgenerationen war min{k : X k+1 = 0}. Um die Ausbruchsdauer zu simulieren wurden Stichproben von individuellen serial Intervallen einer Gamma-Verteilung gemacht, mit Mittelwert 14 Tage, shape 2 und Standardabweichung 14/ 2 = 9.9 Tage. Dann wurde λ mit den Gleichungen (6) und (7) geschätzt. In den folgenden simulierten Experimenten wurden 100 Ausbrüche für feste Werte für m und λ generiert. Man nahm an, dass keine Beobachtungen zensiert wurden. Für jedes Set der 100 Ausbrüche wurde λ mit der Maximum-Likelihood geschätzt. Für m tendiert die offspring Verteilung zu einer Poisson Verteilung mit Mittelwert λ. Demgemäß wurden die Likelihoods, die auf Poisson offspring basieren, benutzt. Der ganze Vorgang wurde 100 mal wiederholt, um durchschnittliche Schätzer zu erhalten. Figur 3 zeigt die durchschnittlichen Schätzer geplottet gegen das wahre λ, für λ=0.5, 0.6, 0.7, 0.8, 0.9, 0.95, 1 und ursprüngliche Populationsgrößen m=10, 100, 1000, 10000, Anfällige. Es überrascht nicht, dass bei nur 10 Anfälligen die Schätzer gravierend verfälscht werden. Für m 100 ist der bias mäßig. Es gibt nur geringe Unterschiede im bias, ob nun Ausbruchsgröße, -dauer oder Zahl der Verbreitungsgenerationen benutzt werden. 6

7 3.2 Minder-Erfassung von Infizierten Die Simulationen wurden unter der Annahme wiederholt, dass die individuelle Erfassungswahrscheinlichkeit p=0.5 und 0.75 ist. Nach Simulation der Ausbrüche wurden Erkrankungen mit Wahrscheinlichkeit p herausgenommen. Bei einigen Infektionen weisen nämlich nicht alle infizierten Individuen klinische Symptome auf, weshalb auch nur ein gewisser Anteil erfasst wird. Für solche Infektionen dürfte eine Schätzung, die auf Ausbruchsdauer basiert, weniger verfälschte Ergebnisse liefern als die, die auf Ausbruchsgröße basiert. Der Ausbruch von Abb.2 beginnt z.b. mit einem einzigen Fall A, so dass s=1. Er beinhaltet insgesamt 12 Erkrankungen in 5 Verbreitungsgenerationen und dauert von A bis B. Der beobachtete Ausbruch beginnt allerdings bei den Erkrankungen C und D, so dass s=2, und er umfasst 7 Erkrankungen. Die Dauer des beobachteten Ausbruchs ist das Zeitintervall D bis E. Die plots der mittleren geschätzten Werte gegen die wahren Werte von λ für anfällige Populationen mit Anfangsgröße m=10000 sind in Figur 5(a) bzw. (b) dargestellt. Sie verwenden Ausbruchsgröße und -dauer mit Erfassungswahrscheinlichkeit p=0.75 und Beispiel: Masern in den USA Die Methoden werden mit einer Datenmenge über Masern in den USA illustriert. Das Datenset beinhaltet Ausbrüche, die zwischen 1997 und 1999 auftraten. Es wurden keine Ausbrüche zensiert. Alle Beispiele basieren auf Bayes schen Methoden. Es wurde eine neutrale a priori Verteilung mit σ = 1 benutzt. Die Berechnungen wurden mit nicht-neutralen a priori Verteilungen mit µ = ±0.5 wiederholt. In allen Fällen waren die Ergebnisse unempfindlich gegenüber der Wahl der a priori Verteilung. In dieser Studie waren Ausbrüche so definiert, dass sie mindestens eine Verbreitungsgeneration mit einschließen. 4.1 Daten über Größe des Ausbruchs Während den 41 Ausbrüchen gab es 207 Erkrankungen. Alle Likelihoods sind bedingt auf das Ereignis, dass jeder Ausbruch inklusive des Anfangsfalls mindestens 2 Erkrankungen hatte. Die Wahrscheinlichkeit dieses Ereignisses ist (1 e λ ) 41 für die Poisson offspring Verteilung und λ 41 (1 + λ) 41 für die geometrische offspring Verteilung. Für die Masern-Daten sind die log likelihood Kerne 166log(λ) 207λ 41(1 e λ ) bei Poisson offspring und 125log(λ)-332log(1 + λ) bei geometrischem offspring. Figur 7(a) zeigt die log likelihood Profile. Die Schätzer und 95%-Konfidenzintervalle sind λ=0.66 (0.55, 0.78) bei Poisson offspring, und λ=0.60 (0.48, 0.75) bei geometrischem offspring. Figur 7(b) zeigt die a posteriori Verteilung unter Verwendung der Ausbruchsgröße. Die a posteriori Wahrscheinlichkeit, dass λ > 1 ist, ist vernachlässigbar. Die korrespondierende a prior Wahrscheinlichkeit war 0.5. Sowohl Likelihood als auch Bayes-Kriterium führen zu dem Schluss, dass Masern eliminiert wurden. 7

8 4.2 Daten über Dauer des Ausbruchs Die Tabelle zeigt die Daten über die Dauer der 41 Ausbrüche, also die Anzahl der Tage zwischen den ersten und den letzten Symptomen. Dauer Häufigkeit Dauer Häufigkeit Bei allen Likelihoods ist die Bedingung, dass die Zahl der Generationen in jedem Ausbruch mindestens 1 ist, also U> 0. Die Dichten f(u; s) aus (7) werden ersetzt durch f(u; s) = h n (u) pn(λ;s) 1 p 0 (λ;s) n=1 1 q(λ) s 1 p 0 (λ;s) 0 < u < u = wobei 1 p 0 (λ; s) = 1 e sλ für die Poisson offspring Verteilung, und = 1 (1 + λ) s für die geometrische. Um die Ausbruchsdauern zu modellieren braucht man zuerst einen Schätzer für die serial Intervall Verteilung von Masern. Eine Näherung ist es, die Dauer von Ausbrüchen zu verwenden, in denen zwei Erkrankungen auftraten. Es gab 13 solche Ausbrüche mit einem mittleren serial Intervall von 12.6 Tagen. 13 Ausbrüche sind aber zu wenig, um einen geeigneten Schätzer zu erhalten. Deshalb wurden Hope Simpson s Daten über Masern in Personen-Haushalten benutzt (Bailey, 1975). Diese Daten wurden häufig untersucht, und lieferten einen Schätzer für die infektiöse Periode, nämlich 2-3 Tage. In 219 der 264 Haushalte wurden zwei Erkrankungen beobachtet. Die 32 Haushalte, in denen die Erkrankungen 5 oder weniger Tage auseinander lagen, wurden ausgeschlossen. Eine passende Gamma-Verteilung für die restlichen 187 Beobachtungen über das serial Intervall T liefert die Verteilung in Abb.3. Die Gamma Verteilung hat Mittelwert Tage und shape Die Standardabweichung von 11.03/ = 2.42 Tagen ist ziemlich kurz, so dass es zwischen den Generationen nur wenigt Überlappung geben dürfte. Im folgenden wird angenommen, dass das serial Intervall Gamma verteilt ist mit diesen Parameterwerten. Die graphischen Resultate sind denen in Figur 7 ganz ähnlich. Man erhält als Schätzer und 95%-Konfidenzintervalle λ=0.53 (0.40,0.68) bei Poisson offspring, und λ=0.56 (0.42,0.73) bei geometrischem offspring. Die a posteriori Wahrscheinlichkeit, dass λ > 1, ist vernachlässigbar. Wieder war die a priori Wahrscheinlichkeit 0.5. Wie vorher folgt, dass in dieser Population Masern ausgelöscht werden. 5 Diskussion Die statistischen Methoden, die beschrieben wurden, liefern einen einfachen Rahmen für die Analyse von surveillance Daten bei infektiösen Krankheiten nach der Elimination von endemischer Übertragung. Diese Situation ist realisiert durch die Forderung, dass die effektive reproduction number λ < 1 ist. Bei den Anwendungen auf Masern liefern alle gezeigten Methoden dieselben Ergebnisse: Masern hat man in dieser Population gut unter Kontrolle. Verzweigungsprozesse werden aber selten direkt verwendet für statistische Modelle. Der besondere Kontext von Schätzung bei Massenimpfprogrammen gibt diesen Methoden neue 8

9 Relevanz. In diesem Vortrag wurde ein Rahmen benutzt, der auf Ausbruchsgröße und - dauer basierte. Wenn man keine Auslöschung verlangt, können die Fälle λ 1 und λ > 1 gemeinsam betrachtet werden. Diese Modelle sind ähnlich zu sensierten survival Modellen. Für einige methodologische Probleme lohnt sich weitere Untersuchung: (a)de Serres et al. (2000) schlug vor, surveillance von λ auf dem Anteil von Erkrankungen basieren zu lassen, die importiert werden. In einem Zeitintervall [0, τ] gebe es x beobachtete Erkrankungen, von denen s importiert wurden. Falls λ 1, müssen alle Erkrankungen von Importen stammen. Kann man Grenzeffekte aufgrund von Zensur bei 0 und τ ignorieren, darf man λ = 1 s/x schätzen. Es wäre nützlich, diese Methode in einen Rahmen zu bringen, der für alle Werte von λ gültig ist, um Schwellenwerte abzuleiten. (b)yanev (1975) beschrieb u.a. die asymptotischen Eigenschaften des MLE λ = 1 s/x, basierend auf Ausbruchsgröße und ohne Zensur, mit λ = 1. Der MLE λ ist immer noch asymptotisch unverfälscht und konsistent, und s(1 λ) σ 2 χ 2 1 für s, wobei σ2 die Varianz der offspring Verteilung ist. z.b. für Poisson offspring, mit λ = 1 D E( λ) = s s + 1 und V ( λ) = 2s (s + 1) 2 (s + 2) Es wäre interessant, asymptotische Ergebnisse für den MLE zu erhalten, die auf der Anzahl der Verbreitungsgenerationen und -dauer basieren mit λ = 1, wenn für die Zahl der Ausbrüche n. (c)die Herleitung der Likelihood für Ausbruchsdauern basierte auf der Annahme, dass die erste und die letzte Erkrankung notwendigerweise die sind, die von der maximalen Anzahl von Generationen getrennt sind. Es wäre nützlich, diese Annahme zu lockern. (d)zensur zerstört die Suffizienz der Ausbruchsgröße. Es wäre interessant zu wissen, wie hoch der Effizienzgewinn in Situationen mit häufiger Zensur wäre, wenn man Ausbruchsgröße und -dauer gemeinsam modelliert. (e)schließlich wäre es nützlich, die Methoden zu erweitern, um Heterogenität bei Kontaktraten mit einzubeziehen. Dies wäre z.b. nützlich, wenn das Modell mit festem λ nicht gut auf die Daten passen würde. In diesem Fall müßte ein neues surveillance Kriterium spezifiziert werden. Klar sind die Methoden begrenzt, da sie der Reduzierung der Anfälligenzahl und Heterogenität in Kontaktraten nicht Rechnung tragen. Sie bieten aber ein einfaches surveillance Instrument und sind deshalb in der Praxis willkommen. Wie gezeigt wurde, ist bias, wenn man die Verringerung der Anfälligenzahl ignoriert, nur für Gemeinschaften mit weniger als 100 Anfälligen wirklich ein Problem. Heterogenität bei Kontaktraten zuzulassen ist schwierig, auch wenn obiges Modell für zufälliges λ eine einfache Methode liefert. Verschiedene Methoden, um Mischung innerhalb und zwischen Haushalten einzubeziehen, wurden vorgeschlagen, auch wenn es eher unwahrscheinlich scheint, dass sie in einem surveillance setting angewendet werden können. Alternativ bieten serologische survey Methoden unterschiedliche, auf Population basierende, Näherungen zur surveillance von Impfprogrammen. 9

10 Abbildung 1: Fisher-Information für eine einzelne Beobachtung mit Zensur bei ξ=5,50,150; (a)poisson offspring, (b) geometrischer offspring 10

11 Abbildung 2: Schematische Darstellung eines Ausbruchs. : erfasste Fälle; : nicht-erfasste Fälle 11

12 Abbildung 3: serial-interval-verteilung für Masern: beobachtete Häufigkeiten und gefittete Gamma-Verteilung( ) 12

Seminar: Statistische Methoden in der Infektionsepidemiologie

Seminar: Statistische Methoden in der Infektionsepidemiologie Seminar: Statistische Methoden in der Infektionsepidemiologie Verzweigungsprozess-Modelle für surveillance von infektiösen Krankheiten, kontrolliert durch Massenimpfung 1 1. Einleitung Impfprogramme zur

Mehr

Wichtige Definitionen und Aussagen

Wichtige Definitionen und Aussagen Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge

Mehr

Statistik III. Walter Zucchini Fred Böker Andreas Stadie

Statistik III. Walter Zucchini Fred Böker Andreas Stadie Statistik III Walter Zucchini Fred Böker Andreas Stadie Inhaltsverzeichnis 1 Zufallsvariablen und ihre Verteilung 1 1.1 Diskrete Zufallsvariablen........................... 1 1.2 Stetige Zufallsvariablen............................

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 1 Inhalt der heutigen Vorlesung Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung der vorherigen Vorlesung Übersicht über Schätzung und

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 11. Vorlesung Jochen Köhler 10.05.011 1 Inhalt der heutigen Vorlesung Zusammenfassung Parameterschätzung Übersicht über Schätzung und Modellbildung Modellevaluation

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik 10. Vorlesung - 2018 Grundbegriffe der Statistik statistische Einheiten = Objekte an denen interessierende Größen erfaßt werden z.b. Bevölkerung einer Stadt; Schüler einer bestimmten Schule; Patienten

Mehr

Biostatistik, Sommer 2017

Biostatistik, Sommer 2017 1/52 Biostatistik, Sommer 2017 Prof. Dr. Achim Klenke http://www.aklenke.de 7. Vorlesung: 02.06.2017 2/52 Inhalt 1 Wahrscheinlichkeit Bayes sche Formel 2 Diskrete Stetige 3/52 Wahrscheinlichkeit Bayes

Mehr

Mathematische Statistik Aufgaben zum Üben. Schätzer

Mathematische Statistik Aufgaben zum Üben. Schätzer Prof. Dr. Z. Kabluchko Wintersemester 2016/17 Philipp Godland 14. November 2016 Mathematische Statistik Aufgaben zum Üben Keine Abgabe Aufgabe 1 Schätzer Es seien X 1,..., X n unabhängige und identisch

Mehr

5 Binomial- und Poissonverteilung

5 Binomial- und Poissonverteilung 45 5 Binomial- und Poissonverteilung In diesem Kapitel untersuchen wir zwei wichtige diskrete Verteilungen d.h. Verteilungen von diskreten Zufallsvariablen): die Binomial- und die Poissonverteilung. 5.1

Mehr

Wahrscheinlichkeitstheorie und Statistik vom

Wahrscheinlichkeitstheorie und Statistik vom INSTITUT FÜR STOCHASTIK SS 2007 UNIVERSITÄT KARLSRUHE Priv.-Doz. Dr. D. Kadelka Dipl.-Math. oec. W. Lao Klausur (Maschineningenieure) Wahrscheinlichkeitstheorie und Statistik vom 2.9.2007 Musterlösungen

Mehr

3.4 Bayes-Verfahren Begrifflicher Hintergrund. Satz 3.22 (allgemeines Theorem von Bayes)

3.4 Bayes-Verfahren Begrifflicher Hintergrund. Satz 3.22 (allgemeines Theorem von Bayes) 3.4 Bayes-Verfahren 203 3.4.1 Begrifflicher Hintergrund Satz 3.22 (allgemeines Theorem von Bayes) Seien X und U zwei Zufallsvariablen mit gemeinsamer Wahrscheinlichkeitsfunktion f X,U ( ) bzw. Dichte f

Mehr

7.5 Erwartungswert, Varianz

7.5 Erwartungswert, Varianz 7.5 Erwartungswert, Varianz Def. 7.5.: a) X sei eine diskrete ZV, die bei unendl. vielen Werten x k folgende Zusatzbedingung erfüllt: x k p k

Mehr

Mehrdimensionale Zufallsvariablen

Mehrdimensionale Zufallsvariablen Mehrdimensionale Zufallsvariablen Im Folgenden Beschränkung auf den diskreten Fall und zweidimensionale Zufallsvariablen. Vorstellung: Auswerten eines mehrdimensionalen Merkmals ( ) X Ỹ also z.b. ω Ω,

Mehr

Statistics, Data Analysis, and Simulation SS 2015

Statistics, Data Analysis, and Simulation SS 2015 Mainz, 2. Juli 2015 Statistics, Data Analysis, and Simulation SS 2015 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Konjugierte Prior Konjugierte Prior

Mehr

Statistics, Data Analysis, and Simulation SS 2017

Statistics, Data Analysis, and Simulation SS 2017 Mainz, 26. Juni 2017 Statistics, Data Analysis, and Simulation SS 2017 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Dr. Michael O. Distler

Mehr

UE Statistische Mustererkennung WS 2018 Angaben zur 2ten Aufgabengruppe

UE Statistische Mustererkennung WS 2018 Angaben zur 2ten Aufgabengruppe UE Statistische Mustererkennung WS 2018 Angaben zur 2ten Aufgabengruppe 1 Aufgabe UE-II.1 Generieren Sie je 1000 Stichproben (samples) mit Umfang 5/30/100/500 für die Normalverteilung N(µ, σ 2 ) = N(4,

Mehr

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Stetige Zufallsvariable Verteilungsfunktion: Dichtefunktion: Integralrechnung:

Mehr

Wahrscheinlichkeit und Statistik: Zusammenfassung

Wahrscheinlichkeit und Statistik: Zusammenfassung HSR Hochschule für Technik Rapperswil Wahrscheinlichkeit und Statistik: Zusammenfassung beinhaltet Teile des Skripts von Herrn Hardy von Lukas Wilhelm lwilhelm.net 12. Januar 2007 Inhaltsverzeichnis 1

Mehr

Varianzkomponentenschätzung

Varianzkomponentenschätzung Qualitas AG Varianzkomponentenschätzung Peter von Rohr Qualitas AG Peter von Rohr Folien ZL I+II LFW C11 October 29, 2015 2 / 23 Multiple Lineare Regression Annahmen Modell y = Xb + e Varianz der Fehler

Mehr

2 Aufgaben aus [Teschl, Band 2]

2 Aufgaben aus [Teschl, Band 2] 20 2 Aufgaben aus [Teschl, Band 2] 2.1 Kap. 25: Beschreibende Statistik 25.3 Übungsaufgabe 25.3 a i. Arithmetisches Mittel: 10.5 ii. Median: 10.4 iii. Quartile: x 0.25 Y 4 10.1, x 0.75 Y 12 11.1 iv. Varianz:

Mehr

Nachklausur Wahrscheinlichkeitstheorie und Inferenz II Sommersemester Oktober 2011

Nachklausur Wahrscheinlichkeitstheorie und Inferenz II Sommersemester Oktober 2011 Nachklausur Wahrscheinlichkeitstheorie und Inferenz II Sommersemester 2011 28. Oktober 2011 Prof. Dr. Torsten Hothorn Institut für Statistik Nachname: Vorname: Matrikelnummer: Anmerkungen: ˆ Schreiben

Mehr

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9. 7. Übung: Aufgabe 1 b), c), e) Aufgabe a), c), e) Aufgabe 3 c), e) Aufgabe 4 b) Aufgabe 5 a) Aufgabe 6 b) Aufgabe 7 e) Aufgabe 8 c) Aufgabe 9 a), c), e) Aufgabe 10 b), d) Aufgabe 11 a) Aufgabe 1 b) Aufgabe

Mehr

Nachklausur zur Vorlesung

Nachklausur zur Vorlesung Institut für Mathematische Stochastik WS 003/004 Universität Karlsruhe 30. April 004 Priv.-Doz. Dr. D. Kadelka Nachklausur zur Vorlesung Statistik für Biologen Musterlösungen Aufgabe 1 Gemessen wurde bei

Mehr

5 Konfidenzschätzung. 5.1 Einige Grundbegriffe zur Konfidenzschätzung

5 Konfidenzschätzung. 5.1 Einige Grundbegriffe zur Konfidenzschätzung 5 Konfidenzschätzung 5. Einige Grundbegriffe zur Konfidenzschätzung Diesem Kapitel liegt das parametrische Modell {X, B X, P } mit P {P Θ} zugrunde. {Θ, B Θ } sei ein Meßraum über Θ und µ ein σ-finites

Mehr

13 Mehrdimensionale Zufallsvariablen Zufallsvektoren

13 Mehrdimensionale Zufallsvariablen Zufallsvektoren 3 Mehrdimensionale Zufallsvariablen Zufallsvektoren Bisher haben wir uns ausschließlich mit Zufallsexperimenten beschäftigt, bei denen die Beobachtung eines einzigen Merkmals im Vordergrund stand. In diesem

Mehr

Binomialverteilung. Häufigkeit, mit der Ereignis A bei n unabhängigen Versuchen eintritt. Träger von X : X = {0, 1, 2,..., n}.

Binomialverteilung. Häufigkeit, mit der Ereignis A bei n unabhängigen Versuchen eintritt. Träger von X : X = {0, 1, 2,..., n}. Binomialverteilung Konstruktionsprinzip: Ein Zufallsexperiment wird n mal unabhängig durchgeführt. Wir interessieren uns jeweils nur, ob ein bestimmtes Ereignis A eintritt oder nicht. X = Häufigkeit, mit

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 8. Dezember 2010 Teil V Schließende Statistik 1 Parameterschätzung Erwartungstreue und Konsistenz Maximum-Likelihood

Mehr

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent

Mehr

7.7 Spezielle diskrete Wahrscheinlichkeitsverteilungen

7.7 Spezielle diskrete Wahrscheinlichkeitsverteilungen 7.7 Spezielle diskrete Wahrscheinlichkeitsverteilungen 7.7.1 Die Laplace-Verteilung Sei X eine gleich verteilte Zufallsvariable mit den Werten in der Menge Ω X = {x i R : i = 1,...,n}, d.h. f (x i = 1

Mehr

3.4 Asymptotische Evaluierung von Sch atzer Konsistenz Konsistenz Definition 3.4.1: konsistente Folge von Sch atzer

3.4 Asymptotische Evaluierung von Sch atzer Konsistenz Konsistenz Definition 3.4.1: konsistente Folge von Sch atzer 3.4 Asymptotische Evaluierung von Schätzer 3.4.1 Konsistenz Bis jetzt haben wir Kriterien basierend auf endlichen Stichproben betrachtet. Konsistenz ist ein asymptotisches Kriterium (n ) und bezieht sich

Mehr

Dr. L. Meier Statistik und Wahrscheinlichkeitsrechnung Sommer Musterlösung

Dr. L. Meier Statistik und Wahrscheinlichkeitsrechnung Sommer Musterlösung Dr. L. Meier Statistik und Wahrscheinlichkeitsrechnung Sommer 014 Musterlösung 1. 8 Punkte) a) 1 Pt)Für das Komplement gilt PR A) = 1 PR c A) = 0.968. b) 1 Pt)Nach Definition der bedingten Wahrscheinlichkeit

Mehr

Statistics, Data Analysis, and Simulation SS 2017

Statistics, Data Analysis, and Simulation SS 2017 Statistics, Data Analysis, and Simulation SS 2017 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Mainz, May 29, 2017 Dr. Michael O. Distler

Mehr

Statistics, Data Analysis, and Simulation SS 2017

Statistics, Data Analysis, and Simulation SS 2017 Statistics, Data Analysis, and Simulation SS 2017 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Mainz, 4. Mai 2017 Dr. Michael O. Distler

Mehr

Der Erwartungswert E[g(X)] von g(x) ist definiert. g(x k )w(x = x k ),

Der Erwartungswert E[g(X)] von g(x) ist definiert. g(x k )w(x = x k ), 2.5 Parameter einer Verteilung 2.5. Erwartungswert X eine Zufallsvariable, g : R R stetig. Der Erwartungswert E[g(X)] von g(x) ist definiert durch: E[g(X)] := k g(x k )w(x = x k ), falls X diskret ist

Mehr

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente... Inhaltsverzeichnis 1 Grundlagen der Wahrscheinlichkeitsrechnung 1 1.1 Wahrscheinlichkeitsräume Ein erster mathematischer Blick auf Zufallsexperimente.......... 1 1.1.1 Wahrscheinlichkeit, Ergebnisraum,

Mehr

Bachelorprüfung: Statistik (1 Stunde)

Bachelorprüfung: Statistik (1 Stunde) Prof. H.R. Künsch D-BIOL, D-CHAB Winter 2010 Bachelorprüfung: Statistik (1 Stunde) Bemerkungen: Es sind alle mitgebrachten schriftlichen Hilfsmittel und der Taschenrechner erlaubt. Natels sind auszuschalten!

Mehr

3.2 Maximum-Likelihood-Schätzung

3.2 Maximum-Likelihood-Schätzung 291 Die Maximum-Likelihood-Schätzung ist die populärste Methode zur Konstruktion von Punktschätzern bei rein parametrischen Problemstellungen. 292 3.2.1 Schätzkonzept Maximum-Likelihood-Prinzip: Finde

Mehr

Heute. Die Binomialverteilung. Poissonverteilung. Approximation der Binomialverteilung durch die Normalverteilung

Heute. Die Binomialverteilung. Poissonverteilung. Approximation der Binomialverteilung durch die Normalverteilung Heute Die Binomialverteilung Poissonverteilung Approximation der Binomialverteilung durch die Normalverteilung Arbeiten mit Wahrscheinlichkeitsverteilungen Die Binomialverteilung Man werfe eine Münze n

Mehr

1.5.4 Quantile und Modi. Bem [Quantil, Modus]

1.5.4 Quantile und Modi. Bem [Quantil, Modus] 1.5.4 Quantile und Modi 1.5 Erwartungswert und Varianz Bem. 1.73. [Quantil, Modus] und Vertei- Analog zu Statistik I kann man auch Quantile und Modi definieren. Gegeben sei eine Zufallsvariable X mit Wahrscheinlichkeitsverteilung

Mehr

Wahrscheinlichkeitsfunktion. Binomialverteilung. Binomialverteilung. Wahrscheinlichkeitshistogramme

Wahrscheinlichkeitsfunktion. Binomialverteilung. Binomialverteilung. Wahrscheinlichkeitshistogramme Binomialverteilung Wahrscheinlichkeitsfunktion Konstruktionsprinzip: Ein Zufallsexperiment wird n mal unabhängig durchgeführt. Wir interessieren uns jeweils nur, ob ein bestimmtes Ereignis A eintritt oder

Mehr

Bootstrap: Punktschätzung

Bootstrap: Punktschätzung Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 1 Bootstrap: Punktschätzung 1. Die Grundidee 2. Plug-in Schätzer 3. Schätzung des Standardfehlers 4. Schätzung und Korrektur der Verzerrung 5. Konsistenz

Mehr

Biostatistik, Sommer 2017

Biostatistik, Sommer 2017 1/51 Biostatistik, Sommer 2017 Wahrscheinlichkeitstheorie: Verteilungen, Kenngrößen Prof. Dr. Achim Klenke http://www.aklenke.de 8. Vorlesung: 09.06.2017 2/51 Inhalt 1 Verteilungen Normalverteilung Normalapproximation

Mehr

Spezielle Verteilungen einer Variablen

Spezielle Verteilungen einer Variablen Kapitel 2 Spezielle Verteilungen einer Variablen In diesem Kapitel werden wir einige häufig benutzte Verteilungen, die von einer Variablen abhängen, vorstellen. 2.1 Binomial-Verteilung Binomial-Verteilungen

Mehr

DWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr

DWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen Wir betrachten nun ein Verfahren zur Konstruktion von Schätzvariablen für Parameter von Verteilungen. Sei X = (X 1,..., X n ). Bei X

Mehr

Wechselkurse und Finanzmarkt-Indizes

Wechselkurse und Finanzmarkt-Indizes 8. Mai 2008 Inhaltsverzeichnis 1 Wechselkurse Einführung Wechselkurs US Dollar - Deutsche Mark Statistischer Prozess 2 Reinjektion Eigenschaften der Fluktuationen von x(τ) 3 Diffusion auf Finanzmärkten

Mehr

3.3 Methoden zur Evaluierung von Schätzern

3.3 Methoden zur Evaluierung von Schätzern 3.3 Methoden zur Evaluierung von Schätzern Bis jetzt haben wir nur glaubwürdige Techniken zur Konstruktion von Punktschätzern besprochen. Falls unterschiedliche Schätzer für einen Parameter resultieren,

Mehr

Wahrscheinlichkeitsrechnung und schließende Statistik

Wahrscheinlichkeitsrechnung und schließende Statistik Karl Mosler Friedrich Schmid Wahrscheinlichkeitsrechnung und schließende Statistik Vierte, verbesserte Auflage Springer Inhaltsverzeichnis 0 Einführung 1 1 Zufalls Vorgänge und Wahrscheinlichkeiten 5 1.1

Mehr

Biostatistik, WS 2017/18 Der Standardfehler

Biostatistik, WS 2017/18 Der Standardfehler 1/70 Biostatistik, WS 2017/18 Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1718/ 24.11.2017 3/70 Ein Versuch Hirse Bild: Panicum miliaceum 4/70 Ein Versuch Ein Versuch Versuchsaufbau:

Mehr

Aufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten:

Aufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten: Aufgabe 1 (8=2+2+2+2 Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten: Die Zufallsvariable X bezeichne die Note. 1443533523253. a) Wie groß ist h(x 5)? Kreuzen

Mehr

Statistik II. Regressionsrechnung+ Regressionsanalyse. Statistik II

Statistik II. Regressionsrechnung+ Regressionsanalyse. Statistik II Statistik II Regressionsrechnung+ Regressionsanalyse Statistik II - 16.06.2006 1 Regressionsrechnung Nichtlineare Ansätze In einigen Situation könnte man einen nichtlinearen Zusammenhang vermuten. Bekannte

Mehr

Monte-Carlo Tests. Diplomarbeit. Wiebke Werft. Mathematisches Institut der Heinrich-Heine-Universität Düsseldorf

Monte-Carlo Tests. Diplomarbeit. Wiebke Werft. Mathematisches Institut der Heinrich-Heine-Universität Düsseldorf Monte-Carlo Tests Diplomarbeit Wiebke Werft Mathematisches Institut der Heinrich-Heine-Universität Düsseldorf Düsseldorf im Dezember 2003 Betreuung: Prof. Dr. Arnold Janssen Inhaltsverzeichnis Einleitung

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Noémie Becker & Dirk Metzler 15. April 2016 Inhaltsverzeichnis 1 Der Standardfehler 1 1.1 Ein Versuch............................................

Mehr

Beispiel 6 (Einige Aufgaben zur Gleichverteilung)

Beispiel 6 (Einige Aufgaben zur Gleichverteilung) Beispiel 6 (Einige Aufgaben zur Gleichverteilung) Aufgabe (Anwendung der Chebyshev-Ungleichung) Sei X eine Zufallsvariable mit E(X) = µ und var(x) = σ a) Schätzen Sie die Wahrscheinlichkeit dafür, daß

Mehr

W-Rechnung und Statistik für Ingenieure Übung 8

W-Rechnung und Statistik für Ingenieure Übung 8 W-Rechnung und Statistik für Ingenieure Übung 8 Aufgabe 1 : Motivation Anhand von Daten soll eine Aussage über die voraussichtliche Verteilung zukünftiger Daten gemacht werden, z.b. die Wahrscheinlichkeit

Mehr

Aufgabe (12 Punkte) Sei A A eine σ-algebra. (a) Man zeige: Ist X : Ω R A -messbar, dann ist X A-messbar. (b) Gilt die Umkehrung von (a)?

Aufgabe (12 Punkte) Sei A A eine σ-algebra. (a) Man zeige: Ist X : Ω R A -messbar, dann ist X A-messbar. (b) Gilt die Umkehrung von (a)? Am 5. Mai 2007 wurde zum dritten Mal eine stochastische Eingangsprüfung durchgeführt. Insgesamt konnten maximal 56 Punkte erreicht werden, zum Bestehen der Prüfung waren mindestens 26 Punkte notwendig.

Mehr

How To Find Out If A Ball Is In An Urn

How To Find Out If A Ball Is In An Urn Prof. Dr. P. Embrechts ETH Zürich Sommer 2012 Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL) Schreiben Sie für Aufgabe 2-4 stets alle Zwischenschritte und -rechnungen sowie Begründungen auf. Aufgabe

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation

Mehr

Wie liest man Konfidenzintervalle? Teil II. Premiu m

Wie liest man Konfidenzintervalle? Teil II. Premiu m Wie liest man Konfidenzintervalle? Teil II Premiu m - Hintergrund Anderer Wahrscheinlichkeitsbegriff subjektiver Wahrscheinlichkeitsbegriff Beispiel: Was ist die Wahrscheinlichkeit dafür, dass ein Patient

Mehr

3 Grundlagen statistischer Tests (Kap. 8 IS)

3 Grundlagen statistischer Tests (Kap. 8 IS) 3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung

Mehr

f(x) = P (X = x) = 0, sonst heißt Poisson-verteilt mit Parameter (oder Rate) λ > 0, kurz X P o(λ). Es gilt x x! 1 Wahrscheinlichkeitsrechnung 212

f(x) = P (X = x) = 0, sonst heißt Poisson-verteilt mit Parameter (oder Rate) λ > 0, kurz X P o(λ). Es gilt x x! 1 Wahrscheinlichkeitsrechnung 212 1.6.2 Poisson Verteilung Eine weitere wichtige diskrete Verteilung ist die Poisson-Verteilung. Sie modelliert die Anzahl (eher seltener) Ereignisse in einem Zeitintervall (Unfälle, Todesfälle; Sozialkontakte,

Mehr

Klausur zur Vorlesung

Klausur zur Vorlesung Institut für Mathematische Stochastik WS 2006/2007 Universität Karlsruhe 12. Februar 2007 Priv.-Doz. Dr. D. Kadelka Dipl.-Math. W. Lao Aufgabe 1 (15 Punkte) Klausur zur Vorlesung Statistik für Biologen

Mehr

Musterlösung der Klausur vom 29. Juli 2003

Musterlösung der Klausur vom 29. Juli 2003 Statistik für Bioinformatiker SoSe 2003 Rainer Spang Musterlösung der Klausur vom 29. Juli 2003 Aufgabe 1. 10 Definieren Sie die folgenden statistischen Begriffe in einem Satz oder in einer Formel: 1.

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 17. November 2010 1 Gesetze Das Gesetz der seltenen Ereignisse Das schwache Gesetz der großen Zahl 2 Verteilungsfunktionen

Mehr

Statistik I für Betriebswirte Vorlesung 14

Statistik I für Betriebswirte Vorlesung 14 Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli

Mehr

Kapitel 9. Schätzverfahren und Konfidenzintervalle. 9.1 Grundlagen zu Schätzverfahren

Kapitel 9. Schätzverfahren und Konfidenzintervalle. 9.1 Grundlagen zu Schätzverfahren Kapitel 9 Schätzverfahren und Konfidenzintervalle 9.1 Grundlagen zu Schätzverfahren Für eine Messreihe x 1,...,x n wird im Folgenden angenommen, dass sie durch n gleiche Zufallsexperimente unabhängig voneinander

Mehr

Wahrscheinlichkeitsrechnung

Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Prof. Dr. Michael Havbro Faber 8.04.009 1 Inhalt der heutigen Vorlesung Zusammenfassung der letzten Vorlesung Übersicht über Schätzung und Modellbildung Modellevaluation

Mehr

Chi-Quadrat-Verteilung

Chi-Quadrat-Verteilung Chi-Quadrat-Verteilung Wikipedia http://de.wikipedia.org/wiki/chi-quadrat-verteilung 1 von 7 6/18/2009 6:13 PM Chi-Quadrat-Verteilung aus Wikipedia, der freien Enzyklopädie Die Chi-Quadrat-Verteilung ist

Mehr

Punktschätzer Optimalitätskonzepte

Punktschätzer Optimalitätskonzepte Kapitel 1 Punktschätzer Optimalitätskonzepte Sei ein statistisches Modell gegeben: M, A, P ϑ Sei eine Funktion des Parameters ϑ gegeben, γ : Θ G, mit irgendeiner Menge G, und sei noch eine Sigma-Algebra

Mehr

Errata für: Methoden der statistischen Inferenz: Likelihood und Bayes

Errata für: Methoden der statistischen Inferenz: Likelihood und Bayes Errata für: Methoden der statistischen Inferenz: Likelihood und Bayes Leonhard Held 9. Juli 2009 2 Einführung 1. Auf Seite 9, muss es in Abschnitt 1.2.8, Zeile 6-7 richtig heissen: Wir werden nur die

Mehr

i =1 i =2 i =3 x i y i 4 0 1

i =1 i =2 i =3 x i y i 4 0 1 Aufgabe (5+5=0 Punkte) (a) Bei einem Minigolfturnier traten 6 Spieler gegeneinander an. Die Anzahlen der von ihnen über das gesamte Turnier hinweg benötigten Schläge betrugen x = 24, x 2 = 27, x = 2, x

Mehr

Die Maximum-Likelihood-Methode

Die Maximum-Likelihood-Methode Vorlesung: Computergestützte Datenauswertung Die Maximum-Likelihood-Methode Günter Quast Fakultät für Physik Institut für Experimentelle Kernphysik SS '17 KIT Die Forschungsuniversität in der Helmholtz-Gemeinschaft

Mehr

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38 Dynamische Systeme und Zeitreihenanalyse Multivariate Normalverteilung und ML Schätzung Kapitel 11 Statistik und Mathematik WU Wien Michael Hauser Dynamische Systeme und Zeitreihenanalyse // Multivariate

Mehr

Bayesianische FDR (Teil 1)

Bayesianische FDR (Teil 1) Bayesianische FDR (Teil 1) Mareile Große Ruse Seminar Multiples Testen 08.11.2010 Übersicht Übersicht Übersicht Alternative: Übersicht Alternative: Übersicht Alternative: Bedingte Wahrscheinlichkeit (Ω,

Mehr

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Zufallsvariable Erinnerung: Merkmal, Merkmalsausprägung Deskriptive Statistik:

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungen stetiger Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Stochastik Praktikum Parametrische Schätztheorie

Stochastik Praktikum Parametrische Schätztheorie Stochastik Praktikum Parametrische Schätztheorie Thorsten Dickhaus Humboldt-Universität zu Berlin 05.10.2010 Prolog Momentenmethode X : Ω 1 Ω Zufallsgröße, die Experiment beschreibt. Ein statistisches

Mehr

13 Grenzwertsätze Das Gesetz der großen Zahlen

13 Grenzwertsätze Das Gesetz der großen Zahlen 13 Grenzwertsätze 13.1 Das Gesetz der großen Zahlen Der Erwartungswert einer zufälligen Variablen X ist in der Praxis meist nicht bekannt. Um ihn zu bestimmen, sammelt man Beobachtungen X 1,X 2,...,X n

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik 9. Vorlesung - 2017 Monte Carlo Methode für numerische Integration Sei g : [0, 1] R stetige Funktion; man möchte 1 0 g(t)dt numerisch approximieren mit Hilfe von Zufallszahlen: Sei (U n ) n eine Folge

Mehr

Klassifikation von Daten Einleitung

Klassifikation von Daten Einleitung Klassifikation von Daten Einleitung Lehrstuhl für Künstliche Intelligenz Institut für Informatik Friedrich-Alexander-Universität Erlangen-Nürnberg (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung

Mehr

1.2 Summen von Zufallsvariablen aus einer Zufallsstichprobe

1.2 Summen von Zufallsvariablen aus einer Zufallsstichprobe 1.2 Summen von Zufallsvariablen aus einer Zufallsstichprobe Nachdem eine Stichprobe X 1,..., X n gezogen wurde berechnen wir gewöhnlich irgendwelchen Wert damit. Sei dies T = T (X 1,..., X n, wobei T auch

Mehr

2. Prinzipien der Datenreduktion

2. Prinzipien der Datenreduktion 2. Prinzipien der Datenreduktion Man verwendet die Information in einer Stichprobe X 1,..., X n, um statistische Inferenz über einen unbekannten Parameter zu betreiben. Falls n groß ist, so ist die beobachtete

Mehr

Erwartungswert, Umgebungswahrscheinlichkeiten und die Normalverteilung

Erwartungswert, Umgebungswahrscheinlichkeiten und die Normalverteilung R. Brinkmann http://brinkmann-du.de Seite 5.05.0 Erwartungswert, Umgebungswahrscheinlichkeiten und die Normalverteilung Erwartungswert binomialverteilter Zufallsgrößen Wird ein Bernoulli- Versuch, bei

Mehr

Wahrscheinlichkeitsrechnung und schließende Statistik

Wahrscheinlichkeitsrechnung und schließende Statistik Springer-Lehrbuch Wahrscheinlichkeitsrechnung und schließende Statistik Bearbeitet von Karl Mosler, Friedrich Schmid 4., verb. Aufl. 2010. Taschenbuch. XII, 347 S. Paperback ISBN 978 3 642 15009 8 Format

Mehr

Wahrscheinlichkeitstheorie und Statistik

Wahrscheinlichkeitstheorie und Statistik Wahrscheinlichkeitstheorie und Statistik Definitionen und Sätze Prof. Dr. Christoph Karg Studiengang Informatik Hochschule Aalen Sommersemester 2018 2.5.2018 Diskrete Wahrscheinlichkeitsräume Diskreter

Mehr

Statistik K urs SS 2004

Statistik K urs SS 2004 Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die

Mehr

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests ue biostatistik: hypothesen, fehler 1. und. art, power 1/8 h. lettner / physik Hypothesen: Fehler 1. und. Art, Power eines statistischen Tests Die äußerst wichtige Tabelle über die Zusammenhänge zwischen

Mehr

Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK

Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK Institut für Stochastik Dr. Steffen Winter Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK für Studierende der INFORMATIK vom 17. Juli 01 (Dauer: 90 Minuten) Übersicht über

Mehr

Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen. Statistik II. Prof. Dr.

Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen. Statistik II. Prof. Dr. Statistik II Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen Statistik II 2. Parameterschätzung: 2.1 Grundbegriffe; 2.2 Maximum-Likelihood-Methode;

Mehr

Zulassungsprüfung Stochastik,

Zulassungsprüfung Stochastik, Zulassungsprüfung Stochastik, 5.5. Wir gehen stets von einem Maßraum (Ω, A, µ) bzw. einem Wahrscheinlichkeitsraum (Ω,A,P) aus. Die Borel σ-algebra auf R n wird mit B n bezeichnet, das Lebesgue Maß auf

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 1 1 Inhalt der heutigen Übung Statistik und Wahrscheinlichkeitsrechnung Hausübung F.4 (Zuverlässigkeitsberechnung) Bayes sche Entscheidungsanalyse (Aufgabe

Mehr

Lösungen zu Übungsblatt 9 Höhere Mathematik2/Stochastik 2 Master KI/PI

Lösungen zu Übungsblatt 9 Höhere Mathematik2/Stochastik 2 Master KI/PI Lösungen zu Übungsblatt 9 Höhere Mathematik/Stochastik Anpassung von Verteilungen Zu Aufgabe ) a) Zeichnen des Histogranmmes: Um das Histogramm zu zeichnen, benötigen wir die Höhe der Balken. Die Höhe

Mehr

Wirtschaftsmathematik

Wirtschaftsmathematik Einführung in einige Teilbereiche der Wintersemester 206 Prof. Dr. Stefan Etschberger HSA Unabhängigkeit von Ereignissen A, B unabhängig: Eintreten von A liefert keine Information über P(B). Formal: P(A

Mehr

Bootstrap: Konfidenzintervalle

Bootstrap: Konfidenzintervalle Resampling Methoden Dortmund, 2005 (Jenő Reicigel) Bootstrap: Konfidenintervalle Konfidenintervall Sei T ein Schäter für θ, und nehmen wir an, dass die Verteilung von T θ bekannt ist. Notwendige Bedingung

Mehr

1 Gemischte Lineare Modelle

1 Gemischte Lineare Modelle 1 Gemischte Lineare Modelle Wir betrachten zunächst einige allgemeine Aussagen für Gemischte Lineare Modelle, ohne zu tief in die mathematisch-statistische Theorie vorzustoßen. Danach betrachten wir zunächst

Mehr