Kindern mit Leukämie in Deutschland,

Größe: px

Ab Seite anzeigen:

Download "Kindern mit Leukämie in Deutschland,"

Margarethe Bösch
vor 5 Jahren
Abrufe

1 Raum-zeitliche Analyse von Kindern mit Leukämie in Deutschland, Arbeitstagung Bayes-Methodik, räumliche Statistik, Ökologie und Umwelt Sven Schmiedel, Peter Kaatsch, Maria Blettner, Joachim Schüz Dänische Krebsgesellschaft, Deutsches Kinderkrebsregister Lübeck, 3. Dezember 2009

2 Problem Leukämiefälle bei Kindern Daten auf Gemeindeebene Hypothese: Es gibt keinen allgemeinen Trend zur Clusterbildung (nicht zu verwechseln mit der Suche nach Clustern) Annahme: Es gilt die Poissonverteilung für Anzahl Fälle innerhalb Gemeinden Wie ist dieses zu überprüfen? 2

3 3

4 Daten International Classification of Childhood Cancer, third version n % I Leukemia, myeloproliferative and myelodysplastic diseases 11, I.a Lymphoid leukemia 9, I.b Acute myeloid leukemia 1, I.c Chronic myeloproliferative diseases I.d Myelodysplastic syndrome and other myeloproliferative diseases I.e Unspecified and other specified leukaemia Alle Kinder < 15 Jahren in Gemeinden, bewohnte Fläche: km² 4

5 Verteilung (H 0 ) Poisson-Verteilung P (X λ k) λ k k! e λ, hier P X (O i o) X o i e X i i o!, wobei O i beobachtete Fälle in Gemeinde i=1,,n 5

6 Der Anteil p-werte > 0,05 liegt bei mehr als 95% Weniger p-werte < 0,05 als man erwarten würde Schweder-Spjøtvoll-Plot 6

7 Verteilung (H 0 ) Voraussetzungen der Poissonverteilung: Var(O i ) = E(O i ) Wenn Var(O i ) > E(O i ) spricht man von Überdispersion i Hinweis esauf allgemeinen e e Trend zur Clusterbildung (oder auch Erhebungsfehler, fehlende Kovariable) 7

8 Verteilung (H 0 ) Vergleich empirischer Erwartungswert mit empirischer Varianz innerhalb der Gemeinden Varianz: 32,2222 Erwartungswert: 0,96 Problem: Natürlich ist Erwartungswert und Varianz der beobachteten Fälle abhängig von der Anzahl der Einwohner 8

9 Anzahl Gemeinden vs. Anzahl Kinder 9

10 Lösung: Einteilung der über Gemeinden in 100 Gruppen, um erwartete Anzahl der Fälle innerhalb der Gruppen auf gleichem Niveau zu halten 10

11 Gruppe 100 mit den größten Gemeinden fehlt 11

12 Teststatistik Nutzung der Statistik (Westermeier und Michaelis, 1994) Q n 1 o o 2 i n 1 i1 o Nach RA Fisher (1964) 12

13 Ergebnis Table 1: Distribution of statistic Q in the 100 groups Min* (1-99) Max (1-99) Group 100 Prop*> /97 3 Gruppen, mit 0 beobachteten Fälle 13

14 Problem Durch Einteilung in 100 Gruppen wird auch 100 Mal getestet Besser wäre Statistik, welche auch Einwohnerzahlen mitberücksichtigt 14

15 Artikel 15

16 Modell Potthoff-Whittinghill O i X i ~ Poi(X i ) X i ~ Gamma(μ i =PP i α,σ i ²=βμ i ) P i Personenjahre oder Anzahl Personen O i ~ NBin(μ i, (1 + β) μ i ) Gemeinsame Verteilung von O 1,,O n O T ~ gemischte Dirichletmultinomial Verteilung ( O i = O T ) Für β 0 Multinomialverteilung 16

17 Statistik nach Potthoff-Whittinghill Unter der Nullhypothese (β = 0) sind O i poissonverteilt und die gemeinsame Verteilung ist multinomialverteilt Potthoff-Whittinghill (1966) zeigten, dass der Score Test β = 0 vs. β > 0 auf folgender Statistik basiert: S n 1 O O 1 i 2 i1 E i O i 1 O 1 T 17

18 Schätzung von β Über die log likelihood der gemischten Dirichlet multinomial Verteilung n O ln E j 1 ln O k 1 i O T l 1 i i1 j1 k1 T 18

19 Vergleich mit anderen Tests Wenn Personen(jahre) gleichverteilt entspricht der Test dem Pearson Chi²-Test S ist im Falle von wenigen Personen(jahren) in Gebieten effizienter Vergleich mit anderen Tests mittels Simulationen unter verschiedenen Voraussetzungen der Verteilung der Bevölkerung hat gezeigt, dass S robust ist 19

20 Vorteile Hat sich als robust gegenüber verschiedenen Annahmen zur Bevölkerungsverteilung gezeigt Berücksichtigung der Bevölkerung der Gemeinden Ein Parameter welcher die Überdispersion in interpretierbarer Weise angibt Vergleichbarkeit mit Literatur Varianz in Komponenten zerlegbar (nicht auf räumliche Struktur beschränkt) 20

21 Nachteile Orte mit 0 oder 1 Fall werden nicht in Statistik mitberücksichtigt Räumlicher Bezug der Daten bleibt unberücksichtigt 21

22 Mit 20km² Raster überdecken zusammen- legen der Gemeinden, die ihr Zentrum innerhalb eines Rasters haben 22

23 23

24 Spatial Scan Statistic Kreise mit Zentrum jeder Gemeinde werden gebildet Unter H 0 ist das Risiko innerhalb der Kreise so groß wie außerhalb Berechnung der Likelihood Funktion für jeden Kreis Verwendung des Kreises mit größter Likelihood als wahrscheinlichstes wahrscheinlichstes Cluster Monte-Carlo Simulation der Verteilung unter H 0 24

25 Poisson Likelihood [c/µ] c x [(C-c)/(C-µ)] C-c c = Anzahl Fälle im Kreis µ = Erwartete Fälle im Kreis C = Gesamtanzahl Fälle 25

26 Anwendung Keine auffälligen p-werte 26

27 Besag Modell Einbeziehung der räumlichen Struktur in das Modell: Sei o i ~ Poisson(e i θ i ) mit log(θ i ) = μ + u i + v i μ: Gesamtlevel v i : Komponente ohne Struktur u i : Komponente unter Einbeziehung räumlicher Struktur Gaussian Markov random field Modell für u i : u i u j i ~ N(u i,σ u2 /m i ) u i : Mittelwert t der Nachbarn m i : Anzahl Nachbarn Unabhängige zufällige Effekte v i ~ N(0, σ v2 ) Unbekannte Hyperparameter σ u2 and σ v2 hyperpriors 27

28 28

29 Literatur Muirhead CR Methods for detecting ti disease clustering, with consideration of childhood leukaemia, Stat Methods Med Res, 15: Westermeier T, Michaelis J Applicability of the Poisson distribution to model the data of the German Children s Cancer Registry, Radiat Environ Biophys, 34: Fisher RA The significance of deviations from expectation in a Poisson series, Biometrics, 20: Potthoff RF, Whittinghill M Testing for homogeneity, Biometrika, 53:

Ähnliche Dokumente

Ein exakter Test für die Meta-Analyse von Studien mit binären Endpunkten. Oliver Kuß, Cora Gromann

Ein exakter Test für die Meta-Analyse von Studien mit binären Endpunkten Oliver Kuß, Cora Gromann Institut für Medizinische Epidemiologie, Biometrie und Informatik, Universität Halle-Wittenberg, Halle