Biostatistische Methoden Ulrich Mansmann, IBE, LMU München Michael Höhle, Institut für Statstik, LMU München Manuela Hummel, IBE, LMU München Vorlesung: Freitag, 08.00-11.00 Uhr, HGB B 101 Übung: Mittwoch, 16.00-18.00, HGB A 240 und CIP-Pool, Institut für Statistik, Ludwigstr. 33 Homepage: http://www.statistik.lmu.de/institut/ag/biostat/teaching/bm2006/ Inhalt 1. Statistische Modelle in der Epidemiologie 2. Statistische Methoden in der Diagnostik 3. Statistische Analyse von hochdimensionalen Genexpressionsdaten Biostatistische Methoden 2 1.1 Was ist Epidemiologie? the study of the distribution and determinants of health-related states or events in specified populations, and the application of this study to the control of health problems. Mögliche Ursachen von Krankheit: biologisch (genetische Faktoren, Altern etc.) Umwelteinflüsse (Strahlung, infektiöse Krankheiten, Luftverschutzung etc.) Soziale Verhaltensmuster (z.b. Zigaretten, Alkohol) Grundsätzliche Problematik Schwierigkeit aus Assoziation auf einen Kausalzusammenhang zu schliessen Problem von Störgrößen, auchstörfaktoren (engl.:confounder) Eine Zuteilung der Exposition durch Randomisierung ist in der Epidemiologie möglich! Abgrenzung einer Kausalbeziehung von einer indirekten Beziehung durch eine Reihe von Kriterien (Stärke der Assoziation, Vorliegen einer Dosis-Wirkungs-Beziehung, Konsistenz der Assoziation, Spezifität der Assoziation, biologische Plausibilität) Biostatistische Methoden 3 Biostatistische Methoden 4
Beispiel I - Confounding Beispiel I - Confounding Aggregierte Betrachtung versus Betrachtung in Schichten Naive Analyse aggregierter Daten kann irreführend sein. Zulassungsdaten der University of Berkely (1973) Männer Frauen Alle % Frauen Fakultäten Schuhgröße X? Z Y Einkommen Einkommen 2691 45% 1835 31% 4526 39% 41% Alle 825 62% 108 82% 933 64% 12% A 560 63% 25 68% 585 63% 4% B 325 37% 593 34% 918 35% 65% C 417 33% 375 38% 792 35% 47% D 191 28% 393 24% 584 25% 67% E 373 6% 341 7% 714 6% 48% F Geschlecht definiert in der beobachteten Population zwei Schichten Schuhgröße # von Bewerbern % von Zugelassenen Deskriptive Epidemiologie Betrachtung der Häufigkeit von Krankheiten in Populationen oder Subpopulationen (engl.: strata ) Möglicherweise auch Information über mittlere Exposition (engl.: exposure ) Oder: Verwendung von Surrogaten (engl.: surrogates ) für Exposition (z.b. deprivation ) Problem des ökologischen Bias, ökologischen Fehlschlusses: Eine statistische Assoziation auf aggregierter Ebene ist gleich der Assoziation auf individueller Ebene Biostatistische Methoden 5 Emil Durkheim Suicide (1951) Durkheim hat Daten zur Häufigkeit von Selbstmorden und dem religiösen Profil der Bevölkerung von Provinzen in Westeuropa gesammelt. Die Zusammenfassung der Daten ergab, dass in Provinzen mit einem höheren Anteil von Protestanten auch eine höhere Selbstmordrate zu verzeichnen war. Durkheim schloss daraus, dass Protestanten eher Selbstmord begehen als Katholiken und sah in der religiösen Grundeinstellung eine Ursache für Selbstmord. Dieser kausale Schluss ist zwingend logisch, denn es könnten ja gerade die Katholiken sein, die in immer deutlicherer Minderheit gegenüber den Protestanten in den Selbstmord getrieben werden. Selvin (1958) hat auf diesen Fehlschluss hingewiesen, den er ökologischen Bias nennt. Er kann sich einstellen, wenn aufgrund von Gruppendaten Schlüsse für individuelles Verhalten gezogen werden. Durkheim, E. (1951) Suicide, Free Press, New York Selvin, HC (1958) Durkheim s suicide and problems of empirical research, Am. J. Sociol., 63:607-619
Analytische Epidemiologie Kohortenstudie Verwendung von Individualdaten, z.b. Exposition durch Radon Studien-Population Nicht Beispiele: Ernährung und Krebs, Berufskohorten Vermeidet so Probleme wie den ökologischen Bias Studien können aber sehr teuer und schwierig durchzuführen Individuelle Rückrechnung der Exposition in Fall-Kontroll- Studien kann sehr schwierig sein Prospektive Beobachtung der Teilnehmer Lange Beobachtungsdauer, hohe Kosten Gut geeignet für seltene Expositionen Ungeeignet bei seltenen Erungen Untersuchung weniger Expositionen an zunächst heitsfreier Population Biostatistische Methoden 6 Fall-Kontroll-Studie Fall-Kontroll-Studie Fall - Kontrolle Beispiele: Rauchen und Lungenkrebs, Risikofaktoren für Nierenzellkarzinom Retrospektive Beobachtung der Teilnehmer Kurze Beobachtungsdauer, moderate Kosten Ungeeignet für seltene Expositionen Gut geeignet bei seltenen Erungen Untersuchung der Auswirkung verschiedener Expositionen auf eine Krankheit Fälle Kontrollen Exponiert a c Nicht b a+b d c+d Risiko ist eine Populationsgröße. Fall-Kontroll-Studien geben jedoch die Daten von Populationen realistisch wieder Hat die Exposition eine heitserzeugende Wirkung, so sollte das Verhältnis von E + zu E - in den Fällen größer sein als in den Kontrollen: Odds Ratio: OR = (a/b) / (c/d) = (a d)/(b c)
Fall-Kontroll-Studie Endometriumkarzinom und Östrogeneinnahme in der Menopause Krebsregister Östrogeneinnahme Endometriumkarzinom 45 7 72 110 Summe 52 182 Ein kurzer Abriß der Geschichte der Epidemiologie Ursprünge gehen hrhunderte zurück, z.b. Snow (1854), Cholera in London: OR = 9.8 (Oddsratio) Hysterektomieregister Östrogeneinnahme JA 59 42 89 106 OR = 1.7 (Oddsratio) Summe 101 195 Biostatistische Methoden 7 Moderne Epidemiologie John Snow Die detaillierte Geschichte ist unter http://www.ph.ucla.edu/epi/snow.html zu finden. Mitte des 20-ten hrhunderts beginnt die moderne Epidemiologie: Kohorten and Fall-Kontroll Studien Motivation: dramatischer Anstieg der Mortalität bei chronischen Krankheiten in den letzten hrzehnten gestiegendes Interesse an der Epidemiologie infektiöser Krankheiten, z.b. AIDS, vcjd, SARS, Vogelgrippe Verbindungen zur Veterinärepidemiologie Biostatistische Methoden 8
Beispiel: Verursacht Rauchen Lungenkrebs? Rauchen und Lungenkrebs R.A. Fisher gegen J. Cornfield Fisher: die Assoziation läßt sich auch durch eine genetische Störgröße, die sowohl Rauchen als auch Lungenkrebs begünstigt, erklären Breslow (1995) schrieb: Fisher was seriously mistaken about the hazards of cigarette smoking. Regrettably, his prominent position on this issue may have helped delay much-needed educational programs and regulatory action. Breslow folgert aber: Fisher s emphasis on the genotype was relevant, not as a cause of lung cancer per se, but rather through interactions with cigarette smoking. und Although Fisher s position on this particular association was wrong, his concern about negative public reaction to dubious scientific claims was well founded. The public is increasingly weary and skeptical of the multitude of contradictory reports of health hazards emanating from epidemiology Biostatistische Methoden 9 Biostatistische Methoden 10 Die Rolle der Statistik Literatur the impact of statisticians on the development of epidemiology is difficult to overstate Schätzung von Expositionseffekten Quantifizierung der Unsicherheit (Konfidenzintervalle, p- Werte) Breslow, N. E. and Day, N. E. (1980). Statistical Methods in Cancer Research. Vol. 1 - The Analysis of Case-Control Studies. Published by Oxford University Press. Breslow, N. E. and Day, N. E. (1987). Statistical Methods in Cancer Research. Vol. 2 - The Design and Analysis of Cohort Studies. Published by Oxford University Press. Clayton, D. and Hills, M. (1993). Statistical Models in Epidemiology. Oxford University Press. Kreienbrock, L. und Schach, S. (1997) Epidemiologische Methoden. 2. Auflage. G. Fischer Verlag. Adjustierung für Störgrößen Biostatistische Methoden 11 Biostatistische Methoden 12