Aus dem Institut für Medizinische Epidemiologie, Biometrie und Informatik (Direktor: Prof. Dr. Johannes Haerting) Frailty Models in Survival Analysis Habilitation zur Erlangung des akademischen Grades Dr. rer. nat., rer. medic. habil. vorgelegt der Medizinischen Fakultät der Martin-Luther-Universität Halle-Wittenberg von Andreas Wienke geboren am 23. Februar 1966 in Güstrow Gutachter: 1. Prof. Dr. Johannes Haerting, Halle 2. Prof. Dr. Ulrich Mansmann, München 3. Prof. Dr. Luc Duchateau, Ghent verteidigt am 16. Januar 2007 urn:nbn:de:gbv:3-000011542 [http://nbn-resolving.de/urn/resolver.pl?urn=nbn%3ade%3agbv%3a3-000011542]
i Kurzreferat: Die vorliegende methodische Arbeit gibt einen umfassenden Überblick zur Anwendung von Frailty-Modellen in der Lebensdaueranalyse. Zunächst wird der aktuelle Stand der Forschung auf den Gebieten der univariaten und multivariaten Frailty-Modelle dargestellt. Insbesondere wird die Bedeutung der Frailty-Modelle bei der Modellierung von Heterogeneität (univariater Fall) und abhängigen Lebensdauern (multivariater Fall) herausgearbeitet. Darauf aufbauend erfolgt die Weiterentwicklung des multivariaten Korrelierten Frailty-Modells in verschiedene Richtungen. Ein erster Schwerpunkt ist dabei die Einbeziehung beobachtbarer Kovariablen und von Interaktionen beobachtbarer und nichtbeobachtbarer Kovariablen. Andere Erweiterungen dienen der Analyse von abhängigen konkurrierenden Risiken, welche sich elegant mit Hilfe des Konzepts der korrelierten Frailty-Modelle realisieren lassen. Ein weiterer Schwerpunkt der vorliegenden Arbeit ist die Einbeziehung von Teilpopulationen, welche dem analysierten Ereignis gegenüber immun sind, sei es aufgrund einer genetischen Prädisposition, einer Impfung oder einer entsprechenden Vorerkrankung. Zahlreiche Anwendungsbeispiele insbesondere aus dem Schnittbereich von Medizin, (genetischer) Epidemiologie und Demografie illustrieren die praktische Relevanz der neu entwickelten Modelle. Dazu werden unter anderem weltweit einmalige Zwillingsdaten aus dem dänischen und schwedischen Zwillingsregister analysiert, wobei Herzkreislauf- und Krebserkrankungen im Mittelpunkt stehen. Simulationen demonstrieren die Eigenschaften der Parameterschätzer in den einzelnen Modellen für realistische Stichprobenumfänge. Wienke, Andreas: Frailty Models in Survival Analysis. Universität Halle-Wittenberg, Medizinische Fakultät, Habilitation, 153 Seiten, 2006
ii
Contents 1 Introduction and Outline 1 2 Survival analysis 5 2.1 Basic concepts in survival analysis...................... 5 2.2 Parametric models.............................. 7 2.2.1 Exponential distribution....................... 7 2.2.2 Weibull distribution......................... 8 2.2.3 Gompertz distribution........................ 10 2.2.4 Log-logistic distribution....................... 11 2.2.5 Gamma distribution......................... 11 2.2.6 Log-normal distribution....................... 13 2.3 Censoring................................... 14 2.4 Truncation................................... 17 2.5 Non-parametric and semi-parametric models................ 18 2.5.1 Kaplan-Meier estimator....................... 18 2.5.2 Proportional hazards model..................... 19 3 Univariate frailty models 21 3.1 Discrete frailty model............................ 27 3.2 Gamma frailty model............................ 30 3.3 Positive stable frailty model......................... 35 3.4 Inverse Gaussian frailty model........................ 37 3.5 PVF frailty model.............................. 37 3.6 Compound Poisson frailty model...................... 38 3.7 Log-normal frailty models.......................... 41 3.8 Univariate frailty cure models........................ 41 iii
iv CONTENTS 4 Multivariate frailty models 45 4.1 Shared frailty model............................. 49 4.2 Limitations of the shared frailty model................... 53 4.3 Correlated frailty model........................... 56 4.4 Correlated gamma frailty model...................... 57 4.5 Correlated compound Poisson frailty model................ 63 4.6 Correlated log-normal frailty model..................... 67 4.7 Other correlated frailty models....................... 68 4.8 Correlated gamma frailty model with covariates.............. 69 4.8.1 Material and methods........................ 71 4.8.2 Mortality............................... 72 4.8.3 Statistical methods.......................... 72 4.8.4 Results................................. 73 4.8.5 Discussion............................... 75 4.9 MCMC methods for the log-normal frailty model............. 77 4.10 Comparison of different estimation strategies................ 82 4.10.1 Estimation strategies......................... 82 4.10.2 Simulations.............................. 84 4.10.3 Discussion............................... 85 4.11 Bivariate frailty cure models......................... 88 4.12 Dependent competing risks in frailty models................ 92 4.12.1 The statistical model......................... 92 4.12.2 Simulation study........................... 95 4.12.3 Example................................ 96 4.12.4 Discussion............................... 97 5 Different aspects of frailty modelling 101 5.1 Omitted covariates in hazard models.................... 101 5.2 Dependence between frailty and observed covariates............ 104 5.3 Tests for heterogeneity............................ 105 5.4 Log-rank test in frailty models........................ 105 5.5 Time-dependent frailty models........................ 107 5.6 Identifiability of frailty models........................ 108 6 Summary 109
CONTENTS v A Data 113 A.1 The Swedish Twin Registry......................... 113 A.2 The Danish Twin Registry......................... 115 B Quantitative Genetics 117 C Correlated gamma frailty model 121 D Correlated compound Poisson frailty model 123 E Bivariate lifetime models with censoring 125 F Dependent competing risks model 127
vi CONTENTS Abbreviations and symbols AFT accelerated failure time c.d.f. cumulative density function E expectation f generic symbol for a probability density function F generic symbol for a cumulative density function Γ Gamma function L Laplace transform λ generic symbol for a (baseline) hazard function Λ generic symbol for a cumulative hazard function MCMC Monte Chain Monte Carlo MZ, DZ twins monozygotic and dizygotic twins P(A) probability of event A p.d.f. probability density function S generic symbol for a survival function V variance X U(a, b) uniform distributed random variable in the interval [a, b] X N(µ, σ 2 ) normal distributed random variable with parameters µ, σ 2 X Exp(λ) exponential distributed random variable with parameter λ X W eibull(a, b) Weibull distributed random variable with parameters a, b X Gompertz(a, b) Gompertz distributed random variable with parameters a, b X Γ(k, λ) Gamma distributed random variable with parameters k, λ X cp (γ, k, λ) compound Poisson distributed random variable with parameters γ, k, λ All models are wrong, some are useful. (Box, 1976)