Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 04. Juni 2013 c Roland Rau Survival-Analyse 08. Sitzung 1 / 22
Vergangene Woche Testat Eintragen von Teams & Themen Diese Woche (und die nächsten Wochen): Regression in der Survivalanalyse c Roland Rau Survival-Analyse 08. Sitzung 2 / 22
Einführung: Was ist methodisch falsch im Artikel von Epstein & Epstein (2013)? c Roland Rau Survival-Analyse 08. Sitzung 3 / 22
Klassisches Regressionmodell: y i = a + bx i c Roland Rau Survival-Analyse 08. Sitzung 4 / 22
Klassisches Regressionmodell: y i = a + bx i oder mit mehr Kovariaten y i = a + bx 1,i + cx 2,i +... c Roland Rau Survival-Analyse 08. Sitzung 5 / 22
Klassisches Regressionmodell in Matrixnotation: y 1 1 x 1,1 x 1,2... x 1,p β 1 ɛ 1 y 2 1 x 2,1 x 2,2... x 2,p β 2 ɛ 2 y 3 1 x 3,1 x 3,2... x 3,p β 3 ɛ 3 y 4 = 1 x 4,1 x 4,2... x 4,p β 4 + ɛ 4........ y n 1 x n,1 x n,2... x n,p β n ɛ n Y = Xβ + ɛ c Roland Rau Survival-Analyse 08. Sitzung 6 / 22
Klassisches Regressionmodell: y i = a + bx i +... Y = Xβ + ɛ Regressionsmodelle in der Survivalanalyse: Proportional Hazards Modelle Accelerated Failure Time Modelle Additive Hazards Modelle Wir behandeln hier nur Proportional Hazards Modelle (diese sind in den Sozialwissenschaften auch die gebräuchlichsten Survival Modelle) c Roland Rau Survival-Analyse 08. Sitzung 7 / 22
Survival Regression: Generelle Form h(t X) = h 0 (t) e β 1x 1 +β 2 x 2 +... h 0 (t) bezeichnet den sogenannten Baseline Hazard die Kovariaten x 1, x 2,... verschieben h 0 (t) proportional nach oben oder unten. Die e-funktion wird primär dazu verwendet, um sicherzustellen, dass der Term positiv ist und bleibt. c Roland Rau Survival-Analyse 08. Sitzung 8 / 22
Häufiges Interesse: Hazard Ratio (einfaches Beispiel: Geschlecht) HR = h(t x = 1) h(t x = 0) = h 0(t)e β 1x h 0 (t)e β 1x = eβ 1x e β 1x = eβ 1x (da x = 0). c Roland Rau Survival-Analyse 08. Sitzung 9 / 22
Numerisches Beispiel: Wolpertinger (reloaded) > wolpi <- read.table("wolpertingerneu.txt", header=true) > head(wolpi) zeit sex cens 1 2.270 2 0 2 0.471 2 0 3 0.046 2 1 4 2.187 2 0 5 0.059 2 0 > table(wolpi$sex) 1 2 500 500 > mit wolpi$sex=1 für männliche Wolpertinger und wolpi$sex=2 für weibliche Wolpertinger. c Roland Rau Survival-Analyse 08. Sitzung 10 / 22
Numerisches Beispiel: Wolpertinger (reloaded) Im Gegensatz zur bisherigen Herangehensweise wollen wir nun nicht nur den Parameter λ der Exponentialverteilung schätzen sondern auch noch einen Parameter, der die männliche Übersterblichkeit misst. D.h. der Baseline-Hazard bleibt weiterhin λ; berücksichtigt unser Modell jedoch die Variable Geschlecht, so wird daraus: h(t) = h 0e βx = λe βx und aus der Survivalkurve ohne Kovariate(n): S(t) = e λt wird mit Kovariate(n): S(t) = e λeβx t Was wird nun aus der Likelihood-Funktion? L (θ x) = i f (...) i S (...) wobei der Parameter-Vektor θ aus den beiden Komponenten λ und x (für das Geschlecht) besteht; i bezeichnet das i-te Individuum und sowie diejenigen beschreibt, die gestorben sind bzw. die überlebt haben. c Roland Rau Survival-Analyse 08. Sitzung 11 / 22
Numerisches Beispiel: Wolpertinger (reloaded) Nun wissen wir auch noch: Daher können wir einsetzen: L (θ x) = i h(t) = f (t) f (t) = h(t)s(t) S(t) f (...) i S (...) = h (...) S (...) S (...) i i i = h (...) S (...) i alle = in unserem Falle der Exponentialverteilung : = λe βx e λeβx t i alle Und nun als Log-Likelihood: L (θ x) = i ((ln λ + βx) δ) + i ( ) λe βx t c Roland Rau Survival-Analyse 08. Sitzung 12 / 22
Numerisches Beispiel: Wolpertinger (reloaded) L (θ x) = i ((ln λ + βx) δ) + i ( λe βx ) t In R (da optim automatisch minimiert, berechnen wir einfach die negative Log-Likelihood-Funktion) geschlecht <- ifelse(wolpisex==1, 1, 0) loglike <- function(theta, t, covariate,delta) { lambda <- theta[1] beta <- theta[2] return(-(sum( (log(lambda) + beta*covariate)*delta) + sum(-lambda * exp(beta * covariate) * t))) } ergebnis <- optim(par=c(0.5, 1.2), fn=loglike, t=wolpi$zeit, delta=wolpi$cens, covariate=geschlecht) ergebnis > ergebnis $par [1] 0.1584182 0.2469518 $value [1] 929.4715 $counts function gradient 71 NA $convergence [1] 0 $message NULL c Roland Rau Survival-Analyse 08. Sitzung 13 / 22
Numerisches Beispiel: Wolpertinger (reloaded) Wie interpretieren wir nun diese Ergebnisse? > ergebnis $par [1] 0.1584182 0.2469518 Da wir die Variable x so gewählt haben, dass für das weibliche Geschlecht x = 0 gilt, so erkennen wir: h(t) = h 0 e βx = h 0 e β0 = h 0 e 0 = h 0 dass der Baseline-Hazard λ = 0.1584182 dem Hazard der Frauen entspricht. Dieser wird bei Männern um den Faktor h(t) = h 0 e βx = h 0 e β1 = h 0 e 0.2469518 = h 0 1.280117 erhöht. Das Hazard Ratio beträgt damit: HR = h 0(t)e β 1 x h 0 (t)e β 1 x = h β 0(t)e 1 x = e β 1 x = 1.280117 h 0 (t) Das bedeutet, dass in unserem Modell Männer in jeder Altersstufe ein in etwa 30% höheres Sterberisiko als Frauen besitzen (28.0117%). c Roland Rau Survival-Analyse 08. Sitzung 14 / 22
Doch was machen wir, wenn wir keine Ahnnug bezüglich der Verteilung haben? Das Cox-Modell! nach Prof. Sir David Roxbee COX, FRS, FBA ( 15 Juli 1924, Oxford) Original-Artikel: COX, D. R. (1972). Regression models and life-tables. Journal of the Royal Statistical Society. Series B (Methodological) 34(2), pp. 187 220. c Roland Rau Survival-Analyse 08. Sitzung 15 / 22
Das Cox-Proportional-Hazards-Model: Besonderheit: Baseline-Hazard bleibt unspezifiziert Schätzung mittels Partial Likelihood Details zur Schätzung: Das Original: Cox (1972) Das Lehrbuch von Cox: Cox and Oakes (1984) Unser Lehrbuch: Klein and Moeschberger (2003) c Roland Rau Survival-Analyse 08. Sitzung 16 / 22
Schätzung in R des Cox-Models: # wie bisher: das Paket survival importieren library(survival) #wie bisher: Definition des Survival-Objekts sobj <- Surv(wolpi$zeit, wolpi$cens) # Umwandlung der Variable Geschlecht in eine kategoriale Variable: sex <- relevel(as.factor(wolpi$sex), ref=2) # Alternativ: Die eigene Umkodierung in eine Dummy-Variables geschlecht <- ifelse(wolpi$sex==1, 1, 0) coxph(sobj ~ sex) coxph(sobj ~ geschlecht) > coxph(sobj ~ sex) Call: coxph(formula = sobj ~ sex) coef exp(coef) se(coef) z p sex1 0.249 1.28 0.109 2.3 0.022 Likelihood ratio test=5.29 on 1 df, p=0.0214 n= 1000, number of events= 343 > coxph(sobj ~ geschlecht) Call: coxph(formula = sobj ~ geschlecht) coef exp(coef) se(coef) z p geschlecht 0.249 1.28 0.109 2.3 0.022 Likelihood ratio test=5.29 on 1 df, p=0.0214 n= 1000, number of events= 343 > c Roland Rau Survival-Analyse 08. Sitzung 17 / 22
Nächste Veranstaltung: Das Cox-Modell mit unseren Daten Wie problematisch ist die Proportionalitätsannahme? Was tun, wenn die Proportionalitätsannahme verletzt ist? c Roland Rau Survival-Analyse 08. Sitzung 18 / 22
Vielen Dank für Ihre Aufmerksamkeit! c Roland Rau Survival-Analyse 08. Sitzung 19 / 22
Cox, D. and D. Oakes (1984). Analysis of Survival Data. London, UK: Chapman & Hall. Cox, D. R. (1972). Regression models and life-tables. Journal of the Royal Statistical Society. Series B (Methodological) 34(2), pp. 187 220. Epstein, C. and R. Epstein (2013). Death in the new york times: the price of fame is a faster flame. QJM 106(6), 517 521. Klein, J. P. and M. L. Moeschberger (2003). Survival Analysis : Techniques for Censored and Truncated Data. Statistics for Biology and Health. New York, NY: Springer. c Roland Rau Survival-Analyse 08. Sitzung 20 / 22
Lizenz This open-access work is published under the terms of the Creative Commons Attribution NonCommercial License 2.0 Germany, which permits use, reproduction & distribution in any medium for non-commercial purposes, provided the original author(s) and source are given credit. Für ausführlichere Informationen: http://creativecommons.org/licenses/by-nc/2.0/de/ (Deutsch) http://creativecommons.org/licenses/by-nc/2.0/de/deed.en (English) c Roland Rau Survival-Analyse 08. Sitzung 21 / 22
Kontakt Universität Rostock Institut für Soziologie und Demographie Lehrstuhl für Demographie Ulmenstr. 69 18057 Rostock Germany Tel.: +49-381-498 4044 Fax.: +49-381-498 4395 Email: roland.rau@uni-rostock.de Sprechstunde im Sommersemester 2013: Mittwochs, 09:00 10:00 (und nach Vereinbarung) c Roland Rau Survival-Analyse 08. Sitzung 22 / 22