Einführung in die Survival-Analyse (Modul: Methoden II)

Ähnliche Dokumente
Einführung in die Survival-Analyse (Modul: Methoden II)

Einführung in die Survival-Analyse (Modul: Methoden II)

Survival Analysis (Modul: Lebensdaueranalyse)

Survival Analysis (Modul: Lebensdaueranalyse)

References. Demographie IV ROLAND RAU. Universität Rostock, Sommersemester Juni c Roland Rau Demographie IV 1 / 20

Einführung in die formale Demographie

Einführung in die Survival-Analyse (Modul: Methoden II)

References. Demographie IV ROLAND RAU. Universität Rostock, Sommersemester Mai c Roland Rau Demographie IV 1 / 20

References. Demographie IV ROLAND RAU. Universität Rostock, Sommersemester Juni c Roland Rau Demographie IV 1 / 19

Mortalitätsanalyse (ehemals: Allgemeine Demographie III)

Forschungspraktikum: Krebssterblichkeit in den USA

Survival Analysis (Modul: Lebensdaueranalyse)

Demographie I ROLAND RAU, GABRIELE DOBLHAMMER. 19. Dezember Universität Rostock, Wintersemester 2012/2013. References

Survival Analysis (Modul: Lebensdaueranalyse)

Einführung in die formale Demographie

Einführung in die formale Demographie

Einführung in die Survival-Analyse (Modul: Methoden II)

References. Demographie IV ROLAND RAU. Universität Rostock, Sommersemester Juli c Roland Rau Demographie IV 1/16

Demographie III ROLAND RAU. 06. Januar Universität Rostock, Wintersemester 2013/2014. c Roland Rau Demographie III 1 / 20

Survival Analysis (Modul: Lebensdaueranalyse)

Einführung in die formale Demographie

Anforderungen der demografischen Forschung an Daten zur Mortalität

Demographie III ROLAND RAU. 14. Oktober Universität Rostock, Wintersemester 2013/2014. c Roland Rau Demographie III 1 / 29

Mortalitätsanalyse (ehemals: Allgemeine Demographie III)

Einführung in die formale Demographie

Survival Analysis (Modul: Lebensdaueranalyse)

Mortalitätsanalyse (ehemals: Allgemeine Demographie III)

Überlebenszeitanalyse. Tempus neminem manet

Weiterführende formale Demographie

References. Demographie IV ROLAND RAU. Universität Rostock, Sommersemester Juli c Roland Rau Demographie IV 1 / 23

Forschungspraktikum: Krebssterblichkeit in den USA

Demographie III ROLAND RAU. 20. Januar Universität Rostock, Wintersemester 2013/2014. c Roland Rau Demographie III 1 / 35

Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios

Survival Analysis (Modul: Lebensdaueranalyse)

Einführung in die formale Demographie

Vergleich von Partial Cox Regression und Lasso zur Analyse von U berlebenszeiten bei hochdimensionalen Daten

Mortalitätsanalyse MARCUS EBELING. 29. Oktober Universität Rostock, Wintersemester 2013/2014. c Marcus Ebeling Mortalitätsanalyse 1 / 33

Statistische Analyse von Ereigniszeiten II

References. Demographie IV ROLAND RAU. Universität Rostock, Sommersemester Juli c Roland Rau Demographie IV 1 / 27

8 Allgemeine Modelle & Robuste Regression

References. Demographie IV ROLAND RAU. Universität Rostock, Sommersemester Juli c Roland Rau Demographie IV 1 / 24

Prüfung im Fach Mikroökonometrie im Sommersemester 2014 Aufgaben

Kommentierter SPSS-Output für hierarchische log-lineare Modelle (Modul Modellauswahl) 3 Dimensionen

Basis-Kurs Statistik und SPSS für Mediziner Lösungen. SPSS-Übung Überlebenszeitanalyse

Ein exakter Test für die Meta-Analyse von Studien mit binären Endpunkten. Oliver Kuß, Cora Gromann

Survival Analysis. December 6, 2007

Übungsklausur Lineare Modelle. Prof. Dr. H. Toutenburg

Willkommen zur Vorlesung Statistik (Master)

Fragen zum zweiten Teil der Vorlesung

Fortgeschrittene Ökonometrie: Maximum Likelihood

Einführung in die Induktive Statistik: Regressionsanalyse

Einführung in die formale Demographie Übung

Grundzüge der Ereignisdatenanalyse

References. Demographie IV ROLAND RAU. Universität Rostock, Sommersemester Juni c Roland Rau Demographie IV 1 / 27

Weiterführende formale Demographie

Stochastik Praktikum Lineare Modelle

Simulation von Überlebenszeiten mit Hilfe von SAS

2. Fehlerhafte Auswahl der exogenen Variablen (Verletzung der A1-Annahme)

Seminar zur Energiewirtschaft:

Least Absolute Shrinkage And Seletion Operator (LASSO)

Kap. 2: Generalisierte lineare Modelle (GLMs) Lineare und generalisierte lineare Modelle Schätzung und Inferenz in GLMs Literatur

Demographie I ROLAND RAU. 29. Januar Universität Rostock, Wintersemester 2013/2014. c Roland Rau Demographie I 1 / 16

5 Allgemeine Verfahren zum Testen von Hypothesen

Prüfung im Fach Mikroökonometrie im Wintersemester 2012/13 Aufgaben

SBWL Tourismusanalyse und Freizeitmarketing

SBWL Tourismusanalyse und Freizeitmarketing

Logistische Regression

Einführung in die Demographie

After Work Statistics

Lineare Regression. Kapitel Regressionsgerade

Verallgemeinerte lineare Modelle. Promotion. Promotion. Methoden empirischer Sozialforschung. 1 binäre und mehrere metrische und kategoriale Variablen

Geometrie. Ingo Blechschmidt. 4. März 2007

Musterwandel Sortenwandel. Sp r a che in Kom m unik a t ion

Bayesian updating in natural hazard risk assessment

Statistik II für Betriebswirte Vorlesung 11

x t2 y t = 160, y = 8, y y = 3400 t=1

Ein relatives Überlebenszeitmodell für korrelierte Beobachtungen. Oliver Kuß

Multivariate Analyse: Einführung in das COX-Modell

Survivor-Analyse und Ereignisanalyse

Masterprüfung SS 2016

Statistik II für Betriebswirte Vorlesung 11

Probeklausur STATISTIK II

The projectivity of the moduli space of stable curves. I: Preliminaries on "det"...

Life Tables und Kaplan Meier

y t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen.

Demographie III ROLAND RAU. 04. November Universität Rostock, Wintersemester 2013/2014. c Roland Rau Demographie III 1 / 34

Strukturerhaltende Integrationsverfahren für stochastische Differentialgleichungen in der Modellierung von Zinsderivaten

Varianzkomponentenschätzung

Poisson Regression. Verallgemeinerte Lineare Modelle (GLMs)

Mortalität nach Schlaganfall bei diabetischen und nicht-diabetischen Patienten

After Work Statistics

Log-lineare Analyse I

Masterprüfung. Fach: Mikroökonometrie Prüfer: Prof. Regina T. Riphahn, Ph.D. Vorbemerkungen: Anzahl der Aufgaben: Bewertung:

Wissensentdeckung in Datenbanken

Die Anwendung des globalen und partiellen F-Tests beim Regressionsmodell

Statistik. R. Frühwirth. Statistik. VO Februar R. Frühwirth Statistik 1/536

Transkript:

Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 04. Juni 2013 c Roland Rau Survival-Analyse 08. Sitzung 1 / 22

Vergangene Woche Testat Eintragen von Teams & Themen Diese Woche (und die nächsten Wochen): Regression in der Survivalanalyse c Roland Rau Survival-Analyse 08. Sitzung 2 / 22

Einführung: Was ist methodisch falsch im Artikel von Epstein & Epstein (2013)? c Roland Rau Survival-Analyse 08. Sitzung 3 / 22

Klassisches Regressionmodell: y i = a + bx i c Roland Rau Survival-Analyse 08. Sitzung 4 / 22

Klassisches Regressionmodell: y i = a + bx i oder mit mehr Kovariaten y i = a + bx 1,i + cx 2,i +... c Roland Rau Survival-Analyse 08. Sitzung 5 / 22

Klassisches Regressionmodell in Matrixnotation: y 1 1 x 1,1 x 1,2... x 1,p β 1 ɛ 1 y 2 1 x 2,1 x 2,2... x 2,p β 2 ɛ 2 y 3 1 x 3,1 x 3,2... x 3,p β 3 ɛ 3 y 4 = 1 x 4,1 x 4,2... x 4,p β 4 + ɛ 4........ y n 1 x n,1 x n,2... x n,p β n ɛ n Y = Xβ + ɛ c Roland Rau Survival-Analyse 08. Sitzung 6 / 22

Klassisches Regressionmodell: y i = a + bx i +... Y = Xβ + ɛ Regressionsmodelle in der Survivalanalyse: Proportional Hazards Modelle Accelerated Failure Time Modelle Additive Hazards Modelle Wir behandeln hier nur Proportional Hazards Modelle (diese sind in den Sozialwissenschaften auch die gebräuchlichsten Survival Modelle) c Roland Rau Survival-Analyse 08. Sitzung 7 / 22

Survival Regression: Generelle Form h(t X) = h 0 (t) e β 1x 1 +β 2 x 2 +... h 0 (t) bezeichnet den sogenannten Baseline Hazard die Kovariaten x 1, x 2,... verschieben h 0 (t) proportional nach oben oder unten. Die e-funktion wird primär dazu verwendet, um sicherzustellen, dass der Term positiv ist und bleibt. c Roland Rau Survival-Analyse 08. Sitzung 8 / 22

Häufiges Interesse: Hazard Ratio (einfaches Beispiel: Geschlecht) HR = h(t x = 1) h(t x = 0) = h 0(t)e β 1x h 0 (t)e β 1x = eβ 1x e β 1x = eβ 1x (da x = 0). c Roland Rau Survival-Analyse 08. Sitzung 9 / 22

Numerisches Beispiel: Wolpertinger (reloaded) > wolpi <- read.table("wolpertingerneu.txt", header=true) > head(wolpi) zeit sex cens 1 2.270 2 0 2 0.471 2 0 3 0.046 2 1 4 2.187 2 0 5 0.059 2 0 > table(wolpi$sex) 1 2 500 500 > mit wolpi$sex=1 für männliche Wolpertinger und wolpi$sex=2 für weibliche Wolpertinger. c Roland Rau Survival-Analyse 08. Sitzung 10 / 22

Numerisches Beispiel: Wolpertinger (reloaded) Im Gegensatz zur bisherigen Herangehensweise wollen wir nun nicht nur den Parameter λ der Exponentialverteilung schätzen sondern auch noch einen Parameter, der die männliche Übersterblichkeit misst. D.h. der Baseline-Hazard bleibt weiterhin λ; berücksichtigt unser Modell jedoch die Variable Geschlecht, so wird daraus: h(t) = h 0e βx = λe βx und aus der Survivalkurve ohne Kovariate(n): S(t) = e λt wird mit Kovariate(n): S(t) = e λeβx t Was wird nun aus der Likelihood-Funktion? L (θ x) = i f (...) i S (...) wobei der Parameter-Vektor θ aus den beiden Komponenten λ und x (für das Geschlecht) besteht; i bezeichnet das i-te Individuum und sowie diejenigen beschreibt, die gestorben sind bzw. die überlebt haben. c Roland Rau Survival-Analyse 08. Sitzung 11 / 22

Numerisches Beispiel: Wolpertinger (reloaded) Nun wissen wir auch noch: Daher können wir einsetzen: L (θ x) = i h(t) = f (t) f (t) = h(t)s(t) S(t) f (...) i S (...) = h (...) S (...) S (...) i i i = h (...) S (...) i alle = in unserem Falle der Exponentialverteilung : = λe βx e λeβx t i alle Und nun als Log-Likelihood: L (θ x) = i ((ln λ + βx) δ) + i ( ) λe βx t c Roland Rau Survival-Analyse 08. Sitzung 12 / 22

Numerisches Beispiel: Wolpertinger (reloaded) L (θ x) = i ((ln λ + βx) δ) + i ( λe βx ) t In R (da optim automatisch minimiert, berechnen wir einfach die negative Log-Likelihood-Funktion) geschlecht <- ifelse(wolpisex==1, 1, 0) loglike <- function(theta, t, covariate,delta) { lambda <- theta[1] beta <- theta[2] return(-(sum( (log(lambda) + beta*covariate)*delta) + sum(-lambda * exp(beta * covariate) * t))) } ergebnis <- optim(par=c(0.5, 1.2), fn=loglike, t=wolpi$zeit, delta=wolpi$cens, covariate=geschlecht) ergebnis > ergebnis $par [1] 0.1584182 0.2469518 $value [1] 929.4715 $counts function gradient 71 NA $convergence [1] 0 $message NULL c Roland Rau Survival-Analyse 08. Sitzung 13 / 22

Numerisches Beispiel: Wolpertinger (reloaded) Wie interpretieren wir nun diese Ergebnisse? > ergebnis $par [1] 0.1584182 0.2469518 Da wir die Variable x so gewählt haben, dass für das weibliche Geschlecht x = 0 gilt, so erkennen wir: h(t) = h 0 e βx = h 0 e β0 = h 0 e 0 = h 0 dass der Baseline-Hazard λ = 0.1584182 dem Hazard der Frauen entspricht. Dieser wird bei Männern um den Faktor h(t) = h 0 e βx = h 0 e β1 = h 0 e 0.2469518 = h 0 1.280117 erhöht. Das Hazard Ratio beträgt damit: HR = h 0(t)e β 1 x h 0 (t)e β 1 x = h β 0(t)e 1 x = e β 1 x = 1.280117 h 0 (t) Das bedeutet, dass in unserem Modell Männer in jeder Altersstufe ein in etwa 30% höheres Sterberisiko als Frauen besitzen (28.0117%). c Roland Rau Survival-Analyse 08. Sitzung 14 / 22

Doch was machen wir, wenn wir keine Ahnnug bezüglich der Verteilung haben? Das Cox-Modell! nach Prof. Sir David Roxbee COX, FRS, FBA ( 15 Juli 1924, Oxford) Original-Artikel: COX, D. R. (1972). Regression models and life-tables. Journal of the Royal Statistical Society. Series B (Methodological) 34(2), pp. 187 220. c Roland Rau Survival-Analyse 08. Sitzung 15 / 22

Das Cox-Proportional-Hazards-Model: Besonderheit: Baseline-Hazard bleibt unspezifiziert Schätzung mittels Partial Likelihood Details zur Schätzung: Das Original: Cox (1972) Das Lehrbuch von Cox: Cox and Oakes (1984) Unser Lehrbuch: Klein and Moeschberger (2003) c Roland Rau Survival-Analyse 08. Sitzung 16 / 22

Schätzung in R des Cox-Models: # wie bisher: das Paket survival importieren library(survival) #wie bisher: Definition des Survival-Objekts sobj <- Surv(wolpi$zeit, wolpi$cens) # Umwandlung der Variable Geschlecht in eine kategoriale Variable: sex <- relevel(as.factor(wolpi$sex), ref=2) # Alternativ: Die eigene Umkodierung in eine Dummy-Variables geschlecht <- ifelse(wolpi$sex==1, 1, 0) coxph(sobj ~ sex) coxph(sobj ~ geschlecht) > coxph(sobj ~ sex) Call: coxph(formula = sobj ~ sex) coef exp(coef) se(coef) z p sex1 0.249 1.28 0.109 2.3 0.022 Likelihood ratio test=5.29 on 1 df, p=0.0214 n= 1000, number of events= 343 > coxph(sobj ~ geschlecht) Call: coxph(formula = sobj ~ geschlecht) coef exp(coef) se(coef) z p geschlecht 0.249 1.28 0.109 2.3 0.022 Likelihood ratio test=5.29 on 1 df, p=0.0214 n= 1000, number of events= 343 > c Roland Rau Survival-Analyse 08. Sitzung 17 / 22

Nächste Veranstaltung: Das Cox-Modell mit unseren Daten Wie problematisch ist die Proportionalitätsannahme? Was tun, wenn die Proportionalitätsannahme verletzt ist? c Roland Rau Survival-Analyse 08. Sitzung 18 / 22

Vielen Dank für Ihre Aufmerksamkeit! c Roland Rau Survival-Analyse 08. Sitzung 19 / 22

Cox, D. and D. Oakes (1984). Analysis of Survival Data. London, UK: Chapman & Hall. Cox, D. R. (1972). Regression models and life-tables. Journal of the Royal Statistical Society. Series B (Methodological) 34(2), pp. 187 220. Epstein, C. and R. Epstein (2013). Death in the new york times: the price of fame is a faster flame. QJM 106(6), 517 521. Klein, J. P. and M. L. Moeschberger (2003). Survival Analysis : Techniques for Censored and Truncated Data. Statistics for Biology and Health. New York, NY: Springer. c Roland Rau Survival-Analyse 08. Sitzung 20 / 22

Lizenz This open-access work is published under the terms of the Creative Commons Attribution NonCommercial License 2.0 Germany, which permits use, reproduction & distribution in any medium for non-commercial purposes, provided the original author(s) and source are given credit. Für ausführlichere Informationen: http://creativecommons.org/licenses/by-nc/2.0/de/ (Deutsch) http://creativecommons.org/licenses/by-nc/2.0/de/deed.en (English) c Roland Rau Survival-Analyse 08. Sitzung 21 / 22

Kontakt Universität Rostock Institut für Soziologie und Demographie Lehrstuhl für Demographie Ulmenstr. 69 18057 Rostock Germany Tel.: +49-381-498 4044 Fax.: +49-381-498 4395 Email: roland.rau@uni-rostock.de Sprechstunde im Sommersemester 2013: Mittwochs, 09:00 10:00 (und nach Vereinbarung) c Roland Rau Survival-Analyse 08. Sitzung 22 / 22