Analyse von Lebensdauern

Größe: px
Ab Seite anzeigen:

Download "Analyse von Lebensdauern"

Transkript

1 , Analyse von Lebensdauern Dozent: Christian Heumann 1 1 Institut für Statistik Ludwig-Maximilians-Universität München Analyse von Lebensdauern WiSe 2010/11 Kapitel 2: Schätzung von λ(t) und S(t) für homogene Populationen Copyright: Vielen Dank an PD Dr. Michael Höhle. Die Folien wurden von ihm für seine Vorlesung im Wintersemester 2009/2010 erstellt. Die Folien beruhen auf einem Skript von Prof. Fahrmeir Michael Höhle Analyse von Lebensdauern 1/ 85

2 , Kapitel 2: Schätzung von λ(t) und S(t) für homogene Populationen 1 Nonparametrische Schätzung von S(t) und Λ(t) Kaplan-Meier-Schätzer Nelson-Aalen-Schätzer Kernbasierte Schätzung der Hazardrate λ(t) 2 Nonparametrische Schätzung von S(t) und Λ(t) Nonparametrische Hypothesentest Einstichproben Test Zweistichproben Test 3 Likelihood-Schätzung für parametrische Hazardratenmodelle Weitere Zensierungsmechanismen und Likelihood 4 Likelihood basierte semiparametrische Schätzung von λ(t) Regressions-Splines Trapezregel Ansatz in Cai et al. (2002) Michael Höhle Analyse von Lebensdauern 2/ 85

3 Nonparametrische S(t) und Λ(t) Schätzung, Outline 1 Nonparametrische Schätzung von S(t) und Λ(t) Kaplan-Meier-Schätzer Nelson-Aalen-Schätzer Kernbasierte Schätzung der Hazardrate λ(t) 2 Nonparametrische Schätzung von S(t) und Λ(t) 3 Likelihood-Schätzung für parametrische Hazardratenmodelle 4 Likelihood basierte semiparametrische Schätzung von λ(t) Michael Höhle Analyse von Lebensdauern 3/ 85

4 Nonparametrische S(t) und Λ(t) Schätzung, Datensituation Daten für homogene Population oder homogene Subpopulation Lebensdauern Zensierungszeiten F C i sind iid. Zufallsvariablen T i iid. Bei Rechtszensierung: (i = 1,..., n) T i = min(t i, C i ) { 1, wenn nicht zensiert δ i = 0, wenn zensiert T i beobachtete Lebensdauer, δ i Zensierungsindikator Michael Höhle Analyse von Lebensdauern 4/ 85

5 Nonparametrische S(t) und Λ(t) Schätzung, Ziele der Schätzung Parametrische oder nonparametrische Schätzung von λ(t), Λ(t), S(t) Bei parametrischer Schätzung: λ(t) = λ(t θ), z.b. Exp.-, Weibull-, etc.- Verteilung Bei nonparametrischer Schätzung: keine parametrische funktionale Form für λ(t), Λ(t), S(t) vorgegeben; entspricht nonparametrischer Dichte-Schätzung Bei semiparametrischer Schätzung: schwache Parametrisierung, z.b. λ(t) = exp(f (t)), wobei f (t) eine Spline-Funktion ist. Michael Höhle Analyse von Lebensdauern 5/ 85

6 Nonparametrische S(t) und Λ(t) Schätzung, Nonparametrische Schätzung von S(t) und Λ(t) Ziel: Nonparametrische Schätzung von S(t), Λ(t) bzw. λ(t) Das heißt für die Hazardrate wird kein parametrisches Modell λ(t; θ), z.b. Exponential, Weibull etc. vorgegeben. Methoden: Kaplan-Meier-Schätzer für S(t) Nelson-Aalen-Schätzer für kumulierte Hazardrate Λ(t) Likelihood-basierte parametrische bzw. nonparametrische Schätzer für λ(t) Michael Höhle Analyse von Lebensdauern 6/ 85

7 Nonparametrische S(t) und Λ(t) Schätzung, Kaplan-Meier-Schätzer Kaplan-Meier-Schätzer (aka. Produkt-Limit-Schätzer) (1) Betrachtet werden die geordneten Ereigniszeitpunkte t (k), k = 1, 2,, m, * * * * 0 t (1) < t (2) <... < t (m 1) < t (m), m n * Ereignis Diskrete Hazardrate für I k = [t (k 1), t (k) ) ist definiert als λ d k = P (T [t (k 1), t (k) ) T t (k 1) ), k = 1,..., m Die Wahrscheinlichkeit, das k-te Intervall zu überleben, gegeben es wurde erreicht: p k = 1 λ d k = P (T t (k) T t (k 1) ) Michael Höhle Analyse von Lebensdauern 7/ 85

8 Nonparametrische S(t) und Λ(t) Schätzung, Kaplan-Meier-Schätzer Kaplan-Meier-Schätzer (2) Die unbedingte Wahrscheinlichkeit, das k-te Intervall zu überleben: P k = P(T t (k) ) = P(T t (k) T t (k 1) ) P(T 0) = p k p 1 Weitere Notation: d k Anzahl von Ereignissen zum Zeitpunkt t (k), d.h. n d k = I (ti = t (k), δ i = 1). i=1 n k Anzahl von Individuen unter Risiko zur Zeit t (k) (genauer: bis kurz vor t (k) ), d.h. n n k = I (ti t (k) ). i=1 Michael Höhle Analyse von Lebensdauern 8/ 85

9 Nonparametrische S(t) und Λ(t) Schätzung, Kaplan-Meier-Schätzer Kaplan-Meier-Schätzer (3) Der Kaplan-Meier-Schätzer für die Survivalfunktion S(t) ist Kaplan-Meier-Schätzer Ŝ(t) = { 1, t < t(1) t (k) t ( ) 1 d k n k, t t (1) Ein Schätzer für die Varianz von Ŝ(t) an der Stelle t ist die Greenwood-Formel: Var{Ŝ(t)} = Ŝ(t) 2 t (k) t d k n k (n k d k ) Michael Höhle Analyse von Lebensdauern 9/ 85

10 Nonparametrische S(t) und Λ(t) Schätzung, Kaplan-Meier-Schätzer Herleitung: Tafel Kaplan-Meier-Schätzer (4) Eigenschaften: Ŝ(t) ist für alle Zeitpunkte kleiner als t (n) definiert Ŝ(t) ist eine rechtsstetige Treppenfunktion mit Ŝ(0) = 1. Bei jedem Ereigniszeitpunkt reduziert sich Ŝ(t) um den Faktor (n k d k )/n k. Bei Zensierungszeiten gibt es keine Änderung. Wenn keine Zensierung vorhanden dann reduziert der KM-Schätzer zur empirischen Survivorfunktion entspricht Var(Ŝ(t)) 1 = nŝ(t)(1 Ŝ(t)). Michael Höhle Analyse von Lebensdauern 10/ 85

11 Nonparametrische S(t) und Λ(t) Schätzung, Kaplan-Meier-Schätzer Beispiel: Infektiöse Komplikationen mit Dialysekatheter Survivalfunktion für die Gruppe mit operativ gelegten Katheter R>fit <- survfit(surv(time, delta) ~ type, data = subset(kidney, + type == 1), type = "kaplan-meier", error = "greenwood", + conf.type = "log", conf.int = 0.95) R>plot(fit, xlab = "time [months]", ylab = "S(t)", conf.int = TRUE, + main = "S(t) for surgical") S(t) for surgical S(t) time [months] Michael Höhle Analyse von Lebensdauern 11/ 85

12 Nonparametrische S(t) und Λ(t) Schätzung, Kaplan-Meier-Schätzer Punktweise Konfidenzintervalle Punktweise KI an (je)der Stelle t mit oberen und unteren Grenze gegeben durch: Ŝ(t) ± z 1 α se{ŝ(t)}, 2 wobei se{ŝ(t)} = Var{Ŝ(t)}. Es gilt für jedes t die Wahrscheinlichkeitsaussage ) a P (Ŝ(t) z1 α se{ŝ(t)} S(t) Ŝ(t) + z 2 1 α 2 se{ŝ(t)} 1 α Bessere Überdeckungswahrscheinlichkeiten können erreicht werden, indem das KI zuerst für eine Transformation von S(t) berechnet wird, wonach die Grenzen rücktransformiert werden Michael Höhle Analyse von Lebensdauern 12/ 85

13 Nonparametrische S(t) und Λ(t) Schätzung, Kaplan-Meier-Schätzer Simultane Konfidenzbänder (1) Bei simultanen Konfidenzbändern soll gelten, dass P (Ŝ(t) ± cα (t L, t U ) S(t), t [t L, t U ]) a 1 α Equal-Precision-Bänder und Hall-Wellner-Bänder sind zwei Methoden, um simultane KIs zu berechnen Die beiden Verfahren entstehen durch die Inversion eines Test mit Nullhypothese H 0 : S(t) = S 0 (t) Michael Höhle Analyse von Lebensdauern 13/ 85

14 Nonparametrische S(t) und Λ(t) Schätzung, Kaplan-Meier-Schätzer Equal-Precision-Konfidenzband (1) Die Equal-Precision-Bänder (EP-Bänder) werden bestimmt durch (Nair, 1984): Ŝ(t) ± c α (a L, a U ) se{ŝ(t)} Die Werte c α (a L, a U ) bzw. t L und t U sind so zu bestimmen, dass 0 < a L < a U < 1, wobei a L = n ˆσ2 S (t L) 1 + n ˆσ 2 S (t L) ˆσ 2 S(t) = Var{Ŝ(t)} Ŝ(t) 2 a U = n ˆσ2 S (t U) 1 + n ˆσ 2 S (t U), und = t (k) t d k n k (n k d k ) c α (a L, a U ) kann durch Eigenschaften einer Brownschen Brücke bestimmt werden Michael Höhle Analyse von Lebensdauern 14/ 85

15 Nonparametrische S(t) und Λ(t) Schätzung, Kaplan-Meier-Schätzer Equal-Precision-Konfidenzband (2) c α (a L, a U ) sind für ein Gitter von a L, a U Werten in z.b. Klein und Moeschberger (1997, Tab. C.3) tabelliert Das EP-Band hat an jedem t die gleiche (geschätzte) Präzision weil es proportional zum punktweisen Konfidenzintervall ist Durch Transformation, z.b. log(s(t)) oder arcsin( S(t)) kann wiederum eine bessere Überdeckungswahrscheinlichkeit erreicht werden Michael Höhle Analyse von Lebensdauern 15/ 85

16 Nonparametrische S(t) und Λ(t) Schätzung, Kaplan-Meier-Schätzer Beispiel: Infektiöse Komplikationen mit Dialysekatheter In R: R>library("km.ci") R>kidneyOp <- subset(kidney, type == 1) R>fit <- survfit(surv(time, delta) ~ type, data = kidneyop) R>a <- km.ci(fit, conf.level = 0.95, tl = NA, tu = NA, + method = "logep") S(t) Kaplan Meier Schätzer EP Bänder (log trans) Punktweise KIs (log trans) time (months) Michael Höhle Analyse von Lebensdauern 16/ 85

17 Nonparametrische S(t) und Λ(t) Schätzung, Kaplan-Meier-Schätzer Hall-Wellner Konfidenzband Alternative Konstruktionsform sind die so genannten Hall-Wellner-Bänder (Hall und Wellner, 1980) Ŝ(t) ± k α(a L, u L ) n [1 + nˆσ 2 S(t)] Ŝ(t) Herleitungen über Martingaltheorie, siehe z.b. Fleming und Harrington (1991) k α (a L, u L ) wird wiederum aus Eigenschaften einer Brownschen Brücke bestimmt, Klein und Moeschberger (1997, Tab. C.4) enthält Tabellierung Wenn keine Zensierung existiert, entsprechen die HW-Bänder eins minus den Kolmogorov-Smirnov-Bänder für die empirische Verteilungsfunktion Michael Höhle Analyse von Lebensdauern 17/ 85

18 Nonparametrische S(t) und Λ(t) Schätzung, Kaplan-Meier-Schätzer Beispiel: Infektiöse Komplikationen mit Dialysekatheter In R: R>b <- km.ci(fit, conf.level = 0.95, tl = NA, tu = NA, + method = "loghall") S(t) Kaplan Meier Schätzer HW Bänder (log trans) Punktweise KIs (log trans) time (months) Michael Höhle Analyse von Lebensdauern 18/ 85

19 Nonparametrische S(t) und Λ(t) Schätzung, Nelson-Aalen-Schätzer Nelson-Aalen-Schätzer für Λ(t) (1) Nelson-Aalen-Schätzer für Λ(t) ˆΛ(t) = t 0 dn(s) Y (s) = t (k) t d k n k Ein Schätzer für die Varianz von ˆΛ(t) an der Stelle t: Var( Λ(t)) = ˆσ 2 Λ (t) = d k n 2 t (k) t k ˆΛ ist eine monoton wachsende rechtsstetige Treppenfunktion mit Sprungstellen t (k), k = 1, 2,... Michael Höhle Analyse von Lebensdauern 19/ 85

20 Nonparametrische S(t) und Λ(t) Schätzung, Nelson-Aalen-Schätzer Nelson-Aalen-Schätzer für Λ(t) (2) Der Schätzer und dessen Varianz kann elegant über Zählprozesse hergeleitet werden Ein Plot von Λ(t) enthält Information über die Form von λ(t) Λ(t) linear, falls λ(t) konstant Λ(t) konvex, falls λ(t) monoton zunehmend ist Λ(t) konkav, falls λ(t) monoton abnehmend ist Es gilt, dass die totale geschätzte Hazard über alle Individuen summiert gleich der totalen Anzahl von Ereignissen ist: n ˆΛ(t i ) = i=1 n N i (ti ) i=1 Michael Höhle Analyse von Lebensdauern 20/ 85

21 Nonparametrische S(t) und Λ(t) Schätzung, Nelson-Aalen-Schätzer Beispiel: Infektiöse Komplikationen mit Dialysekatheter In R: R>Lambda <- basehaz(coxph(surv(time, delta) ~ 1, data = kidneyop)) Λ^(t) time (months) Michael Höhle Analyse von Lebensdauern 21/ 85

22 Nonparametrische S(t) und Λ(t) Schätzung, Nelson-Aalen-Schätzer Nelson-Aalen-Schätzer für Λ(t) (3) Konfidenzintervalle Punktweise Konfidenzintervalle (linear): für jedes (feste) t ˆΛ(t) ± z 1 α/2ˆσ Λ (t) Simultane (lineare) EP-Konfidenzbänder für t [t L, t U ] ˆΛ(t) ± c α (a L, a U )ˆσ Λ (t), mit a L, a U definiert wie für Kaplan-Meier, aber mit ˆσ S (t) ersetzt durch ˆσ Λ (t) Wiederum können Transformationen benutzt werden, um die Überdeckungswahrscheinlichkeit zu verbessern Michael Höhle Analyse von Lebensdauern 22/ 85

23 Nonparametrische S(t) und Λ(t) Schätzung, Nelson-Aalen-Schätzer Breslow-Schätzer für S(t) Breslow-Schätzer für S(t) Über den Nelson-Aalen Schätzer lässt sich als Alternative zum Kaplan-Meier-Schätzer ein Schätzer für S(t) gewinnen: Ŝ B (t) = exp( ˆΛ(t)) Umgedreht wird auch Λ(t) = log(ŝ KM (t)) als Schätzer für Λ(t) vorgeschlagen Michael Höhle Analyse von Lebensdauern 23/ 85

24 Nonparametrische S(t) und Λ(t) Schätzung, Kernbasierte Schätzung der Hazardrate λ(t) Kernbasierte Schätzung der Hazardrate λ(t) Nelson-Aalen-Schätzer ˆΛ(t) ist Treppenfunktion mit Sprüngen an den Ereigniszeitpunkten t (k), k = 1,..., m Zur Erinnerung: Λ(t) = t 0 λ(s)ds bzw. Λ (t) = λ(t) Ein grober Schätzer für die Hazardrate λ(t) zum Zeitpunkt t (k) ist ˆΛ(t (k) ) = ˆΛ(t (k) ) ˆΛ(t (k 1) ) Michael Höhle Analyse von Lebensdauern 24/ 85

25 Nonparametrische S(t) und Λ(t) Schätzung, Kernbasierte Schätzung der Hazardrate λ(t) Ramlau-Hansen-Schätzer Idee: Glätte ˆΛ(t (k) ), k = 1, 2,... mit Kerndichteschätzer Ramlau-Hansen-Schätzer ˆλ(t) = 1 h m ( ) t t(k) K ˆΛ(t h (k) ), k=1 wobei K(x) z.b. der Epanechnikov Kern ist, d.h. K(x) = 3 4 (1 x2 ) für x 1 und sonst 0. ˆλ(t) ist ein gewichtetes Mittel der Zunahmen des Nelson-Aalen-Schätzers über [t h, t + h]. Kerndichteschätzer der Hazardfunktion sind im R-Paket muhaz implementiert Übung Michael Höhle Analyse von Lebensdauern 25/ 85

26 Nonparametrische S(t) und Λ(t) Schätzung, Outline 1 Nonparametrische Schätzung von S(t) und Λ(t) 2 Nonparametrische Schätzung von S(t) und Λ(t) Nonparametrische Hypothesentest Einstichproben Test Zweistichproben Test 3 Likelihood-Schätzung für parametrische Hazardratenmodelle 4 Likelihood basierte semiparametrische Schätzung von λ(t) Michael Höhle Analyse von Lebensdauern 26/ 85

27 Nonparametrische S(t) und Λ(t) Schätzung, Nonparametrische Hypothesentest Nonparametrische Hypothesentest Einstichproben-Test: Vergleich von Hazardraten (bzw. kumulierten Hazardraten) mit einer erwarteten Hazardrate Zweistichproben-Test: Vergleich von Hazardraten (bzw. kumulierten Hazardraten) zwischen zwei Gruppen Anstelle des direkten Vergleichs zwischen beobachteter und erwarteter Hazardrate wird ein gewichteter Vergleich durchgeführt, sodass unterschiedliche Teile der Hazardfunktion hervorgehoben werden können. Michael Höhle Analyse von Lebensdauern 27/ 85

28 Nonparametrische S(t) und Λ(t) Schätzung, Nonparametrische Hypothesentest Einstichproben-Test (1) Zensierte Stichprobe D = {(t i, δ i) ; i = 1,..., n} einer Population Für eine komplett spezifizierte Funktion λ 0 (t) auf [0, τ] besteht Interesse an dem Hypothesentest H 0 : t τ : H 1 : t τ : λ(t) = λ 0 (t) λ(t) λ 0 (t) Typischerweise wird für τ das größte beobachtete ti Ein Schätzer für Λ(t) ist der Nelson-Aalen-Schätzer ˆΛ(t) = t (i) t d i = n i t (i) t d i Y (t (i) ) benutzt. ein grober Schätzer für λ(t (i) ) ist d i /n i. Michael Höhle Analyse von Lebensdauern 28/ 85

29 Nonparametrische S(t) und Λ(t) Schätzung, Nonparametrische Hypothesentest Einstichproben-Test (2) Sei W (t) eine Gewichtsfunktion mit der Eigenschaft, dass W (t) = 0 wenn Y (t) = 0. Die Teststatistik ist Z(τ) = O(τ) E(τ) = m d i W (t (i) ) Y (t (i) ) i=1 Unter der Nullhypothese gilt Z(τ) 2 Var(Z(τ)) τ 0 W (s)λ 0 (s)ds τ a χ 2 (1), mit Var(Z(τ)) = W 2 (s) λ 0(s) 0 Y (s) ds. Für W (t) = Y (t) erhält man den Einstichproben-Log-Rang-Test Tafel. Michael Höhle Analyse von Lebensdauern 29/ 85

30 Nonparametrische S(t) und Λ(t) Schätzung, Nonparametrische Hypothesentest Beispiel Remissionszeiten (in Wochen) von 21 Patienten. Test auf λ 0 (t) = R>t <- c(6, 6, 6, 7, 10, 13, 16, 22, 23, 6, 9, 10, 11, + 17, 19, 20, 25, 32, 32, 34, 35) R>d <- c(1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, + 0, 0, 0, 0, 0) R>source("logrank1.R") R>logRank1(t, d, 0.05 * t) X2 ApproxPvalue2side R>library("survival") R>survdiff(Surv(t, d) ~ offset(exp(-0.05 * t)), rho = 0) Call: survdiff(formula = Surv(t, d) ~ offset(exp(-0.05 * t)), rho = 0) Observed Expected Z p Michael Höhle Analyse von Lebensdauern 30/ 85

31 Nonparametrische S(t) und Λ(t) Schätzung, Nonparametrische Hypothesentest Einstichproben-Test (3) Generelle Gewichtsfunktion mit p 0, q 0: W HF (t) = Y (t)s 0 (t) p (1 S 0 (t)) q Für p >> q werden frühe (i.e. für kleine t) Abweichungen von der Nullhypothese höher gewichtet. Für p << q werden späte Abweichungen von der Nullhypothese höher gewichtet. Für p = q > 0 werden Abweichungen in der Spannweitenmitte höher gewichtet Für p = q = 0 erhält man den Log-Rang-Test Für p = 1 und q = 0 erhält man einen zensierte Version des Wilcoxon-Vorzeichen-Rang-Test Michael Höhle Analyse von Lebensdauern 31/ 85

32 Nonparametrische S(t) und Λ(t) Schätzung, Nonparametrische Hypothesentest Nonparametrische Tests zum Vergleich von zwei Gruppen (1) Standardfall: Homogene Gruppe von Individuen werden zufällig in 2 Gruppen aufgeteilt. Gruppe 1 wird mit Behandlung 1, Gruppe 2 mit Behandlung 2 versehen. Seien λ 1 (t), λ 2 (t) bzw. S 1 (t), S 2 (t) die Hazardraten bzw. Survivorfunktionen der Gruppen 1 und 2. Getestet werden soll H 0 : t τ : H 1 : t τ : λ 1 (t) = λ 2 (t) λ 1 (t) λ 2 (t) Michael Höhle Analyse von Lebensdauern 32/ 85

33 Nonparametrische S(t) und Λ(t) Schätzung, Nonparametrische Hypothesentest Zweistichproben-Test (2) Die Alternative λ 1 (t) λ 2 (t) ist sehr allgemein, z.b. auch mit Überkreuzen: λ j (t) λ 1 (t) λ 2 (t) 1 S j (t) t t Eine spezifische Alternative ist mit c > 0 und c 1 die Annahme von proportionalen Hazardfunktionen H 1 : t : λ 1 (t) = cλ 2 (t) Dies ist äquivalent zu H 1 : t : S 1 (t) = {S 2 (t)} c, somit ist kein Überkreuzen der Survivorfunktionen möglich. Michael Höhle Analyse von Lebensdauern 33/ 85

34 Nonparametrische S(t) und Λ(t) Schätzung, Nonparametrische Hypothesentest Zweistichproben-Test (3) Notation Poole alle Ereigniszeiten (egal ob zu Gruppe 1 oder 2 gehörig) und bilde Order-Statistik t (1) < t (2) <... < t (m) Zusätzliche Notation: d i1 Anzahl von Ereignissen aus Gruppe 1 zum Zeitpunkt t (i) d i2 Anzahl von Ereignissen aus Gruppe 2 zum Zeitpunkt t (i) n i1 Anzahl von Individuen unter Risiko aus Gruppe 1 kurz vor t (i) n i2 Anzahl von Individuen unter Risiko aus Gruppe 2 kurz vor t (i) Daraus wird definiert: d i = d i1 + d i2 Anzahl aller Ereignisse in t (i) n i = n i1 + n i2 Anzahl aller Individuen unter Risiko kurz vor t (i) Michael Höhle Analyse von Lebensdauern 34/ 85

35 Nonparametrische S(t) und Λ(t) Schätzung, Nonparametrische Hypothesentest Zweistichproben-Test (3) Teststatistik Analog zum Einstichproben-Test lässt sich eine gewichtete Differenz zwischen ˆΛ j (t) und dem gepoolten ˆΛ(t) formulieren: Z j (τ) = m i=1 { dij W j (t (i) ) d } i, j = 1, 2 n ij n i Typischer Weise wird die gleiche Gewichtsfunktion für beide Gruppen genommen W j (t (i) ) = n ij W (t (i) ) und somit Z j (τ) = m i=1 Es gilt 2 j=1 Z j(τ) = 0. { } d i W (t (i) ) d ij n ij, j = 1, 2 n i Michael Höhle Analyse von Lebensdauern 35/ 85

36 Nonparametrische S(t) und Λ(t) Schätzung, Nonparametrische Hypothesentest Zweistichproben-Test (4) Teststatistik Die Varianz und Kovarianz der Z j (τ), j = 1, 2, lassen sich wieder im Zählprozess-Kontext bestimmen Bei zwei Gruppen ist die Teststatistik X 2 = ( m [ ]) 2 i=1 W (t d (i)) d i1 n i i1 n i m W (t (i) ) 2 n ( i1 1 n i1 n i n i i=1 ) ni d i n i 1 d i W (t) = 1 führt zum Zweistichproben-Log-Rang-Test. W (t (i) ) = n i führt zu Gehan s zensierter Version des Zweistichproben-Wilcoxon-Rangsummen-Tests. a χ 2 (1) Michael Höhle Analyse von Lebensdauern 36/ 85

37 Nonparametrische S(t) und Λ(t) Schätzung, Nonparametrische Hypothesentest Wiederholung: Wilcoxon-Rangsummen-Test Seien T 11,..., T 1n1 und T 21,..., T 2n2 zwei unabhängige und unzensierte Stichproben aus den Verteilungen F 1 und F 2. Der Wilcoxon-Rangsummen-Test ist ein Test der Hypothesen H 0 : F 1 (t) = F 2 (t), t H 1 : F 1 (t) = F 2 (t θ), t, θ 0 Sei T (1) < T (2) <... < T (n1 +n 2 ) die Order-Statistik der gepoolten Stichprobe und sei R j der Rang der j ten Messung der 1. Stichprobe, d.h. R j = i, falls T (i) = T 1j Die Teststatistik des Tests ist T W = n 1 j=1 R j, wobei E(T W ) = n 1 (n + 1)/2 und Var(T W ) = n 1 n 2 (n + 1)/12 mit n = n 1 + n 2. Michael Höhle Analyse von Lebensdauern 37/ 85

38 Nonparametrische S(t) und Λ(t) Schätzung, Nonparametrische Hypothesentest Zweistichproben-Test (5) Teststatistik Mit p, q 0 und W FH (t (i) ) = Ŝ(t (i 1) ) p (1 Ŝ(t (i 1) ) q besteht wieder die Möglichkeit spezielle Zeitabschnitte hervorzuheben p = 0, q = 0 entspricht dem Log-Rang-Test p = 1, q = 0 resultiert in einer anderen Version des Wilcoxon-Rangsummen-Tests mit Zensierungen q = 0, p > 0 gibt frühzeitigen Abweichungen mehr Gewicht p = 0, q > 0 gibt späten Abweichungen mehr Gewicht Michael Höhle Analyse von Lebensdauern 38/ 85

39 Nonparametrische S(t) und Λ(t) Schätzung, Nonparametrische Hypothesentest Beispiel (1) Kidney Daten R>data("kidney") R>survdiff(Surv(time, delta) ~ type, data = kidney, rho = 0) Call: survdiff(formula = Surv(time, delta) ~ type, data = kidney, rho = 0) N Observed Expected (O-E)^2/E (O-E)^2/V type= type= Chisq= 2.5 on 1 degrees of freedom, p= R>survdiff(Surv(time, delta) ~ type, data = kidney, rho = 1) Call: survdiff(formula = Surv(time, delta) ~ type, data = kidney, rho = 1) N Observed Expected (O-E)^2/E (O-E)^2/V type= type= Chisq= 1.4 on 1 degrees of freedom, p= Michael Höhle Analyse von Lebensdauern 39/ 85

40 Nonparametrische S(t) und Λ(t) Schätzung, Nonparametrische Hypothesentest Beispiel (2) Kidney Daten S^(t) time [months] Michael Höhle Analyse von Lebensdauern 40/ 85

41 Nonparametrische S(t) und Λ(t) Schätzung, Nonparametrische Hypothesentest Beispiel (3) Für p = 0, q = 1 : W FH (t (i) ) = 1 Ŝ(t (i) ) geben Klein und Moeschberger (1997) für die kidney Daten X 2 = 9.67 und p = an. In R (etwas andere Ergebnisse): R>library("surv2sample") R>with(kidney, surv2.logrank(surv(time, delta), group = type, + rho.gamma = c(1, 0))) Two-sample weighted logrank test G(1,0) weight Test statistic: , p-value: p-value based on 2000 permutations Michael Höhle Analyse von Lebensdauern 41/ 85

42 Nonparametrische S(t) und Λ(t) Schätzung, Nonparametrische Hypothesentest Vergleich von Log-Rang- und Wilcoxon-Rangsummen-Test Im Falle von proportionalen Hazardfunktionen, d.h. H 1 : λ 1 (t) = cλ 2 (t) für c > 0, c 1, hat Log-Rang-Test die bessere Güte Proportional-Hazard Annahme bedeutet, dass S 1 (t), S 2 (t) sich nicht überkreuzen dürfen. Eine visuelle Untersuchung dieser Eigenschaft ist es, Ŝ 1 (t) und Ŝ 2 (t) zusammen mit den respektiven Konfidenz-Bändern zu betrachten. Michael Höhle Analyse von Lebensdauern 42/ 85

43 Likelihood-Schätzung für parametrische Hazardratenmodelle, Outline 1 Nonparametrische Schätzung von S(t) und Λ(t) 2 Nonparametrische Schätzung von S(t) und Λ(t) 3 Likelihood-Schätzung für parametrische Hazardratenmodelle Weitere Zensierungsmechanismen und Likelihood 4 Likelihood basierte semiparametrische Schätzung von λ(t) Michael Höhle Analyse von Lebensdauern 43/ 85

44 Likelihood-Schätzung für parametrische Hazardratenmodelle, Likelihood für rechtszensierte Survivaldaten (1) Herleitung für Random Censoring, aber allgemeiner gültig. Die Daten sind {(t i, δ i ), i = 1,..., n}, dabei ist t i die Realisierung von T i = min(t i, C i ) Für eine unzensierte Beobachtung (t i, δ i = 1) ist der Beitrag zur Likelihood: L i = f (t i ) G(t i ), wobei G( ) die Survivorfunktion von C i ist. Für eine zensierte Beobachtung (t i, δ i = 0) ist der Beitrag: L i = S(t i ) g(t i ), wobei g( ) die Dichte von C i ist. Michael Höhle Analyse von Lebensdauern 44/ 85

45 Likelihood-Schätzung für parametrische Hazardratenmodelle, Likelihood für rechtszensierte Survivaldaten (2) Somit ist der Beitrag zur Likelihood einer Beobachtung i: L i = [ f (t i ) G(t i ) ] δ i [ g(ti ) S(t i ) ] 1 δ i = [ f (t i ) δ i S(t i ) 1 δ i ] [ g(t i ) 1 δ i G(t i ) δ i ] Falls g(t) (und somit auch G(t)) nicht von Parametern in f (t) abhängt ist der 2. Faktor konstant und die Gesamtlikelihood ist: L = n f (t i ) δ i S(t i ) 1 δ i i=1 n i=1 λ(t i ) δ i exp ( ti λ(s)ds ) 0 Michael Höhle Analyse von Lebensdauern 45/ 85

46 Likelihood-Schätzung für parametrische Hazardratenmodelle, Likelihood für rechtszensierte Survivaldaten (3) Bemerkung: Herleitung bleibt richtig auch wenn T i und C i weiterhin unabhängig, aber nicht mehr identisch verteilt sind. Dann gilt T i f i, C i g i, wobei f i, g i von der Beobachtung i z.b. über Kovariablen x i abhängen. Bei Typ II Zensierung bestehen die Daten aus den r kleinsten Überlebensdauern T (1) T (2)... T (r) aus einer Zufallsstichprobe von n Überlebensdauern. In diesem Fall ist die gemeinsame Dichte von (t (1),..., t (r) ): [ r n! [S(t(r) f (t (n r)! (i) )] ) ] n r, i=1 welches proportional zur Likelihood bei Typ I Zensierung ist. Michael Höhle Analyse von Lebensdauern 46/ 85

47 Likelihood-Schätzung für parametrische Hazardratenmodelle, Linkszensierung (1) Linkszensierung entsteht, wenn das interessierende Ereignis vor der Zeit C l eingetreten ist, jedoch der genaue Zeitpunkt T des Ereignisses unbekannt ist: T unbekannt C l Beobachtet bei Ereignisdaten mit Linkszensierung wird T = max(t, C l ). Alternative Darstellung: (T, ɛ) mit ɛ = I (T C l ), d.h. { 1 T beobachtet (nicht zensiert) ɛ = 0 sonst Michael Höhle Analyse von Lebensdauern 47/ 85

48 Likelihood-Schätzung für parametrische Hazardratenmodelle, Linkszensierung (2) Beispiele Retrospektive Interviews Frage: Wann zum ersten Mal Alkohol getrunken? Antwort: Bereits getrunken, aber weiß nicht mehr, wann zum ersten Mal Untersuchung von Lernfähigkeit von Kindern Frage: Ist ein Kind im Stande eine genau definierte Handlung durchzuführen? Bei Aufnahme in die Studie ist das Kind dazu schon in der Lage. Michael Höhle Analyse von Lebensdauern 48/ 85

49 Likelihood-Schätzung für parametrische Hazardratenmodelle, Doppelzensierung Doppelzensierung entsteht, wenn in der Studie Rechts- und Linkszensierung auftritt. Repräsentation: (T, δ) mit T = max { } min(t, C r ), C l und 1 T = T δ = 0 T rechtszensiert 1 T linkszensiert Beispiel: Frage: Wann zum ersten Mal Alkohol getrunken? Antwort: noch nie (= Rechtszensierung) oder bereits getrunken, aber weiß nicht mehr, wann zum ersten Mal (Linkszensierung) Michael Höhle Analyse von Lebensdauern 49/ 85

50 Likelihood-Schätzung für parametrische Hazardratenmodelle, Intervall-Zensierung (1) Tritt ein, wenn von der Ereigniszeit nur bekannt ist, dass sie im Intervall (L, R] liegt. Beispiel: Ereigniszeitpunkt eines Patienten liegt zwischen Arztbesuchen zu den Zeiten L und R. Intervall-Zensierung verallgemeinert Rechts- und Linkszensierung: L = 0, R = C l : L = C r, R = + : Linkszensierung Rechtszensierung Michael Höhle Analyse von Lebensdauern 50/ 85

51 Likelihood-Schätzung für parametrische Hazardratenmodelle, Intervall-Zensierung (2) Beispiel für intervallzensierte Daten: Vergleich zwischen Bestrahlungstherapie und Bestrahlungstherapie mit zusätzlicher Chemotherapie, welches beide Alternativen zur Mastektomie bei Brustkrebs sind. Response: Zeitintervall bis zu kosmetischer Schädigung der Brust. Wurde durch Krankenhausarzt bei Untersuchungen alle 4-6 Monate festgestellt. In R: R>library("KMsurv") R>data("bcdeter") R>head(bcdeter) lower upper treat Michael Höhle Analyse von Lebensdauern 51/ 85

52 Likelihood-Schätzung für parametrische Hazardratenmodelle, Linkstrunkierung Bei Trunkierung werden in der Studie nur Individuen erfasst, die eine bestimmte Bedingung erfüllen. Linkstrunkierung entsteht, wenn nur Individuen beobachtet werden, die ein bestimmtes Ereignis (aka. Trunkierungsereignis) vor dem interessierendem Ereignis erfahren haben. Beispiel: Lebensdauerstudie für Bewohner von Altersheimen. Es werden nur Individuen beobachtet, die im Seniorenheim leben. Alle Personen die vorher starben sind linkstrunkiert und werden in der Studie nicht berücksichtigt. Michael Höhle Analyse von Lebensdauern 52/ 85

53 Likelihood-Schätzung für parametrische Hazardratenmodelle, Rechtstrunkierung Rechtstrunkierung entsteht, wenn nur Personen, die das interessierende Ereignis erlebt haben, in die Studie gelangen. Beispiel 1: Mortalitätsstudie basierend auf Sterbeurkunden Beispiel 2: Wenn Individuen nur unter Beobachtung bei Eintritt eines Folgeereignisses kommen und die Ereigniszeit eines vorher eingetreten initiierenden Ereignisses retrospektivisch ermittelt wird. Interesse an Dauer zwischen initiierendem Ereignis und Folgeereignis. Zeit t der AIDS Diagnose und Zeit t + x, wo der Fall den Behörden gemeldet wird. Verteilung der Berichtsverzögerung x wichtig bei der Berechnung von Anzahl Fällen. Zeit t von Infektion mit HIV und Zeit t + x der AIDS Diagnose. Michael Höhle Analyse von Lebensdauern 53/ 85

54 Likelihood-Schätzung für parametrische Hazardratenmodelle, Likelihood für zensierte und trunkierte Daten (1) Entscheidende Annahme: Lebensdauern und Zensierungszeiten sind unabhängig (nicht notwendig identisch verteilt). Beiträge zur Likelihood: Exakt beob. Lebensdauer: f (t) Rechtszensierte Lebensdauer: S(C r ) Linkszensierte Lebensdauer: 1 S(C l ) Intervallzensierte Beobachtung: S(C l ) S(C r ) Linkstrunkierte Beobachtung: f (t)/s(y ) Rechtstrunkierte Beobachtung: f (t)/(1 S(Y )) Michael Höhle Analyse von Lebensdauern 54/ 85

55 Likelihood-Schätzung für parametrische Hazardratenmodelle, Likelihood für zensierte und trunkierte Daten (2) Für Daten mit Zensierung ergibt sich für die Likelihood { 1 S(Cli ) } { S(Li ) S(R i ) } L i E f (t i ) i R S(C ri ) i L i I mit E Menge der Ereigniszeiten R rechtszensierten Beobachtungen L linkszensierten Beobachtungen I intervallzensierten Beobachtungen Im Falle von individuellen aber unabhängigen Survivorfunktionen (typisch bei Regression) gilt: { 1 Si (C li ) } { Si (L i ) S i (R i ) } L i E f i (t i ) i R S i (C ri ) i L i I Michael Höhle Analyse von Lebensdauern 55/ 85

56 Likelihood-Schätzung für parametrische Hazardratenmodelle, Likelihood für zensierte und trunkierte Daten (3) Maximum-Likelihood Schätzer für die Parameter in einem Modell, bei dem die Überlebenszeiten iid. aus der Exponential- bzw. Weibull-Verteilung stammen Übung Stückweises Exponentialmodell λ(t) λ 1 λ k λ q a 0 =0 a 1 a k 1 a k a q Berechnung der ML-Schätzer für λ k, k = 1, 2,... Übung Michael Höhle Analyse von Lebensdauern 56/ 85

57 Likelihood-Schätzung für parametrische Hazardratenmodelle, Likelihood für zensierte und trunkierte Daten (4) Für linkstrunkierte Daten mit Trunkierungszeit Y, unabhängig von T, ist f (t i ) durch f (t i )/S(Y i ) und S(C) durch S(C)/S(Y i ) zu ersetzen. Für rechtstrunkierte Daten werden nur Todesfälle beobachtet, d.h. L i f (Y i ) 1 S(Y i ), wobei Y die Trunkierungsvariable ist. Die Schätzung der Survivorfunktion für Links- und Intervallzensierung sowie Trunkierung wird in Klein und Moeschberger (1997, Kap. 5) behandelt. Michael Höhle Analyse von Lebensdauern 57/ 85

58 Semiparametrische Schätzung von λ(t), Outline 1 Nonparametrische Schätzung von S(t) und Λ(t) 2 Nonparametrische Schätzung von S(t) und Λ(t) 3 Likelihood-Schätzung für parametrische Hazardratenmodelle 4 Likelihood basierte semiparametrische Schätzung von λ(t) Regressions-Splines Trapezregel Ansatz in Cai et al. (2002) Michael Höhle Analyse von Lebensdauern 58/ 85

59 Semiparametrische Schätzung von λ(t), Likelihood basierte semiparametrische Schätzung von λ(t) Das stückweise Exponentialmodell stellt ein erstes Beispiel eines Basisfunktion-Ansatzes zur Schätzung von λ(t) dar Sei λ(t) = exp(η(t)) η(t) = log λ(t) und η(t) in Abhängigkeit von θ. Die Likelihood- und Loglikelihoodfkt. sind: L(θ) = l(θ) = n ( ti ) λ(t i ) δ i exp λ(s)ds 0 n ti δ i η(t i ) exp(η(s))ds. 0 i=1 i=1 Michael Höhle Analyse von Lebensdauern 59/ 85

60 Semiparametrische Schätzung von λ(t), Regressions-Splines Einschub: Regressions-Splines (Polynomiale Splines) Additives Modell Y i = f (x i ) + ε i, i = 1,..., n entspricht η entspricht t i Modellierung von f (x i ) durch polynomiale Spline-Funktion M f (x) = β m B m (x) m=1 Beispiel: TP-Spline der Ordnung 1 mit Knoten (ξ 1,..., ξ K ): K f (x) = α 0 + α 1 x + β k (x ξ k ) +, k=1 wobei x + = max(0, x) = x I (x > 0). Michael Höhle Analyse von Lebensdauern 60/ 85

61 Semiparametrische Schätzung von λ(t), Regressions-Splines Beispiel: Truncated-Power Basis 1. Ordnung (1) Beispiel mit 5 Knoten in (0.1, 0.3, 0.5, 0.7, 0.9). Basisfunktionen Skalierte Basisfunktionen y y x x Michael Höhle Analyse von Lebensdauern 61/ 85

62 Semiparametrische Schätzung von λ(t), Regressions-Splines Beispiel: Truncated-Power Basis 1. Ordnung (2) Summe der skalierten Basisfunktionen y x Michael Höhle Analyse von Lebensdauern 62/ 85

63 Semiparametrische Schätzung von λ(t), Regressions-Splines Penalisierte Splines (1) Problem: Wahl der Anzahl und Lage der Knoten Zu viele Knoten: Overfitting, Hohe Varianz, Entspricht fast Interpolieren. Zu wenig Knoten: nicht flexibel genug, schlechter fit Kompromiss: Mittlere Anzahl von Knoten (20-40) mit zusätzlicher Stabilisierung der Schätzung durch Penalisierung Beispiel: Ridge-Regression für lineare Splines mit TP-Basis KQ(α, β) = = n ( yi f (x i ) ) 2 i=1 ( n y i α 0 α 1 x i i=1 ) 2 K β k (x i ξ k ) + k Michael Höhle Analyse von Lebensdauern 63/ 85

64 Semiparametrische Schätzung von λ(t), Regressions-Splines Penalisierte Splines (2) Resultierendes penalisiertes kleinste Quadrate Kriterium: KQ pen (α, β) = KQ(α, β) + λ K k=1 β 2 k = KQ(α, β) + λ β β }{{} Strafterm Der Parameter λ ist ein Glättungsparameter. Für λ 0 bekommt der Strafterm nur ein sehr geringes Gewicht. Eine nahe an den KQ-Schätzer gelegene Schätzung ergibt sich. Für λ wird die Schätzung durch den Strafterm dominiert. Bei TP-Spline 1. Ordnung erhält man also ein Polynom 1. Ordnung, d.h. f (x) = α 0 + α 1 x. Für zusätzliche Information zu Splines siehe z.b. Fahrmeir et al. (2007, Kapitel ). Michael Höhle Analyse von Lebensdauern 64/ 85

65 Semiparametrische Schätzung von λ(t), Regressions-Splines Schätzung in Survival Modellen Anstelle des KQ-Kriteriums wird die penalisierte Loglikelihoodfunktion als Kriterium herangezogen: l pen (α, β) = l(α, β) λ 2 β β, l(α, β) = = n δ i η(t i ) i=1 n i=1 ti 0 wobei exp(η(s))ds n δ i f (t i ; α, β) Λ(α, β) i=1 Beispiel: Ausdruck für Λ(α, β) Tafel. Michael Höhle Analyse von Lebensdauern 65/ 85

66 Semiparametrische Schätzung von λ(t), Trapezregel Einschub: Trapezregel (1) Die einfache Trapezregel findet sich z.b. in Abramowitz und Stegun (1964, S. 885): x1 x 0 f (x)dx = h 2 (f 0 + f 1 ) h3 12 f (ξ), wobei h = x 1 x 0 und ξ eine Zwischenstelle in [x 0, x 1 ]. f (x 0 )=f 0 f (x 1 )=f 1 h 2 (f 0 + f 1 ) x 0 x 1 Michael Höhle Analyse von Lebensdauern 66/ 85

67 Semiparametrische Schätzung von λ(t), Trapezregel Trapezregel (2) Erweiterte Trapezregel für äquidistantes Gitter: xm x 0 f (x)dx = m 1 i=1 xi+1 x i f (x)dx [ f0 h 2 + f f m 1 + f ] m, 2 mit h = x i x i 1 gleich für alle i = 1,..., m. f 1 f f m 1 0 f m... x 0 x 1 x m 1 x m Michael Höhle Analyse von Lebensdauern 67/ 85

68 Semiparametrische Schätzung von λ(t), Trapezregel Trapezregel (3) Erweiterte Trapezregel bei nicht-äquidistantem Gitter xm x 0 m 1 f (x)dx = i=1 m 1 i=1 xi+1 x i f (x)dx x i x i 1 (f i + f i+1 ) 2 = 1 2 (x1 x0)(f0 + f1) + 1 (x2 x1)(f1 + f2) (xm 1 xm 2)(fm 2 + fm 1) + 1 (xm xm 1)(fm 1 + fm) 2 Michael Höhle Analyse von Lebensdauern 68/ 85

69 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) Ansatz in Cai et al. (2002) (1) Angenommen es gibt keine Bindungen. Verwende als Knoten die geordneten beobachteten Lebensdauern t (i), i = 1,..., n.... f n 1 f n 0 t (1) t (2) t (n 2) t (n 1) t (n) Das zu berechnende Integral der Hazardrate in der Loglikelihoodfunktion kann über die Trapezregel berechnet werden t(n) t(1) t(n) Berechnung von f (x)dx = f (x)dx + f (x)dx 0 0 t (1) Michael Höhle Analyse von Lebensdauern 69/ 85

70 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) Trapezregel in Cai et al. (2002) (1) t(1) 0 t(n) t (1) f (x) t (1) f 1 f (x) = 1 2 = 1 2 n 1 i=1 ( n (t (i+1) t (i) )(f (i+1) + f (i) ) ) f (i) t (i) + f (i) t (i+1) f (i+1) t (i) + f (i+1) t (i+1) i=1 ( n 1 ) ( ) n 1 n 1 f(i) t (i+1) f (i+1) t (i) f (i) t (i) + f (i+1) t (i+1) i=1 i=1 i=1 Michael Höhle Analyse von Lebensdauern 70/ 85

71 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) = 1 2 = 1 2 = 1 2 = 1 2 = 1 2 = 1 2 Trapezregel in Cai et al. (2002) (2) ( n 1 ( ) n 1 f(i) t (i+1) f (i+1) t (i) f (i) t (i) + i=1 ( n 1 i=1 ) n f (i) t (i) i=2 ) ( ) f(i) t (i+1) f (i+1) t (i) f(1) t (1) + f (n) t (n) i=1 ( n 1 ) n 1 f (i) t (i+1) f (i+1) t (i) f (1) t (1) + f (n) t (n) i=1 ( n 1 f (i) t (i+1) i=1 ( n 1 i=1 ) n f (i) t (i 1) f (1) t (1) + f (n) t (n) i=2 ) f (i) (t (i+1) t (i 1) ) + f (1) t (2) f (n) t (n 1) f (1) t (1) + f (n) t (n) i=2 ( n 1 ) f (i) (t (i+1) t (i 1) ) + f (1) (t (2) t (1) ) + f (n) (t (n) t (n 1) ) i=2 Michael Höhle Analyse von Lebensdauern 71/ 85

72 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) Trapezregel in Cai et al. (2002) (3) Zusammenfassend wird Λ(t (n) ) = t (n) 0 f (x)dx für n > 1 approximiert durch = 1 n 1 2 f (i) (t (i+1) t (i 1) ) + f (1) (t (2) + t (1) ) +f (n) (t (n) t (n 1) ) }{{} = Q nf, i=2 f (1) (t (2) t (1) +2t (1) ) wobei Q n = 1 2 (t (2) + t (1), t (3) t (1), t (4) t (2),..., t (n) t (n 1) ) f = (f 1,..., f n) Weiterhin ist Λ(t (n 1) ) = Q n 1 f, wobei nun Q n 1 = 1 2 (t (2) + t (1), t (3) t (1), t (4) t (2),..., t (n 1) t (n 2), 0) Michael Höhle Analyse von Lebensdauern 72/ 85

73 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) Trapezregel in Cai et al. (2002) (4) Insgesamt gilt also Λ(α, β) = 1 Qf, wobei t (1) + t (1) Q = 1 t (2) + t (1) t (2) t (1) 0 0 t (2) + t (1) t (3) t (1) t (3) t (2) t (2) + t (1) t (3) t (1) t (4) t (2) t (n) t (n 1) Ausdruck für Λ(α, β) mit o i s Tafel: Λ(α, β) = n i=1 { exp ( α 0 + α 1 t (i) + K ) } β k (t (i) t (k) ) + + o i k=1 Michael Höhle Analyse von Lebensdauern 73/ 85

74 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) Loglikelihood in Cai et al. (2002) Weil o i nicht von (α, β) abhängt können Teile addiert werden, sodass die Loglikelihood folgende Form hat: l(α, β) = n i=1 δ i ( η i + o i ) n exp(η i + o i ) mit η i = α 0 + α 1 t (i) + K k=1 β k(t (i) ξ k ) +. Dies entspricht einem log-linearem Poisson Modell mit Daten: ( ) δ(i) ; 1, t (i), (t (i) ξ 1 ) +,..., (t (i) ξ K ) + }{{} ( ) y i, und Offset o i Somit sind GLM-Methoden, z.b. in R durch die Funktion glm einsetzbar. x i i=1 Michael Höhle Analyse von Lebensdauern 74/ 85

75 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) Fit durch GLM Methoden (1) R>baseHazTPBReg <- function(t, delta) { + ord <- order(t) + t <- t[ord] + delta <- delta[ord] + xi <- t + K <- length(xi) + n <- length(t) + y <- delta + X <- cbind(1, t) + Z <- sapply(1:k, function(i) pmax(0, t - xi[i])) + o <- rep(0, n) + o[1] <- log(1/2 * (2 * t[1] + (n - 1) * (t[2] + t[1]))) + for (i in (seq_len(n - 2) + 1)) { + o[i] <- log(1/2 * ((t[i] - t[i - 1]) + (n - i) * + (t[i + 1] - t[i - 1]))) + } + o[n] <- log(1/2 * (t[n] - t[n - 1])) + m <- glm(y ~ -1 + X + Z[, -c(1, K)] + offset(o), + family = poisson()) + return(list(y = y, X = X, Z = Z[, -c(1, K)], o = o, + id = 1:n, fit = m)) + } Michael Höhle Analyse von Lebensdauern 75/ 85

76 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) R>set.seed(123) R>t <- sort(rexp(500)) R>delta <- rep(1, length(t)) R>m <- basehaztpbreg(t, delta) Fit durch GLM Methoden (2) GLM fit ohne Penalisierung η^(t) True value t Michael Höhle Analyse von Lebensdauern 76/ 85

77 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) Penalisierung mit Glättungsparameter (1) Tafel Michael Höhle Analyse von Lebensdauern 77/ 85

78 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) Penalisierung mit Glättungsparameter (2) Eine Implementation des Ansatzes basierend auf der Arbeit in Kauermann (2005): R>library("TwoWaySurvival") R>mObject <- OneWaySurv(surv.time = t, status = delta) R>mFit <- OneWaySurvfitCreate(formula = mobject ~ 1, basis = "trunc") R>mFit fixed coefficients beta.t.baseline.intercept beta.t.baseline.slope Penalties for random components penalty.t.baseline Michael Höhle Analyse von Lebensdauern 78/ 85

79 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) R>plot(mFit) R>rug(t) Penalisierung mit Glättungsparameter (3) Baseline Duration time (t) Michael Höhle Analyse von Lebensdauern 79/ 85

80 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) Penalisierung mit Glättungsparameter (4) Duration time (t) λ = 0.01 Michael Höhle Analyse von Lebensdauern 80/ 85

81 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) Penalisierung mit Glättungsparameter (4) λ = Duration time (t) Michael Höhle Analyse von Lebensdauern 80/ 85

82 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) Penalisierung mit Glättungsparameter (4) λ = Duration time (t) Michael Höhle Analyse von Lebensdauern 80/ 85

83 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) Penalisierung mit Glättungsparameter (4) λ = Duration time (t) Michael Höhle Analyse von Lebensdauern 80/ 85

84 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) Penalisierung mit Glättungsparameter (4) λ = Duration time (t) Michael Höhle Analyse von Lebensdauern 80/ 85

85 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) Penalisierung mit Glättungsparameter (4) λ = Duration time (t) Michael Höhle Analyse von Lebensdauern 80/ 85

86 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) Penalisierung mit Glättungsparameter (4) λ = Duration time (t) Michael Höhle Analyse von Lebensdauern 80/ 85

87 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) Bindungen (1) Falls es Bindungen bei den t i s gibt, ist eine Modifikation der o i s notwendig. Seien t n1 < t n2 <... < t nm die streng geordneten Beobachtungszeiten mit jeweils c j = n I (t i = t nj ), i=1 1 j m gleichen beobachteten Lebensdauern Die Modifikation besteht aus: ( ) m K Λ(α, β) = exp α 0 + α 1 t nj + β k (t nj ξ k ) + + õ j j=1 k=1 Michael Höhle Analyse von Lebensdauern 81/ 85

88 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) Bindungen (2) Die neuen Offsets õ j, j = 1,..., m, sind jetzt definiert als: ( 1 [ m õ 1 = log 2c1 t n1 + c j (t n2 + t n1 ) ]) 2 j=2 ( 1 [ m õ 2 = log c2 (t n2 t n1 ) + c j (t n3 t n1 ) ]) 2 j=3. ( 1 õ m 1 = log 2 ( 1 õ m = log 2 [ cm 1 (t nm 1 t nm 2 ) + c m (t nm t nm 1 ) ]) [ cm (t nm t nm 1 ) ]) Michael Höhle Analyse von Lebensdauern 82/ 85

89 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) Bindungen (3) Sei δ j = n i=1 δ i I (t i = t nj ) die Anzahl nicht zensierter Beobachtungen zum Zeitpunkt t nj. Die Loglikelihoodfunktion hat wiederum die Form: l(α, β) = m j=1 { δj ( ηj + õ j ) exp( ηj + õ j )}, wobei η j = α 0 + α 1 t nj + K β k (t nj ξ k ) + k=1 Dies entspricht wiederum der Form der Loglikelihoodfunktion eines log-linearen Poisson-Modells mit Pseudoresponse δ j und Designmatrix [1, t nj, (t nj ξ 1 ) +,..., (t nj ξ K ) + ]. Michael Höhle Analyse von Lebensdauern 83/ 85

90 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) Erweiterungen (1) Der Cai et al. (2002) Ansatz funktioniert auch für B-Splines anstelle von TP-Splines und für Splines mit höherem Polynomgrad. Wichtig ist nur, dass durch die Approximation mit der Trapezregel gilt, dass f i := exp ( f (t (i) ) ) { 1 } 2 (t (i) t (i 1) ) + (n i)(t (n+1) t (n) ) = exp ( ) f (t i ) + o i Bei Benutzung einer Spline der Ordnung 1 und Knoten an den beobachteten Survivalzeiten ist die Integration mittels Trapezregel exakt. Michael Höhle Analyse von Lebensdauern 84/ 85

91 Semiparametrische Schätzung von λ(t), Ansatz in Cai et al. (2002) Literatur I Abramowitz, M. und I. A. Stegun [1964]. Handbook of Mathematical Functions, Volume 55. National Bureau of Standards Applied Mathematics Series. Cai, T., R. J. Hyndman, und M. P. Wand [2002]. Mixed model-based hazard estimation. Journal of Computational and Graphical Statistics 11(4), Fahrmeir, L., T. Kneib, und S. Lang [2007]. Regression. Springer. Fleming, T. R. und D. P. Harrington [1991]. Counting Processes and Survival Analysis. Wiley. Hall, W. J. und J. A. Wellner [1980]. Confidence bands for a survival curve from censored data. Biometrika 67(1), Kauermann, G. [2005]. Penalized spline smoothing in multivariable survival models with varying coefficients. Computational Statistics & Data Analysis 49, Klein, J. P. und M. L. Moeschberger [1997]. Survival Analysis. Springer. Nair, V. N. [1984]. Confidence bands for survival functions with censored data: A comparative study. Technometrics 26(3), Michael Höhle Analyse von Lebensdauern 85/ 85

Seminararbeit. Der Lograng Test. Philipp Rütimann Thomas Hettinger

Seminararbeit. Der Lograng Test. Philipp Rütimann Thomas Hettinger Seminararbeit Der Lograng Test Philipp Rütimann Thomas Hettinger 6.Juni 26 Inhaltsverzeichnis 1 Kurze Repetition 3 2 Der Lograng Test 4 2.1 Test einer hypothetischen Hazardfunktion................. 4 2.2

Mehr

Überlebenszeitanalyse. Tempus neminem manet

Überlebenszeitanalyse. Tempus neminem manet Überlebenszeitanalyse Tempus neminem manet Remissionsdauer bei Leukämie Die Wirksamkeit des Medikaments 6-Mercaptopurin (6-MP) wurde in einer placebokontrollierten Studie an 42 Kindern mit akuter Leukämie

Mehr

Formelsammlung zur Vorlesung Lebensdaueranalyse

Formelsammlung zur Vorlesung Lebensdaueranalyse Lebensdauer- und Ereignisanalyse WiSe 9/ Michael Höhle Formelsammlung zur Vorlesung Lebensdaueranalyse erstellt von Susanne Konrath Einführung. Hazardrate und Survivalfunktion T stetig mit Verteilungsfunktion

Mehr

Die partielle Likelihood-Funktion

Die partielle Likelihood-Funktion Die partielle Likelihood-Funktion Roger Züst 12. Juni 26 1 Repetition: Maximum-Likelihood-Methode Hat man n unabhängige Beobachtungen x 1, x 2,..., x n einer Zufallsvariablen X und eine Familie von möglichen

Mehr

Kapitel 7 Punkt- und Zählprozesse

Kapitel 7 Punkt- und Zählprozesse Kapitel 7 Punkt- und Zählprozesse Grundlage für den modernen Zugang zu Verweildauer-und Ereignisanalyse. Poisson-Prozesse, Erneuerungs-, Markov-, Semi-Markov-Prozesse sind Spezialfälle. Wir betrachten

Mehr

Gemischte Modelle zur Schätzung geoadditiver Regressionsmodelle

Gemischte Modelle zur Schätzung geoadditiver Regressionsmodelle Gemischte Modelle zur Schätzung geoadditiver Regressionsmodelle Thomas Kneib & Ludwig Fahrmeir Institut für Statistik, Ludwig-Maximilians-Universität München 1. Regressionsmodelle für geoadditive Daten

Mehr

Stochastik Praktikum Lineare Modelle

Stochastik Praktikum Lineare Modelle Stochastik Praktikum Lineare Modelle Thorsten Dickhaus Humboldt-Universität zu Berlin 06.10.2010 Übersicht 1 Einfache lineare Regression 2 Multiple lineare Regression 3 Varianzanalyse 4 Verallgemeinerte

Mehr

Teil XI. Hypothesentests für zwei Stichproben. Woche 9: Hypothesentests für zwei Stichproben. Lernziele. Beispiel: Monoaminooxidase und Schizophrenie

Teil XI. Hypothesentests für zwei Stichproben. Woche 9: Hypothesentests für zwei Stichproben. Lernziele. Beispiel: Monoaminooxidase und Schizophrenie Woche 9: Hypothesentests für zwei Stichproben Patric Müller Teil XI Hypothesentests für zwei Stichproben ETHZ WBL 17/19, 26.06.2017 Wahrscheinlichkeit und Statistik Patric

Mehr

Kapitel 5 Erneuerungs- und Semi-Markov-Prozesse

Kapitel 5 Erneuerungs- und Semi-Markov-Prozesse Kapitel 5 Erneuerungs- und Semi-Markov-Prozesse Definition: Erneuerungsprozess Sei {T n, n N} eine Folge unabhängiger, nichtnegativer Zufallsvariablen mit Verteilungsfunktion F, mit F () < 1. Dann heißt

Mehr

Berechnung des LOG-RANK-Tests bei Überlebenskurven

Berechnung des LOG-RANK-Tests bei Überlebenskurven Statistik 1 Berechnung des LOG-RANK-Tests bei Überlebenskurven Hans-Dieter Spies inventiv Health Germany GmbH Brandenburger Weg 3 60437 Frankfurt hd.spies@t-online.de Zusammenfassung Mit Hilfe von Überlebenskurven

Mehr

Diagnose und Prognose: Kurzfassung 4

Diagnose und Prognose: Kurzfassung 4 Diagnose und Prognose: Kurzfassung 4 Ziele der 4. Vorlesung Inhaltliche Verbindung zwischen inhaltlicher Statistisches Konzept / Problemstellung Problemstellung und statistischem statistische Methode Konzept/Methode

Mehr

Survival Analysis. December 6, 2007

Survival Analysis. December 6, 2007 Survival Analysis René Böheim Rene.Boeheim@jku.at December 6, 2007 Basierend auf Cleves, Gould, and Gutierrez (2004), An Introduction to Survival Analysis using Stata, Revised Edition, Stata Press, Texas.

Mehr

Teil VIII Hypothesentests für zwei Stichproben

Teil VIII Hypothesentests für zwei Stichproben Woche 9: Hypothesentests für zwei Stichproben Teil VIII Hypothesentests für zwei Stichproben WBL 15/17, 22.06.2015 Alain Hauser Berner Fachhochschule, Technik und Informatik Berner

Mehr

Analyse von Ereigniszeiten

Analyse von Ereigniszeiten Survivalanalyse Analyse von Ereigniszeiten Lebensdauer = Zeit zwischen einem Startpunkt (Anfangsdatum) und einem aufgetretenen Ereignis (Enddatum) Startpunkte Diagnose einer Krankheit Beginn einer Behandlung

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 1 Inhalt der heutigen Vorlesung Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung der vorherigen Vorlesung Übersicht über Schätzung und

Mehr

Einführung Nichtparametrische Verfahren. Ereignisanalyse. Marcel Noack. 7. Mai 2008

Einführung Nichtparametrische Verfahren. Ereignisanalyse. Marcel Noack. 7. Mai 2008 7. Mai 2008 Inhaltsverzeichnis 1 Mathematische Grundlagen Der Datensatz 2 Zusammenhänge Mathematische Grundlagen Der Datensatz F (t) + S(t) = 1 Zusammenhänge Mathematische Grundlagen Der Datensatz F (t)

Mehr

Stochastik Praktikum Testtheorie

Stochastik Praktikum Testtheorie Stochastik Praktikum Testtheorie Thorsten Dickhaus Humboldt-Universität zu Berlin 11.10.2010 Definition X: Zufallsgröße mit Werten in Ω, (Ω, F, (P ϑ ) ϑ Θ ) statistisches Modell Problem: Teste H 0 : ϑ

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 11. Vorlesung Jochen Köhler 10.05.011 1 Inhalt der heutigen Vorlesung Zusammenfassung Parameterschätzung Übersicht über Schätzung und Modellbildung Modellevaluation

Mehr

Permutationstests II.

Permutationstests II. Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 1 Permutationstests II. 1. Zwei-Stichprobentest auf Variabilität 2. Mehrere Stichproben: Vergleich von Mittelwerten 3. Kurzer Exkurs: Präzision von Monte

Mehr

Analyse von Ereignisdaten Univ.-Prof. DI Dr. Andrea Berghold Institut für Med. Informatik, Statistik und Dokumentation

Analyse von Ereignisdaten Univ.-Prof. DI Dr. Andrea Berghold Institut für Med. Informatik, Statistik und Dokumentation Analyse von Ereignisdaten Univ.-Prof. DI Dr. Andrea Berghold Institut für Med. Informatik, Statistik und Dokumentation Analyse von Ereigniszeiten Lebensdauer = Zeit zwischen einem Startpunkt (Anfangsdatum)

Mehr

Statistische Analyse von Ereigniszeiten

Statistische Analyse von Ereigniszeiten Statistische Analyse von Survival Analysis VO Biostatistik im WS 2006/2007 1 2 3 : Leukemiedaten (unzensiert) 33 Patienten mit Leukemie; Zielvariable Überlebenszeit. Alle Patienten verstorben und Überlebenszeit

Mehr

Statistische Analyse von Ereigniszeiten II

Statistische Analyse von Ereigniszeiten II Statistische Analyse von Analysis VO Biostatistik im WS 2006/2007 1 : Daten zur Nephrektomie 2 3 4 : Daten zur Nephrektomie Studie zur Untersuchung der Wirksamkeit der Nephrektomie (Nierenentfernung) bei

Mehr

Einführung in die Induktive Statistik: Regressionsanalyse

Einführung in die Induktive Statistik: Regressionsanalyse Einführung in die Induktive Statistik: Regressionsanalyse Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Regressionsanalyse Ziel: Analyse

Mehr

Survival Analysis (Modul: Lebensdaueranalyse)

Survival Analysis (Modul: Lebensdaueranalyse) Survival Analysis (Modul: Lebensdaueranalyse) ROLAND RAU Universität Rostock, Sommersemester 2014 06. Mai 2014 c Roland Rau Survival Analysis 1 / 23 Fehler in Folie 7 der ersten Veranstaltung Statistische

Mehr

Wichtige Definitionen und Aussagen

Wichtige Definitionen und Aussagen Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge

Mehr

Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg

Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg Prof. Markus Schumacher, Dr. Stan Lai Physikalisches Institut Westbau 2 OG E-Mail: Markus.Schumacher@physik.uni-freiburg.de

Mehr

Bachelorprüfung: Statistik (1 Stunde)

Bachelorprüfung: Statistik (1 Stunde) Prof. H.R. Künsch D-BIOL, D-CHAB Winter 2010 Bachelorprüfung: Statistik (1 Stunde) Bemerkungen: Es sind alle mitgebrachten schriftlichen Hilfsmittel und der Taschenrechner erlaubt. Natels sind auszuschalten!

Mehr

Statistics, Data Analysis, and Simulation SS 2017

Statistics, Data Analysis, and Simulation SS 2017 Statistics, Data Analysis, and Simulation SS 2017 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Mainz, May 29, 2017 Dr. Michael O. Distler

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik 10. Vorlesung - 2018 Grundbegriffe der Statistik statistische Einheiten = Objekte an denen interessierende Größen erfaßt werden z.b. Bevölkerung einer Stadt; Schüler einer bestimmten Schule; Patienten

Mehr

Statistische Inferenz bei ROC Kurven. Notation. Man unterscheidet:

Statistische Inferenz bei ROC Kurven. Notation. Man unterscheidet: Statistische Inferenz bei ROC Kurven Notation Man unterscheidet: 1. Nichtparametrische, empirische Methoden zur Berechnung der empirischen ROC Kurve 2. Parametrische Ansätze, die recht starke Annahmen

Mehr

5 Allgemeine Verfahren zum Testen von Hypothesen

5 Allgemeine Verfahren zum Testen von Hypothesen 5 Allgemeine Verfahren zum Testen von Hypothesen 5.1 Likelihood Schätzung für multivariate Daten Statistisches Modell: Einfache Zufallsstichprobe X 1,..., X n (unabhängige Wiederholungen von X IR d ).

Mehr

Theorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte

Theorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte Hochschule RheinMain WS 2018/19 Prof. Dr. D. Lehmann Probe-Klausur zur Vorlesung Ökonometrie Theorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte (die eigentliche Klausur wird

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

i =1 i =2 i =3 x i y i 4 0 1

i =1 i =2 i =3 x i y i 4 0 1 Aufgabe (5+5=0 Punkte) (a) Bei einem Minigolfturnier traten 6 Spieler gegeneinander an. Die Anzahlen der von ihnen über das gesamte Turnier hinweg benötigten Schläge betrugen x = 24, x 2 = 27, x = 2, x

Mehr

Dr. L. Meier Statistik und Wahrscheinlichkeitsrechnung Sommer Musterlösung

Dr. L. Meier Statistik und Wahrscheinlichkeitsrechnung Sommer Musterlösung Dr. L. Meier Statistik und Wahrscheinlichkeitsrechnung Sommer 014 Musterlösung 1. 8 Punkte) a) 1 Pt)Für das Komplement gilt PR A) = 1 PR c A) = 0.968. b) 1 Pt)Nach Definition der bedingten Wahrscheinlichkeit

Mehr

Varianzkomponentenschätzung

Varianzkomponentenschätzung Qualitas AG Varianzkomponentenschätzung Peter von Rohr Qualitas AG Peter von Rohr Folien ZL I+II LFW C11 October 29, 2015 2 / 23 Multiple Lineare Regression Annahmen Modell y = Xb + e Varianz der Fehler

Mehr

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Zufallsvariable Erinnerung: Merkmal, Merkmalsausprägung Deskriptive Statistik:

Mehr

Statistik I für Betriebswirte Vorlesung 14

Statistik I für Betriebswirte Vorlesung 14 Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli

Mehr

Cox-Regression. Ausgangspunkt Ansätze zur Modellierung von Einflussgrößen Das Cox-Modell Eigenschaften des Cox-Modells

Cox-Regression. Ausgangspunkt Ansätze zur Modellierung von Einflussgrößen Das Cox-Modell Eigenschaften des Cox-Modells Cox-Regression Ausgangspunkt Ansätze zur Modellierung von Einflussgrößen Das Cox-Modell Eigenschaften des Cox-Modells In vielen Fällen interessiert, wie die Survivalfunktion durch Einflussgrößen beeinflusst

Mehr

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Stetige Zufallsvariable Verteilungsfunktion: Dichtefunktion: Integralrechnung:

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation

Mehr

Nachklausur Wahrscheinlichkeitstheorie und Inferenz II Sommersemester Oktober 2011

Nachklausur Wahrscheinlichkeitstheorie und Inferenz II Sommersemester Oktober 2011 Nachklausur Wahrscheinlichkeitstheorie und Inferenz II Sommersemester 2011 28. Oktober 2011 Prof. Dr. Torsten Hothorn Institut für Statistik Nachname: Vorname: Matrikelnummer: Anmerkungen: ˆ Schreiben

Mehr

Statistische Modellierung latenter Strukturen in den Lebens-, Sozial- und Wirtschaftswissenschaften

Statistische Modellierung latenter Strukturen in den Lebens-, Sozial- und Wirtschaftswissenschaften Statistische Modellierung latenter Strukturen in den Lebens-, Sozial- und Wirtschaftswissenschaften Überlick über Modelle für defizitäre Daten Seminarleiter: Prof. Dr. Thomas Augustin Betreuerin: Julia

Mehr

5 Interpolation und Approximation

5 Interpolation und Approximation 5 Interpolation und Approximation Problemstellung: Es soll eine Funktion f(x) approximiert werden, von der die Funktionswerte nur an diskreten Stellen bekannt sind. 5. Das Interpolationspolynom y y = P(x)

Mehr

Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen. Statistik II. Prof. Dr.

Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen. Statistik II. Prof. Dr. Statistik II Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen Statistik II 2. Parameterschätzung: 2.1 Grundbegriffe; 2.2 Maximum-Likelihood-Methode;

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests Nach Verteilungsannahmen: verteilungsabhängig: parametrischer [parametric] Test verteilungsunabhängig: nichtparametrischer [non-parametric] Test Bei parametrischen Tests

Mehr

Statistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Statistik 2 1. Klausur Sommersemester 2013 Hamburg, 26.07.2013 A BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................

Mehr

6. Schätzverfahren für Parameter

6. Schätzverfahren für Parameter 6. Schätzverfahren für Parameter Ausgangssituation: Ein interessierender Zufallsvorgang werde durch die ZV X repräsentiert X habe eine unbekannte Verteilungsfunktion F X (x) Wir interessieren uns für einen

Mehr

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) 3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =

Mehr

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) 3 Einfache lineare Regression Einfache lineare Modelle mit R 3.6 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula

Mehr

Mathematische Statistik Aufgaben zum Üben. Schätzer

Mathematische Statistik Aufgaben zum Üben. Schätzer Prof. Dr. Z. Kabluchko Wintersemester 2016/17 Philipp Godland 14. November 2016 Mathematische Statistik Aufgaben zum Üben Keine Abgabe Aufgabe 1 Schätzer Es seien X 1,..., X n unabhängige und identisch

Mehr

Basis-Kurs Statistik und SPSS für Mediziner Lösungen. SPSS-Übung Überlebenszeitanalyse

Basis-Kurs Statistik und SPSS für Mediziner Lösungen. SPSS-Übung Überlebenszeitanalyse Basis-Kurs Statistik und SPSS für Mediziner Lösungen SPSS-Übung Überlebenszeitanalyse Mit Datensatz Daten_Übung_Überlebenszeitanalyse.sav 1) Zeichnen Sie die Kaplan-Meier-Kurven des progressionsfreien

Mehr

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell 1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs

Mehr

Life Tables und Kaplan Meier

Life Tables und Kaplan Meier 9. Mai 2012 Inhaltsverzeichnis 1 Mathematische Grundlagen Der Datensatz 2 Zusammenhänge Mathematische Grundlagen Der Datensatz F (t) + S(t) = 1 P (T t) + P (T t) = P (Ω) = 1 t 0 f(u)du + t f(u)du = 0 f(u)du

Mehr

Konfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt

Konfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt Konfidenzintervalle Annahme: X 1,..., X n iid F θ. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt P θ (U θ O) = 1 α, α (0, 1). Das Intervall [U, O] ist ein Konfidenzintervall

Mehr

x t2 y t = 160, y = 8, y y = 3400 t=1

x t2 y t = 160, y = 8, y y = 3400 t=1 Aufgabe 1 (25 Punkte) 1. Eine Online Druckerei möchte die Abhängigkeit des Absatzes gedruckter Fotos vom Preis untersuchen. Dazu verwendet die Firma das folgende lineare Regressionsmodell: wobei y t =

Mehr

Theorie Parameterschätzung Ausblick. Schätzung. Raimar Sandner. Studentenseminar "Statistische Methoden in der Physik"

Theorie Parameterschätzung Ausblick. Schätzung. Raimar Sandner. Studentenseminar Statistische Methoden in der Physik Studentenseminar "Statistische Methoden in der Physik" Gliederung 1 2 3 Worum geht es hier? Gliederung 1 2 3 Stichproben Gegeben eine Beobachtungsreihe x = (x 1, x 2,..., x n ): Realisierung der n-dimensionalen

Mehr

Erneuerungs- und Semi-Markov-Prozesse

Erneuerungs- und Semi-Markov-Prozesse Kapitel 5 Erneuerungs- und Semi-Markov-Prozesse Für den Poisson-Prozess und (reguläre) diskrete Markov-Prozesse impliziert die Markov-Eigenschaft, dass die Zwischenzeiten bzw. Verweildauern exponentialverteilt

Mehr

BayesX: Bayesianische Inferenz in strukturiert additiven Regressionsmodellen

BayesX: Bayesianische Inferenz in strukturiert additiven Regressionsmodellen BayesX: Bayesianische Inferenz in strukturiert additiven Regressionsmodellen Institut für Statistik Ludwig-Maximilians-Universität München 1.12.2006 Outline Outline Disease Mapping (Analyse räumlich korrelierter

Mehr

Teil XII. Einfache Lineare Regression. Woche 10: Lineare Regression. Lernziele. Zusammenfassung. Patric Müller

Teil XII. Einfache Lineare Regression. Woche 10: Lineare Regression. Lernziele. Zusammenfassung. Patric Müller Woche 10: Lineare Regression Patric Müller Teil XII Einfache Lineare Regression ETHZ WBL 17/19, 03.07.2017 Wahrscheinlichkeit und Statistik Patric Müller WBL 2017 Wahrscheinlichkeit

Mehr

Ein exakter Test für die Meta-Analyse von Studien mit binären Endpunkten. Oliver Kuß, Cora Gromann

Ein exakter Test für die Meta-Analyse von Studien mit binären Endpunkten. Oliver Kuß, Cora Gromann Ein exakter Test für die Meta-Analyse von Studien mit binären Endpunkten Oliver Kuß, Cora Gromann Institut für Medizinische Epidemiologie, Biometrie und Informatik, Universität Halle-Wittenberg, Halle

Mehr

Überlebenszeit- und Rezidivanalysen

Überlebenszeit- und Rezidivanalysen Institut für Medizinische Biometrie Überlebenszeit- und Rezidivanalysen Dr. Christoph Meisner Gliederung 1. Ergebnisqualität in der Onkologie: u.a. Analyse der kumulierten Inzidenz von Ereignissen im Zeitverlauf

Mehr

Aufgaben. d) Seien X und Y Poissonverteilt mit Parameter µ, X, Y P(µ). 2. Dann ist die Summe auch Poissonverteilt mit (X + Y ) P(2µ).

Aufgaben. d) Seien X und Y Poissonverteilt mit Parameter µ, X, Y P(µ). 2. Dann ist die Summe auch Poissonverteilt mit (X + Y ) P(2µ). Aufgaben 1. Bei den folgenden 10 Fragen ist jeweils genau eine Antwort richtig. Es gibt pro richtig beantwortete Frage 1 Punkt und pro falsche Antwort 1/2 Punkt Abzug. Minimal erhält man für die gesamte

Mehr

4.2 Methoden um Tests zu finden: Likelihood Quotienten Tests (LRT) Falls X 1,..., X n iid aus f(x θ), so gilt für die Likelihood Funktion

4.2 Methoden um Tests zu finden: Likelihood Quotienten Tests (LRT) Falls X 1,..., X n iid aus f(x θ), so gilt für die Likelihood Funktion 4.2 Methoden um Tests zu finden: Likelihood Quotienten Tests (LRT) Falls X 1,..., X n iid aus f(x θ), so gilt für die Likelihood Funktion L(θ x) = f(x θ) = n f(x i θ). Falls L(θ x) > L(θ x), für θ, θ Θ,

Mehr

y t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen.

y t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen. Aufgabe 1 (25 Punkte Zur Schätzung des Werbe-Effekts in einem Getränke-Unternehmen wird das folgende lineare Modell aufgestellt: Dabei ist y t = β 1 + x t2 β 2 + e t. y t : x t2 : Umsatz aus Getränkeverkauf

Mehr

Modellanpassung und Parameterschätzung. A: Übungsaufgaben

Modellanpassung und Parameterschätzung. A: Übungsaufgaben 7 Modellanpassung und Parameterschätzung 1 Kapitel 7: Modellanpassung und Parameterschätzung A: Übungsaufgaben [ 1 ] Bei n unabhängigen Wiederholungen eines Bernoulli-Experiments sei π die Wahrscheinlichkeit

Mehr

Einführung in die Maximum Likelihood Methodik

Einführung in die Maximum Likelihood Methodik in die Maximum Likelihood Methodik Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Gliederung 1 2 3 4 2 / 31 Maximum Likelihood

Mehr

Statistik I für Betriebswirte Vorlesung 13

Statistik I für Betriebswirte Vorlesung 13 Statistik I für Betriebswirte Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 4. Juli 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Beispiel: Multiples Modell/Omitted Variable Bias I

Beispiel: Multiples Modell/Omitted Variable Bias I 4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss

Mehr

Glossar und Formelsammlung. Hazard Rate. Hazard Ratio =

Glossar und Formelsammlung. Hazard Rate. Hazard Ratio = Glossar und Formelsammlung Hazard Rate Die Hazard Rate steht für das Risiko, genau zum Zeitpunkt t ein Ereignis bei Überlebenszeitanalysen den Tod zu erleiden. Es handelt sich demnach um eine vom Zeitpunkt

Mehr

Kaplan-Meier und Nelson-Aalen Schätzer II Konsistenz und Vertrauensintervall

Kaplan-Meier und Nelson-Aalen Schätzer II Konsistenz und Vertrauensintervall Kaplan-Meier und Nelson-Aalen Schätzer II Konsistenz und Vertrauensintervall Christian Reichlin Michael Stadelmann 29. Mai 26 Statistik-Seminar bei Frau Prof. Dr. Sara van de Geer, Herrn Dr. Prof. Barbour,

Mehr

CIM2004 Übung 7: Permutationstest, Bootstrap & Jackknife

CIM2004 Übung 7: Permutationstest, Bootstrap & Jackknife CIM2004 Übung 7: Permutationstest, Bootstrap & Jackknife Michael Höhle hoehle@stat.uni-muenchen.de Lösung 24. Juni 2004 1 Permutationstest Bilirubin ist ein Zerlegungsprodukt von Haemoglobin. Falls die

Mehr

Lösung Übungsblatt 5

Lösung Übungsblatt 5 Lösung Übungsblatt 5 5. Januar 05 Aufgabe. Die sogenannte Halb-Normalverteilung spielt eine wichtige Rolle bei der statistischen Analyse von Ineffizienzen von Produktionseinheiten. In Abhängigkeit von

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur

Mehr

Lineare Regression. Kapitel Regressionsgerade

Lineare Regression. Kapitel Regressionsgerade Kapitel 5 Lineare Regression 5 Regressionsgerade Eine reelle Zielgröße y hänge von einer reellen Einflussgröße x ab: y = yx) ; zb: Verkauf y eines Produkts in Stückzahl] hängt vom Preis in e] ab Das Modell

Mehr

Die Stochastischen Eigenschaften von OLS

Die Stochastischen Eigenschaften von OLS Die Stochastischen Eigenschaften von OLS Das Bivariate Modell Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Wiederholung

Mehr

Vorlesung: Lineare Modelle

Vorlesung: Lineare Modelle Vorlesung: Lineare Modelle Prof Dr Helmut Küchenhoff Institut für Statistik, LMU München SoSe 2014 5 Metrische Einflußgrößen: Polynomiale Regression, Trigonometrische Polynome, Regressionssplines, Transformationen

Mehr

2.3 Intervallschätzung

2.3 Intervallschätzung 2.3.1 Motivation und Hinführung Bsp. 2.11. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler 2009 war genau 33.7%. Wie groß ist die Wahrscheinlichkeit, in einer Zufallsstichprobe von 1000 Personen genau

Mehr

Ein Vergleich von 2-Stichproben-Verfahren mit Berücksichtigung von Baselinewerten bei ordinalen Zielvariablen

Ein Vergleich von 2-Stichproben-Verfahren mit Berücksichtigung von Baselinewerten bei ordinalen Zielvariablen Ein Vergleich von 2-Stichproben-Verfahren mit Berücksichtigung von Baselinewerten bei ordinalen Zielvariablen Alexander Siemer Abteilung Medizinische Statistik Universität Göttingen 47. Biometrisches Kolloquium

Mehr

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem

Mehr

13 Grenzwertsätze Das Gesetz der großen Zahlen

13 Grenzwertsätze Das Gesetz der großen Zahlen 13 Grenzwertsätze 13.1 Das Gesetz der großen Zahlen Der Erwartungswert einer zufälligen Variablen X ist in der Praxis meist nicht bekannt. Um ihn zu bestimmen, sammelt man Beobachtungen X 1,X 2,...,X n

Mehr

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent

Mehr

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente... Inhaltsverzeichnis 1 Grundlagen der Wahrscheinlichkeitsrechnung 1 1.1 Wahrscheinlichkeitsräume Ein erster mathematischer Blick auf Zufallsexperimente.......... 1 1.1.1 Wahrscheinlichkeit, Ergebnisraum,

Mehr

Alternative Darstellung des 2-Stcihprobentests für Anteile

Alternative Darstellung des 2-Stcihprobentests für Anteile Alternative Darstellung des -Stcihprobentests für Anteile DCF CF Total n 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut

Mehr

Übung zur Vorlesung Statistik I WS Übungsblatt 9

Übung zur Vorlesung Statistik I WS Übungsblatt 9 Übung zur Vorlesung Statistik I WS 2012-2013 Übungsblatt 9 17. Dezember 2012 Aufgabe 26 (4 Punkte): In einer Studie mit n = 10 Patienten soll die Wirksamkeit eines Medikaments gegen Bluthochdruck geprüft

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2

Mehr

4. Verteilungen von Funktionen von Zufallsvariablen

4. Verteilungen von Funktionen von Zufallsvariablen 4. Verteilungen von Funktionen von Zufallsvariablen Allgemeine Problemstellung: Gegeben sei die gemeinsame Verteilung der ZV en X 1,..., X n (d.h. bekannt seien f X1,...,X n bzw. F X1,...,X n ) Wir betrachten

Mehr

2.3 Intervallschätzung

2.3 Intervallschätzung 2.3.1 Motivation und Hinführung Bsp. 2.15. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler unter allen Wählern war 2009 auf eine Nachkommastelle gerundet genau 33.7%. Wie groß ist die Wahrscheinlichkeit,

Mehr

Dr. L. Meier Statistik und Wahrscheinlichkeitsrechnung Sommer Musterlösung

Dr. L. Meier Statistik und Wahrscheinlichkeitsrechnung Sommer Musterlösung Dr. L. Meier Statistik und Wahrscheinlichkeitsrechnung Sommer 2015 Musterlösung 1. (9 Punkte) Emma ist Chefärztin am Universitätsspital Zürich. Im Frühjahr kommen viele Patienten, die über Symptome einer

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

Wie liest man Konfidenzintervalle? Teil II. Premiu m

Wie liest man Konfidenzintervalle? Teil II. Premiu m Wie liest man Konfidenzintervalle? Teil II Premiu m - Hintergrund Anderer Wahrscheinlichkeitsbegriff subjektiver Wahrscheinlichkeitsbegriff Beispiel: Was ist die Wahrscheinlichkeit dafür, dass ein Patient

Mehr

Teil XIII. Multiple lineare Regression. Woche 11: Multiple lineare Regression. Zusammenfassung Einfache lineare Regression.

Teil XIII. Multiple lineare Regression. Woche 11: Multiple lineare Regression. Zusammenfassung Einfache lineare Regression. Woche 11: Multiple lineare Regression Patric Müller Teil XIII Multiple lineare Regression ETHZ WBL 17/19, 10.07.017 Wahrscheinlichkeit und Statistik Patric Müller WBL

Mehr

Semiparametrische Multinomiale Logit-Modelle zur Markenwahl-Analyse

Semiparametrische Multinomiale Logit-Modelle zur Markenwahl-Analyse Semiparametrische Multinomiale Logit-Modelle zur Markenwahl-Analyse Thomas Kneib Institut für Statistik Ludwig-Maximilians-Universität München gemeinsam mit Bernhard Baumgartner Universität Regensburg

Mehr

Step-Down Prozeduren

Step-Down Prozeduren Step-Down Prozeduren zur Kontrolle der Family-Wise Error Rate WS 2010/2011 Jakob Gierl HU Berlin 07.02.2011 1 / 19 Modell Schrittweise Step-Down Modell mathematische Stichprobe X 1,..., X n iid im R J

Mehr

2. Fehlerhafte Auswahl der exogenen Variablen (Verletzung der A1-Annahme)

2. Fehlerhafte Auswahl der exogenen Variablen (Verletzung der A1-Annahme) 2. Fehlerhafte Auswahl der exogenen Variablen (Verletzung der A1-Annahme) Annahme A1: Im multiplen Regressionsmodell fehlen keine relevanten exogenen Variablen und die benutzten exogenen Variablen x 1,

Mehr

Schriftliche Prüfung (90 Minuten)

Schriftliche Prüfung (90 Minuten) Dr. M. Kalisch Prüfung Statistik I Winter 2016 Schriftliche Prüfung (90 Minuten) Bemerkungen: Erlaubte Hilfsmittel: 10 hand- oder maschinengeschriebene A4 Seiten (=5 Blätter). Taschenrechner ohne Kommunikationsmöglichkeit.

Mehr

8 Allgemeine Modelle & Robuste Regression

8 Allgemeine Modelle & Robuste Regression 8.1 Allgemeines Lineares Regressions-Modell 182 8 Allgemeine Modelle & Robuste Regression 8.1 Allgemeines Lineares Regressions-Modell a Modell. Y i F µ i, γ, g µ i = η i = x T i β b Weibull-Verteilung.

Mehr

So berechnen Sie einen Schätzer für einen Punkt

So berechnen Sie einen Schätzer für einen Punkt htw saar 1 EINFÜHRUNG IN DIE STATISTIK: SCHÄTZEN UND TESTEN htw saar 2 Schätzen: Einführung Ziel der Statistik ist es, aus den Beobachtungen eines Merkmales in einer Stichprobe Rückschlüsse über die Verteilung

Mehr