Step-Down Prozeduren zur Kontrolle der Family-Wise Error Rate WS 2010/2011 Jakob Gierl HU Berlin 07.02.2011 1 / 19
Modell Schrittweise Step-Down Modell mathematische Stichprobe X 1,..., X n iid im R J X i = (X i (1),..., X i (J)) P M M Nullhypothesen: M Alternativen: H 0 := {m H 0 (m) = 1} H 1 := {m H 1 (m) = 1} H 0 (1),..., H 0 (M) H 0 (m) := 1 (P M(m)) mit M(m) M H 1 (1),..., H 1 (M) H 1 (m) := 1 (P / M(m)) Menge der wahren Nullhypothesen Menge der falschen Nullhypothesen 2 / 19
Modell Schrittweise Step-Down Modell T n (1),..., T n (M) Teststatistiken (T n (1),..., T n (M)) Q n (P) (unbekannte Verteilung im R M ) Nullverteilung Q 0 schätzt Q n (P) V := V (n, M) := Anzahl der Fehler 1. Art (wahre Nullhypothese verworfen) FWER := P(V 1) Ziel: H 0 schätzen und dabei asymptotische FWER-Kontrolle gewährleisten, also lim sup P(V n 1) α n 3 / 19
Modell Schrittweise Step-Down Ein-Schritt und Schrittweise üblich: T m (X 1,..., X n ) > c(m) H 0 (m) wird abgelehnt Einschrittverfahren: kritische Werte c(m) = c(q 0, α)(m) sind unabhängig von den anderen Tests (siehe Vortrag von Mathias Trabs) Schrittweise : kritische Werte c(m) = c(t n, Q 0, α)(m) dürfen von Statistiken (Daten) abhängen (z.b. die im Folgenden behandelten Step-Down ) 4 / 19
Modell Schrittweise Step-Down Step-Down Hypothesen zu den signikantesten Teststatistiken werden sukzessive geprüft. Sobald eine Nullhypothese akzeptiert wird, werden alle weiteren Hypothesen ungeprüft ebenfalls akzeptiert. Signikanz z.b.: gröÿte absoulute Teststatistik ( maxt-) kleinste unbereinigte p-werte ( minp-) 5 / 19
Modell Schrittweise Step-Down Step-Down : Visualisierung H 0 (1) H 0 (2) H 0 (3) H 0 (4) H 0 (5) H 0 (4) H 0 (1) H 0 (2) H 0 (5) H 0 (3)??? 6 / 19
exakte Agenda Darstellung des s Theorem: Theorem: exakte : Step-Down maxt, Schätzung der Nullverteilung 7 / 19
exakte (Q 0,1,..., Q 0,M ): stetige Randverteilungen der Nullverteilung Q 0 unadjustierte p-werte: P 0n (m) := 1 Q 0m (T n (m)) P 0 (m) := 1 Q 0m (Z(m)) mit Z = (Z(1),..., Z(M)) Q 0 (P 0n (m) [0, 1]) o.b.d.a.: P 0n (1)... P 0n (M) 8 / 19
exakte Für A {1,..., M} und ein multiples Niveau α denieren wir α-quantile c(a) := c(a, Q 0, α) := F 1 A,Q 0 (α) := inf {z F A,Q0 (z) α} ) mit F A,Q0 (z) := P Q0 ( min m A P 0(m) z (mit wachsendem A ist c(a) monoton fallend) Für Teilmengen A m := {m,..., M} denieren wir C n (m) := c(a m, Q 0, α) := F 1 A m,q 0 (α) 9 / 19
exakte Kritische Werte: c 1 := { C n (1) Cn (m), falls P c m := 0n (m 1) < c m 1 0, sonst Entscheidungsregel Lehne die Nullhypothese H 0 (m) zum m-ten signikantesten (d.h. kleinsten) unadjustierten p-wert ab, falls P 0n (m) < c m. Kurz: R(T n, Q 0, α) = {m P 0n (m) < c m } 10 / 19
exakte P 0n (1) < C n (1) ablehnen. P 0n (m 1) < C n (m 1) ablehnen P 0n (m) C n (m) akzeptieren P 0n (m + 1) 0 akzeptieren. P 0n (M) 0 akzeptieren 11 / 19
exakte Annahme und Theorem 1 Annahme AP1 - asymptotische Null-Dominanz Nullverteilung Q 0 : ( lim sup P Qn min P 0n (m) < x n m H 0 ( ) P Q0 min P 0 (m) < x m H 0 ) x R Theorem 1 - Es sei Annahme AP1 erfüllt. Dann gilt für das : lim sup P (V n 1) α n Beweis: ( ) 12 / 19
exakte Annahme und Theorem 2 Annahme AP2 - asymptotische Trennbarkeit von wahren und falschen Nullhypothesen ( ) ɛ > 0: lim P Q n n max P 0n (m) ɛ = 1 m H 1 ( ) lim P Q n n min P 0n (m) ɛ = 0 m H 0 lim ɛ 0 α (0, 1): min c(a, Q 0, α) > 0 A {1,...,M} 13 / 19
exakte Annahme und Theorem 2 Wenn die Annahmen AP1 und AP2 erfüllt sind, gilt nach dem ersten Theorem erst recht: lim sup P (V n 1) α n Verfeinerung: Theorem 2 - exakte Es seien Annahmen AP1 und AP2 erfüllt. Falls auÿerdem Annahme AP1 strikt gilt (= statt ) und Q 0 stetig ist, gilt: lim sup P (V n 1) = α n Beweis: ( ) 14 / 19
exakte äquivalente Umformulierung des s Bemerkung: äquivalente Formulierung P 0n (1) := P 0n(1) P 0n (m) := { P0n (m), falls P 0n (m 1) < C n(m 1) 1, sonst Entscheidungsregel: Wir lehnen H 0 (m) ab, falls P 0n (m) < C n(m). 15 / 19
exakte äquivalente Umformulierung des s original P 0n (1) < C n(1). P 0n (m 1) < C n(m 1) P 0n (m) C n(m) P 0n (m + 1) 0. P 0n (M) 0 äquivalent P 0n (1) < Cn(1). P 0n (m 1) < Cn(m 1) P 0n (m) Cn(m) 1 C n(m + 1). 1 C n(m) ablehnen. ablehnen akzeptieren akzeptieren. akzeptieren 16 / 19
Step-Down maxt Ein ganz ähnliches ist das Step-Down maxt. Hier werden anstatt der unadjustierten p-werte Maxima der Teststatistiken betrachtet. Theorem 1 und 2 gelten hier analog. Wenn die Teststatistiken identisch verteilt sind, sind beide äquivalent. Allgemein ist minp besser ausbalanciert (bewegt sich auf dem Einheitsintervall). 17 / 19
Schätzung der Nullverteilung Es lassen sich Nullverteilungen konstruieren, die unsere Annahme AP1 erfüllen (siehe Vortrag von Mathias Trabs). In der Praxis ist die Verteilung P der Daten unbekannt, also auch die Nullverteilung Q 0 (P). Ein konsistenter Schätzer für Q 0 lässt sich mittels Bootstrap- konstruieren (siehe Mathias Trabs). Die Step-Down funktionieren für diesen analog. (Details siehe van der Laan et al., 2004) 18 / 19
Vielen Dank für eure Aufmerksamkeit! 19 / 19