Nichtparametrische Statistik - Abschnitt 29: Die Pitmanschen Permutationstests

Ähnliche Dokumente
Spezielle stetige Verteilungen

9 Die Normalverteilung

Diskrete Wahrscheinlichkeitstheorie - Probeklausur

8. Konfidenzintervalle und Hypothesentests

Lösungsvorschlag zu den Hausaufgaben der 8. Übung

Statistik II. Statistische Tests. Statistik II

(Man sagt dafür auch, dass die Teilmenge U bezüglich der Gruppenoperationen abgeschlossen sein muss.)

Kapitel 6 Martingale

Gewöhnliche Dierentialgleichungen

Universität des Saarlandes Seminar der Fachrichtung Mathematik Rudolf Umla

Topologische Räume und stetige Abbildungen Teil 2

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Scheinklausur Stochastik 1 für Studierende des Lehramts und der Diplom-Pädagogik

Stochastische Eingangsprüfung,

Caputo fraktionale Differentialgleichungen. 1 Riemann Liouville fraktionale Differentialgleichungen

2 Mengen und Abbildungen

Mathematische und statistische Methoden II

Ebene algebraische Kurven

3.4 Asymptotische Evaluierung von Sch atzer Konsistenz Konsistenz Definition 3.4.1: konsistente Folge von Sch atzer

Die komplexen Zahlen und Skalarprodukte Kurze Wiederholung des Körpers der komplexen Zahlen C.

Übungen zur Vorlesung MATHEMATIK II

Mathematik für Biologen

Interpolation. Nadine Losert. Ausarbeitung zum Vortrag im Proseminar Analysis (Wintersemester 2008/09, Leitung PD Dr.

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Simulation von Zufallsvariablen und Punktprozessen

Die Varianz (Streuung) Definition

Absolute Stetigkeit von Maßen

Mathematik für Informatiker II Übungsblatt 7

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp

Punktprozesse. Andreas Frommknecht Seminar Zufällige Felder Universität Ulm

Statistik IV. Modul P8: Grundlagen der Statistik II Vorlesung P8.1: Wahrscheinlichkeitstheorie und Inferenz II

Lösung zu den Testaufgaben zur Mathematik für Chemiker II (Analysis)

Kapitel VI. Euklidische Geometrie

Gleichmäßige Konvergenz und Funktionenräume

Thema14 Der Satz über inverse Funktionen und der Satz über implizite Funktionen

Übungen zur Vorlesung Funktionentheorie Sommersemester Lösungshinweise zum Klausurvorbereitungsblatt. (z) i f. 2xe (x2 +y 2) i2ye (x2 +y 2 ) 2

Stetigkeit von Funktionen

Bedingte Wahrscheinlichkeiten und Unabhängigkeit

1 Eingebettete Untermannigfaltigkeiten des R d

Kapitel 12 Stetige Zufallsvariablen Dichtefunktion und Verteilungsfunktion. stetig. Verteilungsfunktion

Taylorentwicklung von Funktionen einer Veränderlichen

Hypothesentest, ein einfacher Zugang mit Würfeln

Thema 4 Limiten und Stetigkeit von Funktionen

STETIGKEITS- UND KONVERGENZMODI FÜR FUNKTIONEN UND FUNKTIONENFOLGEN

Vorlesung. Funktionen/Abbildungen

Flüsse, Fixpunkte, Stabilität

Seminarvortrag aus Reiner Mathematik Existenz von Primitivwurzeln

Die Gamma-Funktion, das Produkt von Wallis und die Stirling sche Formel. dt = lim. = lim = Weiters erhalten wir durch partielle Integration, dass

18 Höhere Ableitungen und Taylorformel

Vertiefung NWI: 13. Vorlesung zur Wahrscheinlichkeitstheorie

Lösungsvorschläge Blatt 4

Analysis I - Stetige Funktionen

Übungsblatt 9. f(x) = e x, für 0 x

4. Vektorräume und Gleichungssysteme

Der Abschluss D ist die Menge, die durch Hinzunahme der Intervallränder entsteht, in den obigen Beispielen also

ε δ Definition der Stetigkeit.

K8 Stetige Zufallsvariablen Theorie und Praxis

4.1 Grundlegende Konstruktionen Stetigkeit von Funktionen Eigenschaften stetiger Funktionen... 92

Lineare Gleichungssysteme (Teschl/Teschl 11.1)

Lineare Abhängigkeit

8. Stetige Zufallsvariablen

Satz 16 (Multiplikationssatz)

4. Übungsblatt zur Mathematik I für Maschinenbau

Lösungen zu Aufgabenblatt 7P

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:

Kapitel VI - Lage- und Streuungsparameter

Die Optimalität von Randomisationstests

Iterative Verfahren, Splittingmethoden

WURZEL Werkstatt Mathematik Polynome Grundlagen Teil II

1 Elemente der Wahrscheinlichkeitstheorie

Mathematik II Frühlingsemester 2015 Kap. 9: Funktionen von mehreren Variablen 9.2 Partielle Differentiation

Webinar Induktive Statistik. - Wahrscheinlichkeitsrechnung - Stichprobentheorie

Lösungen zu den Übungsaufgaben in Kapitel 10

Grundbegriffe der Wahrscheinlichkeitstheorie

Surjektive, injektive und bijektive Funktionen.

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Biomathematik für Mediziner, Klausur SS 2001 Seite 1

Stetigkeit. Kapitel 4. Stetigkeit. Peter Becker (H-BRS) Analysis Sommersemester / 543

9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83

Beurteilende Statistik

Analysis II (FS 2015): Vektorfelder und Flüsse

Lösungsvorschläge zum 14. Übungsblatt.

Mathematik für Biologen

Aussagen hierzu sind mit einer unvermeidbaren Unsicherheit behaftet, die statistisch über eine Irrtumswahrscheinlichkeit bewertet wird.

Mathematische Methoden in den Ingenieurwissenschaften 1. Übungsblatt

3 Vektorbündel und das Tangentialbündel

Kapitel 5. Stetige Funktionen 5.1. Stetigkeit

Höhere Mathematik I für die Fachrichtung Informatik. Lösungsvorschläge zum 2. Übungsblatt

Formale Sprachen. Spezialgebiet für Komplexe Systeme. Yimin Ge. 5ahdvn. 1 Grundlagen 1. 2 Formale Grammatiken 4. 3 Endliche Automaten 5.

Dierentialgleichungen 2. Ordnung

Aufgaben für die 6. Übung zur Vorlesung Mathematik 2 für Informatiker: Analysis Sommersemester 2010

Rhetorik und Argumentationstheorie.

27 Taylor-Formel und Taylor-Entwicklungen

1 Zahlentheorie. 1.1 Kongruenzen

ETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig)

1.4 Der Binomialtest. Die Hypothesen: H 0 : p p 0 gegen. gegen H 1 : p p 0. gegen H 1 : p > p 0

Beispielaufgaben rund um Taylor

1 Sprechweisen und Symbole der Mathematik

Dynamische Systeme eine Einführung

Kapitel 2 Wahrscheinlichkeitsrechnung

Transkript:

Nichtparametrische Statistik - Abschnitt 29: Die Pitmanschen Permutationstests Seminarvortrag Blockseminar zur Wahrscheinlichkeitstheorie Master of Science Westfälische Wilhelms-Universität Münster Fachbereich Mathematik und Informatik Institut für Mathematische Statistik Betreuung: Prof. Dr. Matthias Löwe Andrea Winkler Referent: Jörn Borrink Münster, de5. Februar 2013

Inhaltsverzeichnis 29.Die Pitmanschen Permutationstests 1 29.1. Der stetige Fall............................... 2 29.1.1. Zweistichprobenvergleich...................... 2 29.1.2. Verbundene Stichproben...................... 17 29.2. Der diskrete Fall - Ausblick........................ 20 A. Anhang 21 A.1. Stochastische Majorisierung........................ 21 A.2. Testtheorie.................................. 22 I

29. Die Pitmanschen Permutationstests Literatur Die einzige Quelle dieses Seminars ist das Kapitel 5 des Skriptes zur Mathematischen Statistik von Gerold Alsmeyer (3. Auage 2009. Einleitendes Beispiel: Für die Behandlung einer Krankheit liegen zwei neue und völlig verschiedene Methoden (Medikamente I und II vor. Zur Überprüfung, ob Methode I zur Behandlung besser geeignet ist als Methode II, könnten Patienten mit den Methoden behandelt werden und der Erfolg der Behandlung durch eine Kennzahl dargestellt werden, wobei höhere Zahlen für bessere Ergebnisse stehen. Denkbar wären zum Beispiel folgende Szenarien: 1. Die Patienten bilden eine inhomogene Gruppe. Daher werden mittels dem Zufallsprinzip von n Patienten mit Methode I und n 2 = n mit Methode II behandelt. Jeder Patient liefert am Ende der Behandlung einen Messwert, so dass zum Beispiel folgende Tabelle zustande kommen könnte: I 6,8 10,8 5,9 7,2 5,3 II 12,6 6,9 10,3 13,8 2. Die Patienten besitzen bestimmte identische Ausprägungen (z.b Zwillinge und können daher zu Paaren zusammengefügt werden. Nun wird der eine Patient eines Paares mit Methode I und der andere Patient mit Methode II behandelt. Jedes Paar liefert dann am Ende der Behandlung einen Messwert, wobei Werte gröÿer 0 für Methode I und Werte kleiner 0 für Methode II sprechen. Eine Beobachtung könnte zum Beispiel sein: I-II -5,8 3,9-4,4-6,6 Da die beiden Produkte neuartig sind, ist keinerlei Aussage über die Verteilung des Genesungsprozesses möglich, d.h. wir können keine sinnvolle (gerechtfertigte Annahme über den vorliegenden Verteilungstyp machen. Damit ist die Anwendung von bekannten 1

Zweistichprobenvergleich 2 guten Tests, wie zum Beispiel dem t-test oder X 2 -Test, nicht möglich. Interessante Fragen: Ist es möglich (zu einen Niveau α (0, 1 die Behauptung 'Methode I ist zur Behandlung besser geeignet als Methode II' zu überprüfen? Und wie würden in diesem Fall die optimalen Tests aussehen und was heiÿt in diesem Kontext eigentlich optimal? Lassen sich für das Testproblem zum Beispiel gleichmäÿig beste unverfälschte oder gleichmäÿig beste invariante Tests zum Niveau α (0, 1 herleiten? Ziel dieses Vortrags ist die Beantwortung dieser Fragen, also die Entwicklung 'optimaler' Tests unter Verwendung einiger Restriktionen in den beiden obigen Szenarien. 29.1. Der stetige Fall Wir gehen in diesem Abschnitt davon aus, dass die Beobachtungen einer stetigen Verteilung unterliegen. Diese Annahme ist durchaus kritisch zu hinterfragen, welches wir kurz im Ausblick auf den diskreten Fall erläutern werden (siehe 29.2. 29.1.1. Zweistichprobenvergleich Problemstellung 29.1 (Zweistichprobenvergleich Zum Vergleich der Güte zweier Verfahren (Behandlungsmethoden I und II werden Messungen unter Verwendung von Verfahren I und n 2 Messungen unter Verwendung von Verfahren II durchgeführt. Auf der Grundlage der Ergebnisse, repräsentiert durch X 11,..., X 1n1 und X 21,..., X 2n2 für Verfahren I bzw. II, soll entschieden werden, ob Verfahren I besser ist als II, wobei sich gröÿere Güte durch höhere Meÿwerte ausdrückt. Modell 29.2 (Zweistichprobenvergleich Wir machen folgende Annahmen: ˆ (X ij i=1,2,,...,ni sind stochastisch unabhängig ˆ X ij Q i für i = 1, 2 und j = 1,..., n i ˆ (Q 1, Q 2 Θ mit dem Parameterraum Θ := {(Q 1, Q 2 : Q i stetiges W'Maÿ auf (R, B und Q 1 Q 2 oder Q 1 Q 2 }

Zweistichprobenvergleich 3 Erläuterung der Annahmen: Zum einen sichern wir mit der Wahl von Θ, dass die beiden Methoden vergleichbar sind, wodurch eine Untersuchung überhaupt sinnvoll ist. Zum anderen forderen wir gleichzeitig, dass die einzelnen Versuchsergebnisse der Patientenbehandlungen unabhängig und identisch verteilt sind (X ij Q i. Dies impliziert, dass der Behandlungserfolg unabhängig vom heutigen Zustand des Patienten ist. Lezteres ist eine sehr wünschenswerte Voraussetzung, da Abhängigkeiten das Ergebnis verfälschen könnten: Stellen wir uns zum Beispiel die 20-jährige Sportstudentin Sarah vor, die gerade ihren dritten Marathon für dieses Jahr absolviert hat und der die Ernährung unglaublich wichtig ist (ausgewogen, vitaminreich und den 70-jährigen Bankchef Harald, der vor lauter Schreibtischarbeit sowie Stress dem Rauchen und den Süÿigkeiten im überdimensionalem Maÿe zuspricht, die 100kg Marke mit Leichtigkeit übertrumpft sowie chronisch hohen Blutdruck besitzt. Nun werden Sarah und Harald am selben Tag mit einer Krebsdiagnose eingeliefert. Der Stationschef entscheidet sich dazu, Sarah mit Methode I und Harald mit Methode II zu behandeln, und wird in der Folge die Methode verwenden, welche schneller zur vollständigen Heilung geführt hat. Durch die Missachtung der unterschiedlichen Voraussetzungen von Sarah (jung, sportlich, gut ernährt und Harald (alt, übergewichtig, seit Jahren Raucher kann dieses Vorgehen des Stationschefs nun aber zu einer Fehlentscheidung führen, wenn Sarah zuerst geheilt ist. In diesem Fall kann trotzdem Methode II die bessere sein, da sie den 'schwierigen' Patienten zu heilen hatte. Insbesondere ist ein Testergebnis im Bezug auf Abhängigkeiten zwischen den Patienten bzw. zwischen Patient und Krankheit/Behandlung kritisch zu hinterfragen. Gehen wir nun zurück zum Modell und setzen X = (X 11,..., X 1n1, X 21,..., X 2n2 und n = + n 2, so erhalten wir das statistische Experiment E = (R n, B n, (Q 1 Q n 2 2 (Q1,Q 2 Θ. Das Testproblem lässt sich nun präzisieren in der Form H = {(Q 1, Q 2 Θ : Q 1 Q 2 } gegen K = {(Q 1, Q 2 Θ : Q 1 Q 2 } ˆ= I ist nicht besser als II ˆ= I ist besser als II

Zweistichprobenvergleich 4 Lemma 29.3 In der Problemstellung 29.1 gilt ˆ E (Q1,Q 2 (ϕ = α für alle (Q 1, Q 2 J = H K und ϕ Φ u α ˆ J = Θ = := {(Q 1, Q 2 Θ : Q 1 = Q 2 }, d.h. {P X : J} = {Q 1 Q n 2 2 : (Q 1, Q 2 Θ = } = {Q n : Q stetiges W'Maÿ auf (R, B} Bemerkung 29.4 Bezeichnen T 1,(, T 2,( die OS der ersten und zweiten Teilstichprobe von x, genauer T i,( (x = (x i,(1,..., x i,(ni, i = 1, 2, und denieren wir T = (T 1,(, T 2,(, so ist die Statistik T suzient für das Experiment E = (R n, B n, (Q 1 Q n 2 2 (Q1,Q 2 Θ. Bemerkung 29.5 Die Statistik V V = T ( : (x 11,..., x 2n2 (x (11,..., x (2n2 := x ( ist vollständig und suzient für (P X J. Optimalität im Zweistichprobenvergleich: Bisher sind für das vorgestellte Testproblem weder gleichmäÿig beste unverfälschte noch gleichmäÿig beste invariante Tests zum Niveau α (0, 1 bekannt. Aus diesem Grund werden wir uns mit der Angabe eines unverfälschten Tests zum Niveau α begnügen, der lediglich auf einer interessanten Teilmenge K 1 der Alternative K den Fehler 2. Art gleichmäÿig unter allen J-ähnlichen Tests zum Niveau α minimiert. Wir suchen also eine Lösung ϕ von ϕ Φ u α E ϕ (X = max E ϕ(x ϕ Φ u α für alle K 1 K Dies bedeutet, die Hypothese H wird gegen eine eingeschränkte Alternative K 1 K getestet, wobei die Menge K 1 im Folgenden genauer speziziert wird.

Zweistichprobenvergleich 5 Satz 29.6 (Einseitiger Pitman-Zweistichprobentest Sei K 1 := { (Q 1, Q 2 K : β 1 > β 2, g 0 : dq } i dλλ (x = C β i e βix g(x für i = 1, 2. Zum Niveau α (0, 1 wird der Pitman-Test durch 1 > ϕ (x = γν falls x 1j = c ν 0 < (29.1 deniert, ν = V (x = x ( für x R n, wobei sich γ ν [0, 1 und c ν aus der Gleichung { 1 } { n! x R n : x ( = ν, x 1j > c ν + γ ν n! x R n : x ( = ν, x 1j = cν} = α bestimmen. Dann gilt: (29.2 (a ϕ ist gleichmäÿig bester Test für H gegen K 1 unter allen J-ähnlichen Tests zum Niveau α, d.h. ϕ Φ J,α und E (ϕ = max ϕ Φ J,α E (ϕ für alle K 1. (b ϕ ist ein unverfälschter Test zum Niveau α für H gegen K, d.h. ϕ Φ u α. Bemerkung 29.7 Teilmengen von K 1 sind zum Beispiel M 1 = { ( N (µ + ξ, σ 2, N (µ, σ 2 : (µ, ξ, σ R (0, 2 } M 2 = { ( Γ(α, β ξ, Γ(α, β : (α, β (0, 2, ξ (0, β} M 3 = { ( Exp(β ξ, c, Exp(β, c : (β, c (0, 2, ξ (0, β} wobei Exp(β, c die auf (0, c gestutzte Exponentialverteilung mit λλ-dichte bezeichnet. f(x = βe βx 1 e βc 1 (0,c(x

Zweistichprobenvergleich 6 Beweis von Satz 29.6(a. Beweisidee: Konstruktion des gleichmäÿig besten Test für H gegen K 1, welcher letztendlich ϕ sein wird. Hierzu gliedern wir den Beweis in drei Schritte. (1 Umformung des Problems: Sei ϑ K 1. Gesucht ist ein Test ˆϕ mit Wir wissen bereits, dass die Statistik V ˆϕ Φ J,α und E ϑ ( ˆϕ = max ϕ Φ J,α E ϑ (ϕ. (29.3 V = T ( : (x 11,..., x 2n2 (x (11,..., x (2n2 := x ( vollständig und suzient für (P X J, sowie die Statistik T T = (T 1,(, T 2,( : (x 11,..., x 2n2 (x 1(1,..., x 1(n1, x 2(1,..., x 1(n2 suzient für E = (R n, B n, (Q 1 Q n 2 2 (Q1,Q 2 Θ ist. Insbesondere gilt somit, dass die Funktion E (ϕ V auf J konstant ist und wir verwenden die Notation E J (ϕ V für {E (ϕ V J}. Mithilfe dieser beiden Statistiken folgt unter Anwendung von Lemma A.13 und Lemma A.14 (Kapital 20: bedingte Tests, dass ein Test ˆϕ die obigen Forderungen (29.3 genau dann erfüllt, wenn ˆϕ Φ J,α = { ϕ : E J (ϕ V = α } P X -f.s. für alle J und E ϑ ( ˆϕ V E ϑ (ϕ V P X ϑ -f.s. für alle ϕ Φ J,α. Durch Übergang zu bedingten Verteilungen nehmen diese beiden Forderungen die Form ˆϕ Φ J,α = { ϕ : ˆϕ dpϑ ϕ dpj ϕ dpϑ } = α P V (X -f.s. für alle J, (29.4 P V (X ϑ -f.s. für alle ϕ Φ J,α (29.5 an. Die Idee besteht nun darin, für jedes ϑ K 1 einen optimalen Test ˆϕ ϑ, also einen Test, der (29.4 und (29.5 erfüllt, zu konstruieren. Hierzu benötigen wir zuerst die konkrete Form der regulär bedingten Verteilung von X gegeben V (X = ν.

Zweistichprobenvergleich 7 (2 Herleitung der bedingten Verteilungen P für Θ: Für Θ gilt P X (Rn (X = 1, also oensichtlich auch PV (R n < = 1. Für jedes ν R n < ist P eine diskrete Verteilung auf der Menge {K π (ν : π S n } = {(ν π(1,..., ν π(n : π S n } = {x R n : V (x = ν} (29.6 := X ν (29.7 Gegeben ein = (Q 1, Q 2 Θ sei Q ein dominierendes σ-endliches Maÿ für Q 1, Q 2 (z.b. Q = Q 1 +Q 2 und f i := dq i für i = 1, 2. Bezeichnen wir nun mit h dq die Q n -Dichte von P X = Q 1 Q n 2 2, also und setzen weiter h (x = d(q 1 Q n 2 2 dq n (x = 2 n i f i (x ij, i=1 h (x := π S n h K π (x, = π S n h ((x π(1,..., x π(n, so gilt P = x X ν h (x h (ν δ x für Θ mit h (ν > 0, 1 für Θ mit h 42 (ν = 0. (29.8 Auf J ergibt sich insbesondere PJ = 1 n! x X ν δ x, (29.9 wobei δ x das Dirac-Maÿ in x bildet. Bevor die Formel (29.8 bewiesen wird, noch eine kurze Bemerkung zur Herkunft der Formel: Für ν R n < mit h (ν > 0 ist nach (29.6 h (ν = h (x x X ν

Zweistichprobenvergleich 8 und somit P = 1 h (xδ x h (ν x X ν 1 = h (xδ x. h (x x X ν x:v (x=ν Interpretieren kann man dies unter der Voraussetzung P ({V (X = ν} > 0 als Beweis der Gleichung (29.8: P (X V (X = ν = P ({X } {V (X = ν}. P ({V (X = ν} Für die regulär bedingte Verteilung P C P gilt für alle B B n R n, C Bn R n < (B P V (X (dν = P (X B, V (X C und sie ist P V (X -f.s. eindeutig. Damit genügt es zu zeigen, dass für alle B B n R n und C B n R n < gilt. C ( h (x x X ν h (ν 1 B(x P V (X (dν = P (X B, V (X C Für beliebiges C B n R n < betrachten wir P V (X (C = P X (V 1 (C. Es gilt V 1 (C = {x : V (x C} = ν C{x : V (x = ν} und mit C R n < folgt nach (29.6 V 1 (C = ν C{K π (ν : π S n } = {K π (ν} ν C π S n = {K π (ν} π S n ν C := π S n K π (C.

Zweistichprobenvergleich 9 Behauptung: Die (K π (C π Sn sind paarweise disjunkt. Beweis: Angenommen, es gilt x K π (C Kˆπ (C (insbesondere ist dann x R n. Dann existieren ν, ˆν C mit also gilt x = K π (ν und x = Kˆπ (ˆν, (29.10 V (x = V (K π (ν = ν und V (x = V (Kˆπ (ˆν = ˆν, da ν, ˆν R n <, und somit ν = ˆν. Nach (29.10 bedeutet dies also folgt π = ˆπ. K π (ν = Kˆπ (ν = x R n, V 1 (C ist somit Vereinigung der disjunkter Mengen K π (C, π S n, und es ergibt sich mit K 1 π = K π 1( P V (X (C = P X (V 1 (C = P X ( K π (C π S n = π S n P X (K π (C = π S n K π(c h dq n = h (K π K π 1(ν Q n (dν π S K 1 n π 1 (C = h (K π (ν (Q n K π 1 (dν π S n = π S n = = C C C C h (K π (ν Q n (dν π S n h (K π (ν Q n (dν h (ν Q n (dν. Es gilt also auf B n R n < h = dpv (X dq n.

Zweistichprobenvergleich 10 Damit folgt aber für alle B B n R n und C Bn R n < C ( h (x x X ν h (ν 1 B(x P V (X (dν ( h (x = C {h >0} x X ν h (ν 1 B(x h (ν Q n (dν ( = h (x1 B (x Q n (dν C {h >0} x X ν und mit {K π (ν : π S n } = {x R n : V (x = ν} nach (29.6 folgt = = C {h >0} K π 1 (C {h >0} = π S n h (K π (ν1 B (K π (ν Q n (dν π S n h (ν1 B (ν Q n (dν π S n B K π 1 (C {h >0} h (ν Q n (dν = ( P X B K π 1(C {h > 0}. π S n Die Mengengleichheit {π : π S n } = {π 1 : π S n } (da (S n, eine Gruppe ist liefert = π S n P X ( B K π (C {h > 0} ( ( = P X B K π (C {h > 0} π S ( n = P X B, X K π (C {h > 0} π S n = P (X B, X (V 1 (C {h > 0} = P (X B, V (X (C {h > 0} = P (X B, V (X C, wobei im letzen Schritt P (V (X {h = 0} = {h =0} h dq n = 0 verwendet wird.

Zweistichprobenvergleich 11 Insgesamt gilt also C Da h (ν > 0 P V (X ( h (x x X ν h (ν 1 B(x P V (X (dν = P (X B, V (X C. -f.s., besitzt die bedingte Verteilung P die Form in (29.8. Für = (Q 1, Q 1 J = Θ = ergibt sich mit Q = Q 1 oenkundig h = 1 sowie h = n!, was zu führt. PJ = 1 n! x X ν δ x (3 Anwendung des Neyman-Pearson-Lemma: Mit der in Abschnitt 20 (bedingte Tests entwickelten Theorie ergibt sich das weitere Vorgehen. Auf jeder der disjunkten Mengen X ν = {x R n : V (x = ν}, ν Rn <, wird ein bester Test zum Niveau α für P gegen P konstruiert. Ist ϕ ein Test, der für alle ν R n < den Bedingungen J ϕ dpj = α (29.11 ϕ dpϑ = max ϕ: ϕ dpj =α genügt, so folgt E ϑ ϕ E ϑ ϕ für alle ϕ Φ J,α. ϑ ϕ dpϑ (29.12 Begründung: (siehe auch Satz 20.4 im Alsmeyer-Skript Für jedes ϕ Φ J,α bildet N = {ν R n : ϕ dpj α} eine (P V (X J - Nullmenge und damit auch eine P V (X ϑ -Nullmenge für alle ϑ K, denn (P V (X J dominiert (P V (X Θ. Da aber nach (29.12 für ν N c ϕ dpϑ gilt, ergibt sich die Behauptung mittels E ϑ (ψ = ψ dpϑ ϕ dpϑ, dp V (X ϑ.

Zweistichprobenvergleich 12 Gesucht ist also ein Test ϕ mit den Eigenschaften (29.11 und (29.12, der zusätzlich nicht von ϑ K abhängt. Da dies nicht für alle ϑ K möglich ist, wählen wir die Menge K 1 der Verteilungspaare mit Exponentialdichten bezüglich eines λλ-stetigen Maÿes gλλ. Sei also ϑ = (Q 1, Q 2 K 1. Dann gilt mit Q = λλ 2 h (x = d(q 1 Q n 2 dq n 2 = d(q 1 Q n 2 dλλ n 2 n i = f i (x ij = i=1 (x (x 2 n i C βi e β ix ij g(x ij i=1 = C β 1 C n 2 β 2 exp ( 2 i=1 β i n i 2 x ij i=1 n 2 = C β 1 C n 2 β 2 exp (β 1 x 1j + β 2 ( = C β 1 C n 2 β 2 exp (β 1 β 2 ( = C β 1 C n 2 β 2 exp n i (β 1 β 2 x 1j + β 2 g(x ij n i g(x ij 2 x 2j i=1 n 2 2 n i x 1j + β 2 ( x 1j + x 2j g(x ij n n ν j g(ν j mit ν = (ν 1,..., ν n := V (x. Ein bester Test ϕ ν auf X ν für PJ ist nach dem Neyman-Pearson-Lemma gegeben durch 1 > (X=ν PX V ϑ ({x} ϕ ν (x = γ ν (ϑ falls = k ν (ϑ, PJ ({x} 0 < wobei k ν (ϑ, γ ν (ϑ durch die Gleichung ϕ ν dpj gilt auf X ν nach Schritt 2 ϑ P ({x} PJ ({x} = y X ν h (y δ h (ν y(x 1 n! y X ν δ y (x = h (x h (ν n! i=1 gegen Pϑ = α festgelegt werden. Nun

Zweistichprobenvergleich 13 = ( C β 1 C n 2 β 2 exp (β 1 β 2 x 1j + β n 2 ν n j g(ν j h (ν n!, welches oensichtlich monoton wachsend in x 1j ist (β 1 > β 2. Dies impliziert aber die Gleichheit der Mengen { P ({x} P ϑ J ({x} } { n1 > = k ν (ϑ = < } x > 1j = c ν (ϑ < mit c ν (ϑ eindeutig festgelegt durch k ν (ϑ. Aus der Forderung ϕ ν dpj = α (29.13 ergibt sich mittels der regulär bedingten Verteilung in (29.9 und der Mengengleichheit (29.13 α = ϕ ν dpj = x X ν ϕ ν (x P J (x = ϕ ν (x 1 n! x X ν = 1 ( 1 n1 n! { x 1j>c + γ ν(ϑ} ν(ϑ1 n1 { x 1j=c ν(ϑ} x X ν = 1 1 n1 n! { x 1j>c + γ ν(ϑ ν(ϑ} 1 n! { x X ν x X ν = 1 { n! x R n : x ( = ν, x 1j > c ν (ϑ} + γ { ν(ϑ n! x R n : x ( = ν, x 1j = c ν (ϑ} n1 x 1j=c ν(ϑ} Dies bedeutet aber, dass c ν (ϑ, γ ν (ϑ nicht von ϑ abhängen (wohl aber von ν bzw. x. Mit c ν := c ν (ϑ und γ ν := γ ν (ϑ ergibt sich für jedes ϑ K 1, dass 1 > ϕ ν (x = γν falls x 1j = c ν 0 <

Zweistichprobenvergleich 14 der gleichmäÿig beste Test für H gegen {ϑ} unter allen J-ähnlichen Tests zum Niveau α ist. Durch ϕ (x = ϕ V (x (x erhalten wir dann den gleichmäÿig besten Test für H gegen K 1 unter allen J-ähnlichen Tests zum Niveau α ist. Beweis von Satz 29.6(b. Wir verweisen hier auf Alsmeyer, Mathematische Statistik, Seite 203. Bemerkung 29.8 (Durchführung des Tests Für die Auswertung eines Tests wird eine Vertafelung der kritischen Werte c ν benötigt. In Gegensatz zu der Statistik-Vorlesung, wo zum Beispiel im Kapital "Tests im Zusammenhang mit der Normalverteilung" der kritische Wert immer ein durch die Wahl von α eindeutig bestimmtes Quantil (Fraktil einer bekannten Verteilungsfunktion darstellte, ist c ν aufgrund von ν = V (x = x ( von der Realisation abhängig und eine Vertafelung daher nicht möglich. Im Folgenden möchte ich eine einfache Vorgehensweise zur Bestimmung des kritischen Wertes c ν vorführen: Sei v I := {ν i : i I}, I {1,..., n}, I =. Es gibt ( n Teilmengen von {1,..., n} und zu diesen I1,..., I ( n denieren wir die Summen s j = i I j ν i, 1 j ( n, derart dass s1 s 2... s ( n. Dann können wir γν darstellen durch γν = α( { n νi : ν i ν ν i > c } I ν { ν I : ν i ν I ν i = cν} Begründung: Für x = (x 11,..., x 1n1, x 21,..., x 2n2 R n hat die Permutation der forderen und die der hinteren n 2 Einträge keinen Einuss auf die Summe x 1j. Daher gilt { { x R n : x ( = v, x 1j > cv} = ν I : ν i > cν}! n 2! ν i ν I sowie { { x R n : x ( = v, x 1j = cv} = ν I : ν i = cν}! n 2!. ν i ν I

Zweistichprobenvergleich 15 Hieraus ergibt sich { 1 n! } { x R n : x ( = v, x 1j > c v + γ v n! x R n : x ( = v, x 1j = cv} = α 1 { n! {ν I : } { ν i > c ν! n 2! + γ v n! ν I : ν i = cν}! n 2! = α ν i ν I ν i ν I ( 1 { n ν I : } { ν i > c ν + γ v ( n ν I : ν i = cν} = α ν i ν I ν i ν I und somit die Formel für γ ν. Aus der Annahme, dass allen Beobachtungen eine stetige Verteilung zugrundeliegt, lässt sich aber weiter leicht folgern, dass für (P V (X Θ -fast alle ν sogar s 1 >... > s ( n gilt. Mit k := α ( n und c ν = s k +1 folgt somit ( n γν = α α ( n [0, 1. Beispiel 29.9 (Anwendung des einseitigen Pitman-Zweistichprobentest Wir können nun die Behauptung Methode I ist besser als Methode aus dem einleitenden Beispiel zum Niveau α (0, 1 testen. Wir beitzen also folgende Daten: ˆ α = 0, 05, ˆ = 5, n 2 = 4 (also n = 9 sowie ˆ die Meÿwerte bei Anwendung von Verfahren I bzw. II: Es gilt somit ˆ ( n = ( 9 5 = 126, I 6,8 10,8 5,9 7,2 5,3 II 12,6 6,9 10,3 13,8 ˆ k = α ( n = 0, 05 126 = 6 sowie ˆ γ ν = α ( n α ( n = 0, 3 Hieraus ergibt sich c ν := s k +1 = s 7, dies bedeutet, wir müssen die 7 gröÿten Summen aus jeweils = 5 Meÿwerten bilden:

Zweistichprobenvergleich 16 5,3 5,8 6,8 6,9 7,2 10,3 10,8 12,6 13,8 i I ν i 54, 7 54, 4 54, 3 53, 3 52, 8 51, 3 51, 2 Der einseitige Pitman-Zweistichprobentest ist also gegeben durch 1 > ϕ (x = 0, 3 falls x 1j = 51, 2 0 < (29.14 Da x 1j = 6, 8 + 10, 8 + 5, 9 + 7, 2 + 5, 3 = 36 < 51, 2 ist ϕ (x = 0. Der Test entscheidet sich also für die Hypothese "Verfahren I ist nicht besser als Verfahren II", wobei dies bedeutet, dass die Alternative zum Niveau α = 0, 05 nicht gesichert angenommen werden kann (die Hypothese kann bei Tests zum Niveau α nie gesichert angenommen werden, da nicht bekannt ist, wie groÿ der minimierte Fehler 2.Art ist. Bemerkung 29.10 Das Resultat im obigen Beispiel legt nahe, die Hypothese und Alternative zu vertauschen, um "Verfahren II ist besser als Verfahren I" zum Niveau α zu verizieren. D.h. die Rollen der beiden Verfahren werden vertauscht (also Ĩ=II und ĨI=I und wir testen "Verfahren Ĩ ist besser als ĨI". Aufgrund der Gleichheit ( ( n = n n 2 gilt auch in diesem Test c ν = s 7, wobei nun die 7 gröÿsten Summen aus jeweils 4 Meÿwerten gebildet werden müssen: 5,3 5,8 6,8 6,9 7,2 10,3 10,8 12,6 13,8 i I ν i 47, 5 44, 4 44, 1 44, 0 43, 9 43, 6 43, 5

Verbundene Stichprobe7 Es ergibt sich c ν = 43, 5 < 43, 6 = 12, 6 + 6, 9 + 10, 3 + 13, 8 und ϕ (x = 1. Damit kann zum Niveau α = 0, 05 "Verfahren II ist besser als Verfahren I" veriziert werden. 29.1.2. Verbundene Stichproben Erinnern wir uns an die Annahmen in der Problemstellung 29.1, so haben wir deren Gültigkeit in der Realität kritisch geäugt. Dies lag vor allem an der Tatsache, dass das Behandlungsergebnis häug vom sonstigen Zustand des Patienten (Alter, Sportlichkeit, Ernährungsgewohnheiten abhängt. In unserem überspitzten Beispiel mit Sarah und Harald wurde deutlich, dass die Behandlungsergebnisse der Methoden I und II nur sinnvoll interpretierbar sind, wenn die Patienten identische Voraussetzungen mitbringen. Optimal wäre daher ein und dieselbe Person zuerst mit Methode I und beim nächsten Krankheitsausbruch mit Methode II zu behandeln. Die verbundene Stichprobe nimmt diesen Ansatz auf, indem sie Paare von Patienten bildet, deren Eigenschaften in möglichst vielen heilungsrelevanten Komponenten übereinstimmen. Problemstellung 29.11 (Verbundene Stichprobe Modikation des Zweistichprobenvergleichs Zum Vergleich zweier Behandlungsmethoden I und II werden dieses Mal zunächst Paare von Versuchseinheiten mit gleichartigen Komponenten (z.b. eineiige Zwillinge, Augenpaare gebildet und anschlieÿend auf ein Mitglied eines Paares Methode I, auf das andere Mitglied Methode II angewendet. Die Dierenz der Meÿwerte interpretiert man als Auswirkung der Unterschiede zwischen I und II, wobei sich gröÿere Güte wie zuvor durch höhere Meÿwerte ausdrückt. Wir bezeichnen die Meÿwerte im i-ten Paar, i = 1,..., n, mit X 1i und X 2i, wobei (X 11,..., X 1n die Ergebnisse bei Verwendung von Methode I und (X 21,..., X 2n die Ergebnisse bei Verwendung von Methode II repräsentieren. Modell 29.12 (Verbundene Stichprobe Wir machen folgende Annahmen ˆ Die Vektoren (X 11, X 21,..., (X 1n, X 2n sind stochastisch unabhängig und identisch verteilt

Verbundene Stichprobe8 ˆ Die Stichprobendierenz X i : = X 1i X 2i, X i : = X 2i X 1i, i = 1,..., n i = 1,..., n besitzt eine stetige Verteilung P bzw. P. ˆ F bezeichne die Verteilungsfunktion der X i und F die der X i, d.h. es gilt F (t = 1 F ( t für alle t R. ˆ P F mit Parameterraum F := {Q : Q stetiges W'Maÿ auf (R, B mit Q Q oder Q Q } Wir wollen überprüfen, ob Methode I besser ist als Methode II. Mathematisch bedeutet dies, dass die Verteilung der X i die der X i stochastisch majorisiert, d.h. für alle t R gilt P((t, P ((t, mit strikter Ungleichheit für mindestens ein t. Das Testproblem lässt sich also in der Form H = {Q F : Q Q } gegen K = {Q F : Q Q } ˆ= I ist nicht besser als II ˆ= I ist besser als II bei gegebenem statistischem Experiment E = (R n, B n, (Q n Q F präzisieren. Lemma 29.13 In der Problemstellung 29.11 gilt ˆ E Q (ϕ = R n ϕ dq n = α für alle Q J = H K und ϕ Φ u α ˆ J = F s := {Q F : Q = Q }, d.h. J ist die Menge der stetigen, in 0 symmetrischen Verteilungen auf (R, B.

Verbundene Stichprobe9 Bemerkung 29.14 Die Statistik V V : x = (x 1..., x n x ( := T ( ( x 1,..., x n ist vollständig und suzient für (Q n Q Fs. Auch für die Modikation des Zweistichprobenvergleichs sind bisher weder gleichmäÿig beste unverfälschte noch gleichmäÿig beste invariante Tests zum Niveau α (0, 1 bekannt. Daher begnügen wir uns erneut mit der Angabe eines unverfälschten Tests zum Niveau α, der lediglich auf einer interessanten Teilmenge K 1 der Alternative K den Fehler 2. Art gleichmäÿig minimiert. Satz 29.15 (Einseitiger Pitman-Symmetrietest Sei K 1 := { P K : dp } dλλ (x = C βe βx g( x mit β > 0 und g 0. Zum Niveau α (0, 1 wird der Pitman-Symmetrietest durch 1 > n ϕ (x = γv, falls x j = c v 0 < (29.15 deniert, v = V (x = x ( := T ( ( x 1,... x n für x R n = := {y R n : y i y j für i j}, wobei sich γ v [0, 1 und c v { 1 2 n n! x R n = : x ( = v, bestimmen. Dann gilt: aus der Gleichung n } { x j > c v + γ v 2 n n! x R n = : x ( = v, n x j = cv} = α (a ϕ ist gleichmäÿig bester Test für H gegen K 1 unter allen J-ähnlichen Tests zum Niveau α (J = F s, d.h. ϕ Φ J,α und E (ϕ = max ϕ Φ J,α E (ϕ für alle K 1. (b ϕ ist ein unverfälschter Test zum Niveau α für H gegen K, d.h. ϕ Φ u α.

Der diskrete Fall - Ausblick 20 Beweis von Satz 29.15. Die Beweisführung ist weitgehend analog zum Beweis des Satzes 29.6. Bemerkung 29.16 Als Teilmenge von K 1 sei hier M 1 = {N (µ, σ 2 : (µ, σ 2 (0, 2 } erwähnt. 29.2. Der diskrete Fall - Ausblick Kritikpunkt von Anwendern: Die Voraussetzung stetig verteilter Beobachtungen, die dafür sorgt, dass (mit Wahrscheinlichkeit 1 keine Bindungen innerhalb der Stichprobe entstehen. Die Kritiker berufen sich auf die begrenzte Meÿgenauigkeit in der Praxis, aufgrund derer man eigentlich immer nur diskrete Messdaten erhält. Daher ist die Annahme, dass nur bindungsfreie Realisationen möglich sind (selbst wenn die Beobachtungen tatsächlich von einer stetigen Verteilung herrühren, nicht gerechtfertigt. In diesem Subabschnitt wird nun die Parametermenge D = D(S := {(Q 1, Q 2 : Q i W'Maÿ mit Träger S und Q 1 Q 2 oder Q 1 Q 2 }, anstelle von Θ bzw. D = D(S := {Q : Q W'Maÿ mit Träger S und Q Q oder Q Q }, anstelle von F zugrundegelegt. Hierbei ist S eine beliebige abzählbare Teilmenge von R, wobei typischerweise S = dz für ein d > 0 gilt. Betrachten wir den Beweis von Aussage (a des einseitigen Pitman-Zweistichprobentests, so fällt auf, dass nur bei der Berechnung der bedingten Verteilung P die Stetigkeit der auftretenden Verteilungen verwendet wurde. Es verursacht aber keine gröÿeren Probleme die Verteilung P im diskreten Fall (also unter der Annahme, dass ν identische Einträge besitzen kann zu berechnen. Daher können die Pitmanschen Permutationstests für den diskreten Fall aufgestellt und mit dem analogen Vorgehen wie im stetigen Fall bewiesen werden.

A. Anhang A.1. Stochastische Majorisierung Denition A.1 (stochastisch gröÿer Seien Q und P zwei W'Maÿe auf (R, B. Dann heiÿt Q stochastisch gröÿer als P (alternative Q majorisiert P, falls Q((x, P((x, [F Q (x F P (x] für alle x R. Notation: Q P. Gilt auÿerdem P Q, so schreiben wir Q P. Die anschauliche Interpretation liegt auf der Hand: Q ist stochastisch gröÿer als P, wenn Q für jeden Wert x R mehr Masse rechts von x als P besitzt. Dies impliziert: Satz A.2 Seien X, Y Zufallsvariablen sowie Q, P W'Maÿe mit X Q, Y P. Dann gilt die Implikation Q P EX EY. 21

Gleichmäÿig beste Tests 22 A.2. Testtheorie Setting: Gegeben sei ein statistisches Experiment E = (X, A, (W Θ, bestehend aus einem messbaren Raum (X, A und einer Familie (W Θ von W'Maÿen auf (X, A. Zudem sei X : (Ω, F (X, A eine Zufallsvariable mit P X = W. Denition A.3 (Statistik/Test Sei (X, A ein Messraum. Eine messbare Funktion T : (X, A (X, A heiÿt Statistik. Ein Test oder eine Testfunktion auf X ist eine Statistik ϕ mit ϕ : X [0, 1]. Wir betrachten in den folgenden Abschnitten ein Testproblem H gegen K mit ˆ H, K Θ ˆ H K = Θ und ˆ H K =. A.2.1. Gleichmäÿig beste Tests Denition A.4 (Test zum Niveau α Ein Test ϕ heiÿt Test zum Niveau α (0, 1, falls E ϕ(x α für alle H. Es bezeichne Φ α die Gesamtheit aller Tests zum Niveau α. Denition A.5 (Gleichmäÿig bester Test Ein Test ϕ heiÿt gleichmäÿig bester Test zum Niveau α (0, 1, falls ϕ Φ α und E ϕ (X = max ϕ Φ α E ϕ(x für alle K.

Unverfälschte Tests 23 Satz A.6 (Neyman-Pearson-Lemma Seien Q 0 und Q 1 W'Maÿe auf (X, A mit Dichten f 0 bzw f 1 bzgl. eines dominierenden Maÿes µ (etwa µ = Q 0 + Q 1. Ferner sei α (0, 1 und Φ α = {ϕ : ϕ Test mit ϕ dq 0 α}. Dann gilt: ˆ (Hinreichende Bedingung Sei ψ ein Test mit 1. ψ dq 0 = α 2. Es existiert ein k [0, derart, dass 1 f 1 (x > kf 0 (x ψ(x = 0 f 1 (x < kf 0 (x µ-f.ü. (A.1 Dann folgt ψ dq 1 = max ϕ Φ α ϕ dq 1. (A.2 ˆ (Existenz Es existiert ein Test ψ, der die Voraussetzungen (A.1 und (A.2 erfüllt. A.2.2. Unverfälschte Tests Denition A.7 (Unverfälschtheit Ein Test ϕ heiÿt unverfälscht zum Niveau α (0, 1, falls ˆ E ϕ(x α ˆ E ϕ(x α für alle H für alle K Es bezeichne Φ u α die Gesamtheit aller unverfälschten Tests zum Niveau α. Denition A.8 (Gleichmäÿig bester unverfälschter Test Ein Test ϕ heiÿt gleichmäÿig bester unverfälschter Test zum Niveau α (0, 1, falls ϕ Φ u α und E ϕ (X = max E ϕ(x für alle K. ϕ Φ u α

Suenz und Vollständigkeit von Statistiken 24 A.2.3. J-ähnliche Tests Denition A.9 (J-Ähnlichkeit Sei J eine beliebige Teilmenge von Θ. Ein Test ϕ : X [0, 1] heiÿt ähnlich auf J zum Niveau α oder auch J-ähnlich zum Niveau α, falls E (ϕ(x = α für alle J. Die Menge aller solcher Tests bezeichnen wir mit Φ J,α. Satz A.10 Bezeichne W = W(X, A die Menge der W'Maÿe auf (X, A. Sei ϕ ein Test auf (X, A und H, K der topologische Abschluss von H, K bzgl. d V (d V (P, Q := sup A A P(A Q(A. Dann gilt 1. die Gütefunktion P E P ϕ ist gleichmäÿig stetig auf W(X, A bezüglich d V. 2. Ist ϕ ein unverfälschter Test zum Niveau α für H gegen K, wobei H, K W beliebig mit J = H K, so ist ϕ J-ähnlich zum Niveau α. A.2.4. Suenz und Vollständigkeit von Statistiken Denition A.11 (Suzienz Eine Statistik T : (X, A (X, A heiÿt suzient für E, falls für jedes A A eine meÿbare Abbildung W(A T = : X [0, 1] existiert, so dass W (A T = für jedes Θ eine Version der faktorisierten bedingten Wahrscheinlichkeit W (A T = bildet. Dies bedeutet, dass W (A T 1 (A = W (A T = t W T (dt A für alle A A, A A und Θ gelten soll. X T (X=t Eine Statistik T heiÿt also suzient für E, falsch die bedingte Verteilung P unter jedem P dieselbe ist, d.h. von nicht mehr abhängt. Denition A.12 (Vollständigkeit Eine Statistik T : (X, A (X, A heiÿt vollständig für E, falls die Implikation gilt: E f(t (X = 0 f.a. Θ f 0 P T (X -f.s. f.a. Θ

Bedingte Tests (Kapital 20 Alsmeyer 25 A.2.5. Bedingte Tests (Kapital 20 Alsmeyer Nun sei E = (X, A, (W Θ ein statistisches Experiment mit Θ R d, d 2. Zudem bezeichne T : (X, A (X, A eine suziente Statistik für E und wir denieren E ϑ,t (ϕ := E ϑ (ϕ T (X. Wegen der Suzienz von T existiert zu jedem Text ϕ ein ebenso guter Test φ der Form ψ T, und zwar φ = W (ϕ T. Aus diesem Grund betrachten nur noch das durch T reduzierte Experiment E T = (X, A, (W T Θ, wobei jetzt Φ J,α die Menge aller J-ähnlichen Tests ψ : X [0, 1] bezeichne. Lemma A.13 (Lemma 20.2 im Alsmeyer Sei V : (X, A (X, A eine vollständige und suziente Statistik für (W T J. Dann gilt: ψ Φ J,α E,T (ψ V = α W T -f.s. für alle J. Lemma A.14 (Lemma 20.3 im Alsmeyer Sei ϑ Θ \ J und V wie in Lemma A.13. Dann gilt für ψ Φ J,α : E ϑ,t (ψ = max ψ Φ J,α E ϑ,t (ψ E ϑ,t (ψ V E ϑ,t (ψ V W T ϑ -f.s. für alle ψ Φ J,α. Zusammenfassend besagen A.13 und A.14, dass bei Vorliegen einer vollständigen und suzienten Statistik V für W T J die folgenden Problemstellungen äquivalent sind: 1. Finde einen Test ψ * : X [0, 1] mit ˆ E,T (ψ = α für alle J ˆ E ϑ,t (ψ = max ψ Φ J,α E ϑ,t (ψ 2. Finde einen Test ψ * : X [0, 1] mit ˆ E,T (ψ V = α W T -f.s. für alle J ˆ E ϑ,t (ψ V E ϑ,t (ψ V W T ϑ -f.s. für alle ψ Φ J,α