Anwendung der Theorie von Gauß Shift Experimenten auf den Kolmogorov Smirnov Test und das einseitige Boundary Crossing Problem Inauguraldissertation zur Erlangung des Doktorgrades der Mathematisch Naturwissenschaftlichen Fakultät der Heinrich Heine Universität Düsseldorf vorgelegt von Michael Kunz aus Düsseldorf Düsseldorf 1999
dissertation.de Verlag im Internet Sonderausgabe des Werkes mit der ISBN-Nummer: 3-89825-076-8 Gedruckt mit der Genehmigung der Mathematisch-Naturwissenschaftlichen Fakultät der Heinrich-Heine-Universität Düsseldorf Referent: Prof. Dr. A. Janssen, Düsseldorf Korreferent: Prof. Dr. N. Henze, Karlsruhe Tag der mündlichen Prüfung: 21.1.2000 dissertation.de Verlag im Internet Leonhardtstr. 8-9 D-14 057 Berlin Email: Internetadresse: dissertation.de@snafu.de http://www.dissertation.de
Inhaltsverzeichnis Einleitung 3 1 Ein Signalerkennungsproblem 9 1.1 Das Signalerkennungsproblem mit Brownscher Brücke als Rauschterm................................ 9 1.2 Testverfahren fürdassignalerkennungsproblem............ 11 2 Gauß-Shift-Experimente 15 2.1 Einführung in die Theorie der Gauß Shift Experimente........ 15 2.2 Das Signalerkennungsproblem als Gauß-Shift-Experiment....... 20 2.3 Einige Resultate und Sprechweisen................... 21 2.4 Der Kolmogorov Smirnov Test als Limestest.............. 24 3 Einhüllende Gütefunktionen für Gauß Shift Experimente 31 3.1 Ein Maximierungsproblem........................ 31 3.2 Ein Minimierungsproblem........................ 51 3.3 Einige Anwendungen auf Signalerkennungsprobleme.......... 55 3.3.1 Signalerkennungsprobleme mit Brownscher Brücke als Rauschterm................................ 56 3.3.2 Signalerkennungsprobleme mit Brownscher Bewegung als Rauschterm................................ 59 4 Eine weitere Verallgemeinerung des einseitigen Kolmogorov Smirnov Tests 61 1
9 9 9 5 Approximationen und Schranken für Übertrittswahrscheinlichkeiten beim Boundary Crossing Problem 71 5.1 Abschnittweise lineare Übertrittsfunktionen.............. 72 5.2 Konvexe und konkave Übertrittsfunktionen............... 78 5.3 Eine weitere Approximation....................... 84 5.4 Eine untere Abschätzung für eine beliebige Übertrittsfunktion.... 86 5.5 Abschätzungen durch die LösungenderOptimierungsprobleme.... 1 5.6 Übertrittswahrscheinlichkeiten fürdiebrownschebewegung..... 3 5.6.1 Übertrittswahrscheinlichkeiten für einen unendlichen Zeithorizont............................... 3 5.6.2 Übertrittswahrscheinlichkeiten für einen finiten Zeithorizont. 95 A Einfache Übertrittswahrscheinlichkeiten 97 B Anmerkungen zur Simulation Brownscher Brücken 103 Symbolverzeichnis 106 Abbildungsverzeichnis 110 Literaturverzeichnis 113 2
Einleitung In der vorliegenden Arbeit beschäftigen wir uns zunächst mit Gütefunktionen von Tests für beliebige Gauß Shift Experimente. Bezeichnet (H,, ) einen Hilbertraum mit zugehörigem Skalarprodukt,, so versteht man unter einem Gauß Shift mit Parameterraum (H,, ) einexperiment E =(Ω, A, {P h : h H}), mit P h P 0 für h H, dessen Dichtequotienten bzgl. des dominierenden Maßes P 0 die folgende Struktur haben: dp h =exp(l(h) 1 dp 0 2 h 2 ), h H, dabei bezeichnet L einen in h linearen Gaußschen stochastischen Prozeß, für den gilt: L(L(h) P 0 )=N(0, h 2 ). Gauß Shift Experimente spielen in der LAN Theorie von LeCam [15] die Rolle von Limesexperimenten (LAN steht dabei für Lokale Asymptotische Normalität und bezeichnet eine geeignete Konvergenz). Man erhält unmittelbar, daß z.b. die Lokationsfamilie der multivariaten Normalverteilung {P h := N(h, Id) : h IR d } auf dem Meßraum (IR d, B d )eingauß Shift Experiment mit zugehörigem (im Allgemeinen auch oft zentral genannten) stochastischen Prozeß L(h)(x) := h, x ist. Diese Familie stellt für d = 1dasein- fachste Gauß Shift Experiment dar. 3
Ein weiteres Beispiel für ein Gauß Shift Experiment stellt das als Signalerkennungsproblem (SEP) mit Brownscher Brücke als Rauschterm bezeichnete Experiment E =(C 0, B(C 0 ), {L(τ(h)+B B 0 ):h H 0 }) dar. Dabei sei C 0 := {f : [0; 1] IR f stetig, f(0) = f(1) = 0}, B( ) seidas kanonische Auswertungsfunktional auf C 0,d.hfür 0 t 1 setzen wir B(t)(ω) := ω(t) und B 0 sei das Wahrscheinlichkeitsmaß auf C 0, so daß der Prozeß (B(t)) 0 t 1 eine Brownsche Brücke ist. Der Parameterraum ist der Raum H 0 := {h L 2 ([0; 1],λ\ [0;1] ): 1 0 h(x) dλ\ [0;1] (x) =0}. τ bezeichne die durch τ(h)(t) := t 0 h(x) dλ\ [0;1](x) definierte Abbildung von H 0 nach C 0. Der zentrale Prozeß ergibt sich hier als das stochastische Integral L(h) := hdb. Wir bezeichnen mit B h die Verteilung der um τ(h)(t) verschobenen Brownschen Brücke auf C 0.D.h.B h ist das Wahrscheinlichkeitsmaß auf C 0,sodaß(B(t) τ(h)(t)) 0 t 1 unter B h eine Brownsche Brücke ist. Dieses Experiment stellt gleichzeitig mit dem eng verwandten Signalerkennungsproblem mit Brownscher Bewegung als Rauschterm das für uns wichtigste Anwendungsgebiet dar. In Kapitel 1 führen wir das von uns betrachtete einseitige Testproblem für das Signalerkennungsproblem mit Brownscher Brücke als Rauschterm ein: H 1 : {h H 0 τ(h)(t) 0 t [0; 1]} gegen K 1 : {h H 0 τ(h)(t) 0 t [0; 1], τ(h) 0} 4
Für dieses Testproblem werden häufig Kolmogorov Smirnov Tests ϕ (a,b) benutzt, die wie folgt definiert sind (a, b > 0): ϕ (a,b) := 1{ sup B(t) (a(1 t)+bt) 0}. 0 t 1 Dieser Test verwirft die Hypothese, wenn der beobachtete Pfad aus C 0 die Gerade a(1 t)+ bt an mindestens einer Stelle berührt oder überschreitet. In Kapitel 2 stellen wir zunächst die für das Arbeiten mit Gauß Shift Experimenten (mit insbesondere unendlichdimensionalen Parameterraum H) wichtigen Definitionen und Sätze zusammen. Signalerkennungsprobleme sind bereits für sich betrachtet interessante Forschungsgegenstände. Ihre tiefere Bedeutung erhalten sie jedoch dadurch, daß sie in der Nichtparametrik als Limesexperimente auftreten. So gilt z.b. für eine 2 differenzierbare Kurve von Verteilungen (P t ) t IR mit P 0 = λ\ [0;1], P t P 0 für alle reellen t und Ableitung g L 2 0 [0; 1] des Dichtequotienten für den Test ϕ (n) (a,b) := 1{sup 0 t 1 n( ˆFn F 0 ) (a(1 t)+bt) 0}, daß lim E P n ϕ (n) n n 1 (a,b) = E B 0 1{ sup B(t)+ 0 t 1 t 0 g(x) dλ\ [0;1] (x) (a(1 t)+bt) 0}, ( ) vgl. Strasser [22], Example 82.23. Dabei bezeichnet ˆF n die empirische Verteilungsfunktion und F 0 die Verteilungsfunktion von P 0.Wirsetzendabeivoraus,daßdie n für die Auswertung von ˆF n beobachteten Werte Realisierungen von unabhängigen, gemäß P 1 n verteilten Zufallsvariablen sind. Die Limesgüte der Testfolge ϕ (n) (a,b) hängt also nur noch von den lokalen Eigenschaften der zugrunde liegenden Familie (oder Kurve) von Verteilungen ab. Man beachte an dieser Stelle, daß aus der Voraussetzung der 2 Differenzierbarkeit der Kurve von Verteilungen folgt, daß für x [0; 1] gilt: lim t 0 1/t(F Pt (x) F P0 (x)) = x g(y) dλ\ 0 [0;1](y), d.h. für kleine t gilt F Pt (x) F P0 (x)+t x g(y) dλ\ 0 [0;1](y), vgl. Janssen [12], 14. Aus ( ) erhalten wir ebenfalls eine Rechtfertigung für das in Kapitel 1 betrachtete Testproblem, denn eine differenzierbare Familie mit Tangente g, die zusätzlich die Eigenschaft τ(g)(t) > 0für alle t (0; 1) erfüllt, gehört zu einer Familie, für die 5
zumindest lokal gilt: (P t ) ist stochastisch größer als P 0 für t<0 und (P t ) ist stochastisch kleiner als P 0 für t>0. Aus Gleichung ( ) erkennen wir, daß für die Bestimmung der Limesgüte die Kenntnis von Übertrittswahrscheinlichkeiten erforderlich ist. Diese sind jedoch in den wenigsten Fällen explizit bekannt. Wenn auch eine globale Analyse der Limesgüte in aller Regel nicht möglich ist, so kann man doch lokale Aussagen für das Limesexperiment machen. Ist E = (Ω, A, {P h : h H}) ein beliebiger Gauß Shift, so gilt nämlich ganz allgemein für einen Test ϕ :Ω IR: E P h ϕ = E P0 ϕ + b(h) + a(h) 2 2 + o( 2 )bei 0. Der Ausdruck b(h) ist dabei ein lineares Funktional auf H mit b(h) = ϕl(h) dp 0. Da dieser Operator beschränkt ist existiert ein als Gradient bezeichnetes Element h 0 H, sodaßb(h) = h, h 0 für alle h H gilt. Für den Test ϕ (a,b) ist der Gradient h 0,(a,b) z.b. explizit bekannt. Das weitestgehende Resultat über die Abbildung a(h) findet sich bei Janssen [11]. So hängen etwa globale Aussagen über die Gütefunktion von Kolmogorov Smirnov Tests von Übertrittswahrscheinlichkeiten ab. Wir hatten bereits erwähnt, daß diese Wahrscheinlichkeiten in aller Regel nicht explizit bekannt sind. Da aber die lokalen Größen E P0 ϕ und E =0 P h ϕ bekannt sind, liegt es nahe, die Gütefunktion aus diesen lokalen Größen zu extrapolieren. Im Mittelpunkt steht die Frage, welche globalen Güteschranken sich generell für Tests ergeben, wenn das Niveau α und die Steigung b(h) vorgegeben sind. Die Konstruktion von Einhüllenden führt auf ein Optimierungsproblem. Dieses formulieren wir präzise in Kapitel 3 und geben Tests an, die die dort angegebenen Schranken annehmen, d.h. wir zeigen gleichzeitig, daß sich diese Schranken in der von uns betrachteten Klasse von Tests nicht verbessern lassen. Insbesondere sind wir in diesem Fall in der Lage reelle Konstanten b 1 und b 2 anzugeben, so daß Φ(b 2 + h ) E Ph ϕ 1 Φ(b 1 h ) 1 α Φ(b 1 ) 6
gilt, vgl. Satz (5.7). Hierbei ist Φ(x) := x 1 2π exp( y2 ) dλ\(y) die Verteilungsfunktion der Standardnormalverteilung. Ein auf die zweiseitige Situation 2 zugeschnittenes Optimierungsproblem wurde von Strasser [24] betrachtet. Insbesondere lassen sich diese Ergebnisse auf Signalerkennungsprobleme mit sowohl Brownscher Brücke, als auch Brownscher Bewegung als Rauschterm anwenden. In Kapitel 4 beschäftigen wir uns mit einer naheliegenden Variante des SEP mit Brownscher Brücke als Rauschterm, indem wir nur noch voraussetzen, daß das Signal lediglich auf einem Intervall [0; t 0 ] mit einem festen t 0 < 1zubeobachtenist.Wir geben unter anderem eine Darstellung der Stammfunktion des Gradienten eines auf diese Situation zugeschnittenen Kolmogorov Smirnov Tests an. ϕ (a,b),t := 1{ sup 0 t t 0 B(t) (a(1 t)+bt) 0}. In Kapitel 5 schlagen wir eine Brücke von Kolmogorov Smirnov Tests ϕ (a,b) zum (einseitigen) Boundary Crossing Problem. Unter dem (einseitigen) Boundary Crossing Problem verstehen wir die Bestimmung der Wahrscheinlichkeit, daß ein Pfad einer Brownschen Brücke eine Übertrittsfunktion mit Definitionsbereich [0; 1] an mindestens einer Stelle t [0;1] überschreitet. Dabei benutzen wir Ansätze zur Bestimmung der (lokalen) Güte von ϕ (a,b) um Approximationen, bzw. sinnvolle Abschätzungen für bestimmte Übertrittswahrscheinlichkeiten herzuleiten. Unter anderem benutzen wir die Ergebnisse aus Kapitel 3 um obere und untere Schranken angeben zu können. Wir leiten eine approximative Formel zur Berechnung der Wahrscheinlichkeit, daß eine Brownsche Brücke eine konvexe, abschnittweise lineare und stetige Übertrittsfunktion an mindestens einer Stelle t (0;1) überschreitet, her. Zusätzlich leiten wir aus älteren Resultaten über das asymptotische Verhalten des Gradienten noch eine Abschätzung und eine weitere Approximation her. Zum Schluß geben wir noch an, wie sich die vorgestellten Abschätzungen, bzw. Approximationen 7
auf Übertrittswahrscheinlichkeiten für die Brownsche Bewegung mit sowohl endlichem als auch unendlichem Zeithorizont übertragen lassen. Bei Herrn Prof. Dr. A. Janssen möchte ich mich an dieser Stelle für die Hilfe bei der Anfertigung meiner Arbeit und die immer vorhandene Diskussionsbereitschaft bedanken. Herr Janssen hat bereits meine dem selben Themenbereich entstammende Diplomarbeit mit großem Interesse betreut und mich dadurch motiviert, meine Studien auf diesem Gebiet weiter zu vertiefen. Für die Korrektur meiner Arbeit und viele hilfreiche Verbesserungsvorschläge bedanke ich mich bei dem Zweitgutachter Herrn Prof. Dr. N. Henze. 8