Anwendung der Theorie von Gauß Shift Experimenten auf den Kolmogorov Smirnov Test und das einseitige Boundary Crossing Problem



Ähnliche Dokumente
Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Die Optimalität von Randomisationstests

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Approximation durch Taylorpolynome

7 Rechnen mit Polynomen

Data Mining: Einige Grundlagen aus der Stochastik

1 Konvexe Funktionen. 1.1 Definition. 1.2 Bedingung 1.Ordnung. Konvexität und Operationen, die die Konvexität bewahren Seite 1

4. Versicherungsangebot

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Primzahlen und RSA-Verschlüsselung

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

1 Mathematische Grundlagen

Im Jahr t = 0 hat eine Stadt Einwohner. Nach 15 Jahren hat sich die Einwohnerzahl verdoppelt. z(t) = at + b

Klausur Mathematik 2

Universität Bonn, Institut für Angewandte Mathematik. WS 2012/2013 Prüfung Angewandte Mathematik und Statistik - Agrarwiss. /ELW

Definition 3.1: Ein Differentialgleichungssystem 1. Ordnung

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Repetitionsaufgaben Wurzelgleichungen

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse Lösung 10 Punkte

Mathematischer Vorbereitungskurs für Ökonomen

13. Lineare DGL höherer Ordnung. Eine DGL heißt von n-ter Ordnung, wenn Ableitungen y, y, y,... bis zur n-ten Ableitung y (n) darin vorkommen.

Die Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung.


( ) als den Punkt mit der gleichen x-koordinate wie A und der

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

Kurzeinführung zum Plotten in Maple

Informationsblatt Induktionsbeweis

Pädagogik. Melanie Schewtschenko. Eingewöhnung und Übergang in die Kinderkrippe. Warum ist die Beteiligung der Eltern so wichtig?

Lineare Gleichungssysteme

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Beweisbar sichere Verschlüsselung

Musterlösungen zur Linearen Algebra II Blatt 5

Lösungsmethoden gewöhnlicher Differentialgleichungen (Dgl.)

Grundlagen der höheren Mathematik Einige Hinweise zum Lösen von Gleichungen

Das Mathematik-Abitur im Saarland

Erfahrungen mit Hartz IV- Empfängern

BONUS MALUS SYSTEME UND MARKOV KETTEN

1.3 Die Beurteilung von Testleistungen

Einführung in die Algebra

EM-Wellen. david vajda 3. Februar Zu den Physikalischen Größen innerhalb der Elektrodynamik gehören:

Softwareentwicklungspraktikum Sommersemester Grobentwurf

Geld Verdienen im Internet leicht gemacht

Rente = laufende Zahlungen, die in regelmäßigen Zeitabschnitten (periodisch) wiederkehren Rentenperiode = Zeitabstand zwischen zwei Rentenzahlungen

Fachschaft Mathematik und Informatik (FIM) LA I VORKURS. Herbstsemester gehalten von Harald Baum

Kevin Caldwell. 18.April 2012

Abiturprüfung Mathematik 2008 (Baden-Württemberg) Berufliche Gymnasien ohne TG Analysis, Aufgabe 1

14 Schmiegeparabel und Freunde, Taylor-Reihe

Grundbegriffe der Informatik

6.2 Scan-Konvertierung (Scan Conversion)

Extrema von Funktionen in zwei Variablen

Ein Vorwort, das Sie lesen müssen!

9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83

Schleswig-Holstein Kernfach Mathematik

Lineare Differentialgleichungen erster Ordnung erkennen

Lineare Funktionen. 1 Proportionale Funktionen Definition Eigenschaften Steigungsdreieck 3

Abschlussprüfung Realschule Bayern II / III: 2009 Haupttermin B 1.0 B 1.1

Gegeben ist die Funktion f durch. Ihr Schaubild sei K.

Aufgabenset 1 (abzugeben an LK@wacc.de)

Erstellen einer Collage. Zuerst ein leeres Dokument erzeugen, auf dem alle anderen Bilder zusammengefügt werden sollen (über [Datei] > [Neu])

WP-Fach Informationen für Schülerinnen und Schüler der Jahrgangsstufe 5

Mathematik I für Wirtschaftswissenschaftler

W-Rechnung und Statistik für Ingenieure Übung 11

Abituraufgabe zur Analysis, Hessen 2009, Grundkurs (TR)

Modellbildungssysteme: Pädagogische und didaktische Ziele

Persönliche Zukunftsplanung mit Menschen, denen nicht zugetraut wird, dass sie für sich selbst sprechen können Von Susanne Göbel und Josef Ströbl

Fragebogen zur Diplomarbeit von Thomas Friedrich

Test 2: Universitäts- oder Fachhochschulstudium? 24 Auswertung: Universitäts- oder Fachhochschulstudium? 27

Info zum Zusammenhang von Auflösung und Genauigkeit

LU-Zerlegung. Zusätze zum Gelben Rechenbuch. Peter Furlan. Verlag Martina Furlan. Inhaltsverzeichnis. 1 Definitionen.

Aufgabe 1. Zunächst wird die allgemeine Tangentengleichung in Abhängigkeit von a aufgestellt:

Hauptprüfung Fachhochschulreife Baden-Württemberg

Die reellen Lösungen der kubischen Gleichung

Grundlagen der Theoretischen Informatik, SoSe 2008


Elemente der Analysis I Kapitel 2: Einführung II, Gleichungen

Anleitung über den Umgang mit Schildern

Matrizennorm. Definition 1. Sei A M r,s (R). Dann heißt A := sup die Matrixnorm. Wir wissen zunächst nicht, ob A eine reelle Zahl ist.

8. Quadratische Reste. Reziprozitätsgesetz

Die perfekte Bewerbung richtig schreiben online & klassisch

Standardisierte kompetenzorientierte schriftliche Reifeprüfung AHS. 11. Mai Mathematik. Teil-2-Aufgaben. Korrekturheft. öffentliches Dokument

Tangentengleichung. Wie lautet die Geradengleichung für die Tangente, y T =? Antwort:

Arbeitspunkt einer Diode

Schritt 1. Anmelden. Klicken Sie auf die Schaltfläche Anmelden

Gleichungen und Ungleichungen

4. Dynamische Optimierung

Hohe Kontraste zwischen Himmel und Landschaft abmildern

Wichtiges Thema: Ihre private Rente und der viel zu wenig beachtete - Rentenfaktor

Inhalt. 1. Einleitung Hilfe, mein Kind kann nicht richtig schreiben und lesen! Seite

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen

Lineare Gleichungssysteme

Schriftliche Prüfungsarbeit zum mittleren Schulabschluss 2010 im Fach Mathematik. 26. Mai 2010

(Lineare) stochastische Optimierung

Buchhaltung mit WISO EÜR & Kasse 2011

Gleichungen Lösen. Ein graphischer Blick auf Gleichungen

Wachstum 2. Michael Dröttboom 1 LernWerkstatt-Selm.de

Bevor lineare Gleichungen gelöst werden, ein paar wichtige Begriffe, die im Zusammenhang von linearen Gleichungen oft auftauchen.

Statistische Thermodynamik I Lösungen zur Serie 1

Die Pareto Verteilung wird benutzt, um Einkommensverteilungen zu modellieren. Die Verteilungsfunktion ist

A Lösungen zu Einführungsaufgaben zu QueueTraffic

Kugel-Fächer-Modell. 1fach. 3fach. Für die Einzelkugel gibt es 3 Möglichkeiten. 6fach. 3! Möglichkeiten

Transkript:

Anwendung der Theorie von Gauß Shift Experimenten auf den Kolmogorov Smirnov Test und das einseitige Boundary Crossing Problem Inauguraldissertation zur Erlangung des Doktorgrades der Mathematisch Naturwissenschaftlichen Fakultät der Heinrich Heine Universität Düsseldorf vorgelegt von Michael Kunz aus Düsseldorf Düsseldorf 1999

dissertation.de Verlag im Internet Sonderausgabe des Werkes mit der ISBN-Nummer: 3-89825-076-8 Gedruckt mit der Genehmigung der Mathematisch-Naturwissenschaftlichen Fakultät der Heinrich-Heine-Universität Düsseldorf Referent: Prof. Dr. A. Janssen, Düsseldorf Korreferent: Prof. Dr. N. Henze, Karlsruhe Tag der mündlichen Prüfung: 21.1.2000 dissertation.de Verlag im Internet Leonhardtstr. 8-9 D-14 057 Berlin Email: Internetadresse: dissertation.de@snafu.de http://www.dissertation.de

Inhaltsverzeichnis Einleitung 3 1 Ein Signalerkennungsproblem 9 1.1 Das Signalerkennungsproblem mit Brownscher Brücke als Rauschterm................................ 9 1.2 Testverfahren fürdassignalerkennungsproblem............ 11 2 Gauß-Shift-Experimente 15 2.1 Einführung in die Theorie der Gauß Shift Experimente........ 15 2.2 Das Signalerkennungsproblem als Gauß-Shift-Experiment....... 20 2.3 Einige Resultate und Sprechweisen................... 21 2.4 Der Kolmogorov Smirnov Test als Limestest.............. 24 3 Einhüllende Gütefunktionen für Gauß Shift Experimente 31 3.1 Ein Maximierungsproblem........................ 31 3.2 Ein Minimierungsproblem........................ 51 3.3 Einige Anwendungen auf Signalerkennungsprobleme.......... 55 3.3.1 Signalerkennungsprobleme mit Brownscher Brücke als Rauschterm................................ 56 3.3.2 Signalerkennungsprobleme mit Brownscher Bewegung als Rauschterm................................ 59 4 Eine weitere Verallgemeinerung des einseitigen Kolmogorov Smirnov Tests 61 1

9 9 9 5 Approximationen und Schranken für Übertrittswahrscheinlichkeiten beim Boundary Crossing Problem 71 5.1 Abschnittweise lineare Übertrittsfunktionen.............. 72 5.2 Konvexe und konkave Übertrittsfunktionen............... 78 5.3 Eine weitere Approximation....................... 84 5.4 Eine untere Abschätzung für eine beliebige Übertrittsfunktion.... 86 5.5 Abschätzungen durch die LösungenderOptimierungsprobleme.... 1 5.6 Übertrittswahrscheinlichkeiten fürdiebrownschebewegung..... 3 5.6.1 Übertrittswahrscheinlichkeiten für einen unendlichen Zeithorizont............................... 3 5.6.2 Übertrittswahrscheinlichkeiten für einen finiten Zeithorizont. 95 A Einfache Übertrittswahrscheinlichkeiten 97 B Anmerkungen zur Simulation Brownscher Brücken 103 Symbolverzeichnis 106 Abbildungsverzeichnis 110 Literaturverzeichnis 113 2

Einleitung In der vorliegenden Arbeit beschäftigen wir uns zunächst mit Gütefunktionen von Tests für beliebige Gauß Shift Experimente. Bezeichnet (H,, ) einen Hilbertraum mit zugehörigem Skalarprodukt,, so versteht man unter einem Gauß Shift mit Parameterraum (H,, ) einexperiment E =(Ω, A, {P h : h H}), mit P h P 0 für h H, dessen Dichtequotienten bzgl. des dominierenden Maßes P 0 die folgende Struktur haben: dp h =exp(l(h) 1 dp 0 2 h 2 ), h H, dabei bezeichnet L einen in h linearen Gaußschen stochastischen Prozeß, für den gilt: L(L(h) P 0 )=N(0, h 2 ). Gauß Shift Experimente spielen in der LAN Theorie von LeCam [15] die Rolle von Limesexperimenten (LAN steht dabei für Lokale Asymptotische Normalität und bezeichnet eine geeignete Konvergenz). Man erhält unmittelbar, daß z.b. die Lokationsfamilie der multivariaten Normalverteilung {P h := N(h, Id) : h IR d } auf dem Meßraum (IR d, B d )eingauß Shift Experiment mit zugehörigem (im Allgemeinen auch oft zentral genannten) stochastischen Prozeß L(h)(x) := h, x ist. Diese Familie stellt für d = 1dasein- fachste Gauß Shift Experiment dar. 3

Ein weiteres Beispiel für ein Gauß Shift Experiment stellt das als Signalerkennungsproblem (SEP) mit Brownscher Brücke als Rauschterm bezeichnete Experiment E =(C 0, B(C 0 ), {L(τ(h)+B B 0 ):h H 0 }) dar. Dabei sei C 0 := {f : [0; 1] IR f stetig, f(0) = f(1) = 0}, B( ) seidas kanonische Auswertungsfunktional auf C 0,d.hfür 0 t 1 setzen wir B(t)(ω) := ω(t) und B 0 sei das Wahrscheinlichkeitsmaß auf C 0, so daß der Prozeß (B(t)) 0 t 1 eine Brownsche Brücke ist. Der Parameterraum ist der Raum H 0 := {h L 2 ([0; 1],λ\ [0;1] ): 1 0 h(x) dλ\ [0;1] (x) =0}. τ bezeichne die durch τ(h)(t) := t 0 h(x) dλ\ [0;1](x) definierte Abbildung von H 0 nach C 0. Der zentrale Prozeß ergibt sich hier als das stochastische Integral L(h) := hdb. Wir bezeichnen mit B h die Verteilung der um τ(h)(t) verschobenen Brownschen Brücke auf C 0.D.h.B h ist das Wahrscheinlichkeitsmaß auf C 0,sodaß(B(t) τ(h)(t)) 0 t 1 unter B h eine Brownsche Brücke ist. Dieses Experiment stellt gleichzeitig mit dem eng verwandten Signalerkennungsproblem mit Brownscher Bewegung als Rauschterm das für uns wichtigste Anwendungsgebiet dar. In Kapitel 1 führen wir das von uns betrachtete einseitige Testproblem für das Signalerkennungsproblem mit Brownscher Brücke als Rauschterm ein: H 1 : {h H 0 τ(h)(t) 0 t [0; 1]} gegen K 1 : {h H 0 τ(h)(t) 0 t [0; 1], τ(h) 0} 4

Für dieses Testproblem werden häufig Kolmogorov Smirnov Tests ϕ (a,b) benutzt, die wie folgt definiert sind (a, b > 0): ϕ (a,b) := 1{ sup B(t) (a(1 t)+bt) 0}. 0 t 1 Dieser Test verwirft die Hypothese, wenn der beobachtete Pfad aus C 0 die Gerade a(1 t)+ bt an mindestens einer Stelle berührt oder überschreitet. In Kapitel 2 stellen wir zunächst die für das Arbeiten mit Gauß Shift Experimenten (mit insbesondere unendlichdimensionalen Parameterraum H) wichtigen Definitionen und Sätze zusammen. Signalerkennungsprobleme sind bereits für sich betrachtet interessante Forschungsgegenstände. Ihre tiefere Bedeutung erhalten sie jedoch dadurch, daß sie in der Nichtparametrik als Limesexperimente auftreten. So gilt z.b. für eine 2 differenzierbare Kurve von Verteilungen (P t ) t IR mit P 0 = λ\ [0;1], P t P 0 für alle reellen t und Ableitung g L 2 0 [0; 1] des Dichtequotienten für den Test ϕ (n) (a,b) := 1{sup 0 t 1 n( ˆFn F 0 ) (a(1 t)+bt) 0}, daß lim E P n ϕ (n) n n 1 (a,b) = E B 0 1{ sup B(t)+ 0 t 1 t 0 g(x) dλ\ [0;1] (x) (a(1 t)+bt) 0}, ( ) vgl. Strasser [22], Example 82.23. Dabei bezeichnet ˆF n die empirische Verteilungsfunktion und F 0 die Verteilungsfunktion von P 0.Wirsetzendabeivoraus,daßdie n für die Auswertung von ˆF n beobachteten Werte Realisierungen von unabhängigen, gemäß P 1 n verteilten Zufallsvariablen sind. Die Limesgüte der Testfolge ϕ (n) (a,b) hängt also nur noch von den lokalen Eigenschaften der zugrunde liegenden Familie (oder Kurve) von Verteilungen ab. Man beachte an dieser Stelle, daß aus der Voraussetzung der 2 Differenzierbarkeit der Kurve von Verteilungen folgt, daß für x [0; 1] gilt: lim t 0 1/t(F Pt (x) F P0 (x)) = x g(y) dλ\ 0 [0;1](y), d.h. für kleine t gilt F Pt (x) F P0 (x)+t x g(y) dλ\ 0 [0;1](y), vgl. Janssen [12], 14. Aus ( ) erhalten wir ebenfalls eine Rechtfertigung für das in Kapitel 1 betrachtete Testproblem, denn eine differenzierbare Familie mit Tangente g, die zusätzlich die Eigenschaft τ(g)(t) > 0für alle t (0; 1) erfüllt, gehört zu einer Familie, für die 5

zumindest lokal gilt: (P t ) ist stochastisch größer als P 0 für t<0 und (P t ) ist stochastisch kleiner als P 0 für t>0. Aus Gleichung ( ) erkennen wir, daß für die Bestimmung der Limesgüte die Kenntnis von Übertrittswahrscheinlichkeiten erforderlich ist. Diese sind jedoch in den wenigsten Fällen explizit bekannt. Wenn auch eine globale Analyse der Limesgüte in aller Regel nicht möglich ist, so kann man doch lokale Aussagen für das Limesexperiment machen. Ist E = (Ω, A, {P h : h H}) ein beliebiger Gauß Shift, so gilt nämlich ganz allgemein für einen Test ϕ :Ω IR: E P h ϕ = E P0 ϕ + b(h) + a(h) 2 2 + o( 2 )bei 0. Der Ausdruck b(h) ist dabei ein lineares Funktional auf H mit b(h) = ϕl(h) dp 0. Da dieser Operator beschränkt ist existiert ein als Gradient bezeichnetes Element h 0 H, sodaßb(h) = h, h 0 für alle h H gilt. Für den Test ϕ (a,b) ist der Gradient h 0,(a,b) z.b. explizit bekannt. Das weitestgehende Resultat über die Abbildung a(h) findet sich bei Janssen [11]. So hängen etwa globale Aussagen über die Gütefunktion von Kolmogorov Smirnov Tests von Übertrittswahrscheinlichkeiten ab. Wir hatten bereits erwähnt, daß diese Wahrscheinlichkeiten in aller Regel nicht explizit bekannt sind. Da aber die lokalen Größen E P0 ϕ und E =0 P h ϕ bekannt sind, liegt es nahe, die Gütefunktion aus diesen lokalen Größen zu extrapolieren. Im Mittelpunkt steht die Frage, welche globalen Güteschranken sich generell für Tests ergeben, wenn das Niveau α und die Steigung b(h) vorgegeben sind. Die Konstruktion von Einhüllenden führt auf ein Optimierungsproblem. Dieses formulieren wir präzise in Kapitel 3 und geben Tests an, die die dort angegebenen Schranken annehmen, d.h. wir zeigen gleichzeitig, daß sich diese Schranken in der von uns betrachteten Klasse von Tests nicht verbessern lassen. Insbesondere sind wir in diesem Fall in der Lage reelle Konstanten b 1 und b 2 anzugeben, so daß Φ(b 2 + h ) E Ph ϕ 1 Φ(b 1 h ) 1 α Φ(b 1 ) 6

gilt, vgl. Satz (5.7). Hierbei ist Φ(x) := x 1 2π exp( y2 ) dλ\(y) die Verteilungsfunktion der Standardnormalverteilung. Ein auf die zweiseitige Situation 2 zugeschnittenes Optimierungsproblem wurde von Strasser [24] betrachtet. Insbesondere lassen sich diese Ergebnisse auf Signalerkennungsprobleme mit sowohl Brownscher Brücke, als auch Brownscher Bewegung als Rauschterm anwenden. In Kapitel 4 beschäftigen wir uns mit einer naheliegenden Variante des SEP mit Brownscher Brücke als Rauschterm, indem wir nur noch voraussetzen, daß das Signal lediglich auf einem Intervall [0; t 0 ] mit einem festen t 0 < 1zubeobachtenist.Wir geben unter anderem eine Darstellung der Stammfunktion des Gradienten eines auf diese Situation zugeschnittenen Kolmogorov Smirnov Tests an. ϕ (a,b),t := 1{ sup 0 t t 0 B(t) (a(1 t)+bt) 0}. In Kapitel 5 schlagen wir eine Brücke von Kolmogorov Smirnov Tests ϕ (a,b) zum (einseitigen) Boundary Crossing Problem. Unter dem (einseitigen) Boundary Crossing Problem verstehen wir die Bestimmung der Wahrscheinlichkeit, daß ein Pfad einer Brownschen Brücke eine Übertrittsfunktion mit Definitionsbereich [0; 1] an mindestens einer Stelle t [0;1] überschreitet. Dabei benutzen wir Ansätze zur Bestimmung der (lokalen) Güte von ϕ (a,b) um Approximationen, bzw. sinnvolle Abschätzungen für bestimmte Übertrittswahrscheinlichkeiten herzuleiten. Unter anderem benutzen wir die Ergebnisse aus Kapitel 3 um obere und untere Schranken angeben zu können. Wir leiten eine approximative Formel zur Berechnung der Wahrscheinlichkeit, daß eine Brownsche Brücke eine konvexe, abschnittweise lineare und stetige Übertrittsfunktion an mindestens einer Stelle t (0;1) überschreitet, her. Zusätzlich leiten wir aus älteren Resultaten über das asymptotische Verhalten des Gradienten noch eine Abschätzung und eine weitere Approximation her. Zum Schluß geben wir noch an, wie sich die vorgestellten Abschätzungen, bzw. Approximationen 7

auf Übertrittswahrscheinlichkeiten für die Brownsche Bewegung mit sowohl endlichem als auch unendlichem Zeithorizont übertragen lassen. Bei Herrn Prof. Dr. A. Janssen möchte ich mich an dieser Stelle für die Hilfe bei der Anfertigung meiner Arbeit und die immer vorhandene Diskussionsbereitschaft bedanken. Herr Janssen hat bereits meine dem selben Themenbereich entstammende Diplomarbeit mit großem Interesse betreut und mich dadurch motiviert, meine Studien auf diesem Gebiet weiter zu vertiefen. Für die Korrektur meiner Arbeit und viele hilfreiche Verbesserungsvorschläge bedanke ich mich bei dem Zweitgutachter Herrn Prof. Dr. N. Henze. 8