Der Satz von Cramér (1938) Ausarbeitung zu einem Vortrag im Seminar Große Abweichungen am Maren Urner

Ähnliche Dokumente
23 Konvexe Funktionen und Ungleichungen

Monotone Funktionen. Definition Es sei D R. Eine Funktion f : D R heißt. (ii) monoton fallend, wenn für alle x, x D gilt. x < x f (x) f (x ).

Klausur,,Einführung in die W theorie

Kapitel 1. Grundlegendes

Alternativ kann man auch die Differenz a n+1 a n betrachten:

Kapitel II Funktionen reeller Variabler

Mathematik I für Studierende der Geophysik/Ozeanographie, Meteorologie und Physik Vorlesungsskript

Cauchy-Folgen und Kompaktheit. 1 Cauchy-Folgen und Beschränktheit

Existenz unendlich vieler Primzahlen Es werden mehrere Beweise für die Existenz unendlich vieler Primzahlen vorgetragen.

Analysis II 14. Übungsblatt

Musterlösung zum Weihnahchtsübungsblatt. Teil 1 von Martin Fabricius. Aufgabe 1

L 2 -Theorie und Plancherel-Theorem

8. Formelsammlung. Pr[ ] = 0. 0 Pr[A] 1. Pr[Ā] = 1 Pr[A] A B = Pr[A] Pr[B] DWT 8.1 Gesetze zum Rechnen mit Ereignissen 203/467 Ernst W.

22 KAPITEL 1. GRUNDLAGEN. Um zu zeigen, dass diese Folge nicht konvergent ist, betrachten wir den punktweisen Limes und erhalten die Funktion

1. Aufgabe [2 Punkte] Seien X, Y zwei nicht-leere Mengen und A(x, y) eine Aussageform. Betrachten Sie die folgenden Aussagen:

11 Logarithmus und allgemeine Potenzen

30 Die Gammafunktion und die Stirlingsche Formel

GRUNDLAGEN MATHEMATIK

(alternierendes Vorzeichen) a n := ( 1)n n + 1 a n := 3n 2 7n a n := n(n 1)(n 2), n 3

Topologische Grundbegriffe II. Inhaltsverzeichnis

18 Höhere Ableitungen und Taylorformel

,...) ist eine Folge, deren Glieder der Null beliebig nahe kommen. (iii) Die Folge a n = ( 1) n + 1 n oder (a n) = (0, 3 2, 2 3, 5 4, 4 5

Kompaktheit und Überdeckungen. 1 Überdeckungskompaktheit

Serie 4 2 = 10. ) ist). Dann gilt für alle n n 0

Mathematik für Physiker, Informatiker und Ingenieure

Analysis I. 2. Übungsstunde. Steven Battilana. battilana.uk/teaching

HM I Tutorium 2. Lucas Kunz. 3. November 2016

12. Trennungssätze für konvexe Mengen 83

Von Skalarprodukten induzierte Normen

13 Grenzwertsätze Das Gesetz der großen Zahlen

Kapitel II Kontinuierliche Wahrscheinlichkeitsräume

TECHNISCHE UNIVERSITÄT MÜNCHEN Zentrum Mathematik

3 Bedingte Erwartungswerte

Analysis I. 6. Beispielklausur mit Lösungen

Brückenkurs Rechentechniken

D-MAVT/D-MATL Analysis I HS 2017 Dr. Andreas Steiger. Lösung - Serie 6. (n+1)!. Daraus folgt, dass e 1/x < (n+

4 Differenzierbarkeit einer konjugierten Funktion

Zufallsvariable, Verteilung, Verteilungsfunktion

8.1. DER RAUM R N ALS BANACHRAUM 17

Dem Anschein nach werden diese Zahlen kleiner und kleiner und streben gegen Null. Was sollen sie sonst auch tun? Aber der Begriff

Topologische Grundbegriffe I. 1 Offene und Abgeschlossene Mengen

Wahrscheinlichkeitsrechnung

2. Stetige lineare Funktionale

Analyis I -Metrische Räume - eine Einführung in die Topologie

1 Die direkte Methode der Variationsrechnung

Maximale Generatoren Integral Stochastischer Ordnungen - Fortsetzung Eigenschaften von stochastischen Ordnungen Kleine Generatoren

Wahrscheinlichkeitstheorie und Statistik

Analysis I. Guofang Wang , Universität Freiburg

Folgen und Reihen. Thomas Blasi

Scheinklausur zur Vorlesung Stochastik II

Kapitel 6. Fixpunkte und semantische Bereiche

b liegt zwischen a und c.

2 Martingale in stetiger Zeit

Institut für Analysis WiSe 2018/2019 Prof. Dr. Dirk Hundertmark Dr. Markus Lange. Analysis 1. Aufgabenzettel 14

(b) Man nennt die Menge M beschränkt, wenn sie nach oben und unten beschränkt ist.

Topologische Grundbegriffe II. 1 Begriffe auf Mengen

Statistik I für Betriebswirte Vorlesung 3

Folgen und Reihen. Wirtschaftswissenschaftliches Zentrum Universität Basel. Mathematik für Ökonomen 1 Dr. Thomas Zehrt

Wir erinnern uns: Um eine Zufallsvariable mit N verschiedenen, gleichwahrscheinlichen Zuständen binär zu codieren, benötigen wir

Mathematik I HM I A. SoSe Variante A

Karlsruher Institut für Technologie (KIT) WS 2012/13 Institut für Analysis Prof. Dr. Tobias Lamm Dr. Patrick Breuning

$Id: folgen.tex,v /05/31 12:40:06 hk Exp $ an 1 2 n 1 ist gerade, 3a n 1 + 1, a n 1 ist ungerade.

Mengenlehre und vollständige Induktion

Funktionen untersuchen

Vollständigkeit. Andreas Schmitt. Ausarbeitung zum Proseminar zur Topologie im WS 2012/13

Modulprüfung Analysis I für Ingenieurwissenschaften

Analysis 2, Woche 9. Mehrdimensionale Differentialrechnung I. 9.1 Differenzierbarkeit

Analysis I. Vorlesung 13. Gleichmäßige Stetigkeit

Eigenschaften stetiger Funktionen Buch Kap. 2.5

Überabzählbarkeit der reellen Zahlen

Übungen zu Einführung in die Analysis

Tutorium: Analysis und Lineare Algebra

Kapitel 3: Folgen und Reihen

Institut für Analysis WiSe 2018/2019 Prof. Dr. Dirk Hundertmark Dr. Markus Lange. Analysis 1. Aufgabenzettel 4

Analysis I - Einige Lösungen und Ergänzungen

Leitfaden. a ist Vielfaches von d und schreiben verkürzt: d a. Ist d kein Teiler von a, so schreiben wir auch: d a. d teilt a oder

Übungsaufgaben zu Analysis 1 Lösungen von Blatt VI vom

2 Zufallsvariable, Verteilungen, Erwartungswert

Analysis I. 4. Beispielklausur mit Lösungen

Vollständigkeit. 1 Konstruktion der reellen Zahlen

Lösung zur Übung für Analysis einer Variablen WS 2016/17

MAA = MAB + B AA = B CA + CAA BA A Nun sehen wir mit Proposition 10.7 aus dem Skript, dass A M AB gelten muss.

3. Übungsblatt - Lösungsskizzen. so, dass f tatsächlich eine Wahrscheinlichkeitsdichte

Satz Eine Teilmenge U von M ist genau dann offen, wenn jeder Punkt von U innerer Punkt ist. U x, und U ist als Vereinigung offener Mengen offen.

aus der Bedingung/Annahme A folgt ein Widerspruch ), so ist A falsch!

Nachklausur zur Analysis 2, SoSe 2017

Aufgaben und Lösungen Ausarbeitung der Übungsstunde zur Vorlesung Analysis I

Klausur zur Vorlesung Stochastik II

Die trigonometrischen Funktionen

Erwartungswert als Integral

Grundlagen: Algorithmen und Datenstrukturen

Stochastik I. Vorlesungsmitschrift

Seminar Einführung in die Kunst mathematischer Ungleichungen

5 Zufallsvariablen, Grundbegriffe

Musterlösung. Aufgabe 1 a) Die Aussage ist falsch. Ein Gegenbeispiel ist die Funktion f : [0, 1] R, die folgendermaßen definiert ist:

1.3 Zufallsvariablen

7 Poisson-Punktprozesse

piiq oder p 8, aq, p 8, as, pa, `8q, ra, `8q mit einer reellen Zahl a; piiiq oder p 8, `8q R. [6 Punkte] Achtung: Denken Sie auch an den Fall I!

13 Die trigonometrischen Funktionen

Mathematik II für Studierende der Informatik. Wirtschaftsinformatik (Analysis und lineare Algebra) im Sommersemester 2016

Transkript:

Der Satz von Cramér (1938) Ausarbeitung zu einem Vortrag im Seminar Große Abweichungen am 04.12.2010 Maren Urner In diesem Vortrag soll der Satz von Cramér als ein Prinzip großer Abweichungen (LDP) vorgestellt werden. Die Idee des Satzes von Cramér ist es, die Wahrscheinlichkeiten seltener oder untypischer Ereignisse mittels einer exponentiellen Rate und einer Ratenfunktion zu quantifizieren. So kann mit seiner Hilfe beispielsweise die Konvergenzgeschwindigkeit im schwachen Gesetz der großen Zahlen bestimmt werden. Ich werde hier zunächst den Satz vorstellen und beweisen. Dabei werde ich mich vor allem auf die Darstellungen [Loe], [Hol] und [Kle] stützen. Danach werde ich genauer auf die Ratenfunktion und ihre Eigenschaften eingehen und auch die allgemeine Definition einer Ratenfunktion geben. Zum Schluss werde ich noch kurz die Definition eines Prinzips großer Abweichungen nennen. Satz von Cramér (1938) Sei eine Folge von unabhängigen und identisch verteilten (i.i.d.) reellen Zufallsvariablen mit endlicher momenterzeugender Funktion < (1.1.) und sei. Dann gilt für alle wobei die sogenannte Legendre-Transformierte von ist. Beweis: Zunächst machen wir einige Vorüberlegungen: (i) Wir setzen und beweisen Lemma 1: Die folgenden Aussagen sind äquivalent: 1. 2. 3. Beweis durch Zirkelschluss: : Sei beliebig. Dann lässt sich wegen der Unabhängigkeit der als Summe von Produkten schreiben, in denen jeweils für ein der Faktor vorkommt. Wegen 2. und der identischen Verteilung der ist aber. Damit folgt dann. :

(ii) Wir können vorwegnehmen, dass der Satz von Cramér für die Dirac-Verteilung (also für ) trivialerweise wahr ist, denn in diesem Fall gilt für, dass und damit nach Lemma 1 (iii) Wir betrachten nun einige Eigenschaften von, die wir im Beweis benötigen werden: Lemma 2: Sei die Verteilung der Zufallsvariable (und damit natürlich auch die Verteilung der anderen Zufallsvariablen ) und sei die zugehörige Verteilungsfunktion. Dann ist und es gelten: a) ist unendlich oft differenzierbar mit b) ist strikt konvex. Beweis: a) Wir zeigen hierfür, dass für beliebiges auf unendlich oft differenzierbar ist. Daraus folgt dann direkt die Differenzierbarkeit auf ganz. Wir verwenden im Folgenden das Differentiationslemma (eine Folgerung aus dem Satz über die dominierte Konvergenz; vgl. [Kle, Satz 6.28]) und zeigen mit vollständiger Induktion, dass gilt: Induktionsanfang: Für ist die Aussage wahr. Das zeigt man mit dem Differentiationslemma. Dieses gibt bestimmte Bedingungen an, unter denen differenzierbar ist und unter denen man die Ableitung in das Integral hineinziehen darf. Prüfung dieser Bedingungen: - ) nach (1.1.) - Für alle ist, differenzierbar. Dies folgt aus einfachen Ableitungsregeln und es ist. -, denn Damit ist auf differenzierbar mit Induktionsvoraussetzung: Für beliebiges, festes gilt 2

Induktionsschluss: Zeige, dass mit der Induktionsvoraussetzung gilt: Wir benutzen wieder das Differentiationslemma. Prüfung der Bedingungen: - nach Induktionsvoraussetzung. - Für alle ist, differenzierbar. Dies folgt aus einfachen Ableitungsregeln und es ist. -, denn Damit ist auf differenzierbar mit Hiermit ist gezeigt, dass unendlich oft differenzierbar ist mit b) ist strikt konvex, da falls In unserem Fall ist aber Verteilung hier nicht betrachtet wird. ausgeschlossen, da ja die Dirac- (iv) Es sei bemerkt, dass die Existenz von aus (iii)a) folgt, da gilt. (v) Wir nehmen im folgenden Beweis obda und an. Alle anderen Fälle folgen direkt daraus, da mit Substitution gilt: ( ) ( ) ( ) (vi) Für den nun folgenden, eigentlichen Beweis führen wir die Schreibweisen und ein. heißt auch kumulantenerzeugende Funktion von. Natürlich gilt und wegen der Monotonie des Logarithmus gilt und für. Nach diesen Vorüberlegungen führen wir nun den eigentlichen Beweis: Mit (v) und (vi) vereinfacht sich die zu zeigende Gleichheit. Wir müssen zeigen: 3

Große Abweichungen: Der Satz von Cramér Dafür unterscheiden wir drei Fälle, je nachdem, wo Masse hat. Die ersten beiden Fälle können recht schnell abgehandelt werden, der dritte erfordert die Technik der exponentiellen Maßtransformation, die die zentrale Idee des Beweises darstellt. a) In diesem Fall ist (t) und damit streng monoton fallend. Folglich gilt unter Benutzung des Satzes von der monotonen Konvergenz Dann ist mit Lemma 1 b) und Auch hier ist, wie in a), streng monoton fallend und es gilt Wegen der Unabhängigkeit und identischen Verteilung der folgt dann und damit c) und Dann gilt offensichtlich. Aus der strikten Konvexität von folgt dann, dass es ein eindeutiges gibt, so dass in minimal wird, also dass und. Da ist, gilt. Damit kann man die exponentielle Chebyshev-Ungleichung anwenden: So erhält man eine obere Schranke Nun bleibt zu zeigen Dafür benutzen wir die exponentielle Maßtransformation: Wir führen dabei eine neue Folge von unabhängigen und identisch verteilten Zufallsvariablen ein, die die Verteilung besitzen. heißt auch die Cramér-Transformierte von. Nun benötigen wir drei Lemmata: Lemma 3: Es gilt und 4

Große Abweichungen: Der Satz von Cramér Beweis: Sei. Dann gilt wegen (1.1.): Folglich ist auch eine endliche momenterzeugende Funktion, die unendlich oft differenzierbar ist, und es ergibt sich, wenn man sich erinnert, dass : Lemma 4: Es sei. Dann gilt Beweis: Es ist Daher gilt: { } { } { } Lemma 5: Es gilt Beweis: Sei. Dann erhält man wegen der Monotonie des Erwartungswertes eine untere Schranke ( { } ) ( { } ) ( { } ) ( ) Wegen der Monotonie des Logarithmus gilt dann auch * ( )+ Auf Grund von Lemma 3 kann man nun den Zentralen Grenzwertsatz auf anwenden und erhält 5

* ( )+ * + Aus Lemma 4 und 5 ergibt sich nun Damit ist der Satz gezeigt. Bemerkung 6: Mit dem Satz von Cramér kann man auch die Wahrscheinlichkeiten für durch abschätzen. Dies sieht man leicht durch Übergang von auf. Beispiele 7: Wir berechnen die durch die Legendre-Transformierte gegebene Ratenfunktion Folge unabhängiger Zufallsvariablen, die standardnormalverteilt sind: für eine Damit ist und wie man sofort erkennt, wenn man * + zweimal nach t ableitet. Weitere Beispiele für durch die Legendre-Transformierte gegebene Ratenfunktionen hier nur angegeben werden (nach [Koe, Beispiel 1.4.2.]). sollen 6

Für eine Folge unabhängiger, Poi(λ)-verteilter Zufallsvariablen ist für,, sonst. Für eine Folge unabhängiger, Exp(λ)-verteilter Zufallsvariablen ist für, sonst. In letzterem Fall ist zu beachten, dass nicht für alle endlich ist. Hier liegt ein Fall wie im noch folgenden Satz 14 vor. Im Folgenden sollen einige wichtige Eigenschaften der Legendre-Transformierten bewiesen werden. Lemma 8: Unter den Bedingungen des Satzes von Cramér gilt: a) ist von unten halbstetig und konvex auf. b) Für existiert ein eindeutiges mit wobei das Innere von ist. c) ist stetig und strikt konvex auf. d) mit genau dann, wenn e) hat für alle kompakte Niveaumengen. Beweis: a) Konvexität: und gilt: Damit ist konvex. Halbstetigkeit von unten: Sei und eine Folge reeller Zahlen mit. Da man für beliebiges die Abschätzung machen kann, ergibt sich 7

und damit ist gezeigt, dass von unten halbstetig ist. b) Eindeutigkeit: Sei ein Maximierer, d.h.. Nach der Kettenregel ist. Dann gilt. Also ist Um zu bestimmen, definieren wir die Verteilungsfunktion Der Erwartungswert einer Zufallsvariable, die diese Verteilung besitzt, ist dann. Dann erhält man nach der Kettenregel und der Jensen schen Ungleichung ( ) Da man die Dirac-Verteilung in nicht betrachten muss, da für diese ist, ist diese Ungleichung sogar strikt. Damit ist streng monoton wachsend und folglich ist eindeutig. Existenz: Hierfür zeigt man, dass mit die Asymptoten der Abbildung bilden, denn dann kann man aus der Stetigkeit von folgern, dass zu jedem ein existiert für das gilt. Damit ist ) und folglich ist mit (1.2.) ein Maximierer. Für einen genauen Beweis siehe [Geb, Lemma 1.10 und Lemma 1.14] c) Wir zeigen zunächst die Stetigkeit auf : Es folgt direkt aus der Konvexität von, dass ein offenes Intervall ist. Desweiteren folgt aus der Konvexität von, dass mit gilt, dass (vgl. [Ama, S. 339]) Sei nun beliebig gewählt und sei auch mit beliebig. Dann existieren mit und man erhält durch wiederholte Anwendung von (1.3.) Nun sieht man die Stetigkeit direkt, denn ist gegeben, so gilt für 8

Wir zeigen nun noch die strikte Konvexität von auf : Wie bereits in a) gezeigt gilt und mit Das Gleichheitszeichen steht in der 2. Zeile genau dann, wenn beide Suprema in der 1. Zeile an der selben Stelle angenommen werden. Man weiß nun aus b), dass beide Suprema Maxima für je einen eindeutigen Maximierer bzw. sind. Damit in der 2. Zeile das Gleichheitszeichen steht, muss also gelten. Es ist aber ( ( und damit da ja streng monoton wachsend ist, falls F nicht die Dirac-Verteilung ist, was wir jedoch wieder annehmen können, da für die Dirac-Verteilung ist. Es gilt also und mit und damit ist strikt konvex. d) Da, folgt direkt. Um zu zeigen, beachte, dass eine konvexe Funktion ist und benutze die Jensen sche Ungleichung: Dann ergibt sich. Da ist also Minimalstelle. Aus der Konvexität von auf bzw. der strikten Konvexität von auf folgt dann, dass die einzige Minimalstelle von ist. e) Sei beliebig. Um die Kompaktheit der Niveaumengen zu zeigen, zeigen wir, dass diese beschränkt und abgeschlossen sind. Auf den Niveaumengen ist nach c) stetig. Da die Stetigkeit äquivalent dazu ist, dass Urbilder abgeschlossener Mengen abgeschlossen sind, folgt die Abgeschlossenheit von direkt aus der Abgeschlossenheit der Menge Die Beschränktheit von folgt aus der Tatsache, dass einerseits und folglich und andererseits und folglich. Als weitere wichtige Eigenschaft der Legendre-Transformierten, deren Beweis hier nicht gegeben werden soll, findet man, dass die Legendre-Transformierte unendlich oft differenzierbar ist und dass gilt (vgl. [Win, Lemma 1.12]). Bemerkung 9: Aus Lemma 8 a) und d) kann man folgern, dass, wenn gilt, ist. Damit gilt unter den Bedingungen des Satzes von Cramér auch die umgeschriebene Gleichung für alle 9 mit

Wir haben bislang einfach Ratenfunktion genannt, ohne den Begriff Ratenfunktion zu definieren. Das soll hier nachgeholt werden: Definition 10: Sei E ein polnischer Raum mit vollständiger Metrik d. Eine von unten halbstetige Funktion heißt Ratenfunktion. Sind die Niveaumengen für alle kompakt, so heißt gute Ratenfunktion. Es ist offensichtlich, dass die Legendre-Transformierte aus dem Satz von Cramér eine gute Ratenfunktion nach Definition 10 ist. Korollar 11: Unter den Bedingungen aus dem Satz von Cramér genügt die Folge Gesetz der großen Zahlen. dem starken Beweis: Sei obda Bemerke, dass gilt. Aus dem Satz von Cramér und Bemerkung 6 folgt dann, dass für genügend große und gelten, da ja ist. Es gilt also Daraus wiederum folgt, dass für ein beliebiges, genügend großes 10

gilt. Nun kann man das Borel-Cantelli-Lemma anwenden und erhält woraus direkt das starke Gesetz der großen Zahlen folgt: Es soll nun zum Schluss noch gesagt werden, dass der Satz von Cramér ein Prinzip großer Abweichungen nach dem zweiten Teil folgender Definition ist: Definition 12: Sei E ein polnischer Raum mit vollständiger Metrik d, sei eine Ratenfunktion und eine Familie von Wahrscheinlichkeitsmaßen auf E. Wir sagen, dass ein Prinzip großer Abweichungen (kurz LDP für Large Deviations Principle) mit Ratenfunktion erfüllt, falls (LDP1) (LDP2) für jedes offene für jedes abgeschlossene Wir sagen, dass eine Familie von Wahrscheinlichkeitsmaßen auf E ein LDP mit Rate und Ratenfunktion erfüllt, falls (LDP1) und (LDP2) für die Folge und für gelten. Satz 13: Gelten die Bedingungen aus dem Satz von Cramér, so erfüllt und guter Ratenfunktion. ein LDP mit Rate n Beweis: siehe [Kle, Beispiel 23.10] Eine Verstärkung dieses Satzes schließt den Fall mit ein, dass die momenterzeugende Funktion nicht endlich ist: Satz 14: Sei eine Folge von i.i.d. reellen Zufallsvariablen. Dann erfüllt ein LDP mit Ratenfunktion. Beweis: siehe [Dem, Theorem 2.2.3] Bemerkung 15: Die Ratenfunktion aus Satz 14 muss nicht unbedingt eine gute Ratenfunktion sein. 11

Literaturverzeichnis: [Ama] H. AMANN, J. ESCHER; Analysis I. 2. Auflage, Birkhäuser Verlag, Basel Boston Berlin (2002). [Dem] A. DEMBO, O. ZEITOUNI, Large deviations techniques and applications. 2. Auflage, Applications of Mathematics Vol. 38; Springer-Verlag, New York (1998). [Geb] S. GEBENNUS, Das asymptotische Verhalten der gewichteten Höhe des zweifach gewichteten Verzweigungsprozesses. Diplomarbeit, WWU Münster (2006); Download als pdf-datei unter http://wwwmath.unimuenster.de/statistik/alsmeyer/diplomarbeiten/gebennus.pdf. [Hol] F. DEN HOLLANDER, Large Deviations. Fields Institute Monographs Vol. 14, AMS, Providence, RI (2000). [Kle] A. KLENKE, Wahrscheinlichkeitstheorie. 2. Auflage, Springer-Verlag, Berlin Heidelberg (2008). [Koe] W. KÖNIG, Große Abweichungen, Techniken und Anwendungen. Vorlesungsskript, Universität Leipzig (Wintersemester 2004/05 und Sommersemester 2006); Download als pdf-datei unter http://www.wias-berlin.de/people/koenig/www/ga.pdf. [Loe] M. LÖWE, Wahrscheinlichkeitstheorie II. Vorlesungsskript, WWU Münster; Download als pdf-datei unter http://wwwmath.uni-muenster.de/statistik/loewe/skript.pdf. [Win] A. WINTER, Die Theorie der großen Abweichungen und Anwendungen. Basierend auf dem gleichnamigen Skript von Wolfgang König. Vorlesungsskript, TU München (Wintersemester 2009/10); Download als pdf-datei unter http://www-m5.ma.tum.de/pers/winter/ld01.pdf. 12