Randbereiche von Verteilungen: Fat Tails

Ähnliche Dokumente
4 Statistik der Extremwertverteilungen

Definition 18 (Die verallgemeinerte Pareto Verteilung (GPD)) Die standard GPD G γ : ) 1/γ. G γ,ν,β = 1 (1 + γ x ν β

Theorie Parameterschätzung Ausblick. Schätzung. Raimar Sandner. Studentenseminar "Statistische Methoden in der Physik"

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

3.4 Asymptotische Evaluierung von Sch atzer Konsistenz Konsistenz Definition 3.4.1: konsistente Folge von Sch atzer

1.3 Wiederholung der Konvergenzkonzepte

OLS-Schätzung: asymptotische Eigenschaften

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38

Korrektur: Lineare Regression in Excel

Eine Anwendung der Peak over Threshold Methode im Risikomanagement. Diplomarbeit. Julia Prahm. vorgelegt von

Extremwertverteilungen

Seminar Quantitatives Risikomanagement

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation

Modellanpassung und Parameterschätzung. A: Übungsaufgaben

Willkommen zur Vorlesung Statistik (Master)

Wichtige Definitionen und Aussagen

Multivariate Verteilungen

1. Grundbegri e der Stochastik

Wahrscheinlichkeit und Statistik: Zusammenfassung

Statistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt

Kapitel 6. Verteilungsparameter. 6.1 Der Erwartungswert Diskrete Zufallsvariablen

Statistik III. Walter Zucchini Fred Böker Andreas Stadie

Statistik I für Betriebswirte Vorlesung 14

13 Mehrdimensionale Zufallsvariablen Zufallsvektoren

Auswahl von Schätzfunktionen

6. Schätzverfahren für Parameter

Mathematische Statistik Aufgaben zum Üben. Schätzer

Statistik und Wahrscheinlichkeitsrechnung

Nachteile: STD existiert nur für Verteilungen mit E(FL 2 ) <, d.h. nicht ansetzbar bei leptokurtischen ( fat tailed ) Verlustverteilungen;

Willkommen zur Vorlesung Statistik (Master)

Definition Sei X eine stetige Z.V. mit Verteilungsfunktion F und Dichte f. Dann heißt E(X) :=

Statistik I für Betriebswirte Vorlesung 13

Willkommen zur Vorlesung Statistik (Master)

Bootstrap: Punktschätzung

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

70 Wichtige kontinuierliche Verteilungen

Chi-Quadrat-Verteilung

Statistisches Testen

Analyse von Extremwerten

Extremwertstatistik und und ihre Anwendungen in der Meteorologie

DWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr

5.8 Anpassungstests. W. Kössler (IfI HU Berlin) Werkzeuge der empirischen Forschung 389 / 419

Korollar 116 (Grenzwertsatz von de Moivre)

Wahrscheinlichkeitsfunktion. Binomialverteilung. Binomialverteilung. Wahrscheinlichkeitshistogramme

Lösung Übungsblatt 5

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

5. Spezielle stetige Verteilungen

3 Grundlagen statistischer Tests (Kap. 8 IS)

Reelle Zufallsvariablen

Inferenz im multiplen Regressionsmodell

Statistik für Ökonomen

1.4 Stichproben aus einer Normalverteilung

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015

Einführung in die Maximum Likelihood Methodik

1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...

Extremwerte II - Peak over Threshold (POT)

1 Stochastische Konvergenz 2. 2 Das Gesetz der grossen Zahlen 4. 3 Der Satz von Bernoulli 6

8 Stichprobenkennwerteverteilung

Diskrete Zufallsvariablen (Forts.) I

Anpassungsrechnungen mit kleinsten Quadraten und Maximum Likelihood

Beziehungen zwischen Verteilungen

2.3 Intervallschätzung

Vorlesung: Statistik II für Wirtschaftswissenschaft

13 Grenzwertsätze Das Gesetz der großen Zahlen

Grundlegende Eigenschaften von Punktschätzern

Die Familie der χ 2 (n)-verteilungen

Eindimensionale Zufallsvariablen

Mathematik 2 Probeprüfung 1

ML-Schätzung. Likelihood Quotienten-Test. Zusammenhang Reparametrisierung und Modell unter linearer Restriktion. Es gilt: β = Bγ + d (3.

I. Zahlen, Rechenregeln & Kombinatorik

Wahrscheinlichkeitstheorie Kapitel V - Stetige Verteilungen

Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen. Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung

3. Gemeinsame und bedingte Verteilung, stochastische Unabhängigkeit

2.3 Intervallschätzung

Auswertung und Lösung

2.2 Binomialverteilung, Hypergeometrische Verteilung, Poissonverteilung

7.2 Theoretische Kennwerte

Kapitel VII - Funktion und Transformation von Zufallsvariablen

Wahrscheinlichkeitsrechnung und schließende Statistik

3 Satz von Fisher Tippett

Stochastik für die Naturwissenschaften

Einführung in die Statistik

Stochastik-Praktikum

Mathematik für Biologen

Bestimmte Zufallsvariablen sind von Natur aus normalverteilt. - naturwissenschaftliche Variablen: originär z.b. Intelligenz, Körpergröße, Messfehler

Musterlösung zur Klausur im Fach Fortgeschrittene Statistik am Gesamtpunktzahl: 60

1 Relevante Beispiele für Verteilungen auf R

Anpassungsrechnungen mit kleinsten Quadraten und Maximum Likelihood

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Statistische Methoden in den Umweltwissenschaften

Wichtige Begriffe und Sätze aus der Wahrscheinlichkeitsrechnung

1 Verteilungsfunktionen, Zufallsvariable etc.

die wir als Realisationen von unabhängig und identisch verteilten Zufallsvariablen

Eine Einführung in R: Dichten und Verteilungsfunktionen

Wahrscheinlichkeitstheorie und Statistik vom

Hydrologie und Flussgebietsmanagement

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung

Zusammenfassung PVK Statistik

0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1

Transkript:

Randbereiche von Verteilungen: Fat Tails Martin Severin Zusammenfassung Bei der Beurteilung von extremen Risiken in der Finanz- und Versicherungsmathematik bieten die Extremwerttheorie und ihre statistische Methoden einen natürlichen Zugang. Wichtige Ergebnisse dieser Theorie werden dargestellt und am Beispiel eines realen Datensatzes erläutert. Abstract A natural approach to the quantification of extreme risks in insurance and finance is given by extreme value theory and statistical methods based on this theory. Some relevant theoretical results are summarized and applied to BMW asset prices. Keywords Verallgemeinerte Extremwert- und Paretoverteilung, Tailapproximation, Maximum-Likelihood- Schätzung, Pickands-, Hill-, Deckers-Einmahl-de Haan-Schätzer, Mittlere Exzessfunktion Zentrum Mathematik, Technische Universität München, D-80290 München, E-Mail: severin@ma.tum.de, http://www.ma.tum.de/stat/

Randbereiche von Verteilungen: Fat Tails 2 1 Einführung Eine für die Finanz- und Versicherungsmathematik wichtige Problemstellung behandelt die Schätzung der Verteilung von extremen Risiken, wie sie auch bei Aktienkursen auftreten können. Insbesondere sind die Randbereiche solcher Verteilungen interessant. Oft werden hierfür Verteilungen mit sogenannten fetten Verteilungsenden (fat tails oder heavy tails) angepasst. Einen natürlichen Zugang bieten die Extremwerttheorie und ihre statistische Methoden, wie sie etwa in Embrechts, Klüppelberg und Mikosch [3] beschrieben werden. Sehr vereinfacht dargestellt bieten diese Verfahren die Möglichkeit, von den Eigenschaften der mässig extremen Beobachtungen innerhalb einer Stichprobe, auf die Eigenschaften ganz extremer Verteilungsbereiche, die nicht durch die Stichprobe abgedeckt werden, zu schliessen. Ein klassisches Beispiel hierzu ist die Peaks Over Threshold (POT) Methode. Die hier verwendeten Verfahren sind semiparametrisch, d.h. die konkrete Form der Verteilungsfunktion einer Stichprobe wird nicht als bekannt vorausgesetzt. Zur Veranschaulichung soll ein realer Datensatz analysiert werden. Eine ausführliche Darstellung der Theorie findet sich in [3]. 2 Modellierung von Fat Tails Zur Modellierung der Randbereiche einer Verteilungsfunktion verwendet man die Daten, die in diesen Randbereichen auftreten, nach dem Motto let the tails speak for themselves. Wir betrachten hier nur das linke Verteilungsende, d.h. betragsmässige grosse Investmentverluste. Seien hierzu X 1, X 2,..., X n unabhängige und identisch verteilte (i.i.d.) Beobachtungen einer nichtnegativen Zufallsvariablen X mit Verteilungsfunktion F, sowie u > 0 eine fest gewählte Schranke und x F = sup{x R : F (x) < 1}. Jede Beobachtung X i, die den Schwellenwert u > 0 überschreitet heisst Exzedent zum Schwellenwert u und die Differenz Y i = X i u heisst Exzess von X i über u. Die Zufallsvariable N u = card{i : i = 1,..., n, X i > u} = card n (u) zählt die Exzedenten zur Schranke u. Diese Begriffe werden in Abbildung 1 veranschaulicht. Die Verteilungsfunktion des Exzesses Y über einen hohen Schwellenwert u F u (x) = P (X u x X > u) = F (x + u) F (u), u < x F, 1 F (u) wobei x (0, x F u) gilt, wollen wir mit Hilfe der Extremwerttheorie schätzen. Nachfolgend fassen wir die wichtigsten Ergebnisse dieser Theorie zusammen.

Randbereiche von Verteilungen: Fat Tails 3 X 5 X 2 Y 1 Y 2 X 3 Y 3 Y Nu u X 1 X 4 X 13 Abbildung 1: X 1, X 2,..., X 13 und Exzesse Y 1, Y 2,... Y Nu über einen grossen Schwellenwert u 3 Extremwerttheorie 3.1 Die verallgemeinerte Extremwertverteilung Vergleichbar zur Rolle der Normalverteilung als Grenzverteilung von Mittelwerten ist die Bedeutung der verallgemeinerten Extremwertverteilung (Generalized Extreme Value distribution, kurz GEV) für das Grenzverhalten von geeignet normierten und zentrierten Maxima. Das Analogon zum Zentralen Grenzwertsatz ist in der Extremwerttheorie das Theorem von Fisher und Tippett. Die Familie der GEV Verteilungen ist gegeben durch exp ( (1 + ξx) 1/ξ) falls ξ 0 H ξ (x) = exp ( e x ) falls ξ = 0, wobei x so gewählt ist, dass 1 + ξx > 0 bleibt. Je nachdem, ob ξ > 0, ξ < 0 oder ξ = 0 ist, spricht man von der Fréchet-, Weibull- oder Gumbel-Verteilung. Durch Einführen eines zusätzlichen Lokations-, bzw. Skalenparameters µ, bzw. σ > 0 kann diese Familie erweitert werden. Hierbei gilt H ξ,µ,σ (x) = H ξ ((x µ)/σ). Das Maximum von n Beobachtungen bezeichnen wir mit M n = max 1 i n X i. Falls nun reelle Zahlen a n > 0 und b n existieren, so dass die Folge der normalisierten Maxima (M n b n ) /a n in Verteilung gegen eine nichtdegenerierte Verteilungsfunktion H konvergiert, also P ((M n b n )/a n x) = F n (a n x + b n ) H(x), n,

Randbereiche von Verteilungen: Fat Tails 4 für alle Stetigkeitspunkte von H, sagt man F liegt im Maximum-Anziehungsbereich (Maximum Domain of Attraction) der Verteilung H, kurz F MDA(H). Fisher und Tippett zeigten 1928 (s. Theorem 3.2.3 [3]), dass dann Zahlen ξ, µ R, σ > 0 existieren, so dass H(x) = H ξ,µ,σ (x) gilt, also die Grenzverteilung eine verallgemeinerte Extremwertverteilung ist. Der Anziehungsbereich der Fréchet-Verteilung (ξ > 0) ist äquivalent zu den Verteilungen mit regulär variierendem Verteilungsende. Hierbei heisst eine Verteilung F regulär variierend, falls das Verteilungsende asymptotisch polynomial abfällt, genauer 1 F (x) = x α L(x), α > 0, α = 1/ξ, wobei für L(x) gilt L(tx) L(x) 1, falls x und t > 0. Für solche Verteilungen existieren alle Momente bis zur Ordnung α. Die Verteilungsklasse mit regulär variierendem Verteilungsende ist sehr gross und umfasst die Burr-, Pareto-, Log-Gamma-, Cauchy- und t-verteilungen. Diese gehören alle zu den Verteilungen mit sogenanntem Paretotail. Hingegen liegt die Lognormalverteilung im Anziehungsbereich der Gumbel-Verteilung (ξ = 0) und hat vergleichsweise weniger fette Verteilungsenden. 3.2 Die verallgemeinerte Paretoverteilung Weitere Ergebnisse der Extremwerttheorie beschreiben das Verhalten der Exzesse. Hierzu wird die Klasse der verallgemeinerten Paretoverteilung (Generalized Pareto Distribution, kurz GPD) verwendet. Diese ist gegeben durch 1 (1 + ξx/β) 1/ξ falls ξ 0 G ξ,β (x) = 1 exp( x/β) falls ξ = 0, (3.1) wobei der Skalenparameter β > 0 ist und x 0, bzw. 0 x β/ξ, falls ξ 0, bzw. ξ < 0 ist. Für positive Werte von ξ erhält man eine reparametrisierte Version der gewöhnlichen Paretoverteilung. Die Klassen der GEV und der GPD Verteilungen stehen in enger Verbindung zueinander. Für jedes ξ R gilt nach dem Theorem von Pickands, Balkema und de Haan (s. Theorem 3.4.13 [3]) folgende Äquivalenz F MDA(H ξ ) lim u xf sup F u (x) G ξ,β(u) = 0, (3.2) 0<x<x F u wobei β(u) eine geeignet gewählte positive Funktion ist. Für einen nur genügend gross gewählten Schwellenwert u kann also die Verteilung F u (x) des Exzesses X u durch eine verallgemeinerte Paretoverteilung approximiert werden, genau dann wenn F MDA(H ξ ) ist.

Randbereiche von Verteilungen: Fat Tails 5 3.3 Tailapproximation Mit obigem Ergebnis kann aber auch der Tail F (x) = 1 F (x) der Verteilung F approximiert werden, es gilt nämlich für y > 0 und F u (y) = 1 F u (y), F (u + y) = F (u)f u (y). Ein natürlicher Schätzer für F (u) ist der empirische Tail F n (u) = 1 n n i=1 I {Xi >u} = N u n und nach (3.2) gilt für grosse u F u (y) 1 G ξ, β(u) (y) = ( ) 1/ ξ 1 + ξ. (3.3) y β Somit ergibt sich als Schätzer für F (u + y) F (u + y) = N ( ) 1/ ξ u 1 + ξ, (3.4) n y β wobei ξ und β vom Schwellenwert u abhängen. Dieses Schätzverfahren ist auch als POT-Methode (Peaks Over Threshold) bekannt und kann insbesondere zur Schätzung von grossen Quantilen von F verwendet werden. Ein Anwendungsbeispiel hierzu findet sich in Emmer, Klüppelberg, Trüstedt [4]. 3.4 Maximum-Likelihood-Schätzer für GPD Verteilungen Falls Y = (Y 1, Y 2,..., Y k ) eine i.i.d. Stichprobe einer Zufallsvariablen Y ist, die eine GPD Verteilung besitzt, so ergibt sich als logarithmierte Likelihood-Funktion von Y ( ) k ( 1 l((ξ, β); Y) = n log β ξ + 1 log 1 + ξ ) β Y i. Die Likelihood-Gleichungen für die GPD Verteilung haben keine explizite Lösungen und müssen numerisch gelöst werden. Falls F MDA(H ξ ) und ξ > 1/2, so gilt für den Maximum- Likelihood Schätzer ( ξk, β ) k folgende Verteilungskonvergenz k ξ ξ k β k /β 1 i=1 d N(0, Σ), k. (3.5)

Randbereiche von Verteilungen: Fat Tails 6 Hierbei ist N(0, Σ) eine bivariate Normalverteilung mit Erwartungswertvektor 0 und Kovarianzmatrix Σ = (1 + ξ) 1 + ξ 1 1 2. (3.6) Bei der praktischen Umsetzung von (3.3) wird die Stichprobe Y mit den Exzessen über einen Schwellenwert u übereinstimmen und der Stichprobenumfang k von dem gewählten Schwellenwert u abhängig sein, d.h. es gilt k = N u. Diese Resultate ermöglichen es, approximative Standardabweichungen der geschätzten Parameter zu berechnen. 4 Hilfsmittel der Extremwerttheorie 4.1 Mittlere Exzessfunktion Um zu entscheiden, ob Beobachtungen von einer Verteilung mit fettem Verteilungsende stammen gibt es verschiedene Hilfsmittel. Ein solches ist die mittlere Exzessfunktion e(u), die für eine nichtnegative Zufallsvariable X mit EX < wie folgt definiert ist e(u) = E (X u X > u), u 0. (4.7) Die mittlere Exzessfunktion einer Exponentialverteilung entspricht ihrem reziproken Erwartungswert, ist also eine Konstante. Die Exzessfunktion von Verteilungen, die im Vergleich zur Exponentialverteilung fettere Verteilungsenden haben, strebt gegen unendlich. Wie man leicht nachrechnet, ist die mittlere Exzessfunktion einer GPD Verteilung mit endlichem Erwartungswert (ξ < 1) gegeben durch e(u) = β + ξ u 1 ξ, u < x F, und β + u ξ > 0, also eine lineare Funktion. Ersetzt man bei der theoretischen Berechnung von (4.7) die Verteilung von X durch deren empirische Verteilungsfunktion, so ist ein natürlicher Schätzer für e(u) gegeben durch ê(u) = 1 N u i n(u) (X i u), u > 0. (4.8) Zeigt der Verlauf von ê(u) ab einem grossen Schwellenwert u einen monoton wachsenden und linearen Trend, so wird man die Verteilung der Exzesse X u nach den Ergebnissen in Abschnitt 3.2 durch eine GPD Verteilung modellieren. In der Praxis ist die Wahl von u von dem zu modellierenden Datensatz und den Rahmenbedingungen des Anwenders abhängig.

Randbereiche von Verteilungen: Fat Tails 7 4.2 Pickands- und Hill-Schätzer Unter der Voraussetzung F MDA (H ξ ) für ein ξ R ist der Pickands-Schätzer für ξ gegeben durch ξ k,n = 1 ( ) ln 2 ln Xk,n X 2k,n, 1 k < n/4, X 2k,n X 4k,n wobei X n,n <... < X 1,n die Ordnungsstatistiken bezeichnen. Abhängig von nach den in der Praxis gegebenen Möglichkeiten, ist dieser einfach zu berechnende Schätzer für ξ als Alternative oder Ergänzung zum Maximum-Likelihood-Schätzer zu sehen. Unter den Voraussetzungen k/n 0 und k/ ln ln n für n folgt die starke Konsistenz des Pickands-Schätzers, d.h. ξ k,n a.s. ξ. Die asymptotische Normalität von ξ k,n, d.h. k( ξk,n ξ) d N(0, v(ξ)), n, (4.9) ist unter gewissen Regularitätsbedingungen garantiert. Mit Hilfe der asymptotischen Varianz des Pickands-Schätzers v(ξ) = ξ2 ( 2 2ξ+1 + 1 ) (2 (2 ξ 1) ln 2) 2 können asymptotische Konfidenzintervalle für ξ k,n berechnet werden. Falls F MDA (H ξ ) für ein ξ > 0 ist, d.h. im Anziehungsbereich der Fréchet-Verteilung liegt, ist der Hill-Schätzer für α = 1/ξ durch α k,n = 1 k k ln X j,n ln X k,n j=1 gegeben, wobei in geeigneter Weise k = k(n). Wie beim Pickands-Schätzer werden nur hinreichend grosse Ordnungsstatistiken verwendet und die starke Konsistenz folgt unter denselben Voraussetzungen. Eine Erweiterung des Hill-Schätzers für ξ R ist der Deckers-Einmahl-de Haan Schätzer. Weitere Hinweise zu diesen Schätzern finden sich in [3], Chapter 6. 1

Randbereiche von Verteilungen: Fat Tails 8 5 Datenbeispiel Als Beispiel betrachten wir die logarithmierten täglichen Returns der BMW-Aktie (Log-Returns) für den Zeitraum vom 02.01.1973 bis zum 23.07.1996, insgesamt 6146 Beobachtungen. Daten von Finanzzeitreihen verletzen oft die Annahme der Unabhängigkeit, jedoch gibt es für abhängige Daten analoge Ergebnisse zu denen in Abschnitt 3, wie sie etwa in Borkovec und Klüppelberg [1] und McNeil und Frey [5] zu finden sind. Die folgenden Resultate sind daher als erste Analyse dieses Datensatzes zu verstehen und dienen zur Illustration der Extremwerttheorie. Verweise auf Abbildungen beziehen sich auf Anhang A. Die Abbildungen 2 bis 4 geben einen ersten Überblick des Datenmaterials. Schaubild 2 zeigt die Log-Returns in ihrem zeitlichen Auftreten. Das Histogramm in Abbildung 3 und Tabelle 1 zeigen, dass sowohl sehr kleine und grosse Werte im Datensatz enthalten sind. Statistik BMW Log-Returns Anzahl der Beobachtungen 6146 Minimum -0.14060 25% Quantil -0.00665 Median 0.00000 Mittelwert 0.00034 75% Quantil 0.00713 Maximum 0.11719 Varianz 0.00022 Tabelle 1: Statistiken zu den BMW-Daten Der QQ-Plot (vgl. Cleveland [2], S. 28 f) in Abbildung 4 trägt die empirischen Quantile der Log-Returns gegen die theoretischen Quantile einer Normalverteilung mit Dichtefunktion ϕ µ,σ 2(x) = 1 2 π σ e (x µ)2 /2σ 2, x R auf. Als klassische Schätzer für µ und σ 2 dienen empirischer Mittelwert und empirische Varianz der Log-Returns (vgl. Tabelle 1). Stimmt die Wahl der Normalverteilung, liegen die Punkte ungefähr auf der Ursprungsgeraden mit Steigung 1. Der Vergleich des 5%-Quantils der Log- Returns (-0.02126), mit dem 5%-Quantil der angepassten Normalverteilung (-0.02393), ergibt einen Punkt in Abbildung 4 der ungefähr auf der eingezeichneten Ursprungsgeraden mit Steigung

Randbereiche von Verteilungen: Fat Tails 9 1 liegt. Jedoch zeigt das linke Ende des Plots deutlich, dass der linke Tail der Verteilung der Log- Returns sehr viel fetter ist als der linke Tail der angepassten Normalverteilung. Entsprechendes gilt auch für das rechte Verteilungsende der Log-Returns. Die Normalverteilung ist daher keine geeignete Verteilung, um das Risiko in den Tails der Log-Returns zu beschreiben. Im Folgenden wollen wir uns auf den linken Tail der Stichprobenverteilung beschränken. 1 Da es sich dabei um Verluste handelt, sind sie für das Risikomanagment von besonderem Interesse. Um deren Tail zu modellieren und die praktische Umsetzung der Methoden zu erläutern, wählen wir im Folgenden die Absolutbeträge der 500 kleinsten Log-Returns als Datenauswahl. Wesentliche Kennzahlen dieses Datensatzes sind in Tabelle 2 enthalten. In Abbildung 5 ist ein Zeitreihenplot Statistik Datenauswahl Anzahl der Beobachtungen 500 Minimum 0.01719 25% Quantil 0.01948 Median 0.02331 Mittelwert 0.02795 75% Quantil 0.03124 Maximum 0.14062 Tabelle 2: Statistiken zu der Datenauswahl der ausgewählten Daten zu sehen. Abbildung 6 zeigt ein zugehöriges Log-Histogramm, auf dessen Skalierung gut der fette Tail zu erkennen ist. Die empirische mittlere Exzessfunktion wurde in (4.8) definiert, als ê(u) = 1 (X i u), u > 0, N u i n(u) wobei n (u) = {i : i = 1,..., n, X i > u} und (X j ) 1 j n die Datenauswahl repräsentiert. Zu einem vorgegebenen Schwellenwert u schätzt sie den zu erwarteten Exzess X u einer nichtnegativen Zufallsvariablen X. Diese empirische mittlere Exzessfunktion ist in Abbildung 7 zu sehen. Sie zeigt einen monoton wachsenden und ungefähr linearen Trend, so dass die Modellierung des Tails durch eine GPD Verteilung angemessen erscheint. Unter der Annahme der in Abschnitt 4.2 erwähnten Voraussetzungen, berechnen wir den Pickands-Schätzer, welcher in Abbildung 8 als 1 Analog kann für den rechten Tail der Stichprobenverteilung vorgegangen werden.

Randbereiche von Verteilungen: Fat Tails 10 Funktion von 1 k 125 zu sehen ist. Die gepunkteten Linien sind asymptotische obere und untere 95% Konfidenzlinien, die aus (4.9) abgeleitet werden. Der Pickands-Schätzer vermittelt einen ersten Eindruck über den Parameter ξ. Der Maximum-Likelihood-Schätzer ξ für den Shape-Parameter ξ und dessen asymptotische Standardabweichung ist für eine exemplarische Auswahl von Schwellenwerten u in Tabelle 3 zu finden. Die Wahl von u wurde durch den Verlauf der empirischen mittleren Exzessfunktion in Abbilu 0.0172 0.0174 0.0178 0.0181 0.0184 0.0187 0.0189 ξ(n u ) 0.2458 0.2446 0.2505 0.2552 0.2578 0.2424 0.2173 se ξ(n u ) 0.0558 0.0566 0.0579 0.0592 0.0604 0.0609 0.0609 N u 500 483 466 449 433 416 399 u 0.0193 0.0197 0.0201 0.0205 0.0208 0.0215 0.0226 ξ(n u ) 0.2261 0.2280 0.2155 0.2010 0.1840 0.2016 0.1845 se ξ(n u ) 0.0627 0.0642 0.0651 0.0659 0.0666 0.0695 0.0728 N u 382 366 349 332 316 299 265 u 0.0233 0.0238 0.0248 0.0258 0.0265 0.0271 0.0290 ξ(n u ) 0.1884 0.1614 0.1695 0.1770 0.1522 0.1034 0.1454 se ξ(n u ) 0.0753 0.0763 0.0798 0.0836 0.0854 0.0859 0.0942 N u 249 232 215 198 182 165 148 u 0.0301 0.0330 0.0345 0.0369 0.0399 0.0433 0.0652 ξ(n u ) 0.1248 0.2419 0.1978 0.1962 0.2567 0.2172 0.2179 se ξ(n u ) 0.0979 0.1158 0.1210 0.1329 0.1559 0.1757 0.3145 N u 132 115 98 81 65 48 15 Tabelle 3: Maximum-Likelihood-Schätzer für ξ mit asymptotischer Standardabweichung (se) aus (3.6) dung 7 bestimmt. Wie bereits erwähnt, ist ein grosser Schwellenwert u zu wählen, ab dem diese Funktion einen monoton wachsenden und linearen Trend aufzeigt. Der Schwellenwert u führt zur Anzahl N u von Daten, die in den Schätzer einfliessen. Ist N u sehr klein, so ist die Varianz des Schätzers sehr gross. Ein zu grosser Wert von N u verzerrt den Schätzer. In Abbildung 9 ist der Maximum-Likelihood-Schätzer für ξ in Abhängigkeit des Schwellenwertes u oder damit äquivalent, zu N u, der Anzahl der Exzesse geplottet. Die gepunkteten Linien

Randbereiche von Verteilungen: Fat Tails 11 sind asymptotische 95% Konfidenzlinien, die sich aus (3.5) ergeben. Die geschätzten Werte für ξ stabilisieren sich um einen Wert von ca. 0.2. Es folgt ein Beispiel für N u = 100 oder äquivalent hierzu für u = 0.0342. Die Approximation der Verteilung der Exzesse F u (x u) = P (X u x u X > u), x u über einen Schwellenwert von u = 0.0342 durch die angepasste GPD Verteilung nach (3.3), wird in Abbildung 10 gezeigt. Die Maximum-Likelihood-Schätzung ergab hierfür ξ = 0.1972 und β = 0.0120. Die angepasste GPD hat mit (3.1) folgende Form G ξ, β(x) = 1 (1 + 16.433 x ) 5.071, x 0. Mit (3.3) gilt somit folgende Approximation P (X x X > u) = F u (x u) 1 (1 + 16.433 (x u) ) 5.071, x u. Zur praxisorientierten Anwendung von (3.3) sei bekannt, dass die BMW Aktie an einem Tag mindestens 3.4% (u=0.0342) an Wert verloren hat (X > u). Unter dieser Annahme ist der Wertverlust mit ungefähr 68.9% Wahrscheinlichkeit (G ξ, β(x u)) nicht grösser als 5.0% (x = 0.05). Ein Vergleich von empirischen Quantilen der Exzesse X u und theoretischen Quantilen der angepassten Pareto Verteilung, ist in Tabelle 4 zu finden. Die letzte Zeile in Tabelle 4 Quantil Empirisch Schätzung mit GPD 0.90 0.0347 0.0350 0.91 0.0359 0.0370 0.92 0.0413 0.0393 0.93 0.0438 0.0420 0.94 0.0442 0.0452 0.95 0.0473 0.0491 0.96 0.0523 0.0540 0.97 0.0716 0.0607 0.98 0.0720 0.0709 0.99 0.0746 0.0902 Tabelle 4: Vergleich empirischer Exzess-Quantile (u = 0.0342) mit GPD-Quantilen bedeutet etwa, dass unter obiger Annahme, der Exzess X u mit 99% Wahrscheinlichkeit nicht grösser als 7.46% (empirisch) bzw. 9.02% (Schätzung mit GPD) ist.

Randbereiche von Verteilungen: Fat Tails 12 Da Randbereiche von Verteilungen modelliert werden, beinhaltet die Betrachtung der Datenauswahl, also der Absolutbeträge der 500 kleinsten Log-Returns, keine Einschränkung der behandelten Methoden. Die obigen Schätzungen gelten also auch für den Randbereich der Verteilung der Absolutbeträge aller negativer Log-Returns der BMW-Aktie. Tabelle 5 ist eine Anwendung von (3.4) auf die Verteilung der Absolutbeträge aller negativen Log-Returns der BMW-Aktie. Diese Stichprobe umfasst 2768 Beobachtungen. In Tabelle 5 finden sich die Wahrscheinlichkeiten, dass der Absolutbetrag eines negativen Log-Returns einen vorgegebenen Verlust überschreitet. Die empirischen Wahrscheinlichkeiten wurden mit Hilfe der empirischen Verteilungsfunktion der Absolutbeträge der negativen Log-Returns berechnet. Die Werte in der letzten Spalte berechnen sich mit der Approximation der Verteilungsfunktion der Absolutbeträge der negativen Log-Returns durch die GPD nach (3.4), d.h. P (X u + x) = F (u + x) 100 2768 (1 + 16.433 x) 5.071, x 0, wobei jetzt F die Verteilungsfunktion des Absolutbetrages eines negativen Log-Returns bezeichnet. Diese Approximation wird in Abbildung 11 visualisiert. Anzumerken ist, dass die empiri- Verlust Empirisch Schätzung mit GPD 4% 2.3483% 2.2811% 5% 0.9754% 1.1236% 6% 0.5780% 0.6037% 7% 0.3251% 0.3472% 8% 0.2168% 0.2108% 9% 0.1445% 0.1339% Tabelle 5: Wahrscheinlichkeiten, dass der Absolutbetrag eines negativen Log-Returns einen vorgegebenen Verlust (grösser als u = 3.4%) überschreitet schen Wahrscheinlichkeiten unabängig von dem Schwellenwert u berechnet werden können. Die Approximation dieser empirischen Tailwahrscheinlichkeiten durch die verallgemeinerte Pareto- Verteilung verwendet jedoch implizit den gewählten Schwellenwert u und ist bei Änderung von u ebenfalls zu modifizieren. Zusammenfassend lässt sich also festhalten, dass die Randbereiche von Verteilungen im Mittelpunkt der Betrachtungsweise der Extremwerttheorie stehen. Diese bietet einen natürlichen

Randbereiche von Verteilungen: Fat Tails 13 Zugang bei der Beurteilung von extremen Risiken in der Finanz- und Versicherungsmathematik. Wie das Datenbeispiel zeigt, scheint die Wirklichkeit diesen Ansatz zu unterstützen. Danksagung Abschliessend möchte ich mich bei Claudia Klüppelberg und Dirk Tasche für deren freundliche Unterstützung beim Schreiben dieses Berichtes bedanken. Literatur [1] Borkovec, M. und Klüppelberg, C. (1999) Extremwerttheorie für Finanzreihen - ein unverzichtliches Werkzeug im Risikomanagement. Erscheint in: Rudolph, B. und Johanning, L. (Hrsg.) Handbuch Risikomanagement, Uhlenbruch Verlag, Bad Soden. [2] Cleveland, W. S. (1993) Visualizing Data. Hobart Press, Summit, New Jersey. [3] Embrechts, P., Klüppelberg, C. und Mikosch, T. (1997) Modelling Extremal Events for Insurance and Finance. Springer, Berlin. [4] Emmer, S., Klüppelberg, C. und Trüstedt, M. (1998) VaR - ein Mass für das extreme Risiko. Solutions, 2, 53-63. [5] McNeil, A. und Frey, R. (2000) Estimation of Tail-Related Risk Measures for Heteroscedastic Financial Time Series: an Extreme Value Approach. Journal of Empirical Finance, 7, 271-300.

Randbereiche von Verteilungen: Fat Tails 14 A Anhang -0.15-0.10-0.05 0.0 0.05 0.10 02.01.73 02.01.77 02.01.81 02.01.85 02.01.89 02.01.93 0 500 1000 1500-0.15-0.10-0.05 0.0 0.05 0.10 Zeit BMW Abbildung 2: Zeitreihenplot Abbildung 3: Histogramm Empirische Quantile -0.15-0.10-0.05 0.0 0.05 0.10 Quantile der Normalverteilung -0.04-0.02 0.0 0.02 0.04 0.06 Abbildung 4: QQ-Plot

Randbereiche von Verteilungen: Fat Tails 15 0.02 0.04 0.06 0.08 0.10 0.12 0.14 0 10 20 30 40 50 23.01.73 23.01.77 23.01.81 23.01.85 23.01.89 23.01.93-4.0-3.5-3.0-2.5-2.0 Zeit Abbildung 5: Zeitreihenplot Abbildung 6: Log-Histogramm Mittlerer Exzess 0.015 0.020 0.025 0.030 Shape (xi) (CI, p=0.95) -1 0 1 2 0.02 0.04 0.06 0.08 0.10 Schwellenwert u 20 40 60 80 100 120 k Abbildung 7: Mittlere Exzessfunktion Abbildung 8: Pickands-Schätzer

Randbereiche von Verteilungen: Fat Tails 16 Schwellenwert u 0.0652 0.0399 0.0330 0.0271 0.0248 0.0226 0.0208 0.0197 0.0187 0.0178 Shape (xi) (CI, p = 0.95) -0.4-0.2 0.0 0.2 0.4 0.6 0.8 Fu(x-u) 0.0 0.2 0.4 0.6 0.8 1.0 15 48 81 115 148 182 215 249 282 316 349 382 416 449 483 Anzahl der Exzesse N_u 0.05 0.10 0.15 0.20 x Abbildung 9: MLE ξ(n u ) Abbildung 10: GPD-Approximation 1-F(x) 0.0 0.05 0.10 0.15 0.20 0.05 0.10 0.15 0.20 x Abbildung 11: Tailapproximation für F (u + x), x 0, u = 0.0342 nach (3.4)