ChangePoint-Analysen - ein Überblick



Ähnliche Dokumente
In konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert.

Kapitel 5: Dynamisches Programmieren Gliederung

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Professionelle Seminare im Bereich MS-Office

Modellierung von Korrelationen zwischen Kreditausfallraten für Kreditportfolios. Bernd Rosenow, 3. Kölner Workshop Quantitative Finanzmarktforschung

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50, ,5 51,7 48,8

Korrelation - Regression. Berghold, IMI

Algorithmen und Datenstrukturen

Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR)

Fortgeschrittene Statistik Logistische Regression

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse Lösung 10 Punkte

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

Darstellungsformen einer Funktion

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln

Sichere Anleitung Zertifikate / Schlüssel für Kunden der Sparkasse Germersheim-Kandel. Sichere . der

Markovketten. Bsp. Page Ranking für Suchmaschinen. Wahlfach Entscheidung unter Risiko und stat. Datenanalyse

Diagnostisches Interview zur Bruchrechnung

GDOES-Treffen Berlin Sputterprozess und Kristallorientierung

Theoretische Grundlagen der Informatik WS 09/10

Monte-Carlo-Simulationen mit Copulas. Kevin Schellkes und Christian Hendricks

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Tangentengleichung. Wie lautet die Geradengleichung für die Tangente, y T =? Antwort:

Binäre abhängige Variablen

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Maximizing the Spread of Influence through a Social Network

Anleitung zur Einrichtung einer ODBC Verbindung zu den Übungsdatenbanken

Beispiel Zusammengesetzte Zufallsvariablen

Varianzanalyse (ANOVA: analysis of variance)

PVL 3 - Roulette. (5 Punkte) Abgabe bis

Gezielt über Folien hinweg springen

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

Überblick über die Verfahren für Ordinaldaten

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Klausur zur Vorlesung Stochastische Modelle in Produktion und Logistik im SS 2010

Die Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung.

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

R. Brinkmann Seite Schriftliche Übung Mathematik Stochastik II (Nachschreiber) Jan. 2007

Theoretische Grundlagen der Informatik

V 2 B, C, D Drinks. Möglicher Lösungsweg a) Gleichungssystem: 300x y = x + 500y = 597,5 2x3 Matrix: Energydrink 0,7 Mineralwasser 0,775,

Informatik-Sommercamp Mastermind mit dem Android SDK

TREND SEARCH VISUALISIERUNG. von Ricardo Gantschew btk Berlin Dozent / Till Nagel

How to do? Projekte - Zeiterfassung

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift:

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Einführung in die Java- Programmierung

Suche in Spielbäumen Spielbäume Minimax Algorithmus Alpha-Beta Suche. Suche in Spielbäumen. KI SS2011: Suche in Spielbäumen 1/20

Beschreibung EtherNet/IP Prozessschnittstelle

Algorithmen und Datenstrukturen Bereichsbäume

Mathematik. UND/ODER Verknüpfung. Ungleichungen. Betrag. Intervall. Umgebung

Klausur Nr. 1. Wahrscheinlichkeitsrechnung. Keine Hilfsmittel gestattet, bitte alle Lösungen auf dieses Blatt.

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

Klausur zur Vorlesung Multivariate Verfahren, SS Kreditpunkte, 90 min

AirKey Das Handy ist der Schlüssel

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen

FULFILLMENT VON ALLYOUNEED

Musterlösung zu Serie 14

Klausur zur Veranstaltung Industrielle Produktionssysteme im SS 04

Einführung in die Programmierung Laborübung bei Korcan Y. Kirkici. 12.Übung bis

Fassade. Objektbasiertes Strukturmuster. C. Restorff & M. Rohlfing

Lineare Gleichungssysteme

Grundlagen der Inferenzstatistik

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Es gibt zwei Wege die elektronischen Daten aus Navision zu exportieren.

Korrelation (II) Korrelation und Kausalität

Erster Prüfungsteil: Aufgabe 1

Division Für diesen Abschnitt setzen wir voraus, dass der Koeffizientenring ein Körper ist. Betrachte das Schema

Algorithmische Kryptographie

AirKey. Das Smartphone ist der Schlüssel

Operationalisierbare Qualitätskriterien für die Programmierung mit Erfahrungen aus PRÜ1 und PRÜ2

Programmierkurs Java

Internet Explorer Version 6

Der Kontowecker: Einrichtung

Vergleichsklausur 12.1 Mathematik vom

Stellvertretenden Genehmiger verwalten. Tipps & Tricks

Installation des Zertifikats

Entscheidungsbäume. Definition Entscheidungsbaum. Frage: Gibt es einen Sortieralgorithmus mit o(n log n) Vergleichen?

Erzeugung zufälliger Graphen und Bayes-Netze

Funktionaler Zusammenhang. Lehrplan Realschule

Wissensbasierte Systeme

Handbuch für Lehrer. Wie Sie bettermarks im Mathe- Unterricht einsetzen können

Standardisierte kompetenzorientierte schriftliche Reifeprüfung AHS. 11. Mai Mathematik. Teil-2-Aufgaben. Korrekturheft. öffentliches Dokument

Sudoku-Informatik oder wie man als Informatiker Logikrätsel löst

Organisation. Was kommt zum Test? Buch Informatik Grundlagen bis inkl. Kapitel 7.4 Wissensfragen und Rechenbeispiele

Dokumentation. Prüfungen sind zu dokumentieren: elektronische Systeme Prüfplaketten Prüfbücher. DIN VDE Abschn. 6

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Planen mit mathematischen Modellen 00844: Computergestützte Optimierung. Autor: Dr. Heinz Peter Reidmacher

Tutorial: Homogenitätstest

MATHEMATIK 3 STUNDEN. DATUM: 8. Juni 2009

Kleine Einführung in die lineare Regression mit Excel

Algorithmik II. SS 2003 Prof. Dr. H. Stoyan Lehrstuhl für Informatik 8 ( Künstliche Intelligenz) stoyan@informatik.uni-erlangen.

Tipp III: Leiten Sie eine immer direkt anwendbare Formel her zur Berechnung der sogenannten "bedingten Wahrscheinlichkeit".

9. Schätzen und Testen bei unbekannter Varianz

Lineare Gleichungssysteme I (Matrixgleichungen)

Aufgabensammlung Bruchrechnen

Ruinwahrscheinlichkeiten im Glücksspiel

Anleitung Redmine. Inhalt. Seite 1 von 11. Anleitung Redmine

> Mozilla Firefox 3. Browsereinstellungen optimieren. Übersicht. Stand Juli Seite. Inhalt. 1. Cache und Cookies löschen

Transkript:

ChangePoint-Analysen - ein Überblick

Gliederung Motivation Anwendungsgebiete Chow Test Quandt-Andrews Test Fluktuations-Tests Binary Segmentation Recursive circular and binary segmentation algorithm Bayesscher Ansatz Barry und Hartigan Dynamic programming algorithm Minimax TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 2 von 25

Motivation TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 3 von 25

Anwendungsgebiete Qualitätssicherung in der Herstellung Wertpapiermarkt Spam Filter Website Tracking durch Webcrawler Einbruchmeldeanlagen Medizinische Diagnostik TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 4 von 25

Chow Test Gegeben: Datensatz Beschreibung der Beziehung durch lineare Funktion: für TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 5 von 25

Exkurs zur Begriffsklärung Regressionsanalyse Erklärung einer abhängige Variable durch mehrere unabhängige Variablen Bsp.: TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 6 von 25

Exkurs zur Begriffsklärung Regressionsanalyse Erklärung einer abhängige Variable durch mehrere unabhängige Variablen Bsp.: Methode der kleinsten Quadrate Parametresierbare Funktion aus passender Funktionsklasse wählen Parameter bestimmen (Minimierung der Summe der quadratischen Abstände der Kurve zu den Datenpunkten) TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 7 von 25

Exkurs zur Begriffsklärung Regressionsanalyse Erklärung einer abhängige Variable durch mehrere unabhängige Variablen Bsp.: Methode der kleinsten Quadrate Parametresierbare Funktion aus passender Funktionsklasse wählen Parameter bestimmen (Minimierung der Summe der quadratischen Abstände der Kurve zu den Datenpunkten) Residuum Beschreibt Anteil der Variabilität des Modells Grafik erstellt mit APIPRO (Thomas Wagner, Matthias Lehmann) TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 8 von 25

Chow Test (Forts.) Aufspaltung für bessere Beschreibung des Datensatzes für für Test auf Gleichheit durch Koeffizientenvergleich Problem: Bruchzeitpunkt muss bekannt sein TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 9 von 25

Quandt-Andrews Test Idee: wenn für den Chow-Test der Bruchzeitpunkt bekannt sein muss dann Chow-Test auf alle Zeitpunkte anwenden Anschließend Auswertung der Chow-Statistik (Anzahl der nicht übereinstimmenden Regressionsparameter) TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 10 von 25

Quandt-Andrews Test in R USD/EUR Kurs TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 11 von 25

Quandt-Andrews Test in R Chow-Statistik TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 12 von 25

Quandt-Andrews Test in R maximaler Wert TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 13 von 25

Fluktuations-Tests Idee: Brüche an Residuen erkennen Annahme: die Folgepunkte weichen nicht signifikant von Trend ab TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 14 von 25

Fluktuations-Tests Idee: Brüche an Residuen erkennen Annahme: die Folgepunkte weichen nicht signifikant von Trend ab Berechnung rekursiver Residuen aus 1-Schritt- Prognosefehlern im Zeitverlauf Annahme: Folge der Partialsummen der rekursiven Residuen verhält sich pendelt um 0 Algorithmen: CUSUM, OLS- CUSUM TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 15 von 25

Binary Segmentation X1,,Xn Zeitreihe als Beobachtungen X1,,Xn aufgefasst Annahme:Daten mit einer gewissen Varianz normal verteilt TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 16 von 25

Binary Segmentation X1,,Xn Zeitreihe als Beobachtungen X1,,Xn aufgefasst Annahme:Daten mit einer gewissen Varianz normal verteilt Einsatz von Wahrscheinlichkeitsrechnung für den Test auf die Nullhypothese (kein ChangePoint) TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 17 von 25

Binary Segmentation X1,,Xn Zeitreihe als Beobachtungen X1,,Xn aufgefasst Annahme:Daten mit einer gewissen Varianz normal verteilt Einsatz von Wahrscheinlichkeitsrechnung für den Test auf die Nullhypothese (kein ChangePoint) Bei Überschreitung einer gewissen Wahrscheinlichkeit wird Nullhypothese verworfen TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 18 von 25

Binary Segmentation X1,,Xn Zeitreihe als Beobachtungen X1,,Xn aufgefasst Annahme:Daten mit einer gewissen Varianz normal verteilt Einsatz von Wahrscheinlichkeitsrechnung für den Test auf die Nullhypothese (kein ChangePoint) Bei Überschreitung einer gewissen Wahrscheinlichkeit wird Nullhypothese verworfen Segmentierung X1,,Xa Xa+1,,Xn TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 19 von 25

Binary Segmentation X1,,Xn Zeitreihe als Beobachtungen X1,,Xn aufgefasst Annahme:Daten mit einer gewissen Varianz normal verteilt Einsatz von Wahrscheinlichkeitsrechnung für den Test auf die Nullhypothese (kein ChangePoint) Bei Überschreitung einer gewissen Wahrscheinlichkeit wird Nullhypothese verworfen Segmentierung Rekursive Anwendung bis kein ChangePoint mehr gefunden wird X1,,Xa Xa+1,,Xn Nachteil: kleine Brüche in der Mitte eines großen Segments schlecht erkennbar TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 20 von 25

Recursive circular and binary segmentation algorithm Behebt Nachteile von Binary Segmentation durch Verbinden der Segmentenden zu Kreis Veränderte Wahrscheinlichkeitsberechnung mit weiterem Parameter TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 21 von 25

Bayesscher Ansatz Regressionsmodell der Form: Matrixnotation: Wahrscheinlichkeit einer Beobachtung in der in der Umgebung von (LikeliHood-Funktion) An einen gegebenen Change-Point gilt: TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 22 von 25

Barry und Hartigan Annahme Wahrscheinlichkeit eines ChangePoints an der Position i ist unabhängig an allen i Partitionierung in ChangePoint an Position i+1 Initialisierung: die ersten n-1 Elemente mit 0, das n-te mit 1 Benutzung einer Markow Kette für die bei jedem Schritt, an jeder Position i ein Wert ziehen TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 23 von 25

Dynamic programming algorithm Verwendet dynamischen Programmierung optimale Partitionierung in eine beliebige Anzahl an Segmenten Parameter: minimale Segmentlänge h oder maximale Anzahl an Brüchen m TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 24 von 25

Minimax Einsatz von Wavelet-Transformation MAXIMIERUNG Umgebung des ChangePoints wird gefunden MINIMIERUNG genauer Punkt wird gefunden TU Dresden, 08.07.2011 ChangePoint-Analysen - ein Überblick Folie 25 von 25