Schätzung der Kovarianzmatrix

Ähnliche Dokumente
Kapitel 5: Schließende Statistik

Statistik Einführung // Konfidenzintervalle für einen Parameter 7 p.2/39

Praktikum Vorbereitung Fertigungsmesstechnik Statistische Qualitätskontrolle

Es werden 120 Schüler befragt, ob sie ein Handy besitzen. Das Ergebnis der Umfrage lautet: Von 120 Schülern besitzen 99 ein Handy.

14 Statistische Beziehungen zwischen nomi nalen Merkmalen

Kovarianz und Korrelation

Beispiel: p-wert bei Chi-Quadrat-Anpassungstest (Grafik) Auftragseingangsbeispiel, realisierte Teststatistik χ 2 = , p-wert: 0.

3 Kritischer Bereich zum Niveau α = 0.10: K = (χ 2 k 1;1 α, + ) = (χ2 5;0.90, + ) = (9.236, + ) 4 Berechnung der realisierten Teststatistik:

Testen statistischer Hypothesen

Kunde. Kontobewegung

Übungen mit dem Applet Fourier-Reihen

Einführung in die Stochastik 10. Übungsblatt

Eingangsprüfung Stochastik,

Bei 95%iger Konfidenz wäre der Mittelwert der GG zwischen 1421,17DM und 1778,83DM zu erwarten.

X in einer Grundgesamtheit vollständig beschreiben.

n 1,n 2,n 3,...,n k in der Stichprobe auftreten. Für die absolute Häufigkeit können wir auch die relative Häufigkeit einsetzen:

Wissenschaftliches Arbeiten Studiengang Energiewirtschaft

SBP Mathe Aufbaukurs 1. Absolute und relative Häufigkeit. Das arithmetische Mittel und seine Eigenschaften. Das arithmetische Mittel und Häufigkeit

1.2. Taylor-Reihen und endliche Taylorpolynome

Löslichkeitsdiagramm. Grundlagen

Statistische Modelle und Parameterschätzung

Informatik II Dynamische Programmierung

Prof. Dr. Roland Füss Statistik II SS 2008

Evaluierung einer Schulungsmaßnahme: Punktezahl vor der Schulung Punktezahl nach der Schulung. Autoritarismusscore vor/nach Projekt

a) Zeichnen sie ein Schaltbild des Versuches und beschriften sie dieses.

2.2.1 Lagemaße. Exkurs: Quantile. und n. p n

Statistik I/Empirie I

15.4 Diskrete Zufallsvariablen

2.3 Kontingenztafeln und Chi-Quadrat-Test

2 Vollständige Induktion

Übungen mit dem Applet Taylor-Entwickung von Funktionen

Dr. Jürgen Senger INDUKTIVE STATISTIK. Wahrscheinlichkeitstheorie, Schätz- und Testverfahren

Einführung in die Grenzwerte

Methoden zur Konstruktion von Schätzern

Statistik I Februar 2005

Qualitätskennzahlen für IT-Verfahren in der öffentlichen Verwaltung Lösungsansätze zur Beschreibung von Metriken nach V-Modell XT

(4) = 37,7 % mit 37,7 % Wahrscheinlichkeit sind es höchstens 4 Fahrräder, das ist recht hoch; man kann also die Behauptung nicht wirklich ablehnen.

Statistik mit Excel Themen-Special. Peter Wies. 1. Ausgabe, Februar 2014 W-EX2013S

Aufgabe 1: Funktionale Modellierungen

7. Stichproben und Punktschätzung

1 Einführende Worte 2

1. Zahlenfolgen und Reihen

von solchen Abbildungen. Eine solche Folge bestimmt für jedes x M die Folge der Werte f n. Schreibt man dies noch einmal formal hin, so erhält man:

K. Felten: Internet Network infrastucture Fachhochschule Kiel, Fachbereich IuE

2. Gleichwertige Lösungen

Statistische Tests zu ausgewählten Problemen

Kapitel 6: Quadratisches Wachstum

Robuste Asset Allocation in der Praxis

AngStat1(Ue13-21).doc 23

= a n: Wurzelexponent x: Radikand oder Wurzelbasis a: Wurzelwert Bei der ersten Wurzel wird einfach das Wurzelzeichen weggelassen.

Zählterme (Seite 1) Aufgabe: Wie viele Nummernschilder kann es theoretisch im Raum Dresden geben? Wann müsste die 4.Ziffer eingeführt werden?

Parameter von Häufigkeitsverteilungen

Linsengesetze und optische Instrumente

... a ik) i=1...m, k=1...n A = = ( a mn

IWW Studienprogramm. Aufbaustudium. Gründungscontrolling. Lösungshinweise zur 3. Musterklausur

Vorkurs Mathematik für Informatiker Folgen

4. Die Menge der Primzahlen. Bertrands Postulat

Gliederung. Value-at-Risk

Finanzmathematische Formeln und Tabellen

Stichproben im Rechnungswesen, Stichprobeninventur

$Id: reihen.tex,v /06/14 13:59:06 hk Exp $

LV "Grundlagen der Informatik" Programmierung in C (Teil 2)

elektr. und magnet. Feld A 7 (1)

18 2 Zeichen, Zahlen & Induktion *

Konfidenzintervall_fuer_pi.doc Seite 1 von 6. Konfidenzintervall für den Anteilswert π am Beispiel einer Meinungsumfrage

6 Folgen. 6.4 Folgen reeller Zahlen. Mathematik für Informatiker B, SS 2012 Dienstag 5.6. $Id: folgen.tex,v /06/05 11:12:18 hk Exp $

Übung zur Vorlesung Statistik I WS Übungsblatt 8

Die Gasgesetze. Die Beziehung zwischen Volumen und Temperatur (Gesetz von J.-L. und J. Charles): Gay-Lussac

Kennwerte Univariater Verteilungen

Aufgabe 1. Die Abschreibungen erfolgen linear. Der Kalkulationszinssatz beträgt i = 0,10.

Nennenswertes zur Stetigkeit

3. Einführung in die Statistik

Kryptologie: Kryptographie und Kryptoanalyse Kryptologie ist die Wissenschaft, die sich mit dem Ver- und Entschlüsseln von Informationen befasst.

Kapitel 9 WAHRSCHEINLICHKEITS-RÄUME

Grundzüge der Stichprobentheorie. Statistisches Bundesamt

Preisblatt. Service. über Netzanschlüsse Erdgas, Trinkwasser, Strom und Fernwärme, Baukostenzuschüsse und sonstige Kosten. Gültig ab 1.

Kapitel 6: Statistische Qualitätskontrolle

Das FSB Geldkonto. Einfache Abwicklung und attraktive Verzinsung. +++ Verzinsung aktuell bis zu 3,7% p.a. +++

Page-Rank: Markov-Ketten als Grundlage für Suchmaschinen im Internet

Formelsammlung. zur Klausur. Beschreibende Statistik

Wir weisen die Gültigkeit der 4Axiome der sigma-algebra für die Potenzmenge einer endlichen Menge A nach!

Seminar: Randomisierte Algorithmen Routenplanung in Netzwerken

Die Instrumente des Personalmanagements

Wahrscheinlichkeit & Statistik

Übungen zur Klausur Nr. 2: Wahrscheinlichkeitsrechnung II

Der χ 2 Test. Bei Verteilungen Beantwortung der Frage, ob eine gemessene Verteilung Gauß- oder Poisson-verteilt ist oder nicht?

Weitere Lagemaße: Quantile/Perzentile II. Weitere Lagemaße: Quantile/Perzentile I. Weitere Lagemaße: Quantile/Perzentile IV

2 Differentialrechnung und Anwendungen

Versuch 1/1 POISSON STATISTIK Blatt 1 POISSON STATISTIK. 1. Vorbemerkung

Bewertung von Anleihen

Körpergröße x Häufigkeit in [m]

n (n + 1) = 1(1 + 1)(1 + 2) 3 Induktionsschritt: Angenommen die Gleichung gilt für n N. Dann folgt: 1 2 = 2 =

Fingerprinting auf Basis der Geometrischen Struktur von Videos

Statistische Maßzahlen. Statistik Vorlesung, 10. März, Beispiel. Der Median. Beispiel. Der Median für klassifizierte Werte.

Korrelationsanalyse zwischen kategorischen Merkmalen. Kontingenztabellen. Chi-Quadrat-Test

Betrachtung von wahrscheinlichen und unwahrscheinlichen Zuständen eines Systems. Beide Zustände haben die gleiche Innere Energie (ideales Gas).

1.3 Funktionen. Seien M und N Mengen. f : M N x M : 1 y N : y = f(x) nennt man Funktion oder Abbildung. Beachte: Zuordnung ist eindeutig.

Aufgabenblatt 6. Anpassung Beta an Verschuldungsgrad: Problem

Physikalische Grundlagen: Strahlengang durch optische Systeme

Aufgaben und Lösungen der Probeklausur zur Analysis I

Transkript:

Schätzug der Kovariazmatrix Aus eiem Esemble vo Beobachtuge {x i } ka die Kovariazmatrix (Zetralmomete) geschätzt werde: C = E{( x µ )( x µ ) } = R µ µ xx x x xx x x ˆ 1 C ˆ ˆ xx = xk µ x xk µ x k = 1 1 µ ˆ x = xk k = 1 Schätzwert (edliche Summe): ( )( ) ud dem Schätzwert: Cˆ wird also aus der Summe vo Matrize vom Rag 1 berechet: xx ( x ˆ )( ˆ k µ x xk µ x) da i dem dyadische Produkt ur Vielfache des Zeilevektors ( x µ ˆ ) vorkomme, wege: xy k x x1 y x2 y = x N y

Problem der hohe Merkmalsdimesioalität Ĉ ist somit sigulär, we weiger als =N, mit N=dim(x), uabhägige Beobachtuge des Esembles verfügbar sid!! Dies ist ei Problem, we die Azahl der Merkmale sehr groß ist ud ur weige Stichprobe des Esembles zur Verfügug stehe. Die Güte der Schätzug wird allerdigs erst mit >>N verbessert. Außerdem wird icht Ĉ, soder Ĉ -1 beötigt! Was ka ma tu, we eie zu gerige Stichprobe zur Verfügug steht? Ma ka die Azahl der Merkmale durch eie KL reduziere, oder Ma vereifacht das Modell ud damit die Azahl der Parameter: ma immt z.b. Ukorreliertheit der Merkmale a ud setzt alle Nebediagoalelemete zu Null, wodurch die Ivertierbarkeit erzwuge wird. Obwohl diese Vorgehesweise eigetlich ikorrekt ist, ergebe sich durch diese Heuristik häufig brauchbare Ergebisse.

Zum Problem der gerige Stichprobe Der resultierede Klasssifikator uter der Zwagsaahme der statistische Uabhägigkeit ist sicherlich suboptimal. Dies hägt zusamme mit dem Problem der uzureichede Stichprobe. Ma ka es vergleiche mit dem Problem des Kurve- Fittig. Das Bild zeigt 6 Datepukte ud verschiedee Polyome zum Fitte. Die Datepukte wurde erzeugt durch Hizufüge vo mittelwertfreie, uabhägigem Rausche zu eier Parabel. Deshalb sollte eie Parabel de beste Fit ergebe, we wir aehme, dass weitere Stichprobe hizukomme ud die 6 Pukte ergäze. Kurveapproximatio a eie Mege vo Pukte Die Gerade ergibt eie brauchbare Näherug. Die Parabel ergibt eie bessere Approximatio, aber ma ka sich frage, ob die Stichprobe gut geeiget war, die Parabel festzulege. Die Parabel für eie größere Stichprobe köte gaz woaders liege ud im betrachtete Itervall köte die Gerade die bessere Näherug sei. Overfittig: Das Polyom 10. Grades ergibt eie perfekte Fit. Aber ma ka icht erwarte, dass solch eie uterbestimmte Näherug eue Stichprobe gut approximiert. Es müßte sehr viel mehr Stichprobe zur Verfügug stehe, um eie ählich gute Approximatio vo eiem Polyom 10. Grades im Vergleich zu eiem Parabelfit zu bekomme, trotz der atsache, dass das Letztere ei Soderfall (=2) des Erste ist.

Regel: je kleier die Stichprobe, desto eifacher sollte auch das Modell gewählt werde Esemble Im allg. gilt: Zuverlässige Iter- ud Extrapolatio ka ur bei stark überbestimmte Lösuge erwartet werde (hireiched großer Stichprobeumfag). Also: We eie exakte statistische Modellierug gegebe wäre, da ist mit dem MAP-Asatz user Problem gelöst. I der Praxis stellt sich jedoch i der Regel das Problem, aus eier edliche Stichprobe eie gute Klassifikator herzuleite. Stichprobe 1 (repräsetativ) Stichprobe 2 (icht repräsetativ)

Problem der Geeralisierugsfähigkeit eies Klassifikators Wie reagiert ei Klassifikator, welcher auf eie edliche Stichprobe aufbaut, auf eu hizukommede Experimete (Problem der Iter- ud Extrapolatio)? Ma uterscheidet deshalb zwische eier raiigs- (Ler-) ud eier estmege. Die Überprüfug der Leistugsfähigkeit ur ahad des Lersatzes bezeichet ma als Reklassifikatio (dabei ka ma eie ideale Fit erreiche) ud die Überprüfug ahad eies uabhägige estdatesatzes bezeichet ma als Geeralisierug (Iter- ud Extrapolatiosfähigkeit). Je größer die Azahl der Parameter der i der Klassifikatio verwedete Schätzfuktio, desto größer muss der Stichprobeumfag der raiigsmege sei.

Rekursive Schätzug der statistische Kegröße Komme währed eier Erkeugsaufgabe fortwähred eue Stichprobe hizu, so ist es vorteilhaft, die statistische Kegröße rekursiv zu schätze. Dies ist mit wesetlich weiger Aufwad verbude, als vo dem erweiterte Stichprobeumfag die Grudgleichuge immer wieder ereut zu löse (lerede bzw. adaptive Vorgehesweise, batch estimate versus recursive estimate).

Für die Schätzug des Erwartugswerts gilt: 1 1 1 ˆ = xk = ( xk + x) k= 1 k= 1 µ = (1 ) µ ˆ + x = µ ˆ + ( x µ ˆ ) 1 1 1 1 1 1 Die Schätzug wird i jedem Schritt proportioal zur Abweichug zwische der der derzeitige Schätzug ud der derzeitige Beobachtug verädert. Eie Verallgemeierug der obige Rekursio ergibt: µ ˆ = µ ˆ + α( x µ ˆ ) = (1 α) µ ˆ + αx 1 1 1 mit: 1/ statioär α = cost. quasi-statioär

Mit α=1/ werde statioäre Verhältisse ageomme, d.h. alle Beobachtuge habe uabhägig vo der Zeit ihres Auftretes das gleiche Gewicht, d.h. die letzte Beobachtuge sid geauso wichtig wie die erste. Bei α=cost. wird eie Fluktuatio akzeptiert, d.h. die euere Beobachtuge habe eie größeres Gewicht als die alte (expoetial smoothig). Das Beobachtugsfester ist äherugsweise gegebe durch 1/α mit α=cost. Beitrag zum Mittelwert Lagzeitmittelug α =1/ Beitrag zum Mittelwert Kurzzeitmittelug α = cost. 1/α

Rekursive Schätzug der Kovariazmatrix Für die Korrelatiosmatrix (2. Momete) erhält ma die Rekursio: Rˆ = (1 α) Rˆ + αx x 1 Für die rekursive Berechug der Kovariazmatrix wird ˆµ beötigt, was durch eie zweite Rekursio zu ermittel ist: Cˆ = Rˆ µµ ˆ ˆ ˆ = [(1 α) R ˆ ˆ 1+ αxx] [(1 α) µ 1+ αx][(1 α) µ 1+ αx] ˆ 2 2 = (1 α) R ˆ ˆ ˆ ˆ 1+ αxx (1 α) µ 1µ 1 α(1 α)[ µ 1x + xµ 1] α xx (1 )[ ˆ = α R ˆ ˆ ˆ ˆ ˆ ˆ 1 µµ + α( xx µ 1x xµ 1+ µ 1µ 1] = ( ˆ 1 α)[ C + α( x µ ˆ )( x µ ˆ ) ] 1 1 1

Rekursive Schätzug der Kovariazmatrix Also beide Rekursioe zusamme: ˆ ˆ C = (1 α)[ C + α( x µ ˆ )( x µ ˆ ) ] 1 1 1 µ ˆ = (1 α) µ ˆ + αx 1

Rekursive Schätzug der iverse Korrelatiosmatrix Für die Berechug des Mahalaobis-Abstades wird higege eie Rekursio für die iverse Kovariazmatrix beötigt, ohe dass dabei jeweils zusätzlich eie Matrixiversio durchzuführe ist! Mit dem folgede Satz zur Matrixiversio: ( I+ AB ) = I A( I+ B A) B 1 1 Erhält ma eie Rekursio für die iverse Korrelatiosmatrix: Rˆ = [(1 α) Rˆ + αx x ] 1 1 1 1 ˆ 1 ˆ 1 1 = R R x ( + x Rˆ x ) x Rˆ (1 α) (1 α) α (1 α) 1 1 1 1 1 1 2 1 1 1 ˆ 1 ˆ 1 1 ˆ 1 R 1xxR 1 = R 1 α ˆ 1 (1 α) 1 + α( xr 1x 1)

Rekursive Schätzug der iverse Kovariazmatrix Ud für die iverse Kovariazmatrix: Cˆ = [(1 α) Rˆ + αx x ] 1 1 1 1 ˆ = [ C ˆ ˆ 1+ α( x µ 1)( x µ 1) ] (1 α) ˆ ˆ 1 1 ˆ 1 C ˆ ˆ 1( x µ 1)( x µ 1) C 1 = 1 α ˆ 1 (1 α) C 1 + α( x ˆ ˆ µ 1) C 1( x µ 1) 1 Rekursives Lere ka atürlich auch mit der Musterklassifikatio kombiiert werde. Das System verbessert sich bei eu hizukommede Stichprobe. Dies setzt allerdigs voraus, dass ei Labellig für die Klasse stattfidet (überwachtes Lere), d.h. der meschliche Beobachter trifft eie übergeordete Etscheidug für die Klassezugehörigkeit.