Bootstrap: Punktschätzung
|
|
- Jakob Becke
- vor 6 Jahren
- Abrufe
Transkript
1 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 1 Bootstrap: Punktschätzung 1. Die Grundidee 2. Plug-in Schätzer 3. Schätzung des Standardfehlers 4. Schätzung und Korrektur der Verzerrung 5. Konsistenz des Bootstraps
2 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 2 1. Die Grundidee Nehmen wir an, daß wir eine Stichprobe x = (x 1, x 2,..., x n ) aus einer Population genommen und eine Prüfgröße t(x) aus x berechnet haben. Wir möchten jetzt die Verteilung von t(x) bestimmen oder schätzen. Wäre es am einfachsten, wenn wir die Verteilung empirisch bestimmen könnten: wir würden weitere (oder alle mögliche) Stichproben von demselbem Umfang aus der Population nehmen und für jede Stichprobe t(x) berechnen: damit würden wir die Verteilung von t(x) erhalten. Wenn es nicht möglich ist, nehmen wir Stichproben aus der beobachteten Stichprobe x und rechnen damit als ob sie aus der Population stammten! (*-Bezeichnung: x und x*, t und t*, usw.)
3 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 3 Je besser die beobachtete Stichprobe die Population wiederspiegelt, desto besser ist die Übereinstimmung zwischen der wahren Verteilung und der Bootstrap-Verteilung. Der Name kommt aus dem Märchen über den Lügenbaron von Münchhausen, der sich an den Haaren in der englischen Version an der Stiefelschlaufe (=bootstrap) aus dem Wasser gezogen hat.
4 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 4 2. Plug-in Schätzer Parameter und Funktionale In der parametrischen Statistik schätzt man die Parameter einer Verteilung (d. h. Parameter der Verteilungs- oder Dichtefunktion). Beispiele: die Parameter µ oder σ der Normalverteilung, der Parameter λ der Exponentialverteilung, usw. In der nichtparametrischen Statistik sind die zu schätzenden Größen nicht Parameter im obigen Sinn, sondern Funktionale. Beispiel: nichtparametrisch formuliert man den Mittelwert einer Variable X (verteilt nach Q) als E(X) oder E(Q) = xdq = xf ( x) dx. (Diese Definition ist auch in der parametrischen Statistik gültig.)
5 Plug-in Schätzer Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 5 Bezeichne t(q) einen beliebigen Funktional der Verteilung Q. Die plug-in Schätzung von t(q) ist t(q n ), wobei Q n die empirische Verteilung ist. Noch genauer könnte man t Q (Q n ) schreiben, um zu betonen, dass Q n von einer Stichprobe aus der Verteilung Q stammt. Die von der Stichprobe x = (x 1,, x n ) stammende empirische Verteilung ist ein Maß mit Gewichten 1/n an den Werten x i 1 Q ( A) =. n n x A Daher ist die empirische Verteilungsfunktion 1 F ( x) =. n i x i n < x
6 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 6 Beispiele: Der Stichprobemittelwert ist die plug-in Schätzung für den Mittelwert 1 E( Qn ) = xdqn = xi = x i n Die unkorrigierte Varianz ist die plug-in Schätzung für die Varianz var( Q n ) = x dqn E ( Qn ) = xi x = i n (die korrigierte Varianz ist keine plug-in Schätzung!) usw. Da Q n eine konsistente Schätzung für Q liefert, wenn der Funktional t(.) bei Q stetig ist, dann t(q n ) t(q) in Verteilung. s 2
7 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 7 Beim Bootstrap zieht man Stichproben x* aus der empirischen Verteilung F n, und schätzt die Verteilung der Prüfgröße t(f n ) mit der Verteilung von t(f n *), wobei F n * die von x* stammende, empirische Verteilung bezeichnet. x ist eine Stichprobe aus F F n ist die empirische Verteilung basiert auf x t(f n ) ist ein beobachteter Wert der Prüfgröße Q F (t) ist die zu schätzende Verteilung der Prüfgröße x* ist eine Stichprobe aus F n F n * ist die empirische Verteilung basiert auf x* t*=t(f n *) ist ein bootstrap Wert der Prüfgröße Q Fn (t*) ist die bootstrap Verteilung der Prüfgröße Und wie kann man das ohne Stichprobennahme beschreiben?
8 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 8 Für einen Schätzer t(f) möchte man die Verteilung von t(f n ) bestimmen. Problem: die Verteilung F ist unbekannt. Wenn man die unbekannte Verteilung F mit der bekannten Verteilung F n ersetzt, bleibt nichts unbekannt. So erhält man die Verteilung von t(f n *) als Schätzung für die Verteilung von t(f n ). Definition: Beim Bootstrap-Verfahren ersetzt man F(x) durch F n (x) (unabhängig davon, ob man simuliert oder alles theoretisch ausrechnet). Manchmal ist es nur schneller oder bequemer zu simulieren, manchmal ist Simulation die einzige Möglichkeit. Die Bootstrap Verteilung ist die plug-in Schätzung der Prüfverteilung.
9 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 9 Parametrisches Bootstrap Wenn man eine parametrische Voraussetzung über die Verteilung hat, kann man die Stichproben von der vorausgesetzten Verteilung nehmen (Parameter geschätzt aufgrund der Stichprobe). Beispiel: Bei der Exponentialverteilung möchte man die Verteilung von Interquantilsabstand schätzen. Oder die Verzerrung von trimmed mean unter Exponentialverteilung. In diesen Fällen ist es besser nicht direkt von der Stichprobe zu simulieren. Bei einigen parametrischen Voraussetzungen kann man die Verteilung auch theoretisch bestimmen, aber das ist viel mühsamer als die Simulation. In manchen Fällen geht das aber gar nicht.
10 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 10 Ähnliches gilt für nichtparametrische Annahmen. Wenn man z.b. die Voraussetzung hat, dass die Verteilung symmetrisch ist, kann man die empirische Verteilung symmetrisieren und von dieser symmetrisierten Verteilung simulieren.
11 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) Schätzung des Standardfehlers Der Standardfehler eines Schätzers kann einfach von der Bootstrap-Verteilung geschätzt werden. SE F (t) wird durch SE Fn (t*) geschätzt, wobei t* = t(f n *). Die klassische (unkorrigierte) Schätzung des Standardfehlers des Mittelwertes ist auch eine Bootstrap-Schätzung. var( F) SE F ( x) = wird durch n SE var( Fn ( x*) = geschätzt. n F n ) Und dazu braucht man keine simulierte Stichprobennahme, in diesem Fall kann man alles völlig theoretisch ausrechnen. (Aber das ist leider nur eine Ausnahme.)
12 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) Schätzung und Korrektur der Verzerrung Sei θ ein Parameter der Verteilung F, oder der Wert eines Funktionals für die Verteilung F: θ = t(f). x eine Stichprobe vom Umfang n aus F. θˆ ein Schätzer für θ, in allgemeinen θ ˆ = s( x), oder speziell θ ˆ = t( Fˆ ) (der plug-in Schätzer, wobei Fˆ die empirische Verteilung bezeichnet.) Die Verzerrung von θˆ wird als definiert. bias F (θˆ) = E F (θˆ) θ = E F (s(x)) t(f)
13 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 13 Die Schreibweise bias F (θˆ) und E F (θˆ) betont, daß die Verzerrung eines Schätzers von der wahrenverteilung abhängt. Die Verzerrung von θˆ kann mit dem Bootstrap geschätzt werden: bias ( ˆ) = E ( ˆ) θ = E F ( s( x)) t(f) Fˆ θ Fˆ θ ˆ Der Bootstrap Schätzer der Verzerrung ist ein plug-in Schätzer (anstelle von F wird Fˆ in die Formel eingesteckt) unabhängig davon, ob s(x) der plug-in Schätzer für t(f) ist oder nicht. bias ( ˆ) ist eine Schätzung für bias F (θˆ) Fˆ θ
14 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 14 Beispiel: Gamma-Verteilung Parameter: α > 0, λ > 0 Dichtefunktion: f α λ α 1 λx ( x) = x e x 0 Γ ( α) (Spezialfälle: Exponential, Erlang, Chi-quadrat) Parameterschätzung (mit der Methode der Momenten): 2 x α ˆ = und ˆ x = 2 2 s 1 λ, wobei s ( x n s i= 1 = n Schätzung für α verzerrt, Verzerrung kann aber mit dem Bootstrap geschätzt und korrigiert werden. 2 i x) 2
15 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 15 Simulation mit Stichproben von Umfang n = 15 aus der Gamma-Verteilung mit α = 3, λ = 1. Gamma-Verteilung mit alpha = 3 und lambda = 1 Haufigkeit Wert Für jede Stichprobe wurde α geschätzt und mit dem Bootstrap- Verfahren (mit 300 Bootstrap Replikationen) Bias-korrigiert.
16 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 16 Histogramme der Verzerrung des Schätzers für α ohne und mit Korrektur. Mittelwert der Verzerrung unkorrigiert: korrigiert: Haufigkeit Verzerrung ohne Korrektion Mittlerer quadratischer Fehler vom wahren Wert α = 3 unkorrigiert: korrigiert: Korrektur war jetzt nützlich. Haufigkeit Bootstrap korrigierte Verzerrung
17 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 17 Die Korrektur funktioniert aber nicht immer. Es kann sein, daß der Mittelwert der Verzerrung ganz klein ist, aber der mittlere quadratische Fehler viel größer ist als ohne Korrektur. Erklärung: da der Korrekturfaktor vom Zufall abhängt, hat er einen zufälligen Fehler, der in einem unglücklichen Fall ziemlich groß sein kann. Wenn man den Korrekturfaktor und den Schätzer addiert, werden auch die zufälligen Fehler summiert. Beispiel: Variationskoeffizient var( X ) CV = geschätzt durch E( X ) CV = Simulation mit Stichproben von Umfang n = 15 aus der Exponentialverteilung mit λ = 1. Bei der Exponentialverteilung gilt E(X) = var (X) = 1/λ. Daher ist CV = 1. s x.
18 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 18 Histogramme von Verzerrung der Schätzung für CV ohne und mit Korrektur. Mittelwert der Verzerrung unkorrigiert: korrigiert: Haufigkeit Verzerrung ohne Korrektion Mittlerer quadratischer Fehler vom wahren Wert CV = 1 unkorrigiert: korrigiert: Jetzt ist es mit Korrektur schlimmer als ohne. Haufigkeit Bootstrap korrigierte Verzerrung
19 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 19 Woher weiß man, wann man korrigieren soll und wann nicht? Ganz sicher weiß man das nicht. Faustregel: Wenn die Bootstrap Verzerrung kleiner als 50% des Bootstrap Standardfehlers ist, lohnt es sich wahrscheinlich nicht die Verzerrung zu korrigieren.
20 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) Konsistenz des Bootstraps Konsistenz, wenn eine Verteilungsfunktion geschätzt wird Sei ρ eine Metrik zwischen den Verteilungsfunktionen in R n. Am häufigsten ist dies die Supremum-Metrik: ρ(f, G) = sup x R n F(x) G(x). Sei F n eine Folge von Schätzungen für F. F n wird konsistent genannt, wenn ρ(f n, F) in W. 0 und stark konsistent genannt, wenn ρ(f n, F) f. s. 0. Beispiel: die empirische Verteilung ist eine konsistente Schätzung der Verteilung.
21 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 21 Resultate über die Konsistenz des Bootstraps (nichtparametrisches Bootstrap, Stichprobe i.i.d.) Shao and Tu (Springer, 1995) Funktionen des Stichprobenmittelwertes: T n = g( X n ) Hinreichende Bedingung für starke Konzistenz des Bootstraps: E( X 2 )<, g(.) stetig differenzierbar bei E(X) mit Ableitung 0 U-Statistiken L-Statistiken Differenzierbare Funktionale Beran and Ducharme (Univ. Montreal, 1991) Mammen (Springer, 1992)
22 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 22 Inkonsistenz des Bootstraps Einige Gründe, wegen denen die bootstrap Punktschätzung inkonsistent sein kann: t(f n ) nicht differenzierbar Beispiel: t(f n ) = x, wenn E(F) = 0, var(f) < Beispiel: Gleichverteilung auf [0,θ], t(f n ) = max(f n ) Heavy-tailed Verteilung der Daten Es kann passieren, dass t(f n ) eine Grenzverteilung mit Varianz < hat, aber var(t(f n *)). Subsampling hilft in meisten Fällen dieser Art.
23 Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 23 Konsistenz des Subsampling-Verfahrens Sei n der Stichprobenumfang und m n der Umfang der bootstrap Stichproben (m n < n). Wenn n, m n /n 0 und t(f n ) eine Grenzverteilung hat, ist die Schätzung der Verteilung von t(f n ) durch Subsampling konsistent. (Politis and Romano, Bull. Int. Stat. Inst. 2, )
Resampling. in»statistische Methoden in der Physik« Referent: Alex Ortner. Studenten-Seminar Sommersemester 2007
Resampling in»statistische Methoden in der Physik«Referent: Studenten-Seminar Sommersemester 2007 Gliederung 1 Resampling Prinzip Einleitung Resampling Methoden 2 3 4 Einleitung intuitv Resampling Prinzip
MehrResampling Methoden Dortmund, 2005 (Jenő Reiczigel) 1. Bootstrap: Tests
Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 1 Bootstrap: Tests Zwei Ideen 1. Mit dem Bootstrap kann man gute Konfidenzintervalle erstellen, und die Tests kann man von diesen Konfidenzintervallen
Mehr3.4 Asymptotische Evaluierung von Sch atzer Konsistenz Konsistenz Definition 3.4.1: konsistente Folge von Sch atzer
3.4 Asymptotische Evaluierung von Schätzer 3.4.1 Konsistenz Bis jetzt haben wir Kriterien basierend auf endlichen Stichproben betrachtet. Konsistenz ist ein asymptotisches Kriterium (n ) und bezieht sich
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 1 Inhalt der heutigen Vorlesung Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung der vorherigen Vorlesung Übersicht über Schätzung und
MehrKlausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1
Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester 2013 Aufgabe 1 In einer Urne
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Punkt- und Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr.
MehrStatistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de
rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent
Mehr3.3 Methoden zur Evaluierung von Schätzern
3.3 Methoden zur Evaluierung von Schätzern Bis jetzt haben wir nur glaubwürdige Techniken zur Konstruktion von Punktschätzern besprochen. Falls unterschiedliche Schätzer für einen Parameter resultieren,
MehrZentraler Grenzwertsatz/Konfidenzintervalle
/ Statistik I Sommersemester 2009 Statistik I ZGWS/ (1/37) Kann Ahmadinejad die Wahl gewonnen haben? Im wesentlichen Dreiteilung der polit. Elite 2005: 17.3 Millionen Stimmen (Stichwahl), Wahlbeteiligung
Mehrdie wir als Realisationen von unabhängig und identisch verteilten Zufallsvariablen
Kapitel 8 Schätzung von Parametern 8.1 Schätzmethoden Gegeben seien Beobachtungen Ü Ü ¾ Ü Ò die wir als Realisationen von unabhängig und identisch verteilten Zufallsvariablen ¾ Ò auffassen. Die Verteilung
MehrWahrscheinlichkeitstheorie Kapitel V - Stetige Verteilungen
Wahrscheinlichkeitstheorie Kapitel V - Stetige Verteilungen Georg Bol georg.bol@statistik.uni-karlsruhe.de Markus Höchstötter hoechstoetter@statistik.uni-karlsruhe.de Stetige Verteilungen Definition: Sei
Mehr3 Grundlagen statistischer Tests (Kap. 8 IS)
3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung
Mehr1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung
0 Einführung 1 Wahrscheinlichkeitsrechnung Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung Motivation und Hinführung Der wahre Anteil der rot-grün Wähler 009 war genau
MehrDefinition Sei X eine stetige Z.V. mit Verteilungsfunktion F und Dichte f. Dann heißt E(X) :=
Definition 2.34. Sei X eine stetige Z.V. mit Verteilungsfunktion F und Dichte f. Dann heißt E(X) := x f(x)dx der Erwartungswert von X, sofern dieses Integral existiert. Entsprechend wird die Varianz V(X)
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
Mehr7.2 Moment und Varianz
7.2 Moment und Varianz Def. 21 Es sei X eine zufällige Variable. Falls der Erwartungswert E( X p ) existiert, heißt der Erwartungswert EX p p tes Moment der zufälligen Variablen X. Es gilt dann: + x p
Mehr17 Nichtparametrische Schätzer
17 Nichtparametrische Schätzer In diesem Paragraphen werden kurz einige Möglichkeiten skizziert, auch in nichtparametrischen Modellenzu Schätzern fürinteressierende statistische Größenzugelangen. a Empirische
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 8. Dezember 2010 Teil V Schließende Statistik 1 Parameterschätzung Erwartungstreue und Konsistenz Maximum-Likelihood
MehrAnalyse von Querschnittsdaten. Signifikanztests I Basics
Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004
MehrDie Momentenmethode. Vorteil: Oft einfach anwendbar. Nachteil: Güte kann nur schwer allgemein beurteilt werden; liefert zum Teil unbrauchbare
17.1.3 Die Momentenmethode Vorteil: Oft einfach anwendbar. Nachteil: Güte kann nur schwer allgemein beurteilt werden; liefert zum Teil unbrauchbare Lösungen. Sei ϑ = (ϑ 1,...,ϑ s ) der unbekannte, s-dimensionale
Mehr5. Spezielle stetige Verteilungen
5. Spezielle stetige Verteilungen 5.1 Stetige Gleichverteilung Eine Zufallsvariable X folgt einer stetigen Gleichverteilung mit den Parametern a und b, wenn für die Dichtefunktion von X gilt: f x = 1 für
MehrZufallsvariablen [random variable]
Zufallsvariablen [random variable] Eine Zufallsvariable (Zufallsgröße) X beschreibt (kodiert) die Versuchsausgänge ω Ω mit Hilfe von Zahlen, d.h. X ist eine Funktion X : Ω R ω X(ω) Zufallsvariablen werden
MehrStetige Verteilungen Rechteckverteilung
Stetige Verteilungen Rechteckverteilung Die Längenabweichungen X produzierter Werkstücke von der Norm seien gleichmäßig verteilt zwischen a = mm und b = 4mm. Die Dichtefunktion lautet also f(x) = für a
Mehro o o o o o o o o o o o
Klumpen-Stichproben = Cluster Sampling Obs.: Bei einer uneingeschränkten Zufallsauswahl wird pro Randomisierungs- Schritt genau eine Beobachtung gemacht. Ein ganz wesentlicher Punkt : Jedes zufällig ausgewählte
Mehr4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)
4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte
MehrEinführung in die Maximum Likelihood Methodik
in die Maximum Likelihood Methodik Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Gliederung 1 2 3 4 2 / 31 Maximum Likelihood
MehrStatistik III. Walter Zucchini Fred Böker Andreas Stadie
Statistik III Walter Zucchini Fred Böker Andreas Stadie Inhaltsverzeichnis 1 Zufallsvariablen und ihre Verteilung 1 1.1 Diskrete Zufallsvariablen........................... 1 1.2 Stetige Zufallsvariablen............................
MehrAuswahl von Schätzfunktionen
Auswahl von Schätzfunktionen Worum geht es in diesem Modul? Überblick zur Punktschätzung Vorüberlegung zur Effizienz Vergleich unserer Schätzer für My unter Normalverteilung Relative Effizienz Einführung
Mehr- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden.
Normalverteilung und Standardnormalverteilung als Beispiel einer theoretischen Verteilung - Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden. - Stetige (kontinuierliche),
Mehr5.8 Anpassungstests. W. Kössler (IfI HU Berlin) Werkzeuge der empirischen Forschung 389 / 419
5.8 8.1 Einführung empirische Verteilungsfunktion 8.2 EDF- Kolmogorov-Smirnov-Test Anderson-Darling-Test Cramer-von Mises-Test 8.3 Anpassungstest auf Normalverteilung - Shapiro-Wilk-Test 8.4. auf weitere
MehrEinführung in die Statistik
Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt
MehrEinführung in die (induktive) Statistik
Einführung in die (induktive) Statistik Typische Fragestellung der Statistik: Auf Grund einer Problemmodellierung sind wir interessiert an: Zufallsexperiment beschrieben durch ZV X. Problem: Verteilung
MehrK8 Stetige Zufallsvariablen Theorie und Praxis
K8 Stetige Zufallsvariablen Theorie und Praxis 8.1 Theoretischer Hintergrund Wir haben (nicht abzählbare) Wahrscheinlichkeitsräume Meßbare Funktionen Zufallsvariablen Verteilungsfunktionen Dichten in R
MehrKonfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir
MehrKapitel V - Erwartungstreue Schätzfunktionen
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel V - Erwartungstreue Schätzfunktionen Induktive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo Siebenschuh
MehrTheorie - Statistik und Wahrscheinlichkeitstheorie. 27. Mai 2008
Theorie - Statistik und Wahrscheinlichkeitstheorie 27. Mai 2008 Inhaltsverzeichnis 1. Was ist eine Zufallsvariable?......................... 4 2. Wie ist Freiheitsgrad definiert?.......................
MehrSignalverarbeitung 2. Volker Stahl - 1 -
- 1 - Überblick Bessere Modelle, die nicht nur den Mittelwert von Referenzvektoren sondern auch deren Varianz berücksichtigen Weniger Fehlklassifikationen Mahalanobis Abstand Besseres Abstandsmaß basierend
MehrAllgemeines zu Tests. Statistische Hypothesentests
Statistische Hypothesentests Allgemeines zu Tests Allgemeines Tests in normalverteilten Grundgesamtheiten Asymptotische Tests Statistischer Test: Verfahren Entscheidungsregel), mit dem auf Basis einer
MehrWahrscheinlichkeitstheorie und Statistik vom
INSTITUT FÜR STOCHASTIK SS 2007 UNIVERSITÄT KARLSRUHE Priv.-Doz. Dr. D. Kadelka Dipl.-Math. oec. W. Lao Klausur (Maschineningenieure) Wahrscheinlichkeitstheorie und Statistik vom 2.9.2007 Musterlösungen
Mehr1.8 Kolmogorov-Smirnov-Test auf Normalverteilung
1.8 Kolmogorov-Smirnov-Test auf Normalverteilung Der Kolmogorov-Smirnov-Test ist einer der klassischen Tests zum Überprüfen von Verteilungsvoraussetzungen. Der Test vergleicht die Abweichungen der empirischen
MehrEinführung in die Induktive Statistik: Testen von Hypothesen
Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte
Mehr2 Zufallsvariable, Verteilungen, Erwartungswert
2 Zufallsvariable, Verteilungen, Erwartungswert Bisher: Zufallsexperimente beschrieben durch W-Räume (Ω, A, P) Häufig interessiert nur eine zufällige Größe X = X(ω), die vom Ergebnis ω des Zufallsexperiments
Mehr7.5 Erwartungswert, Varianz
7.5 Erwartungswert, Varianz Def. 7.5.: a) X sei eine diskrete ZV, die bei unendl. vielen Werten x k folgende Zusatzbedingung erfüllt: x k p k
MehrMathematische und statistische Methoden II
Statistik & Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte
MehrMethodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 10 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie als Wissenschaft
MehrDie Varianz (Streuung) Definition
Die (Streuung) Definition Diskrete Stetige Ang., die betrachteten e existieren. var(x) = E(X EX) 2 heißt der Zufallsvariable X. σ = Var(X) heißt Standardabweichung der X. Bez.: var(x), Var(X), varx, σ
Mehr1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...
Inhaltsverzeichnis 0 Einführung 1 1 Zufallsvorgänge und Wahrscheinlichkeiten 5 1.1 Zufallsvorgänge.......................... 5 1.1.1 Ergebnismengen..................... 6 1.1.2 Ereignisse und ihre Verknüpfung............
Mehr1 Dichte- und Verteilungsfunktion
Tutorium Yannick Schrör Klausurvorbereitungsaufgaben Statistik Lösungen Yannick.Schroer@rub.de 9.2.26 ID /455 Dichte- und Verteilungsfunktion Ein tüchtiger Professor lässt jährlich 2 Bücher drucken. Die
MehrETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig)
ETWR Teil B 2 Ziele Bisher (eindimensionale, mehrdimensionale) Zufallsvariablen besprochen Lageparameter von Zufallsvariablen besprochen Übertragung des gelernten auf diskrete Verteilungen Ziel des Kapitels
MehrWebinar Induktive Statistik. - Wahrscheinlichkeitsrechnung - Stichprobentheorie
Webinar Induktive Statistik - Wahrscheinlichkeitsrechnung - Stichprobentheorie Wahrscheinlichkeitstheorie Aufgabe : Zwei Lieferanten decken den Bedarf eines PKW-Herstellers von 00.000 Einheiten pro Monat.
MehrNachteile: STD existiert nur für Verteilungen mit E(FL 2 ) <, d.h. nicht ansetzbar bei leptokurtischen ( fat tailed ) Verlustverteilungen;
Risikomaße basierend auf die Verlustverteilung Sei F L := F Ln+1 die Verteilung der Verlust L n+1. Die Parameter von F Ln+1 werden anhand von historischen Daten entweder direkt oder mit Hilfe der Risikofaktoren
MehrVerteilungen eindimensionaler stetiger Zufallsvariablen Einführung Stetige Verteilungen
Verteilungen eindimensionaler stetiger Zufallsvariablen Einführung Stetige Verteilungen Stetige Gleichverteilung Exponentialverteilung Normalverteilung Bibliografie: Prof. Dr. Kück Universität Rostock
MehrSchließende Statistik
Schließende Statistik Die schließende Statistik befasst sich mit dem Rückschluss von einer Stichprobe auf die Grundgesamtheit (Population). Die Stichprobe muss repräsentativ für die Grundgesamtheit sein.
MehrStatistik II Übung 4: Skalierung und asymptotische Eigenschaften
Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden
MehrKlausur (Modulprüfung) zum Lehrerweiterbildungskurs Stochastik am von 10:00 bis 11:00 Uhr
Klausur (Modulprüfung) zum Lehrerweiterbildungskurs Stochastik am 5..201 von 10:00 bis 11:00 Uhr Bearbeiten Sie zwei der drei folgenden Aufgaben! Sätze aus der Vorlesung und den Übungen dürfen Sie ohne
MehrSchätzer und Konfidenzintervalle
Kapitel 2 Schätzer und Konfidenzintervalle Bisher haben wir eine mathematische Theorie entwickelt, die es uns erlaubt, gewisse zufällige Phänomene zu modellieren. Zum Beispiel modellieren wir die Anzahl
MehrKapitel 3 Schließende Statistik
Beispiel 3.4: (Fortsetzung Bsp. 3.) bekannt: 65 i=1 X i = 6, also ˆp = X = 6 65 = 0, 4 Überprüfen der Voraussetzungen: (1) n = 65 30 () n ˆp = 6 10 (3) n (1 ˆp) = 39 10 Dr. Karsten Webel 194 Beispiel 3.4:
MehrExponentialverteilung
Exponentialverteilung Dauer von kontinuierlichen Vorgängen (Wartezeiten; Funktionszeiten technischer Geräte) Grenzübergang von der geometrischen Verteilung Pro Zeiteinheit sei die Eintrittswahrscheinlichkeit
MehrKlausur zu Statistik II
GOETHE-UNIVERSITÄT FRANKFURT FB Wirtschaftswissenschaften Statistik und Methoden der Ökonometrie Prof. Dr. Uwe Hassler Wintersemester 03/04 Klausur zu Statistik II Matrikelnummer: Hinweise Hilfsmittel
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 9. Dezember 2010 1 Konfidenzintervalle Idee Schätzung eines Konfidenzintervalls mit der 3-sigma-Regel Grundlagen
MehrMathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007
Mathematik IV für Maschinenbau und Informatik Stochastik Universität Rostock, Institut für Mathematik Sommersemester 007 Prof. Dr. F. Liese Dipl.-Math. M. Helwich Serie Termin: 9. Juni 007 Aufgabe 3 Punkte
MehrAufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.
Aufgabenblock 4 Aufgabe ) Da s = 8. cm nur eine Schätzung für die Streuung der Population ist, müssen wir den geschätzten Standardfehler verwenden. Dieser berechnet sich als n s s 8. ˆ = = =.88. ( n )
MehrStochastik für die Naturwissenschaften
Stochastik für die Naturwissenschaften Dr. C.J. Luchsinger 4. Zufallsgrösse X Literatur Kapitel 4 * Storrer: Kapitel (37.2)-(37.8), (38.2)-(38.3), (38.5), (40.2)-(40.5) * Stahel: Kapitel 4, 5 und 6 (ohne
MehrBioinformatik und Medizin. Brustkrebs. Population. Molekulare Eigenschaften des Brustkrebs
Molekulare Eigenschaften des Brustkrebs Bioinformatik und Medizin Genomische Datenanalyse 11. Kapitel Medizinischer Fortschritt ist das vornehmste Ziel der Genomforschung und damit auch der Bioinformatik
MehrÜbungen mit dem Applet Vergleich von zwei Mittelwerten
Vergleich von zwei Mittelwerten 1 Übungen mit dem Applet Vergleich von zwei Mittelwerten 1 Statistischer Hintergrund... 2 1.1 Typische Fragestellungen...2 1.2 Fehler 1. und 2. Art...2 1.3 Kurzbeschreibung
MehrStatistik. R. Frühwirth Teil 1: Deskriptive Statistik. Statistik. Einleitung Grundbegriffe Merkmal- und Skalentypen Aussagen und
Übersicht über die Vorlesung Teil : Deskriptive fru@hephy.oeaw.ac.at VO 42.090 http://tinyurl.com/tu42090 Teil 2: Wahrscheinlichkeitsrechnung Teil 3: Zufallsvariable und Verteilungen Februar 200 Teil 4:
MehrÜbung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010
MehrMultivariate Verteilungen
Multivariate Verteilungen Zufallsvektoren und Modellierung der Abhängigkeiten Ziel: Modellierung der Veränderungen der Risikofaktoren X n = (X n,1, X n,2,..., X n,d ) Annahme: X n,i und X n,j sind abhängig
MehrSchätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief
Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte : Schätzung Statistik
MehrTeil II. Der Weg zur schließenden Statistik: Von den Daten zu Wahrscheinlichkeiten. StatSoz 127
Teil II Der Weg zur schließenden Statistik: Von den Daten zu Wahrscheinlichkeiten StatSoz 127 6 Zufallsstichprobe und Parameter 6.1 Parameter einer Grundgesamtheit 6.2 Zufallsstichprobe und Bias 6.3 Stichprobenfehler
MehrVS PLUS
VS PLUS Zusatzinformationen zu Medien des VS Verlags Statistik II Inferenzstatistik 2010 Übungsaufgaben und Lösungen - Inferenzstatistik 1 [Übungsaufgaben und Lösungenn - Inferenzstatistik 1] ÜBUNGSAUFGABEN
MehrStatistische Methoden für Bauingenieure WS 13/14. Einführungsbeispiel
Statistische Methoden für Bauingenieure WS 13/14 Einheit 2: Statistische Schätzverfahren Univ.Prof. Dr. Christian Bucher Einführungsbeispiel Wir wollen Beton mit einer vorgegebenen Festigkeitsklasse produzieren
MehrTeilklausur des Moduls Kurs 42221: Vertiefung der Statistik
Name, Vorname Matrikelnummer Teilklausur des Moduls 32741 Kurs 42221: Vertiefung der Statistik Datum Termin: 21. März 2014, 14.00-16.00 Uhr Prüfer: Univ.-Prof. Dr. H. Singer Vertiefung der Statistik 21.3.2014
MehrKapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung Induktive Statistik Prof. Dr. W.-D.
Mehr5. Statistische Schätztheorie
5. Statistische Schätztheorie Problem: Sei X eine Zufallsvariable (oder X ein Zufallsvektor), die einen interessierenden Zufallsvorgang repräsentiere Man möchte die tatsächliche Verteilung von X (oder
MehrI. Zahlen, Rechenregeln & Kombinatorik
XIV. Wiederholung Seite 1 I. Zahlen, Rechenregeln & Kombinatorik 1 Zahlentypen 2 Rechenregeln Brüche, Wurzeln & Potenzen, Logarithmen 3 Prozentrechnung 4 Kombinatorik Möglichkeiten, k Elemente anzuordnen
MehrKonfidenzintervalle. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09
Konfidenzintervalle Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Münzspiel Experiment 100 Münzwürfe: Stefan gewinnt bei "Kopf" Hypothesen H 0 : Stefan wird so oft gewinnen
MehrStatistische Tests (Signifikanztests)
Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)
MehrEinführung in die Stochastik für Informatiker Übungsaufgaben mit Lösungen
Einführung in die Stochastik für Informatiker Übungsaufgaben mit Lösungen David Geier und Sven Middelberg RWTH Aachen, Sommersemester 27 Inhaltsverzeichnis Information 2 Aufgabe 4 Aufgabe 2 6 4 Aufgabe
MehrKapitel 10 Mittelwert-Tests Einstichproben-Mittelwert-Tests 10.2 Zweistichproben Mittelwert-Tests
Kapitel 10 Mittelwert-Tests 10.1 Einstichproben-Mittelwert-Tests 10.2 Zweistichproben Mittelwert-Tests 10.1 Einstichproben- Mittelwert-Tests 10.1.1 Einstichproben- Gauß-Test Dichtefunktion der Standard-Normalverteilung
Mehr3.1 Punktschätzer für Mittelwert µ und Varianz σ 2. Messungen x 1,..., x N, die unabhängig voneinander auf gleiche Weise gewonnen worden sind
Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 3.1 3.1 Punktschätzer für Mittelwert µ und Varianz σ 2 Messungen x 1,..., x N, die unabhängig voneinander auf gleiche Weise gewonnen worden
MehrSchätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II
Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Wiederholung Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte
MehrZusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen
Zusammenfassung Mathe II Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen Zufallsexperiment: Ein Vorgang, bei dem mindestens zwei Ereignisse möglich sind
MehrKapitel XI - Operationscharakteristik und Gütefunktion
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel XI - Operationscharakteristik und Gütefunktion Induktive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo
MehrEntscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten
Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 4.1 4. Statistische Entscheidungsverfahren Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten Beispiel:
MehrTaylorreihen. Kapitel 9. Lernziele. Taylorreihe. (x x 0 ) + f (x 0 ) 2! (x x 0 ) f (n) (x 0 ) (x x 0 ) n. Taylorreihe und MacLaurinreihe
Kapitel 9 Taylorreihen Josef Leydold c 2006 Mathematische Methoden IX Taylorreihen 1 / 25 Lernziele Taylorreihe und MacLaurinreihe Beispiele Alternative Schreibweisen Approimation der Veränderung einer
MehrBootstrap-Konfidenzintervalle
Bootstrap-Konfidenzintervalle Worum geht es in diesem Modul? Ausgangspunkt Grundlagen zum Bootstrap Die Idee des Bootstrap Das Bootstrap-t-Konfidenzintervall Simulation: Bootstrap-t-Konfidenzintervall
MehrSeminar im Wintersemester 2010/2011: Quantitative und implementierte Methoden der Marktrisikobewertung
M.Sc. Brice Hakwa hakwa@uni-wuppertal.de Seminar im Wintersemester 2010/2011: Quantitative und implementierte Methoden der Marktrisikobewertung - Zusammenfassung zum Thema: Berechnung von Value-at-Risk
MehrKenngrößen von Zufallsvariablen
Kenngrößen von Zufallsvariablen Die Wahrscheinlichkeitsverteilung kann durch die sogenannten Kenngrößen beschrieben werden, sie charakterisieren sozusagen die Verteilung. Der Erwartungswert Der Erwartungswert
MehrKapitel 5. Univariate Zufallsvariablen. 5.1 Diskrete Zufallsvariablen
Kapitel 5 Univariate Zufallsvariablen Im ersten Teil dieses Skriptes haben wir uns mit Daten beschäftigt und gezeigt, wie man die Verteilung eines Merkmals beschreiben kann. Ist man nur an der Population
MehrKapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell
Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften
MehrDas (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell
1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs
MehrAnpassungstests VORGEHENSWEISE
Anpassungstests Anpassungstests prüfen, wie sehr sich ein bestimmter Datensatz einer erwarteten Verteilung anpasst bzw. von dieser abweicht. Nach der Erläuterung der Funktionsweise sind je ein Beispiel
MehrStochastik und Statistik für Ingenieure Vorlesung 4
Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik Stochastik und Statistik für Ingenieure Vorlesung 4 30. Oktober 2012 Quantile einer stetigen Zufallsgröße Die reelle Zahl
MehrHypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren
Hypothesenprüfung Teil der Inferenzstatistik Befaßt sich mit der Frage, wie Hypothesen über eine (in der Regel unbekannte) Grundgesamtheit an einer Stichprobe überprüft werden können Behandelt werden drei
MehrNumerische Methoden und Algorithmen in der Physik
Numerische Methoden und Algorithmen in der Physik Hartmut Stadie, Christian Autermann 15.01.2009 Numerische Methoden und Algorithmen in der Physik Christian Autermann 1/ 47 Methode der kleinsten Quadrate
MehrKapitel 1 Einführung. Angewandte Ökonometrie WS 2012/13. Nikolaus Hautsch Humboldt-Universität zu Berlin
Kapitel 1 Einführung Angewandte Ökonometrie WS 2012/13 Nikolaus Hautsch Humboldt-Universität zu Berlin 1. Allgemeine Informationen 2 17 1. Allgemeine Informationen Vorlesung: Mo 12-14, SPA1, 23 Vorlesung
MehrWahrscheinlichkeit und die Normalverteilung. Jonathan Harrington
Wahrscheinlichkeit und die Normalverteilung Jonathan Harrington Der Populations-Mittelwert 100 Stück Papier nummeriert 0, 1, 2, 99 Ich ziehe 10 davon und berechne den Mittelwert. Was ist der Mittelwert
MehrInhaltsverzeichnis. 2 Kurzbeschreibung von SPSS Der SPSS-Dateneditor Statistische Analysen mit SPSS DieDaten...
Inhaltsverzeichnis Teil I Einführung 1 Kleine Einführung in R... 3 1.1 Installieren und Starten von R... 3 1.2 R-Befehleausführen... 3 1.3 R-Workspace speichern... 4 1.4 R-History sichern........ 4 1.5
Mehr9 Die Normalverteilung
9 Die Normalverteilung Dichte: f(x) = 1 2πσ e (x µ)2 /2σ 2, µ R,σ > 0 9.1 Standard-Normalverteilung µ = 0, σ 2 = 1 ϕ(x) = 1 2π e x2 /2 Dichte Φ(x) = 1 x 2π e t2 /2 dt Verteilungsfunktion 331 W.Kössler,
Mehr