Parameterschätzung. Numero, pondere et mensura Deus omnia condidit

Ähnliche Dokumente
Schätzen von Populationswerten

Schätzen von Populationswerten

2. Schätzverfahren 2.1 Punktschätzung wirtschaftlicher Kennzahlen. Allgemein: Punktschätzung eines Parameters:

X X Schätzen von Vertrauensintervallen Schwankungsintervall

4 Schwankungsintervalle Schwankungsintervalle 4.2

Vl Statistische Prozess- und Qualitätskontrolle und Versuchsplanung Übung 5

Tests statistischer Hypothesen

Wirksamkeit, Effizienz

Kapitel 5: Schließende Statistik

Wirksamkeit, Effizienz. Beispiel: Effizienz. Mittlerer quadratischer Fehler (MSE) Konsistenz im quadratischen Mittel

Statistik. 5. Schließende Statistik: Typische Fragestellung anhand von Beispielen. Kapitel 5: Schließende Statistik

Parameterschätzung. Kapitel Schätzfunktionen

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

X in einer Grundgesamtheit vollständig beschreiben.

Statistik und Wahrscheinlichkeitsrechnung

Empirische Verteilungsfunktion

Wahrscheinlichkeitstheorie und Statistik vom

Eingangsprüfung Stochastik,

Konfidenzintervalle. Praktische Übung Stochastik SS 2017 Lektion 10 1

Einführung in die Stochastik 10. Übungsblatt

Statistische Modelle und Parameterschätzung

Induktive Schlussweise. Schätzfunktionen und Schätzverfahren. Bibliografie

Maximum Likelihood Version 1.6

Evaluation & Forschungsstrategien

7. Stichproben und Punktschätzung

Prof. Dr. Roland Füss Statistik II SS 2008

10. Intervallschätzung 10.1 Begriff des Konfidenzintervalls

II. Grundzüge der Stichprobentheorie

6. Grenzwertsätze. 6.1 Tschebyscheffsche Ungleichung

Übungen mit dem Applet erwartungstreu

Statistik Einführung // Konfidenzintervalle für einen Parameter 7 p.2/39

Induktive Statistik. Formelsammlung. Prof. Dr. W. Assenmacher. Stichprobenraum: Ω = {ω 1, ω 2,...,ω m }

Dr. Jürgen Senger INDUKTIVE STATISTIK. Wahrscheinlichkeitstheorie, Schätz- und Testverfahren

Angewandte Stochastik II

Lösungsvorschlag Probeklausur zur Elementaren Wahrscheinlichkeitsrechnung

Statistische Schätzungen

10. Übungsblatt zur Einführung in die Stochastik

Übungen zu QM III Mindeststichprobenumfang

Wahrscheinlichkeitsrechnung & Statistik - Ergänzung zum Skript

Grundlagen der Biostatistik und Informatik

3. Einführung in die Statistik

Dr. Jürgen Senger INDUKTIVE STATISTIK. Wahrscheinlichkeitstheorie, Schätz- und Testverfahren

Einführung in die induktive Statistik. Inferenzstatistik. Konfidenzintervalle. Friedrich Leisch

Empirische Ökonomie 1 Sommersemester Formelsammlung. Statistische Grundlagen. Erwartungswert und Varianz einer Zufallsvariable.

Kapitel 9: Schätzungen

Aufgaben zu Kapitel 40

BSc: Waldmesslehre Waldinventur I

Der χ 2 Test. Bei Verteilungen Beantwortung der Frage, ob eine gemessene Verteilung Gauß- oder Poisson-verteilt ist oder nicht?

Pflichtlektüre: Kapitel 10 Grundlagen der Inferenzstatistik

Güteeigenschaften von Schätzern

4. Übung Konfidenzintervalle für Anteile und Mittelwerte

Logarithmusfunktion, Rechenregeln für Logarithmen, Ableiten von Logarithmen (die Ableitung nach p wird hier stets als p geschrieben)

Stochastik I (Statistik)

Klausur zu,,einführung in die Wahrscheinlichkeitstheorie. Musterlösungen

Kapitel 12. Schätzung von Parametern

Grundproblem der Inferenzstatistik

Zenraler Grenzwertsatz

Zufallsvariable. Die Wahrscheinlichkeitsverteilung p (probability function) ist definiert durch: p(x i ) := P (X = x i ),

Bayessches Lernen (II)

TESTEN VON HYPOTHESEN

Kapitel 2. Induktive Statistik. 2.1 Grundprinzipien der induktiven Statistik

Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2015/2016. Aufgabe 1

Übungen Abgabetermin: Freitag, , 10 Uhr THEMEN: Testtheorie

Methoden zur Konstruktion von Schätzern

SBP Mathe Aufbaukurs 1. Absolute und relative Häufigkeit. Das arithmetische Mittel und seine Eigenschaften. Das arithmetische Mittel und Häufigkeit

Körpergröße x Häufigkeit in [m]

Wissenschaftliches Arbeiten Studiengang Energiewirtschaft

Diskrete Zufallsvariablen

Klassifizierung der Verteilungen. Streuung der diskreten Verteilung

Wahrscheinlichkeit & Statistik

Testen statistischer Hypothesen

15.4 Diskrete Zufallsvariablen

Fakultät für Wirtschafts- und Rechtswissenschaften

Bei 95%iger Konfidenz wäre der Mittelwert der GG zwischen 1421,17DM und 1778,83DM zu erwarten.

Übungsblatt 9 zur Vorlesung. Statistische Methoden

}) = ϑ Einsen (1 ϑ) Nullen,

Übungsaufgaben - Organisatorisches

Übungsrunde 12, Gruppe 2 LVA , Übungsrunde 12, Gruppe 2, Markus Nemetz, TU Wien,

1. Einführung. 1 A (T (x 1,..., x n )) P θ (dx 1 )... P θ (dx n ) X. P θ {T n (X 1,..., X n ) A} =

Evaluierung einer Schulungsmaßnahme: Punktezahl vor der Schulung Punktezahl nach der Schulung. Autoritarismusscore vor/nach Projekt

Intervallschätzung II 2

Klausur vom

Übungsaufgaben - Organisatorisches

11 Likelihoodquotiententests

7. Grenzwertsätze Grenzwertsätzen Zentraler Grenzwertsatz Gesetz der großen Zahlen Tschebyscheffsche Ungleichung

Normalverteilung. Standardnormalverteilung. Intervallwahrscheinlichkeiten. Verteilungsfunktion

Statistik I Februar 2005

Kontingenztabellen. Chi-Quadrat-Test. Korrelationsanalyse zwischen kategorischen Merkmalen. 1. Unabhängigkeitstest

Einführung in die Wahrscheinlichkeitstheorie Lösungsvorschläge zu Übungsblatt 5

Das kollektive Risikomodell. 12. Mai 2009

Gütefunktion und Fehlerwahrscheinlichkeiten Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = Interpretation von Testergebnissen I

Grundproblem der Inferenzstatistik

Testen. Zufallszahlen Runs-Test χ 2 -Test. t-test Konfidenzintervalle Quiz

Stochastisches Integral

Es werden 120 Schüler befragt, ob sie ein Handy besitzen. Das Ergebnis der Umfrage lautet: Von 120 Schülern besitzen 99 ein Handy.

10. Grundlagen der linearen Regressionsanalyse 10.1 Formulierung linearer Regressionsmodelle

Stochastik: Binomialverteilung Stochastik Bernoulli-Experimente, binomialverteilte Zufallsvariablen Gymnasium ab Klasse 10

Stochastik für Physiker: Aufgaben und Lösungsvorschläge

KAPITEL 9. Konfidenzintervalle

Praktikum Vorbereitung Fertigungsmesstechnik Statistische Qualitätskontrolle

Transkript:

Parameterschätzug Numero, podere et mesura Deus omia codidit

Populatio, Zufallsvariable, Stichprobe Populatio Zufallsvariable X Stichprobe x eie"realisierug vo X (Beobachtug)

alle mäliche Rekrute der US Armee (Populatio) die erste 0 mäliche Wehrpflichtige, die am. Mai 004 das Rekrutierugsbüro der US Armee i Cocord NH betrete (Stichprobe) BMI eies zu eiem zufällige Zeitpukt i eiem zufällig gewählte Rekrutierugsbüro azutreffede Rekrute (Zufallsvariable)

Eiige Kovetioe Zufallsvariable werde mit Großbuchstabe bezeichet. Mögliche Werte oder tatsächliche Beobachtuge ("Realisieruge") werde mit kleie Buchstabe bezeichet. P(X x) Wahrscheilichkeit, dass der BMI eies zufällig ausgewählte Rekrute höchstes de Wert x aimmt P(X>8) Wahrscheilichkeit, dass ei zufällig ausgewählter Rekrut icht utergewichtig ist P(4<X<30) Wahrscheilichkeit, dass ei zufällig ausgewählter Rekrut übergewichtig, aber icht fettleibig ist

Schätzug aus Stichprobe Grudidee Populatio X Zufallsvariable θ: Parameter Stichprobe Ziehe Stichprobe x,...,x Realisieruge Schlussfolgerug Date Sammel θˆ Schätzug Iferez Bilde ˆ(x θ,...,x Schätzer )

Schätzug aus Stichprobe Grudidee Parameter θ π Wahrscheilichkeit µ Erwartugswert σ Variaz Beobachtuge x,...,x 0,0,,,0,,....3,4.8,7.55,....4,9.6,0.4,... Schätzer θ ) x,...,x ) ( ˆ π k Ateil µ ˆ / x Stichprobemittel σˆ s Stichprobevariaz

Werfe eier Müze π: Wahrscheilichkeit für Kopf k 6 ˆ π 0 0.6 0.30 0.5 0.0 X: Azahl Kopf i 0 Würfe X hat eie Bi(π,0) Verteilug 0.5 0.0 0.05 P (X 6) 0 π 6 ( π) 4 0.00 0.0 0. 0.4 0.6 0.8.0 π π

Likelihood ud Wahrscheilichkeit Die Likelihood eies Parameters, gegebe die Beobachtuge, ist die Wahrscheilichkeit der Beobachtuge, gegebe der Parameter. L ( θ x) P (X θ x)

Das Maximum-Likelihood-Prizip Auf der Basis vo Beobachtuge wird ei Parameter durch desse mutmaßlichste Wert geschätzt, d.h. durch de Wert, der die Wahrscheilichkeit der Beobachtuge maximiert. D.h. θˆ wird so gewählt, dass L(ˆ θ x) max θ L( θ x)

AB0-Blutgruppe I eier Stichprobe vo 75 Idividue aus eier bestimmte Populatio hatte 0 Persoe die Blutgruppe B. Wie groß ist die Häufigkeit π der Blutgruppe B i dieser Populatio? 0.6 0. 0.08 0 8.3 0 π ( π ) 65 0.04 0 ˆ π 75 0.33 0.00 0.0 0. 0.4 0.6 0.8.0 π

Das Maximum-Likelihood-Prizip Biomialverteilug L( π k) k π k ( π) k log{ L( π k)} cost + k log( π) + ( k) log( π) δlog{l( π k)} δπ k π k π 0 π k ˆ π k / ist der Maximum-Likelihood-Schätzer vo π

Weiblicher Body-Mass-Idex (BMI) Welche Erwartugswert µ hat derbmi eier US Schöheitsköigi? Liegt µ ugefähr bei x 8.6? Jahr Name 984 985 986 987 988 989 990 99 998 999 00 00 Suzette Charles Sharlee Wells Susa Aki Kellye Cash Kaye Lai Rae Rafko Gretche Carlso Debbye Turer Marjorie Vicet Kate Shidle Nicole Johso Agela Perez Baraquio Katie Harma BMI 7.7 8. 6.8 7.6 8.8 9. 7.9 7.8 0. 9.6 0.3 9.5

Das Maximum-Likelihood-Prizip Normalverteilug L( µ x log{l( µ (x i µ ) σ,...,x) e i δlog{ L( µ x δµ µ σ π x,...,x)} cost (x µ i i ) σ,...,x )} µ ˆ x ist der Maximum-Likelihood-Schätzer vo µ σ ( ) µ x 0 i i i xi

Schätzer als Zufallsvariable Wege der zufällige Natur vo Stichprobe ist jeder Schätzer θˆ selbst eie Zufallsvariable mit Erwartugswert E( θˆ ) ud Variaz Var( θˆ ). Var(ˆ) θ wird als "Stadardfehler" vo θˆ bezeichet.

Seie X,...,X uabhägig ud idetisch verteilt mit E(X i )µ ud Var(X i )σ. Verteilug des Stichprobemittels µ µ E(X) X E E(X) i i i i Var(X) X Var Var(X) i i i i σ σ σ Stadardfehler:

Geauigkeit ud Präzisio Geauigkeit bezieht sich auf die Differez zwische dem Erwartugswert eies Schätzers ud dem wahre Parameter. Präzisio bezieht sich auf die Variaz eies Schätzers. geau präzise geau icht präzise icht geau präzise icht geau icht präzise

"Gute" Schätzer Ei guter Schätzer ist uverzerrt: E(ˆθ) "00% geau, d.h. er liefert im Durchschitt de wahre Parameter" kosistet: ( ˆθ θ > ε) 0 P "liefert mit wachsedem Stichprobeumfag immer geauere ud präzisere Schätzuge, die dem wahre Parameter zustrebe" effiziet: Var(ˆθ ) "kei aderer uverzerrter (d.h. 00% geauer) Schätzer liefert präzisere Schätzuge θ miimal

"Gute" Schätzer uverzerrt (00% geau) kosistet (Geauigkeit ud Präzisio strebe mit wachsedem Umfag der Stichprobe 00% zu) effiziet (der präziseste Schätzer uter alle 00% geaue Schätzer)

"Gute" Schätzer Maximum-Likelihood Maximum-Likelihood-Schätzer sid geerell kosistet asymptotisch effiziet aber NICHT immer uverzerrt

ˆ π k Uverzerrte Schätzer Wahrscheilichkeit X habe eie Bi(π,) Verteilug X k E(ˆ) π E E(X) k π ( π) k 0 k π π k... ˆ π k / ist ei uverzerrter Schätzer vo π

πˆ Werfe eier Müze : Ateil vo Kopf uter Würfe 0.8 0.7 00 Wiederholuge 0.6 πˆ 0.5 0.4 0.3 0. 50 00 500

Uverzerrte Schätzer x ˆ µ ist ei uverzerrter Schätzer vo µ X,...,X seie idetisch verteilt mit E(X i )µ µ µ µ E(X) X E E(ˆ) i i i i µ i i x x ˆ Erwartugswert

Würfelspiel X i : Augezahl eies eizele Wurfs (i,...,) X: durchschittliche Augezahl aus Würfe 5.5 5.0 00 Wiederholuge 4.5 4.0 X 3.5 3.0.5.0.5 0 00 500

σ s ist ei uverzerrter Schätzer vo σ ˆ Uverzerrte Schätzer Variaz X,...,X seie uabhägig ud idetisch verteilt mit Var(X i )σ σˆ s (x i i x) E(ˆ σ ) E (X X) i i ( ) [E(X ) µ ]... σ

Die (stetige) Gleichverteilug f(x) b 0 a für a x b sost E(X) b + a Var(X) (b a) b a a b

Gleichverteilug a4, b8 µ6, σ.33 3.5 3.0 00 Wiederholuge.5 s.0.5.0 0.5 0.0 5 0 5 0 5 Stichprobeumfag ()

Kosistete Schätzer Ei Schätzer heißt "kosistet", we seie Geauigkeit ud Präzisio mit zuehmedem Stichprobeumfag wachse ud jeweils gege 00% strebe. P ( ˆθ θ > ε) 0 ˆ π k / ist ei kosisteter Schätzer vo π µ ˆ x ist ei kosisteter Schätzer vo µ σ s ist ei kosisteter Schätzer vo σ ˆ

Effiziete Schätzer Ei uverzerrter Schätzer heißt "effiziet", we jeder adere uverzerrte Schätzer mehr streut. Var(ˆ) θ miimal ˆ π k/ ist ei effizieter Schätzer vo π µ ˆ x ist meistes ei effizieter Schätzer vo µ σ s ist meistes ei effizieter Schätzer vo σ ˆ

Kofidezitervall Für die meiste stetige Zufallsvariable gilt P (ˆθ θ) 0 d.h. es ist umöglich, dass ei Schätzer de wahre Parameter "auf de Kopf trifft". Meistes ist es sivoller, θdurch ei Itervall zu schätze, das θmit eier gewisse "Sicherheit" ethält.

Kofidezitervall Defiitio Ei Kofidezitervall ist eie Vorschrift, die eier Stichprobe x ei Itervall I(x) so zuordet, dass für jede mögliche Wert θ des zu schätzede Parameters Pθ(x: θ I(x)) α gilt. Wurde die Stichprobe x erhobe ud das Kofidezitervall I(x) berechet, so besteht ei Vertraue -α, dass I(x) das wahre θ auch ethält. -α heißt "Kofideziveau" (üblicherweise 0.95)

Kofidezitervall Erwartugswert Aus dem Zetrale Grezwertsatz folgt, dass X σ µ für großes eie N(0,)-Verteilug hat. X µ P (.96.96) σ 0.95 σ σ P (X.96 µ X +.96 ) 0.95

Kofidezitervall Erwartugswert x ±.96 σ markiert ei Itervall, das de wahre Erwartugswert mit Wahrscheilichkeit 0.95 (d.h. i 95% aller uabhägige Wiederholuge des Experimets) ethalte wird. µ

Weiblicher Body-Mass-Idex (BMI) 95% Kofidezitervall für de Erwartugswert (Aahme: σ.) 8.6 ±.96 oder (7.9,9.3). Jahr Name 984 985 986 987 988 989 990 99 998 999 00 00 Suzette Charles Sharlee Wells Susa Aki Kellye Cash Kaye Lai Rae Rafko Gretche Carlso Debbye Turer Marjorie Vicet Kate Shidle Nicole Johso Agela Perez Baraquio Katie Harma BMI 7.7 8. 6.8 7.6 8.8 9. 7.9 7.8 0. 9.6 0.3 9.5

Kofidezitervall Erwartugswert σ bekat: σ x ± z α/ σ ubekat: -α α/ α/ x ± t α/, s z α/ z -α/ wobei t -α/,- das Quatil eier t-verteilug mit - Freiheitsgrade ist.

Studet t-verteilug 0.4 0.3 f(x) 0. 0. William S. Gosset (876-937) 0.0-4 - 0 4 Freiheitsgrad Freiheitsgrade x 3 Freiheitsgrade 500 Freiheitsgrade

Wie ma bessere Schätzuge bekommt Erwartugswert Var(X) σ d.h. der Stadardfehler des Stichprobemittels sikt mit wachsedem Stichprobeumfag. ± α KI: x z / σ KI: x ± t α/, s d.h. die Breite eies Kofidezitervalls verrigert sich mit wachsedem Stichprobeumfag.

Wie ma bessere Schätzuge bekommt Erwartugswert Breite W des KI: W z α/ σ -α α/ α/ -α steigt z α/ z -α/ z -α/ steigt W steigt Die Breite eies Kofidezitervalls steigt mit steigeder Sicherheit.

Kofidezitervall Stichprobeumfag W z α/ σ z α/ W σ Wie viele Beobachtuge sid ötig, um de Erwartugswert des mäliche BMI mit eiem 95% Kofidezitervall vo höchste kg/m Breite zu schätze (Aahme: BMI ist ormalverteilt mit σ.5)? Atwort:.96.5 4.0

Zusammefassug -Schätze bezeichet de wisseschaftliche Vorgag des Erschließes vo Populatiosparameter aus Stichprobe. -Ei Schätzer ist eie mathematische Vorschrift für die Berechug vo Parameterschätzuge aus Date. -Schätzer wie z.b. das Stichprobemittel sid selbst wieder Zufallsvariable, mit Erwartugswert ud Variaz. -Gute Schätzer sollte uverzerrt (geau), effiziet (am präziseste) ud kosistet (zuehmed präzise) sei. -Statt "Puktschätzuge" liefer Kofidezitervalle Bereiche, die eie gesuchte Parameter mit bestimmter Sicherheit ethalte.