Parameterschätzug Numero, podere et mesura Deus omia codidit
Populatio, Zufallsvariable, Stichprobe Populatio Zufallsvariable X Stichprobe x eie"realisierug vo X (Beobachtug)
alle mäliche Rekrute der US Armee (Populatio) die erste 0 mäliche Wehrpflichtige, die am. Mai 004 das Rekrutierugsbüro der US Armee i Cocord NH betrete (Stichprobe) BMI eies zu eiem zufällige Zeitpukt i eiem zufällig gewählte Rekrutierugsbüro azutreffede Rekrute (Zufallsvariable)
Eiige Kovetioe Zufallsvariable werde mit Großbuchstabe bezeichet. Mögliche Werte oder tatsächliche Beobachtuge ("Realisieruge") werde mit kleie Buchstabe bezeichet. P(X x) Wahrscheilichkeit, dass der BMI eies zufällig ausgewählte Rekrute höchstes de Wert x aimmt P(X>8) Wahrscheilichkeit, dass ei zufällig ausgewählter Rekrut icht utergewichtig ist P(4<X<30) Wahrscheilichkeit, dass ei zufällig ausgewählter Rekrut übergewichtig, aber icht fettleibig ist
Schätzug aus Stichprobe Grudidee Populatio X Zufallsvariable θ: Parameter Stichprobe Ziehe Stichprobe x,...,x Realisieruge Schlussfolgerug Date Sammel θˆ Schätzug Iferez Bilde ˆ(x θ,...,x Schätzer )
Schätzug aus Stichprobe Grudidee Parameter θ π Wahrscheilichkeit µ Erwartugswert σ Variaz Beobachtuge x,...,x 0,0,,,0,,....3,4.8,7.55,....4,9.6,0.4,... Schätzer θ ) x,...,x ) ( ˆ π k Ateil µ ˆ / x Stichprobemittel σˆ s Stichprobevariaz
Werfe eier Müze π: Wahrscheilichkeit für Kopf k 6 ˆ π 0 0.6 0.30 0.5 0.0 X: Azahl Kopf i 0 Würfe X hat eie Bi(π,0) Verteilug 0.5 0.0 0.05 P (X 6) 0 π 6 ( π) 4 0.00 0.0 0. 0.4 0.6 0.8.0 π π
Likelihood ud Wahrscheilichkeit Die Likelihood eies Parameters, gegebe die Beobachtuge, ist die Wahrscheilichkeit der Beobachtuge, gegebe der Parameter. L ( θ x) P (X θ x)
Das Maximum-Likelihood-Prizip Auf der Basis vo Beobachtuge wird ei Parameter durch desse mutmaßlichste Wert geschätzt, d.h. durch de Wert, der die Wahrscheilichkeit der Beobachtuge maximiert. D.h. θˆ wird so gewählt, dass L(ˆ θ x) max θ L( θ x)
AB0-Blutgruppe I eier Stichprobe vo 75 Idividue aus eier bestimmte Populatio hatte 0 Persoe die Blutgruppe B. Wie groß ist die Häufigkeit π der Blutgruppe B i dieser Populatio? 0.6 0. 0.08 0 8.3 0 π ( π ) 65 0.04 0 ˆ π 75 0.33 0.00 0.0 0. 0.4 0.6 0.8.0 π
Das Maximum-Likelihood-Prizip Biomialverteilug L( π k) k π k ( π) k log{ L( π k)} cost + k log( π) + ( k) log( π) δlog{l( π k)} δπ k π k π 0 π k ˆ π k / ist der Maximum-Likelihood-Schätzer vo π
Weiblicher Body-Mass-Idex (BMI) Welche Erwartugswert µ hat derbmi eier US Schöheitsköigi? Liegt µ ugefähr bei x 8.6? Jahr Name 984 985 986 987 988 989 990 99 998 999 00 00 Suzette Charles Sharlee Wells Susa Aki Kellye Cash Kaye Lai Rae Rafko Gretche Carlso Debbye Turer Marjorie Vicet Kate Shidle Nicole Johso Agela Perez Baraquio Katie Harma BMI 7.7 8. 6.8 7.6 8.8 9. 7.9 7.8 0. 9.6 0.3 9.5
Das Maximum-Likelihood-Prizip Normalverteilug L( µ x log{l( µ (x i µ ) σ,...,x) e i δlog{ L( µ x δµ µ σ π x,...,x)} cost (x µ i i ) σ,...,x )} µ ˆ x ist der Maximum-Likelihood-Schätzer vo µ σ ( ) µ x 0 i i i xi
Schätzer als Zufallsvariable Wege der zufällige Natur vo Stichprobe ist jeder Schätzer θˆ selbst eie Zufallsvariable mit Erwartugswert E( θˆ ) ud Variaz Var( θˆ ). Var(ˆ) θ wird als "Stadardfehler" vo θˆ bezeichet.
Seie X,...,X uabhägig ud idetisch verteilt mit E(X i )µ ud Var(X i )σ. Verteilug des Stichprobemittels µ µ E(X) X E E(X) i i i i Var(X) X Var Var(X) i i i i σ σ σ Stadardfehler:
Geauigkeit ud Präzisio Geauigkeit bezieht sich auf die Differez zwische dem Erwartugswert eies Schätzers ud dem wahre Parameter. Präzisio bezieht sich auf die Variaz eies Schätzers. geau präzise geau icht präzise icht geau präzise icht geau icht präzise
"Gute" Schätzer Ei guter Schätzer ist uverzerrt: E(ˆθ) "00% geau, d.h. er liefert im Durchschitt de wahre Parameter" kosistet: ( ˆθ θ > ε) 0 P "liefert mit wachsedem Stichprobeumfag immer geauere ud präzisere Schätzuge, die dem wahre Parameter zustrebe" effiziet: Var(ˆθ ) "kei aderer uverzerrter (d.h. 00% geauer) Schätzer liefert präzisere Schätzuge θ miimal
"Gute" Schätzer uverzerrt (00% geau) kosistet (Geauigkeit ud Präzisio strebe mit wachsedem Umfag der Stichprobe 00% zu) effiziet (der präziseste Schätzer uter alle 00% geaue Schätzer)
"Gute" Schätzer Maximum-Likelihood Maximum-Likelihood-Schätzer sid geerell kosistet asymptotisch effiziet aber NICHT immer uverzerrt
ˆ π k Uverzerrte Schätzer Wahrscheilichkeit X habe eie Bi(π,) Verteilug X k E(ˆ) π E E(X) k π ( π) k 0 k π π k... ˆ π k / ist ei uverzerrter Schätzer vo π
πˆ Werfe eier Müze : Ateil vo Kopf uter Würfe 0.8 0.7 00 Wiederholuge 0.6 πˆ 0.5 0.4 0.3 0. 50 00 500
Uverzerrte Schätzer x ˆ µ ist ei uverzerrter Schätzer vo µ X,...,X seie idetisch verteilt mit E(X i )µ µ µ µ E(X) X E E(ˆ) i i i i µ i i x x ˆ Erwartugswert
Würfelspiel X i : Augezahl eies eizele Wurfs (i,...,) X: durchschittliche Augezahl aus Würfe 5.5 5.0 00 Wiederholuge 4.5 4.0 X 3.5 3.0.5.0.5 0 00 500
σ s ist ei uverzerrter Schätzer vo σ ˆ Uverzerrte Schätzer Variaz X,...,X seie uabhägig ud idetisch verteilt mit Var(X i )σ σˆ s (x i i x) E(ˆ σ ) E (X X) i i ( ) [E(X ) µ ]... σ
Die (stetige) Gleichverteilug f(x) b 0 a für a x b sost E(X) b + a Var(X) (b a) b a a b
Gleichverteilug a4, b8 µ6, σ.33 3.5 3.0 00 Wiederholuge.5 s.0.5.0 0.5 0.0 5 0 5 0 5 Stichprobeumfag ()
Kosistete Schätzer Ei Schätzer heißt "kosistet", we seie Geauigkeit ud Präzisio mit zuehmedem Stichprobeumfag wachse ud jeweils gege 00% strebe. P ( ˆθ θ > ε) 0 ˆ π k / ist ei kosisteter Schätzer vo π µ ˆ x ist ei kosisteter Schätzer vo µ σ s ist ei kosisteter Schätzer vo σ ˆ
Effiziete Schätzer Ei uverzerrter Schätzer heißt "effiziet", we jeder adere uverzerrte Schätzer mehr streut. Var(ˆ) θ miimal ˆ π k/ ist ei effizieter Schätzer vo π µ ˆ x ist meistes ei effizieter Schätzer vo µ σ s ist meistes ei effizieter Schätzer vo σ ˆ
Kofidezitervall Für die meiste stetige Zufallsvariable gilt P (ˆθ θ) 0 d.h. es ist umöglich, dass ei Schätzer de wahre Parameter "auf de Kopf trifft". Meistes ist es sivoller, θdurch ei Itervall zu schätze, das θmit eier gewisse "Sicherheit" ethält.
Kofidezitervall Defiitio Ei Kofidezitervall ist eie Vorschrift, die eier Stichprobe x ei Itervall I(x) so zuordet, dass für jede mögliche Wert θ des zu schätzede Parameters Pθ(x: θ I(x)) α gilt. Wurde die Stichprobe x erhobe ud das Kofidezitervall I(x) berechet, so besteht ei Vertraue -α, dass I(x) das wahre θ auch ethält. -α heißt "Kofideziveau" (üblicherweise 0.95)
Kofidezitervall Erwartugswert Aus dem Zetrale Grezwertsatz folgt, dass X σ µ für großes eie N(0,)-Verteilug hat. X µ P (.96.96) σ 0.95 σ σ P (X.96 µ X +.96 ) 0.95
Kofidezitervall Erwartugswert x ±.96 σ markiert ei Itervall, das de wahre Erwartugswert mit Wahrscheilichkeit 0.95 (d.h. i 95% aller uabhägige Wiederholuge des Experimets) ethalte wird. µ
Weiblicher Body-Mass-Idex (BMI) 95% Kofidezitervall für de Erwartugswert (Aahme: σ.) 8.6 ±.96 oder (7.9,9.3). Jahr Name 984 985 986 987 988 989 990 99 998 999 00 00 Suzette Charles Sharlee Wells Susa Aki Kellye Cash Kaye Lai Rae Rafko Gretche Carlso Debbye Turer Marjorie Vicet Kate Shidle Nicole Johso Agela Perez Baraquio Katie Harma BMI 7.7 8. 6.8 7.6 8.8 9. 7.9 7.8 0. 9.6 0.3 9.5
Kofidezitervall Erwartugswert σ bekat: σ x ± z α/ σ ubekat: -α α/ α/ x ± t α/, s z α/ z -α/ wobei t -α/,- das Quatil eier t-verteilug mit - Freiheitsgrade ist.
Studet t-verteilug 0.4 0.3 f(x) 0. 0. William S. Gosset (876-937) 0.0-4 - 0 4 Freiheitsgrad Freiheitsgrade x 3 Freiheitsgrade 500 Freiheitsgrade
Wie ma bessere Schätzuge bekommt Erwartugswert Var(X) σ d.h. der Stadardfehler des Stichprobemittels sikt mit wachsedem Stichprobeumfag. ± α KI: x z / σ KI: x ± t α/, s d.h. die Breite eies Kofidezitervalls verrigert sich mit wachsedem Stichprobeumfag.
Wie ma bessere Schätzuge bekommt Erwartugswert Breite W des KI: W z α/ σ -α α/ α/ -α steigt z α/ z -α/ z -α/ steigt W steigt Die Breite eies Kofidezitervalls steigt mit steigeder Sicherheit.
Kofidezitervall Stichprobeumfag W z α/ σ z α/ W σ Wie viele Beobachtuge sid ötig, um de Erwartugswert des mäliche BMI mit eiem 95% Kofidezitervall vo höchste kg/m Breite zu schätze (Aahme: BMI ist ormalverteilt mit σ.5)? Atwort:.96.5 4.0
Zusammefassug -Schätze bezeichet de wisseschaftliche Vorgag des Erschließes vo Populatiosparameter aus Stichprobe. -Ei Schätzer ist eie mathematische Vorschrift für die Berechug vo Parameterschätzuge aus Date. -Schätzer wie z.b. das Stichprobemittel sid selbst wieder Zufallsvariable, mit Erwartugswert ud Variaz. -Gute Schätzer sollte uverzerrt (geau), effiziet (am präziseste) ud kosistet (zuehmed präzise) sei. -Statt "Puktschätzuge" liefer Kofidezitervalle Bereiche, die eie gesuchte Parameter mit bestimmter Sicherheit ethalte.