Auswertug uivariater Datemege -iduktiv - Iduktive Schlussweise Schätzfuktioe ud Schätzverfahre Schätzug I Bibliografie Prof. Dr. Kück Uiversität Rostock Statistik, Vorlesugsskript Abschitt 7..; 7.. Bleymüller / Gehlert / Gülicher Verlag Vahle Statistik für Wirtschaftswisseschaftler MMStat. Eie iteraktive Eiführug i die Welt der Statistik PC Pool WISO-Fakultät \\zeus\statistik\mmstat\start Dr. Rolad Jeske, Uiversität Kostaz http://www.wiwi.ui-kostaz.de/heiler/os/ Dr. H.-J. Mittag, Feruiversität Hage http://www.ferui-hage.de/ewstatistics Schätzug I
Iduktive Schlussweise - Beispiel Beispiel : (Durchmesser der Welle I eier Maschiebaufabrik werde Welle mit eiem Nemaß vo 0 mm Durchmesser (Merkmal gedreht. Um die Zuverlässigkeit der Produktio zu überprüfe, werde aus der Tagesproduktio vo.000 Welle 50 zufällig ausgewählte exakt gemesse ud dere mittlerer Durchmesser berechet. Auf Grud der Differez zwische dem Sollwert ud dem berechete mittlere Durchmesser wird auf die Zuverlässigkeit der Tagesproduktio zurück geschlosse. Schätzug I Gemeisamkeite bei Awedug der Methode der iduktive Statistik Gegebe ist eie statistische Masse (z. B..000 Welle Tagesproduktio. Über ei bei dieser Masse utersuchtes Merkmal (Durchmesser der Welle möchte ma bestimmte Aussage mache (Ausschussateil. Eie Utersuchug der vollstädige statistische Masse ist icht möglich, zu teuer, icht zweckmäßig. Ma beschräkt sich deshalb auf eie ausgewählte Teil der Gesamtmasse, eie Stichprobe (z. B. 50 zufällig ausgewählte Welle. Aus de Ergebisse der statistische Utersuchug der ausgewählte Stichprobe soll auf die Gesamtmasse zurückgeschlosse werde. Schätzug I
Gegestad der iduktive Statistik Wie ma aus de Ergebisse der statistische Utersuchug eier Stichprobe (Teilmasse auf die übergeordete Grudgesamtheit (Gesamtmasse schließe ka, ist der Gegestad der iduktive oder schließede Statistik. Die wichtigste Teile der iduktive Statistik sid: Schätzverfahre Testverfahre Schätzug I 5 Grudlage des Schätzes Gesucht wird ei Wert, ei Parameter für eie ubekate Grudgesamtheit. Schätzug I 6
Testverfahre Statistische Tests sid Verfahre zur Überprüfug vo Aahme bzw. Hypothese über ubekate Parameterwerte eier Verteilug bzw. über die ubekate Verteilug eies Merkmals i der Grudgesamtheit auf der Basis der Ergebisse eier Zufallsstichprobe. Solche Aahme köe auf theoretische Überleguge, frühere Beobachtuge, Sollwerte, Güteaforderuge, Erfahruge, Behauptuge usw. basiere. Schätzug I 7 Iduktive Schlussweise -Problemstellug- Grudgesamtheit Zufallsstichprobe : utersuchtes Merkmal i d. GG Parameter ud Verteilugsfuktio x, x, x,... x µ, σ², θ, F(x Für GG i. Allg. ubekat Iduktio x, s², p, F i Für SP bekat Schätze Teste (Hypothese prüfe Schätzug I 8
Schätzug vo Lage- ud Streuugsparameter -Aufgabestellug- Das Iteresse richtet sich hier auf die ubekate Parameter q (wie z. B. Erwartugswert µ, Variaz σ oder Ateilswert θ eier Verteilug i der Grudgesamtheit (Parameterschätzug. Der Wert dieses Parameters q ist ubekat ud soll mittels eier Zufallsstichprobe geschätzt werde. Dabei uterscheidet ma zwei Arte vo Schätzuge: Puktschätzug ud Itervallschätzug. Schätzug I 9 Parameterschätzug Beispiel: Es soll das Merkmal : Eikomme aller -Persoe-Haushalte der Hasestadt Rostock utersucht werde. Dabei iteressiert vor allem, wie hoch das Durchschittseikomme µ sowie die etsprechede Streuug σ² dieses Merkmals für diese Haushaltstyp i Rostock sid. Dazu befragt ma 00 zufällig ausgewählte -Persoe Haushalte. Ma ka je Parameter eie Schätzwert agebe oder ei Itervall, welches de zu schätzede Parameter mit eier bestimmte Sicherheit eischließt bzw. überdeckt. Schätzug I 0 5
Puktschätzug Als Puktschätzug wird die Ermittlug eies eizele Schätzwertes für de Parameter q der Grudgesamtheit aufgrud der Ergebisse eier Zufallsstichprobe bezeichet. Eie Aufgabe der Schätzugstheorie ist es, gute Schätzfuktioe, Schätzer geat, zu ermittel. Diese Schätzfuktioe solle eie möglichst gute Näherugswert für de ubekate Parameter liefer. Schätzug I Puktschätzug, Schätzer, Schätzuge Grudgesamtheit Zufallsstichprobe F(x Parameter q z. B. µ, σ², θ Schätzer Qˆ qˆ Schätzuge g(x, x, K, x qˆ g(x,x, K,x qˆ g(x, x, K, x g(,, K, Eifache Zufallsstichprobe,,..., F i (xf (x,,..., Realisatioe x, x,..., x x, x,..., x x, x,..., x Schätzug I 6
Schätzer bzw. Schätzfuktio als Zufallsgröße Ei Schätzer Qˆ g(,, K, eies Parameters q ist eie Fuktio der Zufallsvariable (der Stichprobevariable ud deshalb selbst wieder eie Zufallsvariable. Als Zufallsvariable besitzt er eie Verteilug, Stichprobeverteilug geat. Für die Verteilug der Schätzfuktio (des Schätzers ka - der Erwartugswert E( Qˆ - die Variaz Var( Qˆ ud - die Stadardabweichug σ( Qˆ ermittelt werde. Schätzug I Schätzer für µ -Beispiele Für de Erwartugswert µ eier symmetrische Verteilug i der Grudgesamtheit köe uterschiedliche Schätzer oder Schätzfuktioe kostruiert werde. Das Stichprobemittel als arithmetisches Mittel der SP i Das Stichprobemittel als Media der SP {,,, } Me K Schätzug I 7
Schätzer für σ -Beispiele Für die Variaz σ der Grudgesamtheit köe uterschiedliche Schätzer verwedet werde. Die gewöhliche Stichprobevariaz σˆ S (i µ σˆ ' S (i Azuwede, we µ für GG bekat ist. Azuwede, we µ für GG ubekat ist. Die modifizierte Stichprobevariaz σˆ S (i Azuwede, we µ für GG ubekat ist. Schätzug I 5 Gute Eigeschafte eies Schätzers Da für jede Parameter der Grudgesamtheit mehrere, verschiedee Schätzer awedbar sid, sucht ma de Schätzer (Stichprobefuktio mit de beste Eigeschafte. Gute Eigeschafte eies Schätzers sid: Erwartugstreue Effiziez Kosistez Schätzug I 6 8
Erwartugstreue Ei Schätzer oder Schätzfuktio für de ubekate Parameter q heißt erwartugstreu oder uverzerrt (ubiased, we der Erwartugswert des Schätzers existiert ud mit dem wahre Parameter übereistimmt. Die Differez zwische Erwartugswert des Schätzers ud Parameterwert wird Verzerrug (bias geat. Für erwartugstreue Schätzer ist die Verzerrug gleich Null. E( Qˆ q Verzerrug (Qˆ E(Qˆ q 0 E( Qˆ q Die Eigeschaft der Erwartugstreue besagt, dass sich bei eier hireiched große Azahl vo Stichprobe des Umfags die positive ud egative Schätzfehler gegeseitig aufhebe (d. h. zu Null addiere ud dass die Schätzfuktio tedeziell de wahre Parameter weder überschätzt och uterschätzt. Schätzug I 7 Erwartugstreue Schätzer vo µ - Beispiele Eie Grudgesamtheit hat de Mittelwert µ ud die Variaz σ. Es sei (,, eie eifache Zufallsstichprobe aus dieser Grudgesamtheit, d. h. jede der Stichprobevariable i (,, hat E( i µ ud Var( i σ. Folgede drei Schätzer vo µ sid erwartugstreu. (Beispiele aus MMStat (a (b (c ( + + ( + ( + E( E[ ( + + ] (µ + µ + µ µ E( E[ ( + ] ( µ + µ µ E( E[ ( + ] ( µ + µ µ Schätzug I 8 9
Mittlere quadratische Abweichug (Mea Square Error - MSE Der mittlere quadratische Fehler bzw. Mea Square Error (Abkürzug: MSE eies Schätzers ist der mittlere quadratische Abstad zwische der Schätzfuktio ud dem wahre Parameter i der Grudgesamtheit: MSE( Qˆ E(Qˆ q² E( Qˆ q q E( Qˆ Verzerrug (Qˆ E(Qˆ q < 0 D. h. sie liefert im Durchschitt Uterschätzuge vo q. Verzerrug (Qˆ E(Qˆ q > 0 D. h. sie liefert im Durchschitt Überschätzuge vo q. Schätzug I 9 Es gilt: Zusammehag zwische MSE, Verzerrug ud Variaz MSE( Qˆ MSE( Qˆ E(Qˆ q² [Verzerrug(Qˆ ]² + Var(Qˆ mit Verzerrug(Qˆ E(Qˆ q Für erwartugstreue Schätzer gilt: Verzerrug (Qˆ E(Qˆ q 0 MSE( Qˆ Var(Qˆ Schätzug I 0 0
Zusammehag zwische MSE, Verzerrug ud Variaz -Beweis MSE( Qˆ [Verzerrug(Qˆ ]² + Var(Qˆ MSE(Qˆ E{[Qˆ E[Qˆ Var(Qˆ E(Qˆ E(Qˆ E(Qˆ q² E[Qˆ ]² + [Qˆ ]² + [E(Qˆ E(Qˆ E(Qˆ + 0 + [Verzerrug(Qˆ E(Qˆ ][E(Qˆ + E(Qˆ ][E(Qˆ q]² q] + [E(Qˆ q] + [E(Qˆ ]² [Verzerrug(Qˆ q]²} q]² ]² + Var(Qˆ Schätzug I Vergleich vo Schätzer - Beispiel (a ( + + E( µ MSE( Var( (b (c σ ² Var( Var[ ( + + ] Var( + + ² 9 ( + ( + σ ² E( µ MSE( Var( σ ² + σ ² 8 σ ² Var( Var[ ( + ] Var( + ² 6 6 σ ² E( µ MSE( Var( σ ² + σ ² Var( Var[ ( + ] Var( + ² 9 5 σ ² 9 Var( < Var( < Var( µ ist der beste Schätzer vo µ Schätzug I
Effiziez Ei erwartugstreuer Schätzer für de Parameter q eier Grudgesamtheit heißt effiziet (wirksam, we er eie edliche Variaz hat ud we es für q keie adere erwartugstreue Schätzer gibt, der eie kleiere Variaz besitzt. Effiziet bedeutet da Erwartugstreue ud miimale Variaz. Diese Eigeschaft bei eiem Schätzer zu beweise ist icht leicht, da die Variaze der adere dekbare Schätzer ubekat sid. Verzerrug(Qˆ Var(Qˆ Var(Qˆ E(Qˆ q 0 für alle adere erwartugstreue Schätzer Qˆ des Parameters q Schätzug I Kosistez Ma et eie Schätzfuktio kosistet, we der vo ihr erzeugte Schätzwert bei laufeder Vergrößerug des Stichprobeumfages ( mit de zu schätzede Parameter zusammefällt ud die Variaz gege Null strebt. Ei Schätzer eies ubekate Parameters q heißt da kosistet, we die beide Bediguge gelte:.. lim [E(Qˆ q] 0 lim Var(Qˆ 0 Asymptotisch uverzerrt Asymptotisch effiziet MSE( Qˆ lim E(Qˆ q² 0 q² q]² + Schätzug I E(Qˆ [E(Qˆ Var(Qˆ
Erwartugswert ud Variaz der modifizierte Stichprobevariaz Sei eie Grudgesamtheit mit dem Mittelwert µ ud der Variaz σ. Es sei (,,..., eie eifache Zufallsstichprobe aus dieser Grudgesamtheit, d. h. jede der Stichprobevariable i (,,..., hat de Erwartugswert E( i µ ud die Variaz Var( i σ. Für die modifizierte Stichprobevariaz S² gilt: E(S E[ (i ²] σ² ud Var(S Var[ (i ²] Der Beweis dieser Eigeschafte erfordert mathematische Ketisse, die de Rahme dieses Kurses überschreitet. Eie ausführliche Beweis köe Sie bei http://www.wiwi.ui-kostaz.de/heiler/os/ Kapitel 9 ud 0 fide. σ Schätzug I 5 Eigeschafte der modifizierte Stichprobevariaz Die modifizierte Stichprobevariaz ist uverzerrt ud kosistet. uverzerrt E(S E[ (i ²] σ ² E(S σ² 0 kosistet σ Var(S Var[ (i ²] lim Var(S 0 MSE(S [E(S σ ²]² Var(S lim MSE[S σ ]² 0 + Schätzug I 6
Erwartugswert ud Variaz der gewöhliche Stichprobevariaz Sei eie Grudgesamtheit mit dem Mittelwert µ ud der Variaz σ. Es sei (,,..., eie eifache Zufallsstichprobe aus dieser Grudgesamtheit, d. h. jede der Stichprobevariable i (,,..., hat de Erwartugswert E( i µ ud die Variaz Var( i σ. Für die gewöhliche Stichprobevariaz S ² gilt: ' E(S E[ (i ²] σ² ud ' Var(S Var[ (i ²] ( σ ² Var(S ( ² ( ² σ ( ² ' Var(S Var[ ( i ²] Var[ ( i ²] ² σ ² Schätzug I 7 Eigeschafte der gewöhliche Stichprobevariaz Die gewöhliche Stichprobevariaz ist icht uverzerrt aber kosistet. Verzerrug Verzerrug(S E(S σ kosistet E(S σ ² < 0 E(S < σ lim σ σ ² σ lim D. h. sie liefert im Durchschitt Uterschätzuge vo σ², aber sie ist für große Stichprobeumfäge kei schlechter Schätzer. ' ' ' MSE(S [E(S σ ²]² + Var(S ( σ lim ( σ + 0 lim ² lim Schätzug I 8
Prizipie zur Erzeugug guter Schätzer Bisher ist dargestellt worde, was eie Schätzfuktio ist ud welche wichtigste Aforderuge (Eigeschafte a sie zu stelle sid. Behadelt werde jetzt och die Prizipie, ach dee sich sivolle Schätzuge für Parameter explizit erzeuge lasse. Die folgede Prizipie werde zur Erzeugug vo gute Schätzer agewadt: Das Prizip der kleiste Quadrate Das Likelihood-Prizip Schätzug I 9 Das Prizip der kleiste Quadrate Wir werde dieses Prizip ahad des Erwartugswertes µ eier Grudgesamtheit erläuter. Es sei (,,..., eie eifache Zufallsstichprobe aus dieser Grudgesamtheit, d. h. jede der Stichprobevariable i (,,..., hat E( i µ. Sei (x, x,..., x eie Realisatio der Zufallsstichprobe. Es wird ei Schätzer vo µ (Fuktio der Stichprobevariable i, µ -Dach, so gewählt, dass die Summe der quadrierte Abweichuge zwische de Stichprobewerte ud dem Schätzwert des ubekate Parameters µ möglichst klei wird. Das bedeutet, dass µ -Dach so zu bestimme ist, dass für alle adere mögliche Parameterschätzer µ -Dach gilt: ( xi ² ( xi ² Bei der Lösug dieser Aufgabe hadelt es sich um ei eifaches Extremwertproblem. Ma beutzt dafür die Differetialrechug. f( x i Schätzug I 0 Ma muss das Miimum der Fuktio ( ² bestimme. 5
KQ-Schätzer des Erwartugswertes µ f( df( ( xi ² ( xi d We f zweimal ableitbar ist ud a der Stelle ei Miimum besitzt, da gelte:. df( d ( x 0 i ( xi xi 0. d ² f( d ² < 0 i Schätzug I Das Likelihood-Prizip Die Maximum - Likelihood - Methode zur Kostruktio vo Schätzfuktioe besteht dari, dejeige Wert q-dach zu fide, für de die Likelihood - Fuktio L(q bzw. ihr Logarithmus l L(q für eie eifache Zufallstichprobe (x, x,..., x ihr Maximum aimmt: L(q f(x, x, K, x q f(x q f(x q Kf(x q f(xi q ll(q l f(xi q lf(xi q L( qˆ maxl(q für alle q Die Likelihood Fuktio ist das Produkt der Dichte- bzw. Wahrscheilichkeitsfuktioe. Da die Logarithmische Fuktio mooto wachsed ist, habe L(q ud ll(q das Maximum a der gleiche Stelle. Schätzug I 6
ML- Schätzer für die Parameter der Normalverteilug Dichtefuktio Erwartugswert Variaz f(x µ,σ σ e π (x µ² σ² E( µ Var( σ² i σˆ S (i µ σˆ S (i Azuwede, we µ für GG bekat Azuwede, we µ für GG ubekat Schätzug I ML- Schätzer für die Parameter aderer Verteiluge Poissoverteilte Grudgesamtheit f(x µ µ x! x µ e E( Var( µ i Expoetialverteilte Grudgesamtheit f(x λ λe 0 λx für x 0 für x < 0 E( λ Var( λ ² λˆ i Schätzug I 7
Uzuläglichkeit der Puktschätzug Bei eier Puktschätzug erhält ma für de ubekate Parameter eie Schätzwert. Bei jeder kokret ausgewählte Stichprobe erhält ma eie etsprechede Schätzwert des Parameters. Selbst we die Schätzfuktio gute Eigeschafte aufweist, ist die Wahrscheilichkeit, dass der Schätzwert mit dem wahre Wert des Parameters i der Grudgesamtheit übereistimmt, im Allgemeie gleich Null oder sehr klei. Um diese Uzuläglichkeit abzuschwäche ud die Geauigkeit des Schätzverfahres eizubeziehe, geht ma meist zu eier Itervallschätzug über. Schätzug I 5 Itervallschätzug Mit eier Itervallschätzug wird ei ubekater Parameter der Grudgesamtheit derart geschätzt, dass ei Itervall etsteht ud die Wahrscheilichkeit dafür agegebe werde ka, dass der wahre Parameterwert der Grudgesamtheit i diesem Itervall liegt. Diese Aussage erfolgt uter dem Vorbehalt eier Irrtumswahrscheilichkeit α. Ei solches Itervall wird als Kofidez- oder Vertrauesitervall bezeichet. Die Wahrscheilichkeit - α heißt Kofideziveau. Schätzug I 6 8
Viele Dak!!! Schätzug I 7 9