3. Itervallschätzuge 3.1. Zufallsstichprobe ud Stichprobefuktioe 3.1.1 Zufallsstichprobe 1 Sei eie Zufallsvariable ud seie gemeisamer Verteilug,,,, Zufallsvariable mit - da heiße 1,,, Zufallsstichprobe aus, we jedes x1 x wie verteilt ist. ist Stichprobeumfag ud die Werte i,,, x 1
der Zufallsvariable 1,,, heiße Realisierug oder Wert der Stichprobe. - Eie Zufallsstichprobe 1,,, heißt eifache Stichprobe aus, we 1,,, außerdem stochastisch uabhägig sid. Eie Zahl, die vo der Verteilug vo abhägt, et ma eie Verteilugsparameter. Die wichtigste Parameter sid der Erwartugswert, die Variaz, die Quatile sowie die Iterwallwahrscheilichkeite.
Beispiel: G Die utersuchte Grudgesamtheit besteht aus alle Haushalte i Deutschlad im Jahr 001. Utersuchugsmerkmal ist das verfügbare moatliche Haushaltseikomme. Da die Grudgesamtheit sehr groß ist, soll ur ei Teil der Eikomme statistisch erhobe werde. Durch ei Experimet wird ei Haushalt zufällig ausgewählt (zufällig heißt, jeder Haushalt besitzt die gleiche Chace, ausgewählt zu werde). Da werde durch ereute Zufallsauswahl aus der Grudgesamtheit uabhägig voeiader weitere Haushalte gezoge ud etsprechede Eikomme festgestellt. G 3
Durch (verfügbares moatliches Eikomme des Haushalts i) ist i x1 x eie Zufallsvariable gegebe. Die Eikommeswerte,,, x köe als Realisieruge eier Stichprobe aus 1,,, aus aufgefasst werde. 3.1.. Stichprobefuktioe Statistische Verfahre beruhe auf Zufallsstichprobe aus eier oder mehrere Zufallsvariable. Eie Stichprobe 1,,, aus geht jedoch meistes icht direkt, soder über eie Fuktio 4
g 1 (,,, ) i das Verfahre ei. Die Fuktio g( 1,,, ) ist selbst eie Zufallsvariable ud wird Stichprobefuktio geat. Wichtige Stichprobefuktioe sid das Stichprobemittel ud die Stichprobevariaz. i heißt Stichprobe- Das arithmetische Mittel der Beobachtuge mittel: 1 = i = 1 i 5
Stichprobevariaz: S 1 1 = ( i ) = i= 1 i= 1 i 3. Stichprobeverteiluge Die Stichprobeparameter wie Mittelwert, Ateilswert, Variaz ud adere sid Realisatioe vo Zufallsvariable. Ihre Wahrscheilichkeitsverteiluge et ma Stichprobeverteiluge. 6
Verteilug des Stichprobemittelwertes Sei ~ N ( µ, σ ) ud sei 1,,, eie Stichprobe aus (ormalverteilte Stichprobe). Da gilt für das Stichprobemittel: σ ~ N( µ, ) De bei großem Stichprobeumfag gilt für die Verteilug des Stichprobemittelwertes : E( ) = µ ud σ = σ 7
ist (ach dem zetrale Grezwertsatz) aäherd ormalverteilt. Dies bedeutet, dass die ZV, für die der beobachtete Stichprobemittelwert x eie Realisatio darstellt, asymptotisch ormalverteilt ist mit de Parameter µ ud σ (gilt bei beliebiger Verteilug vo ud Uabhägigkeit (Stichprobe mit Zurücklege)). Ma geht davo aus, dass bei eiem Stichprobeumfag vo die Ausgagsverteilug keie Rolle spielt. > 30 8
Aber: icht ur Stichprobeumfag, soder auch Verteilug des Merkmals i der GG ist relevat Durch Stadardisiere der ZV erhält ma de stadardisierte Stichprobemittel: σ / µ ~ N( 01, ) ist aäherd stadardormalverteilt. 9
Hieraus folgt die Wahrscheilichkeitsaussage P( µ z σ < < µ + z σ ) D( z) (direkter Schluss) = Direkter Schluss = Schluss vo der Grudgesamtheit auf die Stichprobe: Mit welcher Wahrscheilichkeit fällt ei Stichprobemittelwert i ei Dz ( ) vorher bestimmtes Itervall oder umgekehrt. Dabei beschreibt die über dem symmetrische Itervall [-z, +z] liegede Wahrscheilichkeit. 10
Verteilug des Stichprobeateilswertes Etsprechedes gilt für de Ateilswert H eier große Stichprobe: E( H) = p ud σh = p( 1 p) q: = 1 p H ist aäherd ormalverteilt bzw. mit, H p pq / ~ N( 01, ) aäherd stadardormalverteilt 11
3.3 Itervallschätzuge mit große Stichprobe Trotz der gute Eigeschafte der Puktschätzuge, weiß ma icht, welches Vertraue ma i sie lege ka. Aders ist das bei de Itervallschätzuge. Bei Itervallschätzuge ka ma die Wahrscheilichkeite agebe, mit dee ei Schätzer i ei bestimmtes Itervall fällt. Itervallschätzug basiert wie der direkte Schluss auf der Wahrscheilichkeitsaussage. Ma erhält u ei Itervall um µ. = Umkehrschluss oder Rückschluss 1
P( zσ µ + zσ ) = D( z) = 1 α Begriff des Kofidezitervalls: Gilt für das Zufallsitervall [Q 1 ;Q ] ud eie bestimmte Parameter q 1 Q P ( Q q ) = 1 α, d.h. überdeckt das Itervall de ubekate Parameter q mit eier vorgegebee Wahrscheilichkeit 1-α, da heißt [Q 1 ;Q ] Kofidezitervall für q zum Kofideziveau 1-α. 13
1-α = Kofidezwahrscheilichkeit. Sie gibt a, iwieweit ma darauf vertraue ka, dass der ubekate Wert q im Kofidezitervall liegt. α = Irrtumswahrscheilichkeit. Sie gibt a, wie oft ma sich im Mittel irrt, we ma Kofidezitervalle aufstellt. Q 1 ; Q = Kofidez- oder Vertrauesgreze. 14
Kofidezitervalle für Mittelwerte Die Itervallschätzug stellt die Umkehrug des direkte Schlusses (s.o.) dar ud heißt auch Umkehrschluss oder Rückschluss (idirekter Schluss). Idirekter Schluss: Schluss vo der Stichprobe auf die ubekate Grudgesamtheit. Kofidezitervall um de Mittelwert µ: 15
KONF ( x zσ µ x + zσ ) = 1 α I de meiste Fälle ist aber auch die Variaz des Merkmals i der Grudgesamtheit ubekat, so dass ma sie schätze muss, σ = ˆ σˆ um das Kofidezitervall zu bestimme: KONF zσˆ µ x + zσˆ ) = 1 α ( x Dadurch etsteht eie zusätzliche Ugeauigkeit. 16
Kofidezitervalle für Ateilswerte: Bei große Stichprobe werde die Itervalle für Ateilswerte aalog geschätzt Normalverteilug als Näherugsverteilug): pq pq KONF( H z p H + z ) = D( z) = 1 α (Rückschluss) p Da zu schätzede wird durch de Stichprobeateilswert ersetzt ud das Kofidezitervall für Ateilswerte lautet: h 17
h( 1 h) h( 1 h) KONF( h z p h + z ) = 1 α 3.4 Chi-Quadrat-Verteilug Seie U1, U,, U ν uabhägige N(0,1)-verteilte Zufallsvariable. Da besitzt Q = ν i= 1 U i ~ χ ν eie Chi-Quadrat-Verteilug (ν = Azahl der Freiheitsgrade). 18
Chi-Quadrat-Verteilug ist eie stetige Verteilug auf [0, ] (positive Wahrscheilichkeitsdichte). Diese Verteilug ist asymmetrisch ud rechtsschief: 19
Der Erwartugswert ud die Variaz dieser Verteilug sid: E[ Q] = ν ud V[ Q] = ν Sei 1,,, eie Stichprobe aus ~ N ( µ, σ ). Aus der Defiitio der Chi-Quadrat-Verteilug folgt, dass i= 1 i µ σ ~ χ 0
Es gilt außerdem: S 1 i = ( ) ~ i = χ 1 σ σ i= 1 i= 1 σ Die Stichprobevariaz S ist somit verteilt wie das χ 1 -verteilte Zufallsvariable. σ -fache eier 1
3.5 t-verteilug U Q U Seie ud stochastisch uabhägig, wobei stadardormal ver- U ~ N( 01, ) Q teilt ud chi-quadrat-verteilt U ~ χ ist. ν Die Verteilug vo W = U Q ν heißt t-verteilug (auch Studet- Verteilug geat) mit Parameter ν : W U = ν ~ tν (mit ν = Azahl der Freiheitsgrade). Q
Für diese Verteilug gilt: ν E[ W ] = 0, falls ν ud VW [ ] = > 1, falls ν 3. ν Die Dichtefuktio der t-verteilug ähelt der Dichte der Stadardormalverteilug. Sie ist symmetrisch um Null. A de Flake weist jedoch die Dichte der t-verteilug mehr Masse als die N(0,1)-Dichte auf. Mit steigeder Azahl der Freiheitsgrade (für ν 40) kovergiert die t- Verteilug gege die Stadardormalverteilug. 3
4
3.6 Itervallschätzug mit kleie Stichprobe Bei große Stichprobe lasse sich die Kofidezitervalle leicht kostruiere, da ach dem zetrale Grezwertsatz die Normalverteilug eie gute Näherug für die wahre Stichprobeverteilug darstellt. Bei kleie Stichprobe ist es jedoch icht gegebe. Nur i de Situatioe, we das Merkmal bereits i der Grudgesamtheit ormalverteilt ist, wird die Kostruktio vo Kofidezitervalle wieder eifach. Wege der Reproduktioseigeschaft der Normalverteilug ist der Stichprobemittelwert auch ormalverteilt. 5
Kofidezitervalle für Mittelwerte We die Stichprobe aus eier ormalverteilte Grudgesamtheit stammt, ist der Quotiet µ σ ˆ auch für kleie Stichprobe Studet-tverteilt mit -1 Freiheitsgrade. Hieraus folgt die Wahrscheilichkeitsaussage: µ P( t + t) = FT ( t) FT ( t) ˆ σ 6
Das Kofidezitervall für µ lautet: KONF ( x t ˆ σ µ + ˆ x t 1σ ) = 1 α 1 mit dem (1- α/)-quatil: t 1[ 1 α /] = t 1[ α /] Kofidezitervalle für Variaze Die Variaz S eier Stichprobe ist eie Zufallsvariable. Ihre Verteilug lässt sich bereche für de Fall, dass das Merkmal i der Grud- 7
Prof. Dr. Rolad Füss Statistik II SS 008 gesamtheit aäherd ormalverteilt ist ud die eizele Stichprobe uabhägig gezoge werde. We das Merkmal i der Grudgesamtheit ormalverteilt ist, so ist der Quotiet 1 = S χ σ chi-quadrat-verteilt mit 1 Freiheitsgrade. [ ] [ ] α α χ σ α χ = 1 / / 1 1 1 s s KONF Chi-Quadrat-Verteilug ist keie symmetrische Verteilug, 8
F( χ F( χ ute obe ) = α / ) = 1 α / beide Stelle sid positiv. Quelle: J. Schira (003), S. 461. 9
3.7 Übersicht Variaze - Variaz i der Stichprobe 1 s x x = ( j ) i = 1 mit = Stichprobeumfag ud x 1 xj i = 1 = - Variaz i der Grudgesamtheit 1 σ µ = ( x j ) N i= 1 mit N = Stichprobeumfag ud 1 N x j i= 1 µ = N 30
- Geschätzte Variaz i der Grudgesamtheit ˆ s 1 σ = mit -1 = Azahl der Freiheitsgrade - Variaz des Stichprobemittelwertes V( ) = σ = σ - Geschätzt Variaz des Stichprobemittelwertes Vˆ( ) = σ = ˆ σ ˆ 31