2.2 Punktschätzung. Gegeben sei die in Kapitel 2.1 beschriebene Situation, also eine i.i.d. Stichprobe X 1,...,X n eines Merkmales X.

Transkript

1 Ziel: Finde ein möglichst gutes Schätzverfahren und damit einen möglichst guten Schätzwert für eine bestimmte Kenngröße ϑ (Parameter) der Grundgesamtheit, z.b. den wahren Anteil der rot/grün-wähler, den wahren Mittelwert, die wahre Varianz, aber auch z.b. das wahre Maximum (z.b. von Windgeschwindigkeit) Schätzfunktionen Gegeben sei die in Kapitel 2.1 beschriebene Situation, also eine i.i.d. Stichprobe X 1,...,X n eines Merkmales X. 2 Induktive Statistik 262

2 Definition 2.1. Sei X 1,...,X n i.i.d. Stichprobe. Jede Funktion T = g(x 1,...,X n ) heißt Schätzer oder Schätzfunktion. Inhaltlich ist g( ) eine Auswertungsregel der Stichprobe: Welche Werte sich auch in der Stichprobe ergeben, ich wende das durch g( ) beschriebene Verfahren auf sie an. (z.b. ich bilde den Mittelwert der Daten) 2 Induktive Statistik 263

3 Typische Beispiele für Schätzfunktionen: 1. Arithmetisches Mittel der Stichprobe: X = g(x 1,...,X n ) = 1 n n i=1 X i Für binäre X i mit X i {0,1} ist X auch die relative Häufigkeit des Auftretens von X i = 1 in der Stichprobe 2. Stichprobenvarianz: S 2 = g(x 1,...,X n ) = 1 n n (X i X) 2 = i=1 ( 1 n n i=1 X 2 i ) ( X) 2 = 1 n ( X 2 i n X 2) 2 Induktive Statistik 264

4 3. Korrigierte Stichprobenvarianz: S 2 = g(x 1,...,X n ) = 1 n 1 n i=1 (X i X) 2 = 1 n 1 ( n ) Xi 2 n X 2 i=1 4. Größter Stichprobenwert: X (n) = g(x 1,...,X n ) = max i=1,...,n X i 5. Kleinster Stichprobenwert: X (1) = g(x 1,...,X n ) = min i=1,...,n X i 2 Induktive Statistik 265

5 Schätzfunktion und Schätzwert: Da X 1,...,X n zufällig sind, ist auch die Schätzfunktion T = g(x 1,...,X n ) zufällig. Zieht man mehrere Stichproben, so erhält man jeweils andere Realisationen von X 1,...,X n, und damit auch von T. Die Realisation t (konkreter Wert) der Zufallsvariable T (Variable) heißt Schätzwert. Man hat in der Praxis meist nur eine konkrete Stichprobe und damit auch nur einen konkreten Wert t von T. Zur Beurteilung der mathematischen Eigenschaften werden aber alle denkbaren Stichproben und die zugehörigen Realisationen der Schätzfunktion T herangezogen. D.h. beurteilt wird nicht der einzelne Schätzwert als solcher, sondern die Schätzfunktion, als Methode, d.h. als Regel zur Berechnung des Schätzwerts aus der Stichprobe. Andere Notation in der Literatur: ˆϑ Schätzer für ϑ. Dabei wird nicht mehr direkt unterschieden zwischen Zufallsvariable (bei uns Großbuchstaben) und Realisation (bei uns klein). = Schreibe ˆϑ(X 1,...,X n ) bzw. ˆϑ(x 1,...,x n ) wenn die Unterscheidung benötigt wird. 2 Induktive Statistik 266

6 Bsp Durchschnittliche Anzahl der Statistikbücher in einer Grundgesamtheit von Studierenden schätzen. Grundgesamtheit: Drei Personen Ω = { ω 1, ω 2, ω 3 }. Merkmal X: Anzahl der Statistikbücher X( ω 1 ) = 3 X( ω2 ) = 1 X( ω3 ) = 2. Wahrer Durchschnittswert: µ = 2. Stichprobe X 1,X 2 ohne Zurücklegen (Stichprobenumfang n = 2): X 1 = X(ω 1 ) X 2 = X(ω 2 ) wobei ω 1 erste gezogene Person, ω 2 zweite gezogene Person. 2 Induktive Statistik 267

7 Betrachte folgende möglichen Schätzer: T 1 = g 1 (X 1,X 2 ) = X = X 1+X 2 2 T 2 = X 1 T 3 = g(x 1,X 2 ) = 2 3 X (2) = 2 3 max(x 1,X 2 ) 2 Induktive Statistik 268

8 2.2.2 Gütekriterien Beurteile die Schätzfunktionen, also das Verfahren an sich, nicht den einzelnen Schätzwert. Besonders bei komplexeren Schätzproblemen sind klar festgelegte Güteeigenschaften wichtig. Natürlich ist auch zu Beginn genau festzulegen, was geschätzt werden soll. Im Folgenden sei der Parameter ϑ stets eine eindimensionale Kenngröße der Grundgesamtheit (z.b. Mittelwert, Varianz, Maximum) Der Punkt ist, dass T zufällig ist; der Wert schwankt mit der konkreten Stichprobe. Man kann also nicht erwarten, dass man immer den richtigen Wert trifft. Die Beurteilung der Güte des Schätzers bezieht sich auf Kenngrößen seiner Verteilung (v.a. Erwartungswert und Varianz) 2 Induktive Statistik 269

9 Definition 2.3. (Erwartungstreue, Bias) Gegeben sei eine Stichprobe X 1,...,X n und eine Schätzfunktion T = g(x 1,...,X n ) (mit existierendem Erwartungswert). T heißt erwartungstreu für den Parameter ϑ, falls gilt für alle ϑ. Die Größe E ϑ (T) = ϑ Bias ϑ (T) = E ϑ (T) ϑ heißt Bias (oder Verzerrung) der Schätzfunktion. Man schreibt E ϑ (T) und Bias ϑ (T), um deutlich zu machen, dass die Größen von dem wahren ϑ abhängen. Erwartungstreue Schätzfunktionen haben per Definition einen Bias von 0. 2 Induktive Statistik 270

10 Anschauliche Interpretation: 2 Induktive Statistik 271

11 Bsp [Fortsetzung des Beispiels] Nehmen Sie an, die Stichprobenziehung sei gemäß einer reinen Zufallsauswahl erfolgt, d.h. jede Stichprobe hat dieselbe Wahrscheinlichkeit gezogen zu werden (hier dann 1 6 ). Sind die oben betrachteten Schätzfunktionen T 1,T 2,T 3 erwartungstreu? 2 Induktive Statistik 272

12 Zur Beurteilung: Alle möglichen Stichproben (vom Umfang n = 2, ohne Zurücklegen) betrachten: Personen in der Nummer Realisationen von Stichprobe der Stichprobe X 1 X 2 T 1 T 2 T 3 1 ω 1, ω ω 1, ω ω 2, ω ω 2, ω ω 3, ω ω 3, ω Verteilung von T 1,T 2,T 3 siehe bei Erwartungstreue 2 Induktive Statistik 273

13 Für die Träger T i von T i, i = 1,2,3 gilt: T 1 = {1.5,2,2.5} T 2 = {1,2,3} T 3 = {1. 3,2} Bei T 1 gilt: P({T 1 = 1.5}) = P({T 1 = 2}) = P({T 1 = 2.5}) = 2 6 = 1 3 Bei T 2 gilt: P({T 2 = 1}) = P({T 2 = 2}) = P({T 2 = 3}) = 2 6 = 1 3 Bei T 3 gilt: P({T 3 = 1.5}) = 2 6 = 1 3 ; P({T 3 = 3}) = 4 6 = Induktive Statistik 274

14 und damit bei ϑ = µ = 2 : E 2 (T 1 ) = t 1 T 1 t 1 P({T 1 = t 1 }) = 1 3 ( ) = 2. In der Tat gilt allgemein (vgl. die nächste Bemerkung): Das arithmetische Mittel ist erwartungstreu für den Erwartungswert. E 2 (T 2 ) = t 2 T 2 t 2 P({T 2 = t 2 }) = 1 3 (1+2+3) = 2 Wieder gilt allgemein: Einzelne Stichprobenvariablen ergeben auch erwartungstreue Schätzer für den Erwartungswert, sind aber weniger geeignet (s.u.). E 2 (T 3 ) = T 3 ist also nicht erwartungstreu. Es gilt t 3 T 3 t 3 P({T 3 = t 3 }) = = Bias(T 3 ) = E 2 (T 3 ) 2 = = Induktive Statistik 275

15 2 Induktive Statistik 276

16 Bem [Bias und Erwartungstreue bei einigen typischen Schätzfunktionen] Das arithmetische Mittel X = 1 n n i=1 X i ist erwartungstreu für den Mittelwert µ einer Grundgesamtheit: Aus X 1,...,X n i.i.d. und E µ (X 1 ) = E µ (X 2 ) =... = µ folgt: E( X) = E µ ( 1 n = 1 n = 1 n n i=1 ) ( n X i = 1 n ) n E µ X i i=1 E(X i ) n µ = 1 n n µ = µ i=1 i=1 2 Induktive Statistik 277

17 Sei σ 2 die Varianz in der Grundgesamtheit. Es gilt E σ 2( S 2 ) = n 1 n σ2, also ist S 2 nicht erwartungstreu für σ 2. Bias σ 2( S 2 ) = n 1 n σ2 σ 2 = 1 n σ2 (Für n geht Bias σ 2( S 2 ) gegen 0, S 2 ist asymptotisch erwartungstreu.) 2 Induktive Statistik 278

18 Für die korrigierte Stichprobenvarianz gilt dagegen: ( ) E σ 2(S 2 1 n ) = E σ 2 (X i n 1 X) 2 i=1 ( ) 1 = E σ 2 n 1 n n (X i n X) 2 i=1 ( ) n = E σ 2 n 1 S2 = n n 1 n 1 n σ2 = σ 2 Also ist S 2 erwartungstreu für σ 2. Diese Eigenschaft ist auch die Motivation dafür, von einer Korrektur der Stichprobenvarianz zu sprechen. Vorsicht: Im Allgemeinen gilt, wie in Kapitel ausgeführt, für beliebige, nichtlineare Funktionen g Eg(X) g(e(x)). Man kann also nicht einfach z.b. und E vertauschen. In der Tat gilt: S 2 ist zwar erwartungstreu für σ 2, aber S 2 ist nicht erwartungstreu für σ 2 = σ. 2 Induktive Statistik 279

19 Bsp [Wahlumfrage] Gegeben sei eine Stichprobe der wahlberechtigten Bundesbürger. Geben Sie einen erwartungstreuen Schätzer des Anteils der rot-grün Wähler an. 2 Induktive Statistik 280

20 Bedeutung der Erwartungstreue: Erwartungstreue ist in gewisser Weise ein schwaches Kriterium, denn es gibt viele unsinnige erwartungstreue Schätzer! Deshalb betrachtet man zusätzlich die Effizienz eines Schätzers, s.u. 2 Induktive Statistik 281

21 2.2.3 Effizienz Beispiel Wahlumfrage: Gegeben sind zwei erwartungstreue Schätzer (n sei zum einfacheren Rechnen gerade): T 1 = 1 n T 2 = 1 n/2 n i=1 X i n/2 i=1 X i Was unterscheidet formal T 1 von dem unsinnigen Schätzer T 2, der die in der Stichprobe enthaltene Information nicht vollständig ausnutzt? Vergleiche die Schätzer über ihre Varianz, nicht nur über den Erwartungswert! 2 Induktive Statistik 282

22 Wenn n so groß ist, dass der zentrale Grenzwertsatz angewendet werden kann, dann gilt approximativ 1 n n (X i π) i=1 π(1 π) = n X i n π i=1 n π(1 π) = 1 n X i π n i=1 π(1 π) N(0;1) n und damit Analog kann man zeigen: T 1 = 1 n n X i N i=1 ( π; π(1 π) ). n T 2 = 1 n/2 n/2 i=1 X i N ( π, π(1 π) ). n/2 T 1 und T 2 sind approximativ normalverteilt, wobei T 1 eine deutlich kleinere Varianz als T 2 hat. 2 Induktive Statistik 283

23 T 1 und T 2 treffen beide im Durchschnitt den richtigen Wert π. Der Schätzer T 1 schwankt aber weniger um das wahre π, ist also im Durchschnitt genauer. Andere Interpretation: Dichte von T 1 Dichte von T 2 π π π + Für jeden Punkt π + > π ist damit P(T 1 > π + ) < P(T 2 > π + ) und für jeden Punkt π < π ist P(T 1 < π ) < P(T 2 < π ). 2 Induktive Statistik 284

24 Es ist also die Wahrscheinlichkeit, mindestens um π + π bzw. π π daneben zu liegen, bei T 2 stets größer als bei T 1. Umgekehrt gesagt: Ein konkreter Wert ist damit verlässlicher, wenn er von T 1, als wenn er von T 2 stammt. Diese Überlegung gilt ganz allgemein: Ein erwartungstreuer Schätzer ist umso besser, je kleiner seine Varianz ist. Var(T) = Erwartete quadratische Abweichung von T von E(T) }{{} =ϑ Je kleiner die Varianz, umso mehr konzentriert sich die Verteilung eines erwartungstreuen Schätzers um den wahren Wert. Dies ist umso wichtiger, da der Schätzer den wahren Wert i.a. nur selten exakt trifft. 2 Induktive Statistik 285

25 Definition 2.7. Effizienz Gegeben seien zwei erwartungstreue Schätzfunktionen T 1 und T 2 für einen Parameter ϑ. Gilt Var ϑ (T 1 ) Var ϑ (T 2 ) für alle ϑ und so heißt T 1 effizienter als T 2. Var ϑ (T 1 ) < Var ϑ (T 2 ) für mindestens ein ϑ Eine für ϑ erwartungstreue Schätzfunktion T opt heißt UMVU-Schätzfunktion für ϑ (uniformly minimum v ariance unbiased), falls Var ϑ (T opt ) Var ϑ (T) für alle ϑ und für alle erwartungstreuen Schätzfunktionen T. 2 Induktive Statistik 286

26 Bem Inhaltliche Bemerkung: Der Sinn von Optimalitätskriterien bei der Auswertung der Stichprobe wird klassischerweise insbesondere auch in der Gewährleistung von Objektivität, besser Intersubjektivität, gesehen. Ohne wissenschaftlichen Konsens darüber, welcher Schätzer in welcher Situation zu wählen ist, wäre die Auswertung einer Stichprobe willkürlich und der Manipulation Tür und Tor geöffnet. Allerdings gibt es wirkliche Eindeutigkeit nur bei idealen, sauberen Daten. Z.B. sind ausreißerunempfindliche Verfahren bei idealen Daten weniger effizient, haben aber den Vorteil, stabiler bei kleinen Abweichungen von den Verteilungsannahmen zu sein. Ist X 1,...,X n eine i.i.d. Stichprobe mit X i N(µ,σ 2 ), dann ist * X UMVU-Schätzfunktion für µ bei bekanntem σ 2 und * S 2 UMVU-Schätzfunktion für σ 2 bei bekanntem µ. Ist X 1,...,X n mit X i {0,1} eine i.i.d. Stichprobe mit π = P(X i = 1), dann ist die relative Häufigkeit X UMVU-Schätzfunktion für π. 2 Induktive Statistik 287

27 Bei nicht erwartungstreuen Schätzern macht es keinen Sinn, sich ausschließlich auf die Varianz zu konzentrieren. Man zieht dann den sogenannten Mean Squared Error MSE ϑ (T) := E ϑ (T ϑ) 2 zur Beurteilung heran. Es gilt MSE ϑ (T) = Var ϑ (T)+(Bias ϑ (T)) 2. Der MSE kann als Kompromiss zwischen zwei Auffassungen von Präzision gesehen werden: möglichst geringe systematische Verzerrung (Bias) und möglichst geringe Schwankung (Varianz). 2 Induktive Statistik 288

28 2.2.4 Asymptotische Gütekriterien Asymptotische Erwartungstreue * Eine Schätzfunktion heißt asymptotisch erwartungstreu, falls lim E ϑ(ˆθ) = θ n d.h., gilt. lim Bias ϑ(ˆθ) = 0 n * Abschwächung des Begriffs der Erwartungstreue: Gefordert wird die Erwartungstreue nur bei einer unendlich großen Stichprobe. * Erwartungstreue Schätzer sind auch asymptotisch erwartungstreu. * Sowohl S 2 als auch S 2 sind asymptotisch erwartungstreu. (vgl. vorne Bias σ 2( S 2 ) = 1 n σ2 geht für n gegen 0.) 2 Induktive Statistik 289

29 Für komplexere Modelle ist oft die Erwartungstreue der Verfahren ein zu restriktives Kriterium. Man fordert deshalb oft nur, dass sich der Schätzer wenigstens für große Stichproben gut verhält. Hierzu gibt es verwandte aber etwas unterschiedliche Kriterien, z.b. das folgende: Ein Schätzer heißt(mse-)konsistent oder konsistent im quadratischen Mittel, wenn gilt lim (MSE(T)) = 0. n Beispiel: Der MSE von X ist gegeben durch MSE( X) = Var( X)+Bias 2 ( X) = σ2 n +0 = σ2 n 0. X ist also ein MSE-konsistenter Schätzer für den Erwartungswert. 2 Induktive Statistik 290

30 Anschaulich bedeutet die Konsistenz, 2 Induktive Statistik 291

31 2.2.5 Konstruktionsprinzipien guter Schätzer Die Methode der kleinsten Quadrate = Regressionsanalyse Das Maximum-Likelihood-Prinzip * Aufgabe: Schätze den Parameter ϑ eines parametrischen Modells anhand einer i.i.d. Stichprobe X 1,...,X n mit der konkreten Realisation x 1,...,x n. * Idee der Maximium-Likelihood (ML) Schätzung für diskrete Verteilungen: Man kann für jedes ϑ die Wahrscheinlichkeit ausrechnen, genau die Stichprobe 2 Induktive Statistik 292

32 x 1,...,x n zu erhalten: P ϑ (X 1 = x 1,X 2 = x 2,...,X n = x n ) = n P ϑ (X i = x i ) i=1 Je größer für ein gegebenes ϑ 0 die Wahrscheinlichkeit ist, die konkrete Stichprobe erhalten zu haben, umso plausibler ist es, dass tatsächlich ϑ 0 der wahre Wert ist (gute Übereinstimmung zwischen Modell und Daten). Man nennt daher L(ϑ) = P ϑ (X 1 = x 1,...,X n = x n ), nun als Funktion von ϑ gesehen, die Likelihood (deutsch: Plausibilität, Mutmaßlichkeit) von ϑ gegeben die Realisation x 1,...,x n. Derjenige Wert ˆϑ = ˆϑ(x 1,...,x n ), der L(ϑ) maximiert, heißt Maximum-Likelihood- Schätzwert; die zugehörige Schätzfunktion T(X 1,...,X n ) Maximum-Likelihood- Schätzer (siehe genauer Definition 2.11). 2 Induktive Statistik 293

33 Bsp i.i.d. Stichprobe vom Umfang n = 5 aus einer B(10, π)-verteilung: Wahrscheinlichkeit der Stichprobe für gegebenes π, hier notiert durch π : P(... π) Wahrscheinlichkeit, wenn π der wahre Parameter ist P(X 1 = 6,...,X 5 = 4 π) = P(X 1 = 6 π)... P(X 5 = 4 π) ( ) 10 = π 6 (1 π) 4... ( ) 10 π 4 (1 π) Induktive Statistik 294

34 Wahrscheinlichkeit für einige Werte von π: π P(X 1 = 6,...,X 5 = 4 π) Induktive Statistik 295

35 Bem Zwei Sichtweisen auf P ϑ (X 1 = x 1,...,X n = x n ) : * Deduktiv (Wahrscheinlichkeitsrechnung): ϑ bekannt, x 1,...,x n zufällig ( unbekannt ). * Induktiv (Statistik): ϑ unbekannt, x 1,...,x n bekannt. Für stetige Verteilungen gilt P ϑ (X 1 = x 1,X 2 = x 2,...,X n = x n ) = 0 für beliebige Werte ϑ. In diesem Fall verwendet man die Dichte f ϑ (x 1,...,x n ) = n f ϑ (x i ) i=1 als Maß für die Plausibilität von ϑ. 2 Induktive Statistik 296

36 Für die praktische Berechnung maximiert man statt der Likelihood typischerweise die sog. Log-Likelihood l(ϑ), also den natürlichen Logarithmus der Likelihood. n l(ϑ) = ln(l(ϑ)) = ln P ϑ (X i = x i ) = i=1 n lnp ϑ (X i = x i ) i=1 bzw. l(ϑ) = ln n f ϑ (x i ) = i=1 n lnf ϑ (x i ). Dies liefert denselben Schätzwert ˆϑ und erspart beim Differenzieren die Anwendung der Produktregel. Manchmal ist es noch geschickter, zunächst n i=1 P ϑ(x i = x i ) zu vereinfachen und dann zu logarithmieren. Bei den in Statistik II betrachteten regulären Verteilungsmodellen reicht es, die erste Ableitung zu betrachten. Man kann zeigen, dass sie immer auf ein Maximum führt. i=1 2 Induktive Statistik 297

37 Definition (Maximum-Likelihood-Schätzung) Gegeben sei die Realisation x 1,...,x n einer i.i.d. Stichprobe. Die Funktion in ϑ L(ϑ) = n P ϑ (X i = x i ) falls X i diskret i=1 n f ϑ (x i ) i=1 falls X i stetig. heißt Likelihood des Parameters ϑ bei der Beobachtung x 1,...,x n. Derjenige Wert ˆϑ = ˆϑ(x 1,...,x n ), der L(ϑ) maximiert, heißt Maximum-Likelihood- Schätzwert; die zugehörige Schätzfunktion T(X 1,...,X n ) Maximum-Likelihood- Schätzer. 2 Induktive Statistik 298

38 Bsp (Maximum-Likelihood-Schätzer bei der Bernoulli-Verteilung) 2 Induktive Statistik 299

39 Bsp [ML-Schätzung bei Normalverteilung] Der ML-Schätzer ˆµ = X für µ stimmt mit dem üblichen Schätzer für den Erwartungswert überein. Der ML-Schätzer ˆσ 2 = S 2 für σ 2 ist die Stichprobenvarianz; diese ist nicht erwartungstreu. 2 Induktive Statistik 300

40 Bem [Einige allgemeine Eigenschaften von ML-Schätzern] Unter allgemeinen Regularitätsbedingungen gilt: ML-Schätzer ˆθ sind im Allgemeinen nicht erwartungstreu. ML-Schätzer ˆθ sind asymptotisch erwartungstreu. ML-Schätzer ˆθ sind konsistent (und meist in einem asymptotischen Sinne effizient). 2 Induktive Statistik 301

41 2.3 Intervallschätzung 2.3 Intervallschätzung Motivation und Hinführung Bsp [Wahlumfrage] Der wahre Anteil der rot-grün Wähler unter allen Wählern war 2009 auf eine Nachkommastelle gerundet genau 33.7%. Wie groß ist die Wahrscheinlichkeit, in einer Zufallsstichprobe von 1000 Personen aus allen Wählern genau einen relativen Anteil von 33.7% von rot-grün Wählern erhalten zu haben? D.h., mit Wahrscheinlichkeit von etwa 97.3%, verfehlt der Schätzer den wahren Wert. Hat man ein stetiges Merkmal, so ist sogar P(X = w) = 0 für jeden Wert w, d.h. der wahre Wert wird mit Wahrscheinlichkeit 1 verfehlt. 2 Induktive Statistik 302

42 Konsequenzen: 2.3 Intervallschätzung InsbesondereVorsichtbeiderInterpretation knapperergebnisse (z.b.anteil50.2%) Suche Schätzer mit möglichst kleiner Varianz, um im Durchschnitt möglichst nahe am wahren Wert dran zu sein Es ist häufig auch gar nicht nötig, sich genau auf einen Wert als Schätzung festzulegen. Oft reicht die Angabe eines Intervalls, von dem man hofft, dass es den wahren Wert überdeckt: Intervallschätzung Symmetrische Intervallschätzung basierend auf einer Schätzfunktion T = g(x 1,...,X n ): I(T) = [T a,t +a] 2 Induktive Statistik 303

43 Trade off bei der Wahl von a: Wie soll man a wählen? 2.3 Intervallschätzung Typisches Vorgehen: Man gebe sich durch inhaltliche Überlegungen einen Sicherheitsgrad (Konfidenzniveau) γ vor. Dann konstruiert man das Intervall so, dass es mindestens mit der Wahrscheinlichkeit γ den wahren Parameter überdeckt Konfidenzintervall ( Vertrauensintervall ) 2 Induktive Statistik 304

44 2.3.2 Definition von Konfidenzintervallen: 2.3 Intervallschätzung Gegeben sei eine i.i.d. Stichprobe X 1,...,X n zur Schätzung eines Parameters ϑ und eine Zahl γ (0;1). Ein zufälliges Intervall C(X 1,...,X n ) heißt Konfidenzintervall zum Sicherheitsgrad γ (Konfidenzniveau γ), falls für jedes ϑ gilt: P ϑ (ϑ C(X 1,...,X n ) ) γ. }{{} zufälliges Intervall 2 Induktive Statistik 305

45 Bem Intervallschätzung Die Wahrscheinlichkeitsaussage bezieht sich auf das Ereignis, dass das zufällige Intervall den festen, wahren Parameter überdeckt. Streng genommen darf man im objektivistischen Verständnis von Wahrscheinlichkeit nicht von der Wahrscheinlichkeit sprechen, dass ϑ in dem Intervall liegt, da ϑ nicht zufällig ist und somit keine Wahrscheinlichkeitsverteilung besitzt. (Ein Zurückziehen auf subjektive Wahrscheinlichkeiten führt hier aber auch auf Widersprüche.) Typischerweise konstruiert man Konfidenzintervalle symmetrisch um einen Schätzer T. Es sind aber auch manchmal z.b. einseitige Konfidenzintervalle, etwa der Form [ X, X +b], sinnvoll. 2 Induktive Statistik 306

46 2.3.3 Konstruktion von Konfidenzintervallen 2.3 Intervallschätzung Für die Konstruktion sehr praktische Vorgehensweise: Suche Zufallsvariable Z ϑ, die den gesuchten Parameter ϑ enthält und deren Verteilung aber nicht mehr von dem Parameter abhängt, ( Pivotgröße, dt. Angelpunkt). Dann wähle den Bereich [z unten,z oben ] so, dass P(Z ϑ [z unten,z oben ]) = γ und löse nach ϑ auf. Mit Blick auf Kapitel kann man also sagen: Man bildet für Z ϑ einen Modalbereich zum Grade γ und löst dann nach ϑ auf. 2 Induktive Statistik 307

47 2.3 Intervallschätzung Konfidenzintervall für den Mittelwert eines normalverteilten Merkmals bei bekannter Varianz: X 1,...,X n i.i.d. Stichprobe gemäß X i N(µ,σ 2 ), wobei σ 2 bekannt sei. [ X σ, X + n z1+γ 2 σ] = n z1+γ 2 [ X ± σ] n z1+γ 2 (2.10) Bem i) Die Wirkung der einzelnen Größen im Konfidenzintervall erkennt man am besten durch eine Ceteris paribus-analyse ; alle Größen bis auf eine werden festgehalten, diese wird variiert: Je größer σ, desto breiter das Intervall! Je größer γ, desto größer z1+γ 2 Je größer n und damit n, desto schmäler ist das Intervall 2 Induktive Statistik 308

48 2.3 Intervallschätzung ii) Man vergleicht dies mit dem entsprechenden Modalbereich am Ende von Kap. 1.6 mit X durch X und damit σ 2 durch σ2 n ersetzt Konfidenzintervall für den Mittelwert eines normalverteilten Merkmals bei unbekannter Varianz: Neben dem Erwartungswert sei nun auch σ 2 unbekannt. σ 2 wird entsprechend durch den UMVU-Schätzer S 2 = 1 n (X i n 1 X) 2, (mit S = S 2 ) geschätzt. Allerdings ist i=1 Z = X µ S n jetzt nicht mehr normalverteilt, denn S ist zufällig. Wir führen deshalb ein neues Verteilungsmodell ein. 2 Induktive Statistik 309

49 Bem t-verteilung 2.3 Intervallschätzung Gegeben sei eine i.i.d. Stichprobe X 1,...,X n mit X i N(µ,σ 2 ). Dann heißt die Verteilung von Z = X µ n S t-verteilung (oder Student-Verteilung) mit ν = n 1 Freiheitsgraden. In Zeichen: Z t(ν). Wichtige Werte der t-verteilung sind tabelliert. Angegeben sind, für verschiedene α, die Lösung t α der Gleichung P(Z t α (ν)) = α, wobei t α (ν) von der Anzahl ν der Freiheitsgrade abhängt. t α ist das α-quantil der entsprechenden t-verteilung (analog zu z α als Quantil der Standardnormalverteilung). Die Dichte einer t-verteilung ist der Dichte der Standardnormalverteilung sehr ähnlich: Sie ist auch symmetrisch um 0, besitzt aber etwas höhere Dichte für extreme Werte ( schwerere Enden ). 2 Induktive Statistik 310

50 2.3 Intervallschätzung ν Induktive Statistik 311

51 2.3 Intervallschätzung f(x) x Dichten von t-verteilungen für ν = 1 ( ), = 2 ( ), = 5 (- - -) und = 20 ( ) Freiheitsgrade. 2 Induktive Statistik 312

52 2.3 Intervallschätzung Je größer ν ist, umso ähnlicher sind sich die t(ν)-verteilung und die Standardnormalverteilung. Für ν sind sie gleich, ab ν = 30 gilt im Allgemeinen der Unterschied als vernachlässigbar. Konfidenzintervall zum Konfidenzniveau γ: 2 Induktive Statistik 313

53 Bem Intervallschätzung Es gelten analoge Aussagen zur Wirkung des Stichprobenumfangs und Konfidenzniveaus wie bei bekannter Varianz. (vgl. Bem. 2.17) Für jedes γ (und jedes ν) gilt t1+γ(ν) > z1+γ 2 2 also ist das t-verteilungs-konfidenzintervall (etwas) breiter. (2.11) Da die Unterschiede zur Normalverteilung für n 30 meist als vernachlässigbar gelten (s.o.), rechnet man für n 30 bei der t-verteilung auch einfach mit z1+γ. 2 2 Induktive Statistik 314

54 Bsp Intervallschätzung Eine Maschine füllt Gummibärchen in Tüten ab, die laut Aufdruck 250g Füllgewicht versprechen. Wir nehmen im Folgenden an, dass das Füllgewicht normalverteilt ist. Bei 16 zufällig aus der Produktion herausgegriffenen Tüten wird ein mittleres Füllgewicht von 245g und eine Stichprobenstreuung (Standardabweichung) von 10g festgestellt. a) Berechnen Sie ein Konfidenzintervall für das mittlere Füllgewicht zum Sicherheitsniveau von 95%. b) Wenn Ihnen zusätzlich bekannt würde, dass die Stichprobenstreuung gleich der tatsächlichen Streuung ist, wäre dann das unter a) zu berechnende Konfidenzintervall für das mittlere Füllgewicht breiter oder schmäler? Begründen Sie ihre Antwort ohne Rechnung! 2 Induktive Statistik 315

55 2.3 Intervallschätzung Bsp [Klausurergebnisse (Fiktives Beispiel)] i punkte i punkte i punkte i punkte i punkte i punkte Mittelwert und Varianz der Grundgesamtheit (alle 35 Klausuren): µ = punkte = σ 2 = s 2 punkte = Wir ziehen insgesamt jeweils 80 Stichproben vom Umfang n = 5, n = 20, n = 35 und bestimmen Konfidenzintervalle zum Niveau 95%. 2 Induktive Statistik 316

56 2.3 Intervallschätzung 95% KI s, Stichprobenumfang n= Stichprobe 95% KI s, Stichprobenumfang n= Stichprobe 2 Induktive Statistik 317

57 2.3 Intervallschätzung 95% KI s, Stichprobenumfang n= Stichprobe Punktzahl der Klausur Statistik I: Konfidenzintervalle für 80 Stichproben mit jeweiligem Stichprobenumfang n = 5 (oben), n = 20 (Mitte), n = 35 (unten). 2 Induktive Statistik 318

58 2.3 Intervallschätzung 95% KI s, Stichprobenumfang n= Stichprobe 95% KI s, Stichprobenumfang n=5, Varianz bekannt Stichprobe Punktzahl der Klausur Statistik I: Konfidenzintervalle für 80 Stichproben mit Stichprobenumfang n = 5. Oben ist die Varianz unbekannt, unten als bekannt vorausgesetzt. 2 Induktive Statistik 319

59 Ergebnis: 2.3 Intervallschätzung * Die Breite der Konfidenzintervalle nimmt mit wachsendem n ab. * Nicht alle Konfidenzintervalle enthalten den wahren Mittelwert µ = 23.1 (per Konstruktion tritt dieser Effekt mit Wahrscheinlichkeit 5% ein). * Die Intervalle mit bekannter Varianz sind im Mittel enger. * Die Intervalle mit bekannter Varianz sind immer gleich lang. 2 Induktive Statistik 320

60 2.3 Intervallschätzung Approximative Konfidenzintervalle Ist der Stichprobenumfang groß genug, so kann wegen des zentralen Grenzwertsatzes das Normalverteilungs-Konfidenzintervall auf den Erwartungswert beliebiger Merkmale (mit existierender Varianz) angewendet werden. Man erhält approximative Konfidenzintervalle, die meist auch der Berechnung mit Software zugrundeliegen. Beispiel: Konfidenzintervall für den Anteil π: Seien X 1,...,X n i.i.d. mit X i = { 1 0, P(X i = 1) = π. 2 Induktive Statistik 321

61 2.3 Intervallschätzung Bsp [Wahlumfrage] Seien n = 500, X = 46.5% und γ = 95% 1+γ 2 = 97.5%. Inhaltliche Bemerkungen: 2 Induktive Statistik 322

62 2.3 Intervallschätzung Bestimmung des Stichprobenumfangs Eine große praktische Bedeutung haben Konfidenzintervalle auch für die Stichprobenplanung. Sie werden herangezogen, um den benötigten Stichprobenumfang zu ermitteln. Je genauer und sicherer, desto größer muss der Stichprobenumfang sein Genauigkeit: Halbe Länge des Konfidenzintervalls Gib Konfidenzniveau (oft 95%) und eine Schranke b max an (inhaltliche Entscheidungen!), also de facto die halbe Breite für die minimal zulässige Genauigkeit im Sinne von 1 b max Bestimme den Mindeststichprobenumfang so, dass γ und b max eingehalten werden 2 Induktive Statistik 323

63 Konkrete Umsetzung für die Anteilsschätzung 2.3 Intervallschätzung γ: Konfidenzniveau b max : Genauigkeitsschranke z1+γ 2 X(1 X) n b max Auflösen nach n: n 1 b 2 max z 2 1+γ 2 X(1 X) 2 Induktive Statistik 324

64 2.3 Intervallschätzung Da X unbekannt ist, verwendet man zur Stichprobenplanung z.b. Schätzwerte früherer Untersuchungen oder als konservative Schranke X(1 X) Dies gilt immer: betrachte f(a) = a (1 a) = a 2 + a; a [0,1] df(a) d(a) = 0 2a + 1 = 0 a = 1 2 d 2 f(a) da 2 = 2 also Maximum an der Stelle a max = 1 2 mit f(a) max = ( 1 2 ) = Induktive Statistik 325

65 Bsp Intervallschätzung Gegeben: Konfidenzniveau: γ = 95% Genauigkeit: b max = 0.1 Bestimmung von n: n 1 g 2z2 1+γ 2 X(1 X) = = wobei konservativ angesezt wurde X(1 X) Also sollten ca. 100 Personen befragt werden. Bei g = 5% ergibt sich n = 385, bei g = 1% ergibt sich n = Induktive Statistik 326

66 2.3 Intervallschätzung Ausblick Viele weitere Konfidenzintervalle, auch bezüglich der Unterschiede bei zwei Stichproben Differenz von Mittelwerten bei unabhängigen Stichproben Differenz von Anteilen bei unabhängigen Stichproben Differenz von Mittelwerten bei verbundenen Stichproben Diese gehorchen immer dem gleichen Konstruktionsprinzip (vgl. von Kap ) und sind analog zu den genauer besprochenenen Beispielen zu interpretieren. Man vergleiche auch die Konstruktion von Tests im Kapitel??, die auf einem ähnlichen Ausgangspunkt rekurrieren. In der Tat gibt es einen engen Zusammenhang zwischen Hypothesentests und Konfidenzintervallen (vgl. Dualität am Ende von Kap.??). 2 Induktive Statistik 327