2.2 Punktschätzung. Gegeben sei die in Kapitel 2.1 beschriebene Situation, also eine i.i.d. Stichprobe X 1,...,X n eines Merkmales X.
|
|
- Siegfried Sternberg
- vor 6 Jahren
- Abrufe
Transkript
1 Ziel: Finde ein möglichst gutes Schätzverfahren und damit einen möglichst guten Schätzwert für eine bestimmte Kenngröße ϑ (Parameter) der Grundgesamtheit, z.b. den wahren Anteil der rot/grün-wähler, den wahren Mittelwert, die wahre Varianz, aber auch z.b. das wahre Maximum (z.b. von Windgeschwindigkeit) Schätzfunktionen Gegeben sei die in Kapitel 2.1 beschriebene Situation, also eine i.i.d. Stichprobe X 1,...,X n eines Merkmales X. 2 Induktive Statistik 262
2 Definition 2.1. Sei X 1,...,X n i.i.d. Stichprobe. Jede Funktion T = g(x 1,...,X n ) heißt Schätzer oder Schätzfunktion. Inhaltlich ist g( ) eine Auswertungsregel der Stichprobe: Welche Werte sich auch in der Stichprobe ergeben, ich wende das durch g( ) beschriebene Verfahren auf sie an. (z.b. ich bilde den Mittelwert der Daten) 2 Induktive Statistik 263
3 Typische Beispiele für Schätzfunktionen: 1. Arithmetisches Mittel der Stichprobe: X = g(x 1,...,X n ) = 1 n n i=1 X i Für binäre X i mit X i {0,1} ist X auch die relative Häufigkeit des Auftretens von X i = 1 in der Stichprobe 2. Stichprobenvarianz: S 2 = g(x 1,...,X n ) = 1 n n (X i X) 2 = i=1 ( 1 n n i=1 X 2 i ) ( X) 2 = 1 n ( X 2 i n X 2) 2 Induktive Statistik 264
4 3. Korrigierte Stichprobenvarianz: S 2 = g(x 1,...,X n ) = 1 n 1 n i=1 (X i X) 2 = 1 n 1 ( n ) Xi 2 n X 2 i=1 4. Größter Stichprobenwert: X (n) = g(x 1,...,X n ) = max i=1,...,n X i 5. Kleinster Stichprobenwert: X (1) = g(x 1,...,X n ) = min i=1,...,n X i 2 Induktive Statistik 265
5 Schätzfunktion und Schätzwert: Da X 1,...,X n zufällig sind, ist auch die Schätzfunktion T = g(x 1,...,X n ) zufällig. Zieht man mehrere Stichproben, so erhält man jeweils andere Realisationen von X 1,...,X n, und damit auch von T. Die Realisation t (konkreter Wert) der Zufallsvariable T (Variable) heißt Schätzwert. Man hat in der Praxis meist nur eine konkrete Stichprobe und damit auch nur einen konkreten Wert t von T. Zur Beurteilung der mathematischen Eigenschaften werden aber alle denkbaren Stichproben und die zugehörigen Realisationen der Schätzfunktion T herangezogen. D.h. beurteilt wird nicht der einzelne Schätzwert als solcher, sondern die Schätzfunktion, als Methode, d.h. als Regel zur Berechnung des Schätzwerts aus der Stichprobe. Andere Notation in der Literatur: ˆϑ Schätzer für ϑ. Dabei wird nicht mehr direkt unterschieden zwischen Zufallsvariable (bei uns Großbuchstaben) und Realisation (bei uns klein). = Schreibe ˆϑ(X 1,...,X n ) bzw. ˆϑ(x 1,...,x n ) wenn die Unterscheidung benötigt wird. 2 Induktive Statistik 266
6 Bsp Durchschnittliche Anzahl der Statistikbücher in einer Grundgesamtheit von Studierenden schätzen. Grundgesamtheit: Drei Personen Ω = { ω 1, ω 2, ω 3 }. Merkmal X: Anzahl der Statistikbücher X( ω 1 ) = 3 X( ω2 ) = 1 X( ω3 ) = 2. Wahrer Durchschnittswert: µ = 2. Stichprobe X 1,X 2 ohne Zurücklegen (Stichprobenumfang n = 2): X 1 = X(ω 1 ) X 2 = X(ω 2 ) wobei ω 1 erste gezogene Person, ω 2 zweite gezogene Person. 2 Induktive Statistik 267
7 Betrachte folgende möglichen Schätzer: T 1 = g 1 (X 1,X 2 ) = X = X 1+X 2 2 T 2 = X 1 T 3 = g(x 1,X 2 ) = 2 3 X (2) = 2 3 max(x 1,X 2 ) 2 Induktive Statistik 268
8 2.2.2 Gütekriterien Beurteile die Schätzfunktionen, also das Verfahren an sich, nicht den einzelnen Schätzwert. Besonders bei komplexeren Schätzproblemen sind klar festgelegte Güteeigenschaften wichtig. Natürlich ist auch zu Beginn genau festzulegen, was geschätzt werden soll. Im Folgenden sei der Parameter ϑ stets eine eindimensionale Kenngröße der Grundgesamtheit (z.b. Mittelwert, Varianz, Maximum) Der Punkt ist, dass T zufällig ist; der Wert schwankt mit der konkreten Stichprobe. Man kann also nicht erwarten, dass man immer den richtigen Wert trifft. Die Beurteilung der Güte des Schätzers bezieht sich auf Kenngrößen seiner Verteilung (v.a. Erwartungswert und Varianz) 2 Induktive Statistik 269
9 Definition 2.3. (Erwartungstreue, Bias) Gegeben sei eine Stichprobe X 1,...,X n und eine Schätzfunktion T = g(x 1,...,X n ) (mit existierendem Erwartungswert). T heißt erwartungstreu für den Parameter ϑ, falls gilt für alle ϑ. Die Größe E ϑ (T) = ϑ Bias ϑ (T) = E ϑ (T) ϑ heißt Bias (oder Verzerrung) der Schätzfunktion. Man schreibt E ϑ (T) und Bias ϑ (T), um deutlich zu machen, dass die Größen von dem wahren ϑ abhängen. Erwartungstreue Schätzfunktionen haben per Definition einen Bias von 0. 2 Induktive Statistik 270
10 Anschauliche Interpretation: 2 Induktive Statistik 271
11 Bsp [Fortsetzung des Beispiels] Nehmen Sie an, die Stichprobenziehung sei gemäß einer reinen Zufallsauswahl erfolgt, d.h. jede Stichprobe hat dieselbe Wahrscheinlichkeit gezogen zu werden (hier dann 1 6 ). Sind die oben betrachteten Schätzfunktionen T 1,T 2,T 3 erwartungstreu? 2 Induktive Statistik 272
12 Zur Beurteilung: Alle möglichen Stichproben (vom Umfang n = 2, ohne Zurücklegen) betrachten: Personen in der Nummer Realisationen von Stichprobe der Stichprobe X 1 X 2 T 1 T 2 T 3 1 ω 1, ω ω 1, ω ω 2, ω ω 2, ω ω 3, ω ω 3, ω Verteilung von T 1,T 2,T 3 siehe bei Erwartungstreue 2 Induktive Statistik 273
13 Für die Träger T i von T i, i = 1,2,3 gilt: T 1 = {1.5,2,2.5} T 2 = {1,2,3} T 3 = {1. 3,2} Bei T 1 gilt: P({T 1 = 1.5}) = P({T 1 = 2}) = P({T 1 = 2.5}) = 2 6 = 1 3 Bei T 2 gilt: P({T 2 = 1}) = P({T 2 = 2}) = P({T 2 = 3}) = 2 6 = 1 3 Bei T 3 gilt: P({T 3 = 1.5}) = 2 6 = 1 3 ; P({T 3 = 3}) = 4 6 = Induktive Statistik 274
14 und damit bei ϑ = µ = 2 : E 2 (T 1 ) = t 1 T 1 t 1 P({T 1 = t 1 }) = 1 3 ( ) = 2. In der Tat gilt allgemein (vgl. die nächste Bemerkung): Das arithmetische Mittel ist erwartungstreu für den Erwartungswert. E 2 (T 2 ) = t 2 T 2 t 2 P({T 2 = t 2 }) = 1 3 (1+2+3) = 2 Wieder gilt allgemein: Einzelne Stichprobenvariablen ergeben auch erwartungstreue Schätzer für den Erwartungswert, sind aber weniger geeignet (s.u.). E 2 (T 3 ) = T 3 ist also nicht erwartungstreu. Es gilt t 3 T 3 t 3 P({T 3 = t 3 }) = = Bias(T 3 ) = E 2 (T 3 ) 2 = = Induktive Statistik 275
15 2 Induktive Statistik 276
16 Bem [Bias und Erwartungstreue bei einigen typischen Schätzfunktionen] Das arithmetische Mittel X = 1 n n i=1 X i ist erwartungstreu für den Mittelwert µ einer Grundgesamtheit: Aus X 1,...,X n i.i.d. und E µ (X 1 ) = E µ (X 2 ) =... = µ folgt: E( X) = E µ ( 1 n = 1 n = 1 n n i=1 ) ( n X i = 1 n ) n E µ X i i=1 E(X i ) n µ = 1 n n µ = µ i=1 i=1 2 Induktive Statistik 277
17 Sei σ 2 die Varianz in der Grundgesamtheit. Es gilt E σ 2( S 2 ) = n 1 n σ2, also ist S 2 nicht erwartungstreu für σ 2. Bias σ 2( S 2 ) = n 1 n σ2 σ 2 = 1 n σ2 (Für n geht Bias σ 2( S 2 ) gegen 0, S 2 ist asymptotisch erwartungstreu.) 2 Induktive Statistik 278
18 Für die korrigierte Stichprobenvarianz gilt dagegen: ( ) E σ 2(S 2 1 n ) = E σ 2 (X i n 1 X) 2 i=1 ( ) 1 = E σ 2 n 1 n n (X i n X) 2 i=1 ( ) n = E σ 2 n 1 S2 = n n 1 n 1 n σ2 = σ 2 Also ist S 2 erwartungstreu für σ 2. Diese Eigenschaft ist auch die Motivation dafür, von einer Korrektur der Stichprobenvarianz zu sprechen. Vorsicht: Im Allgemeinen gilt, wie in Kapitel ausgeführt, für beliebige, nichtlineare Funktionen g Eg(X) g(e(x)). Man kann also nicht einfach z.b. und E vertauschen. In der Tat gilt: S 2 ist zwar erwartungstreu für σ 2, aber S 2 ist nicht erwartungstreu für σ 2 = σ. 2 Induktive Statistik 279
19 Bsp [Wahlumfrage] Gegeben sei eine Stichprobe der wahlberechtigten Bundesbürger. Geben Sie einen erwartungstreuen Schätzer des Anteils der rot-grün Wähler an. 2 Induktive Statistik 280
20 Bedeutung der Erwartungstreue: Erwartungstreue ist in gewisser Weise ein schwaches Kriterium, denn es gibt viele unsinnige erwartungstreue Schätzer! Deshalb betrachtet man zusätzlich die Effizienz eines Schätzers, s.u. 2 Induktive Statistik 281
21 2.2.3 Effizienz Beispiel Wahlumfrage: Gegeben sind zwei erwartungstreue Schätzer (n sei zum einfacheren Rechnen gerade): T 1 = 1 n T 2 = 1 n/2 n i=1 X i n/2 i=1 X i Was unterscheidet formal T 1 von dem unsinnigen Schätzer T 2, der die in der Stichprobe enthaltene Information nicht vollständig ausnutzt? Vergleiche die Schätzer über ihre Varianz, nicht nur über den Erwartungswert! 2 Induktive Statistik 282
22 Wenn n so groß ist, dass der zentrale Grenzwertsatz angewendet werden kann, dann gilt approximativ 1 n n (X i π) i=1 π(1 π) = n X i n π i=1 n π(1 π) = 1 n X i π n i=1 π(1 π) N(0;1) n und damit Analog kann man zeigen: T 1 = 1 n n X i N i=1 ( π; π(1 π) ). n T 2 = 1 n/2 n/2 i=1 X i N ( π, π(1 π) ). n/2 T 1 und T 2 sind approximativ normalverteilt, wobei T 1 eine deutlich kleinere Varianz als T 2 hat. 2 Induktive Statistik 283
23 T 1 und T 2 treffen beide im Durchschnitt den richtigen Wert π. Der Schätzer T 1 schwankt aber weniger um das wahre π, ist also im Durchschnitt genauer. Andere Interpretation: Dichte von T 1 Dichte von T 2 π π π + Für jeden Punkt π + > π ist damit P(T 1 > π + ) < P(T 2 > π + ) und für jeden Punkt π < π ist P(T 1 < π ) < P(T 2 < π ). 2 Induktive Statistik 284
24 Es ist also die Wahrscheinlichkeit, mindestens um π + π bzw. π π daneben zu liegen, bei T 2 stets größer als bei T 1. Umgekehrt gesagt: Ein konkreter Wert ist damit verlässlicher, wenn er von T 1, als wenn er von T 2 stammt. Diese Überlegung gilt ganz allgemein: Ein erwartungstreuer Schätzer ist umso besser, je kleiner seine Varianz ist. Var(T) = Erwartete quadratische Abweichung von T von E(T) }{{} =ϑ Je kleiner die Varianz, umso mehr konzentriert sich die Verteilung eines erwartungstreuen Schätzers um den wahren Wert. Dies ist umso wichtiger, da der Schätzer den wahren Wert i.a. nur selten exakt trifft. 2 Induktive Statistik 285
25 Definition 2.7. Effizienz Gegeben seien zwei erwartungstreue Schätzfunktionen T 1 und T 2 für einen Parameter ϑ. Gilt Var ϑ (T 1 ) Var ϑ (T 2 ) für alle ϑ und so heißt T 1 effizienter als T 2. Var ϑ (T 1 ) < Var ϑ (T 2 ) für mindestens ein ϑ Eine für ϑ erwartungstreue Schätzfunktion T opt heißt UMVU-Schätzfunktion für ϑ (uniformly minimum v ariance unbiased), falls Var ϑ (T opt ) Var ϑ (T) für alle ϑ und für alle erwartungstreuen Schätzfunktionen T. 2 Induktive Statistik 286
26 Bem Inhaltliche Bemerkung: Der Sinn von Optimalitätskriterien bei der Auswertung der Stichprobe wird klassischerweise insbesondere auch in der Gewährleistung von Objektivität, besser Intersubjektivität, gesehen. Ohne wissenschaftlichen Konsens darüber, welcher Schätzer in welcher Situation zu wählen ist, wäre die Auswertung einer Stichprobe willkürlich und der Manipulation Tür und Tor geöffnet. Allerdings gibt es wirkliche Eindeutigkeit nur bei idealen, sauberen Daten. Z.B. sind ausreißerunempfindliche Verfahren bei idealen Daten weniger effizient, haben aber den Vorteil, stabiler bei kleinen Abweichungen von den Verteilungsannahmen zu sein. Ist X 1,...,X n eine i.i.d. Stichprobe mit X i N(µ,σ 2 ), dann ist * X UMVU-Schätzfunktion für µ bei bekanntem σ 2 und * S 2 UMVU-Schätzfunktion für σ 2 bei bekanntem µ. Ist X 1,...,X n mit X i {0,1} eine i.i.d. Stichprobe mit π = P(X i = 1), dann ist die relative Häufigkeit X UMVU-Schätzfunktion für π. 2 Induktive Statistik 287
27 Bei nicht erwartungstreuen Schätzern macht es keinen Sinn, sich ausschließlich auf die Varianz zu konzentrieren. Man zieht dann den sogenannten Mean Squared Error MSE ϑ (T) := E ϑ (T ϑ) 2 zur Beurteilung heran. Es gilt MSE ϑ (T) = Var ϑ (T)+(Bias ϑ (T)) 2. Der MSE kann als Kompromiss zwischen zwei Auffassungen von Präzision gesehen werden: möglichst geringe systematische Verzerrung (Bias) und möglichst geringe Schwankung (Varianz). 2 Induktive Statistik 288
28 2.2.4 Asymptotische Gütekriterien Asymptotische Erwartungstreue * Eine Schätzfunktion heißt asymptotisch erwartungstreu, falls lim E ϑ(ˆθ) = θ n d.h., gilt. lim Bias ϑ(ˆθ) = 0 n * Abschwächung des Begriffs der Erwartungstreue: Gefordert wird die Erwartungstreue nur bei einer unendlich großen Stichprobe. * Erwartungstreue Schätzer sind auch asymptotisch erwartungstreu. * Sowohl S 2 als auch S 2 sind asymptotisch erwartungstreu. (vgl. vorne Bias σ 2( S 2 ) = 1 n σ2 geht für n gegen 0.) 2 Induktive Statistik 289
29 Für komplexere Modelle ist oft die Erwartungstreue der Verfahren ein zu restriktives Kriterium. Man fordert deshalb oft nur, dass sich der Schätzer wenigstens für große Stichproben gut verhält. Hierzu gibt es verwandte aber etwas unterschiedliche Kriterien, z.b. das folgende: Ein Schätzer heißt(mse-)konsistent oder konsistent im quadratischen Mittel, wenn gilt lim (MSE(T)) = 0. n Beispiel: Der MSE von X ist gegeben durch MSE( X) = Var( X)+Bias 2 ( X) = σ2 n +0 = σ2 n 0. X ist also ein MSE-konsistenter Schätzer für den Erwartungswert. 2 Induktive Statistik 290
30 Anschaulich bedeutet die Konsistenz, 2 Induktive Statistik 291
31 2.2.5 Konstruktionsprinzipien guter Schätzer Die Methode der kleinsten Quadrate = Regressionsanalyse Das Maximum-Likelihood-Prinzip * Aufgabe: Schätze den Parameter ϑ eines parametrischen Modells anhand einer i.i.d. Stichprobe X 1,...,X n mit der konkreten Realisation x 1,...,x n. * Idee der Maximium-Likelihood (ML) Schätzung für diskrete Verteilungen: Man kann für jedes ϑ die Wahrscheinlichkeit ausrechnen, genau die Stichprobe 2 Induktive Statistik 292
32 x 1,...,x n zu erhalten: P ϑ (X 1 = x 1,X 2 = x 2,...,X n = x n ) = n P ϑ (X i = x i ) i=1 Je größer für ein gegebenes ϑ 0 die Wahrscheinlichkeit ist, die konkrete Stichprobe erhalten zu haben, umso plausibler ist es, dass tatsächlich ϑ 0 der wahre Wert ist (gute Übereinstimmung zwischen Modell und Daten). Man nennt daher L(ϑ) = P ϑ (X 1 = x 1,...,X n = x n ), nun als Funktion von ϑ gesehen, die Likelihood (deutsch: Plausibilität, Mutmaßlichkeit) von ϑ gegeben die Realisation x 1,...,x n. Derjenige Wert ˆϑ = ˆϑ(x 1,...,x n ), der L(ϑ) maximiert, heißt Maximum-Likelihood- Schätzwert; die zugehörige Schätzfunktion T(X 1,...,X n ) Maximum-Likelihood- Schätzer (siehe genauer Definition 2.11). 2 Induktive Statistik 293
33 Bsp i.i.d. Stichprobe vom Umfang n = 5 aus einer B(10, π)-verteilung: Wahrscheinlichkeit der Stichprobe für gegebenes π, hier notiert durch π : P(... π) Wahrscheinlichkeit, wenn π der wahre Parameter ist P(X 1 = 6,...,X 5 = 4 π) = P(X 1 = 6 π)... P(X 5 = 4 π) ( ) 10 = π 6 (1 π) 4... ( ) 10 π 4 (1 π) Induktive Statistik 294
34 Wahrscheinlichkeit für einige Werte von π: π P(X 1 = 6,...,X 5 = 4 π) Induktive Statistik 295
35 Bem Zwei Sichtweisen auf P ϑ (X 1 = x 1,...,X n = x n ) : * Deduktiv (Wahrscheinlichkeitsrechnung): ϑ bekannt, x 1,...,x n zufällig ( unbekannt ). * Induktiv (Statistik): ϑ unbekannt, x 1,...,x n bekannt. Für stetige Verteilungen gilt P ϑ (X 1 = x 1,X 2 = x 2,...,X n = x n ) = 0 für beliebige Werte ϑ. In diesem Fall verwendet man die Dichte f ϑ (x 1,...,x n ) = n f ϑ (x i ) i=1 als Maß für die Plausibilität von ϑ. 2 Induktive Statistik 296
36 Für die praktische Berechnung maximiert man statt der Likelihood typischerweise die sog. Log-Likelihood l(ϑ), also den natürlichen Logarithmus der Likelihood. n l(ϑ) = ln(l(ϑ)) = ln P ϑ (X i = x i ) = i=1 n lnp ϑ (X i = x i ) i=1 bzw. l(ϑ) = ln n f ϑ (x i ) = i=1 n lnf ϑ (x i ). Dies liefert denselben Schätzwert ˆϑ und erspart beim Differenzieren die Anwendung der Produktregel. Manchmal ist es noch geschickter, zunächst n i=1 P ϑ(x i = x i ) zu vereinfachen und dann zu logarithmieren. Bei den in Statistik II betrachteten regulären Verteilungsmodellen reicht es, die erste Ableitung zu betrachten. Man kann zeigen, dass sie immer auf ein Maximum führt. i=1 2 Induktive Statistik 297
37 Definition (Maximum-Likelihood-Schätzung) Gegeben sei die Realisation x 1,...,x n einer i.i.d. Stichprobe. Die Funktion in ϑ L(ϑ) = n P ϑ (X i = x i ) falls X i diskret i=1 n f ϑ (x i ) i=1 falls X i stetig. heißt Likelihood des Parameters ϑ bei der Beobachtung x 1,...,x n. Derjenige Wert ˆϑ = ˆϑ(x 1,...,x n ), der L(ϑ) maximiert, heißt Maximum-Likelihood- Schätzwert; die zugehörige Schätzfunktion T(X 1,...,X n ) Maximum-Likelihood- Schätzer. 2 Induktive Statistik 298
38 Bsp (Maximum-Likelihood-Schätzer bei der Bernoulli-Verteilung) 2 Induktive Statistik 299
39 Bsp [ML-Schätzung bei Normalverteilung] Der ML-Schätzer ˆµ = X für µ stimmt mit dem üblichen Schätzer für den Erwartungswert überein. Der ML-Schätzer ˆσ 2 = S 2 für σ 2 ist die Stichprobenvarianz; diese ist nicht erwartungstreu. 2 Induktive Statistik 300
40 Bem [Einige allgemeine Eigenschaften von ML-Schätzern] Unter allgemeinen Regularitätsbedingungen gilt: ML-Schätzer ˆθ sind im Allgemeinen nicht erwartungstreu. ML-Schätzer ˆθ sind asymptotisch erwartungstreu. ML-Schätzer ˆθ sind konsistent (und meist in einem asymptotischen Sinne effizient). 2 Induktive Statistik 301
41 2.3 Intervallschätzung 2.3 Intervallschätzung Motivation und Hinführung Bsp [Wahlumfrage] Der wahre Anteil der rot-grün Wähler unter allen Wählern war 2009 auf eine Nachkommastelle gerundet genau 33.7%. Wie groß ist die Wahrscheinlichkeit, in einer Zufallsstichprobe von 1000 Personen aus allen Wählern genau einen relativen Anteil von 33.7% von rot-grün Wählern erhalten zu haben? D.h., mit Wahrscheinlichkeit von etwa 97.3%, verfehlt der Schätzer den wahren Wert. Hat man ein stetiges Merkmal, so ist sogar P(X = w) = 0 für jeden Wert w, d.h. der wahre Wert wird mit Wahrscheinlichkeit 1 verfehlt. 2 Induktive Statistik 302
42 Konsequenzen: 2.3 Intervallschätzung InsbesondereVorsichtbeiderInterpretation knapperergebnisse (z.b.anteil50.2%) Suche Schätzer mit möglichst kleiner Varianz, um im Durchschnitt möglichst nahe am wahren Wert dran zu sein Es ist häufig auch gar nicht nötig, sich genau auf einen Wert als Schätzung festzulegen. Oft reicht die Angabe eines Intervalls, von dem man hofft, dass es den wahren Wert überdeckt: Intervallschätzung Symmetrische Intervallschätzung basierend auf einer Schätzfunktion T = g(x 1,...,X n ): I(T) = [T a,t +a] 2 Induktive Statistik 303
43 Trade off bei der Wahl von a: Wie soll man a wählen? 2.3 Intervallschätzung Typisches Vorgehen: Man gebe sich durch inhaltliche Überlegungen einen Sicherheitsgrad (Konfidenzniveau) γ vor. Dann konstruiert man das Intervall so, dass es mindestens mit der Wahrscheinlichkeit γ den wahren Parameter überdeckt Konfidenzintervall ( Vertrauensintervall ) 2 Induktive Statistik 304
44 2.3.2 Definition von Konfidenzintervallen: 2.3 Intervallschätzung Gegeben sei eine i.i.d. Stichprobe X 1,...,X n zur Schätzung eines Parameters ϑ und eine Zahl γ (0;1). Ein zufälliges Intervall C(X 1,...,X n ) heißt Konfidenzintervall zum Sicherheitsgrad γ (Konfidenzniveau γ), falls für jedes ϑ gilt: P ϑ (ϑ C(X 1,...,X n ) ) γ. }{{} zufälliges Intervall 2 Induktive Statistik 305
45 Bem Intervallschätzung Die Wahrscheinlichkeitsaussage bezieht sich auf das Ereignis, dass das zufällige Intervall den festen, wahren Parameter überdeckt. Streng genommen darf man im objektivistischen Verständnis von Wahrscheinlichkeit nicht von der Wahrscheinlichkeit sprechen, dass ϑ in dem Intervall liegt, da ϑ nicht zufällig ist und somit keine Wahrscheinlichkeitsverteilung besitzt. (Ein Zurückziehen auf subjektive Wahrscheinlichkeiten führt hier aber auch auf Widersprüche.) Typischerweise konstruiert man Konfidenzintervalle symmetrisch um einen Schätzer T. Es sind aber auch manchmal z.b. einseitige Konfidenzintervalle, etwa der Form [ X, X +b], sinnvoll. 2 Induktive Statistik 306
46 2.3.3 Konstruktion von Konfidenzintervallen 2.3 Intervallschätzung Für die Konstruktion sehr praktische Vorgehensweise: Suche Zufallsvariable Z ϑ, die den gesuchten Parameter ϑ enthält und deren Verteilung aber nicht mehr von dem Parameter abhängt, ( Pivotgröße, dt. Angelpunkt). Dann wähle den Bereich [z unten,z oben ] so, dass P(Z ϑ [z unten,z oben ]) = γ und löse nach ϑ auf. Mit Blick auf Kapitel kann man also sagen: Man bildet für Z ϑ einen Modalbereich zum Grade γ und löst dann nach ϑ auf. 2 Induktive Statistik 307
47 2.3 Intervallschätzung Konfidenzintervall für den Mittelwert eines normalverteilten Merkmals bei bekannter Varianz: X 1,...,X n i.i.d. Stichprobe gemäß X i N(µ,σ 2 ), wobei σ 2 bekannt sei. [ X σ, X + n z1+γ 2 σ] = n z1+γ 2 [ X ± σ] n z1+γ 2 (2.10) Bem i) Die Wirkung der einzelnen Größen im Konfidenzintervall erkennt man am besten durch eine Ceteris paribus-analyse ; alle Größen bis auf eine werden festgehalten, diese wird variiert: Je größer σ, desto breiter das Intervall! Je größer γ, desto größer z1+γ 2 Je größer n und damit n, desto schmäler ist das Intervall 2 Induktive Statistik 308
48 2.3 Intervallschätzung ii) Man vergleicht dies mit dem entsprechenden Modalbereich am Ende von Kap. 1.6 mit X durch X und damit σ 2 durch σ2 n ersetzt Konfidenzintervall für den Mittelwert eines normalverteilten Merkmals bei unbekannter Varianz: Neben dem Erwartungswert sei nun auch σ 2 unbekannt. σ 2 wird entsprechend durch den UMVU-Schätzer S 2 = 1 n (X i n 1 X) 2, (mit S = S 2 ) geschätzt. Allerdings ist i=1 Z = X µ S n jetzt nicht mehr normalverteilt, denn S ist zufällig. Wir führen deshalb ein neues Verteilungsmodell ein. 2 Induktive Statistik 309
49 Bem t-verteilung 2.3 Intervallschätzung Gegeben sei eine i.i.d. Stichprobe X 1,...,X n mit X i N(µ,σ 2 ). Dann heißt die Verteilung von Z = X µ n S t-verteilung (oder Student-Verteilung) mit ν = n 1 Freiheitsgraden. In Zeichen: Z t(ν). Wichtige Werte der t-verteilung sind tabelliert. Angegeben sind, für verschiedene α, die Lösung t α der Gleichung P(Z t α (ν)) = α, wobei t α (ν) von der Anzahl ν der Freiheitsgrade abhängt. t α ist das α-quantil der entsprechenden t-verteilung (analog zu z α als Quantil der Standardnormalverteilung). Die Dichte einer t-verteilung ist der Dichte der Standardnormalverteilung sehr ähnlich: Sie ist auch symmetrisch um 0, besitzt aber etwas höhere Dichte für extreme Werte ( schwerere Enden ). 2 Induktive Statistik 310
50 2.3 Intervallschätzung ν Induktive Statistik 311
51 2.3 Intervallschätzung f(x) x Dichten von t-verteilungen für ν = 1 ( ), = 2 ( ), = 5 (- - -) und = 20 ( ) Freiheitsgrade. 2 Induktive Statistik 312
52 2.3 Intervallschätzung Je größer ν ist, umso ähnlicher sind sich die t(ν)-verteilung und die Standardnormalverteilung. Für ν sind sie gleich, ab ν = 30 gilt im Allgemeinen der Unterschied als vernachlässigbar. Konfidenzintervall zum Konfidenzniveau γ: 2 Induktive Statistik 313
53 Bem Intervallschätzung Es gelten analoge Aussagen zur Wirkung des Stichprobenumfangs und Konfidenzniveaus wie bei bekannter Varianz. (vgl. Bem. 2.17) Für jedes γ (und jedes ν) gilt t1+γ(ν) > z1+γ 2 2 also ist das t-verteilungs-konfidenzintervall (etwas) breiter. (2.11) Da die Unterschiede zur Normalverteilung für n 30 meist als vernachlässigbar gelten (s.o.), rechnet man für n 30 bei der t-verteilung auch einfach mit z1+γ. 2 2 Induktive Statistik 314
54 Bsp Intervallschätzung Eine Maschine füllt Gummibärchen in Tüten ab, die laut Aufdruck 250g Füllgewicht versprechen. Wir nehmen im Folgenden an, dass das Füllgewicht normalverteilt ist. Bei 16 zufällig aus der Produktion herausgegriffenen Tüten wird ein mittleres Füllgewicht von 245g und eine Stichprobenstreuung (Standardabweichung) von 10g festgestellt. a) Berechnen Sie ein Konfidenzintervall für das mittlere Füllgewicht zum Sicherheitsniveau von 95%. b) Wenn Ihnen zusätzlich bekannt würde, dass die Stichprobenstreuung gleich der tatsächlichen Streuung ist, wäre dann das unter a) zu berechnende Konfidenzintervall für das mittlere Füllgewicht breiter oder schmäler? Begründen Sie ihre Antwort ohne Rechnung! 2 Induktive Statistik 315
55 2.3 Intervallschätzung Bsp [Klausurergebnisse (Fiktives Beispiel)] i punkte i punkte i punkte i punkte i punkte i punkte Mittelwert und Varianz der Grundgesamtheit (alle 35 Klausuren): µ = punkte = σ 2 = s 2 punkte = Wir ziehen insgesamt jeweils 80 Stichproben vom Umfang n = 5, n = 20, n = 35 und bestimmen Konfidenzintervalle zum Niveau 95%. 2 Induktive Statistik 316
56 2.3 Intervallschätzung 95% KI s, Stichprobenumfang n= Stichprobe 95% KI s, Stichprobenumfang n= Stichprobe 2 Induktive Statistik 317
57 2.3 Intervallschätzung 95% KI s, Stichprobenumfang n= Stichprobe Punktzahl der Klausur Statistik I: Konfidenzintervalle für 80 Stichproben mit jeweiligem Stichprobenumfang n = 5 (oben), n = 20 (Mitte), n = 35 (unten). 2 Induktive Statistik 318
58 2.3 Intervallschätzung 95% KI s, Stichprobenumfang n= Stichprobe 95% KI s, Stichprobenumfang n=5, Varianz bekannt Stichprobe Punktzahl der Klausur Statistik I: Konfidenzintervalle für 80 Stichproben mit Stichprobenumfang n = 5. Oben ist die Varianz unbekannt, unten als bekannt vorausgesetzt. 2 Induktive Statistik 319
59 Ergebnis: 2.3 Intervallschätzung * Die Breite der Konfidenzintervalle nimmt mit wachsendem n ab. * Nicht alle Konfidenzintervalle enthalten den wahren Mittelwert µ = 23.1 (per Konstruktion tritt dieser Effekt mit Wahrscheinlichkeit 5% ein). * Die Intervalle mit bekannter Varianz sind im Mittel enger. * Die Intervalle mit bekannter Varianz sind immer gleich lang. 2 Induktive Statistik 320
60 2.3 Intervallschätzung Approximative Konfidenzintervalle Ist der Stichprobenumfang groß genug, so kann wegen des zentralen Grenzwertsatzes das Normalverteilungs-Konfidenzintervall auf den Erwartungswert beliebiger Merkmale (mit existierender Varianz) angewendet werden. Man erhält approximative Konfidenzintervalle, die meist auch der Berechnung mit Software zugrundeliegen. Beispiel: Konfidenzintervall für den Anteil π: Seien X 1,...,X n i.i.d. mit X i = { 1 0, P(X i = 1) = π. 2 Induktive Statistik 321
61 2.3 Intervallschätzung Bsp [Wahlumfrage] Seien n = 500, X = 46.5% und γ = 95% 1+γ 2 = 97.5%. Inhaltliche Bemerkungen: 2 Induktive Statistik 322
62 2.3 Intervallschätzung Bestimmung des Stichprobenumfangs Eine große praktische Bedeutung haben Konfidenzintervalle auch für die Stichprobenplanung. Sie werden herangezogen, um den benötigten Stichprobenumfang zu ermitteln. Je genauer und sicherer, desto größer muss der Stichprobenumfang sein Genauigkeit: Halbe Länge des Konfidenzintervalls Gib Konfidenzniveau (oft 95%) und eine Schranke b max an (inhaltliche Entscheidungen!), also de facto die halbe Breite für die minimal zulässige Genauigkeit im Sinne von 1 b max Bestimme den Mindeststichprobenumfang so, dass γ und b max eingehalten werden 2 Induktive Statistik 323
63 Konkrete Umsetzung für die Anteilsschätzung 2.3 Intervallschätzung γ: Konfidenzniveau b max : Genauigkeitsschranke z1+γ 2 X(1 X) n b max Auflösen nach n: n 1 b 2 max z 2 1+γ 2 X(1 X) 2 Induktive Statistik 324
64 2.3 Intervallschätzung Da X unbekannt ist, verwendet man zur Stichprobenplanung z.b. Schätzwerte früherer Untersuchungen oder als konservative Schranke X(1 X) Dies gilt immer: betrachte f(a) = a (1 a) = a 2 + a; a [0,1] df(a) d(a) = 0 2a + 1 = 0 a = 1 2 d 2 f(a) da 2 = 2 also Maximum an der Stelle a max = 1 2 mit f(a) max = ( 1 2 ) = Induktive Statistik 325
65 Bsp Intervallschätzung Gegeben: Konfidenzniveau: γ = 95% Genauigkeit: b max = 0.1 Bestimmung von n: n 1 g 2z2 1+γ 2 X(1 X) = = wobei konservativ angesezt wurde X(1 X) Also sollten ca. 100 Personen befragt werden. Bei g = 5% ergibt sich n = 385, bei g = 1% ergibt sich n = Induktive Statistik 326
66 2.3 Intervallschätzung Ausblick Viele weitere Konfidenzintervalle, auch bezüglich der Unterschiede bei zwei Stichproben Differenz von Mittelwerten bei unabhängigen Stichproben Differenz von Anteilen bei unabhängigen Stichproben Differenz von Mittelwerten bei verbundenen Stichproben Diese gehorchen immer dem gleichen Konstruktionsprinzip (vgl. von Kap ) und sind analog zu den genauer besprochenenen Beispielen zu interpretieren. Man vergleiche auch die Konstruktion von Tests im Kapitel??, die auf einem ähnlichen Ausgangspunkt rekurrieren. In der Tat gibt es einen engen Zusammenhang zwischen Hypothesentests und Konfidenzintervallen (vgl. Dualität am Ende von Kap.??). 2 Induktive Statistik 327
1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung
0 Einführung 1 Wahrscheinlichkeitsrechnung Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung Motivation und Hinführung Der wahre Anteil der rot-grün Wähler 009 war genau
MehrKonfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir
MehrDie Momentenmethode. Vorteil: Oft einfach anwendbar. Nachteil: Güte kann nur schwer allgemein beurteilt werden; liefert zum Teil unbrauchbare
17.1.3 Die Momentenmethode Vorteil: Oft einfach anwendbar. Nachteil: Güte kann nur schwer allgemein beurteilt werden; liefert zum Teil unbrauchbare Lösungen. Sei ϑ = (ϑ 1,...,ϑ s ) der unbekannte, s-dimensionale
Mehr3.4 Asymptotische Evaluierung von Sch atzer Konsistenz Konsistenz Definition 3.4.1: konsistente Folge von Sch atzer
3.4 Asymptotische Evaluierung von Schätzer 3.4.1 Konsistenz Bis jetzt haben wir Kriterien basierend auf endlichen Stichproben betrachtet. Konsistenz ist ein asymptotisches Kriterium (n ) und bezieht sich
MehrStatistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de
rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent
Mehrdie wir als Realisationen von unabhängig und identisch verteilten Zufallsvariablen
Kapitel 8 Schätzung von Parametern 8.1 Schätzmethoden Gegeben seien Beobachtungen Ü Ü ¾ Ü Ò die wir als Realisationen von unabhängig und identisch verteilten Zufallsvariablen ¾ Ò auffassen. Die Verteilung
MehrKapitel 3 Schließende Statistik
Beispiel 3.4: (Fortsetzung Bsp. 3.) bekannt: 65 i=1 X i = 6, also ˆp = X = 6 65 = 0, 4 Überprüfen der Voraussetzungen: (1) n = 65 30 () n ˆp = 6 10 (3) n (1 ˆp) = 39 10 Dr. Karsten Webel 194 Beispiel 3.4:
MehrEinführung in die Induktive Statistik: Testen von Hypothesen
Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Punkt- und Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr.
MehrÜbungsaufgaben zu Statistik II
Übungsaufgaben zu Statistik II Prof. Dr. Irene Prof. Dr. Albrecht Ungerer Die Kapitel beziehen sich auf das Buch: /Ungerer (2016): Statistik für Wirtschaftswissenschaftler Springer Gabler 4 Übungsaufgaben
MehrEinführung in die (induktive) Statistik
Einführung in die (induktive) Statistik Typische Fragestellung der Statistik: Auf Grund einer Problemmodellierung sind wir interessiert an: Zufallsexperiment beschrieben durch ZV X. Problem: Verteilung
Mehr3.3 Methoden zur Evaluierung von Schätzern
3.3 Methoden zur Evaluierung von Schätzern Bis jetzt haben wir nur glaubwürdige Techniken zur Konstruktion von Punktschätzern besprochen. Falls unterschiedliche Schätzer für einen Parameter resultieren,
MehrKlausur zu Statistik II
GOETHE-UNIVERSITÄT FRANKFURT FB Wirtschaftswissenschaften Statistik und Methoden der Ökonometrie Prof. Dr. Uwe Hassler Wintersemester 03/04 Klausur zu Statistik II Matrikelnummer: Hinweise Hilfsmittel
Mehr3 Grundlagen statistischer Tests (Kap. 8 IS)
3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung
MehrStatistik. R. Frühwirth Teil 1: Deskriptive Statistik. Statistik. Einleitung Grundbegriffe Merkmal- und Skalentypen Aussagen und
Übersicht über die Vorlesung Teil : Deskriptive fru@hephy.oeaw.ac.at VO 42.090 http://tinyurl.com/tu42090 Teil 2: Wahrscheinlichkeitsrechnung Teil 3: Zufallsvariable und Verteilungen Februar 200 Teil 4:
MehrLösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK
Institut für Stochastik Dr. Steffen Winter Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK für Studierende der INFORMATIK vom 17. Juli 01 (Dauer: 90 Minuten) Übersicht über
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrSchätzer und Konfidenzintervalle
Kapitel 2 Schätzer und Konfidenzintervalle Bisher haben wir eine mathematische Theorie entwickelt, die es uns erlaubt, gewisse zufällige Phänomene zu modellieren. Zum Beispiel modellieren wir die Anzahl
MehrZentraler Grenzwertsatz/Konfidenzintervalle
/ Statistik I Sommersemester 2009 Statistik I ZGWS/ (1/37) Kann Ahmadinejad die Wahl gewonnen haben? Im wesentlichen Dreiteilung der polit. Elite 2005: 17.3 Millionen Stimmen (Stichwahl), Wahlbeteiligung
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 9. Dezember 2010 1 Konfidenzintervalle Idee Schätzung eines Konfidenzintervalls mit der 3-sigma-Regel Grundlagen
Mehr5. Spezielle stetige Verteilungen
5. Spezielle stetige Verteilungen 5.1 Stetige Gleichverteilung Eine Zufallsvariable X folgt einer stetigen Gleichverteilung mit den Parametern a und b, wenn für die Dichtefunktion von X gilt: f x = 1 für
MehrWebinar Induktive Statistik. - Wahrscheinlichkeitsrechnung - Stichprobentheorie
Webinar Induktive Statistik - Wahrscheinlichkeitsrechnung - Stichprobentheorie Wahrscheinlichkeitstheorie Aufgabe : Zwei Lieferanten decken den Bedarf eines PKW-Herstellers von 00.000 Einheiten pro Monat.
Mehr8. Konfidenzintervalle und Hypothesentests
8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars
MehrKapitel V - Erwartungstreue Schätzfunktionen
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel V - Erwartungstreue Schätzfunktionen Induktive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo Siebenschuh
MehrStatistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe
Kapitel 4 Statistische Tests 4.1 Grundbegriffe Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe X 1,..., X n. Wir wollen nun die Beobachtung der X 1,...,
MehrWahrscheinlichkeitstheorie und Statistik vom
INSTITUT FÜR STOCHASTIK SS 2007 UNIVERSITÄT KARLSRUHE Priv.-Doz. Dr. D. Kadelka Dipl.-Math. oec. W. Lao Klausur (Maschineningenieure) Wahrscheinlichkeitstheorie und Statistik vom 2.9.2007 Musterlösungen
Mehr2 Aufgaben aus [Teschl, Band 2]
20 2 Aufgaben aus [Teschl, Band 2] 2.1 Kap. 25: Beschreibende Statistik 25.3 Übungsaufgabe 25.3 a i. Arithmetisches Mittel: 10.5 ii. Median: 10.4 iii. Quartile: x 0.25 Y 4 10.1, x 0.75 Y 12 11.1 iv. Varianz:
MehrInhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5
Inhaltsverzeichnis Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite 1.0 Erste Begriffsbildungen 1 1.1 Merkmale und Skalen 5 1.2 Von der Urliste zu Häufigkeitsverteilungen 9 1.2.0 Erste Ordnung
MehrZufallsvariablen [random variable]
Zufallsvariablen [random variable] Eine Zufallsvariable (Zufallsgröße) X beschreibt (kodiert) die Versuchsausgänge ω Ω mit Hilfe von Zahlen, d.h. X ist eine Funktion X : Ω R ω X(ω) Zufallsvariablen werden
MehrStatistische Tests für unbekannte Parameter
Konfidenzintervall Intervall, das den unbekannten Parameter der Verteilung mit vorgegebener Sicherheit überdeckt ('Genauigkeitsaussage' bzw. Zuverlässigkeit einer Punktschätzung) Statistischer Test Ja-Nein-Entscheidung
MehrLösungen zur Klausur WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK (STOCHASTIK)
Institut für Stochastik Dr. Steffen Winter Lösungen zur Klausur WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK (STOCHASTIK) für Studierende des Maschinenbaus vom 7. Juli (Dauer: 8 Minuten) Übersicht über die
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 8. Dezember 2010 Teil V Schließende Statistik 1 Parameterschätzung Erwartungstreue und Konsistenz Maximum-Likelihood
MehrEinführung in die Maximum Likelihood Methodik
in die Maximum Likelihood Methodik Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Gliederung 1 2 3 4 2 / 31 Maximum Likelihood
MehrNachhol-Klausur - Schätzen und Testen - Wintersemester 2013/14
Prof. Dr. Rainer Schwabe 08.07.2014 Otto-von-Guericke-Universität Magdeburg Institut für Mathematische Stochastik Nachhol-Klausur - Schätzen und Testen - Wintersemester 2013/14 Name:, Vorname: Matr.-Nr.
MehrKapitel 2 Wahrscheinlichkeitsrechnung
Definition 2.77: Normalverteilung & Standardnormalverteilung Es sei µ R und 0 < σ 2 R. Besitzt eine stetige Zufallsvariable X die Dichte f(x) = 1 2 πσ 2 e 1 2 ( x µ σ ) 2, x R, so heißt X normalverteilt
MehrKapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung Induktive Statistik Prof. Dr. W.-D.
Mehr7.5 Erwartungswert, Varianz
7.5 Erwartungswert, Varianz Def. 7.5.: a) X sei eine diskrete ZV, die bei unendl. vielen Werten x k folgende Zusatzbedingung erfüllt: x k p k
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 1 Inhalt der heutigen Vorlesung Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung der vorherigen Vorlesung Übersicht über Schätzung und
Mehr4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)
4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte
Mehr2 Zufallsvariable, Verteilungen, Erwartungswert
2 Zufallsvariable, Verteilungen, Erwartungswert Bisher: Zufallsexperimente beschrieben durch W-Räume (Ω, A, P) Häufig interessiert nur eine zufällige Größe X = X(ω), die vom Ergebnis ω des Zufallsexperiments
MehrGrundgesamtheit und Stichprobe
Grundgesamtheit und Stichprobe Definition 1 Die Menge der Untersuchungseinheiten {U 1,U 2,...,U N } heißt Grundgesamtheit. Die Anzahl N der Einheiten ist der Umfang der Grundgesamtheit. Jeder Einheit U
Mehr1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...
Inhaltsverzeichnis 0 Einführung 1 1 Zufallsvorgänge und Wahrscheinlichkeiten 5 1.1 Zufallsvorgänge.......................... 5 1.1.1 Ergebnismengen..................... 6 1.1.2 Ereignisse und ihre Verknüpfung............
MehrKapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen Induktive Statistik Prof. Dr. W.-D. Heller
MehrAuswahl von Schätzfunktionen
Auswahl von Schätzfunktionen Worum geht es in diesem Modul? Überblick zur Punktschätzung Vorüberlegung zur Effizienz Vergleich unserer Schätzer für My unter Normalverteilung Relative Effizienz Einführung
MehrKlausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1
Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester 2013 Aufgabe 1 In einer Urne
MehrGrundgesamtheit und Stichprobe
Grundgesamtheit und Stichprobe Definition 1 Die Menge der Untersuchungseinheiten {U 1,U 2,...,U N } heißt Grundgesamtheit. Die Anzahl N der Einheiten ist der Umfang der Grundgesamtheit. Jeder Einheit U
MehrDefinition Sei X eine stetige Z.V. mit Verteilungsfunktion F und Dichte f. Dann heißt E(X) :=
Definition 2.34. Sei X eine stetige Z.V. mit Verteilungsfunktion F und Dichte f. Dann heißt E(X) := x f(x)dx der Erwartungswert von X, sofern dieses Integral existiert. Entsprechend wird die Varianz V(X)
MehrETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig)
ETWR Teil B 2 Ziele Bisher (eindimensionale, mehrdimensionale) Zufallsvariablen besprochen Lageparameter von Zufallsvariablen besprochen Übertragung des gelernten auf diskrete Verteilungen Ziel des Kapitels
MehrKlausur zum Fach GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK. für Studierende der INFORMATIK
Institut für Stochastik Prof. Dr. Daniel Hug Name: Vorname: Matr.-Nr.: Klausur zum Fach GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK für Studierende der INFORMATIK Datum: 08. Februar 0 Dauer:
MehrDatenanalyse. (PHY231) Herbstsemester Olaf Steinkamp
Datenanalyse (PHY31) Herbstsemester 015 Olaf Steinkamp 36-J- olafs@physik.uzh.ch 044 63 55763 Einführung, Messunsicherheiten, Darstellung von Messdaten Grundbegriffe der Wahrscheinlichkeitsrechnung und
MehrInstitut für Biometrie und klinische Forschung. WiSe 2012/2013
Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie (3) Überblick. Deskriptive Statistik I 2. Deskriptive
MehrZufallsgröße. Würfelwurf mit fairem Würfel. Wahrscheinlichkeitsverteilung einer diskreten
Zufallsgrößen Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt 0 Einführung Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Hypothesentests
Mehr3 Konfidenzintervalle
3 Konfidenzintervalle Konfidenzintervalle sind das Ergebnis von Intervallschätzungen. Sicheres Wissen über Grundgesamtheiten kann man anhand von Stichproben nicht gewinnen. Aber mit Hilfe der Statistik
MehrZufallsgröße X : Ω R X : ω Anzahl der geworfenen K`s
X. Zufallsgrößen ================================================================= 10.1 Zufallsgrößen und ihr Erwartungswert --------------------------------------------------------------------------------------------------------------
Mehr5. Statistische Schätztheorie
5. Statistische Schätztheorie Problem: Sei X eine Zufallsvariable (oder X ein Zufallsvektor), die einen interessierenden Zufallsvorgang repräsentiere Man möchte die tatsächliche Verteilung von X (oder
Mehr7.2 Moment und Varianz
7.2 Moment und Varianz Def. 21 Es sei X eine zufällige Variable. Falls der Erwartungswert E( X p ) existiert, heißt der Erwartungswert EX p p tes Moment der zufälligen Variablen X. Es gilt dann: + x p
MehrEntscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten
Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 4.1 4. Statistische Entscheidungsverfahren Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten Beispiel:
Mehr9 Die Normalverteilung
9 Die Normalverteilung Dichte: f(x) = 1 2πσ e (x µ)2 /2σ 2, µ R,σ > 0 9.1 Standard-Normalverteilung µ = 0, σ 2 = 1 ϕ(x) = 1 2π e x2 /2 Dichte Φ(x) = 1 x 2π e t2 /2 dt Verteilungsfunktion 331 W.Kössler,
Mehr1 Stochastische Konvergenz 2. 2 Das Gesetz der grossen Zahlen 4. 3 Der Satz von Bernoulli 6
Wirtschaftswissenschaftliches Zentrum 0 Universität Basel Mathematik Dr. Thomas Zehrt Grenzwertsätze Benötigtes Vorwissen: Der Stoff der Vorlesung,,Statistik wird als bekannt vorausgesetzt, insbesondere
MehrDemokurs. Modul Grundlagen der Wirtschaftsmathematik Grundlagen der Statistik
Demokurs Modul 31101 Grundlagen der Wirtschaftsmathematik und Statistik Kurs 40601 Grundlagen der Statistik 13. Juli 2010 KE 1 2.4 Schiefe und Wölbung einer Verteilung Seite: 53 2.4 Schiefe und Wölbung
MehrSchätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief
Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte : Schätzung Statistik
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen
Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen Noémie Becker & Dirk Metzler http://evol.bio.lmu.de/_statgen 7. Juni 2013 1 Binomialverteilung 2 Normalverteilung 3 T-Verteilung
Mehr9. Schätzen und Testen bei unbekannter Varianz
9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,
MehrAllgemeines zu Tests. Statistische Hypothesentests
Statistische Hypothesentests Allgemeines zu Tests Allgemeines Tests in normalverteilten Grundgesamtheiten Asymptotische Tests Statistischer Test: Verfahren Entscheidungsregel), mit dem auf Basis einer
MehrBiometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1
Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1 Aufgabe 1 (10 Punkte). 10 Schüler der zehnten Klasse unterziehen sich zur Vorbereitung auf die Abschlussprüfung einem Mathematiktrainingsprogramm.
Mehr3.1 Punktschätzer für Mittelwert µ und Varianz σ 2. Messungen x 1,..., x N, die unabhängig voneinander auf gleiche Weise gewonnen worden sind
Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 3.1 3.1 Punktschätzer für Mittelwert µ und Varianz σ 2 Messungen x 1,..., x N, die unabhängig voneinander auf gleiche Weise gewonnen worden
Mehr1 Dichte- und Verteilungsfunktion
Tutorium Yannick Schrör Klausurvorbereitungsaufgaben Statistik Lösungen Yannick.Schroer@rub.de 9.2.26 ID /455 Dichte- und Verteilungsfunktion Ein tüchtiger Professor lässt jährlich 2 Bücher drucken. Die
MehrWahrscheinlichkeitsrechnung und schließende Statistik
Günther Bourier Wahrscheinlichkeitsrechnung und schließende Statistik Praxisorientierte Einführung Mit Aufgaben und Lösungen 3. F überarbeitete Auflage GABLER Inhaltsverzeichnis Vorwort Inhaltsverzeichnis
MehrMathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007
Mathematik IV für Maschinenbau und Informatik Stochastik Universität Rostock, Institut für Mathematik Sommersemester 007 Prof. Dr. F. Liese Dipl.-Math. M. Helwich Serie Termin: 9. Juni 007 Aufgabe 3 Punkte
MehrStatistik III. Walter Zucchini Fred Böker Andreas Stadie
Statistik III Walter Zucchini Fred Böker Andreas Stadie Inhaltsverzeichnis 1 Zufallsvariablen und ihre Verteilung 1 1.1 Diskrete Zufallsvariablen........................... 1 1.2 Stetige Zufallsvariablen............................
MehrSchätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II
Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Wiederholung Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte
Mehr2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:
2.4.1 Grundprinzipien statistischer Hypothesentests Hypothese: Behauptung einer Tatsache, deren Überprüfung noch aussteht (Leutner in: Endruweit, Trommsdorff: Wörterbuch der Soziologie, 1989). Statistischer
MehrÜbungen zur Vorlesung Wirtschaftsstatistik Konfidenzintervalle Aufgabe 11.1 NewYorkTimes, Monday, May17,2010:
Technische Hochschule Köln Fakultät für Wirtschafts- und Rechtswissenschaften Prof. Dr. Arrenberg Raum 221, Tel. 3914 jutta.arrenberg@th-koeln.de Übungen zur Vorlesung Wirtschaftsstatistik Konfidenzintervalle
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen
Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen Noémie Becker & Dirk Metzler 31. Mai 2016 Inhaltsverzeichnis 1 Binomialverteilung 1 2 Normalverteilung 2 3 T-Verteilung
MehrStatistik II für Betriebswirte Vorlesung 1
Statistik II für Betriebswirte Vorlesung 1 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 19. Oktober 2016 Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung
MehrJost Reinecke. 7. Juni 2005
Universität Bielefeld 7. Juni 2005 Testtheorie Test für unabhängige Stichproben Test für abhängige Stichproben Testtheorie Die Testtheorie beinhaltet eine Reihe von Testverfahren, die sich mit der Überprüfung
MehrStatistik für SozialwissenschaftlerInnen II p.85
Schätzverfahren Statistik für SozialwissenschaftlerInnen II p.85 Schätzverfahren Ziel von Schätzverfahren: Ausgehend von Stichproben Aussagen über Populationskennwerte machen Kenntnis der Abweichung des
MehrMathematische und statistische Methoden II
Statistik & Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte
MehrInstitut für Stochastik, SoSe K L A U S U R , 13:
Institut für Stochastik, SoSe 2014 Mathematische Statistik Paravicini/Heusel 1. K L A U S U R 12.7.2014, 13:00-16.00 Name: Geburtsdatum: Vorname: Matrikelnummer: Übungsgruppe bei: Studiengang & angestrebter
MehrStatistische Tests (Signifikanztests)
Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)
MehrDas (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell
1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs
MehrÜbungen mit dem Applet Vergleich von zwei Mittelwerten
Vergleich von zwei Mittelwerten 1 Übungen mit dem Applet Vergleich von zwei Mittelwerten 1 Statistischer Hintergrund... 2 1.1 Typische Fragestellungen...2 1.2 Fehler 1. und 2. Art...2 1.3 Kurzbeschreibung
MehrGrundlegende Eigenschaften von Punktschätzern
Grundlegende Eigenschaften von Punktschätzern Worum geht es in diesem Modul? Schätzer als Zufallsvariablen Vorbereitung einer Simulation Verteilung von P-Dach Empirische Lage- und Streuungsparameter zur
MehrFERNUNIVERSITÄT IN HAGEN WIRTSCHAFTSWISSENSCHAFT
FERNUNIVERSITÄT IN HAGEN FAKULTÄT WIRTSCHAFTSWISSENSCHAFT Matrikelnummer Name: Vorname: Klausur Modul 31091: STATISTISCHE METHODENLEHRE Termin: 21.09.2009, 18.00-20.00 Uhr Prüfer: Univ.-Prof. Dr. Hermann
MehrStatistik II. Sommersemester PD Dr. Michael Krapp Institut für Statistik und Mathematische Wirtschaftstheorie. Universität Augsburg
Statistik II Sommersemester 2005 PD Dr. Michael Krapp Institut für Statistik und Mathematische Wirtschaftstheorie Klausur und Unterlagen Klausur: Spielregeln : Wie Statistik I Nachholklausur im WS 2005
MehrStatistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg
Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg Prof. Markus Schumacher, Dr. Stan Lai Physikalisches Institut Westbau 2 OG E-Mail: Markus.Schumacher@physik.uni-freiburg.de
MehrEinführung in die Statistik
Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt
MehrStatistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage
Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz Statistik Der Weg zur Datenanalyse Zweite, verbesserte Auflage Mit 165 Abbildungen und 34 Tabellen Springer Inhaltsverzeichnis Vorwort v 1 Einführung
MehrZusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen
Zusammenfassung Mathe II Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen Zufallsexperiment: Ein Vorgang, bei dem mindestens zwei Ereignisse möglich sind
MehrBiostatistik, Winter 2011/12
Biostatistik, Winter 2011/12 / Übungsaufgaben Prof. Dr. Achim Klenke http://www.aklenke.de 13. Vorlesung: 10.02.2012 1/51 Aufgabe 1 Aufgabenstellung Übungsaufgaben Ein Pharmakonzern möchte ein neues Schlankheitsmedikament
MehrTeilklausur des Moduls Kurs 42221: Vertiefung der Statistik
Name, Vorname Matrikelnummer Teilklausur des Moduls 32741 Kurs 42221: Vertiefung der Statistik Datum Termin: 21. März 2014, 14.00-16.00 Uhr Prüfer: Univ.-Prof. Dr. H. Singer Vertiefung der Statistik 21.3.2014
MehrKapitel 12 Stetige Zufallsvariablen Dichtefunktion und Verteilungsfunktion. stetig. Verteilungsfunktion
Kapitel 12 Stetige Zufallsvariablen 12.1. Dichtefunktion und Verteilungsfunktion stetig Verteilungsfunktion Trägermenge T, also die Menge der möglichen Realisationen, ist durch ein Intervall gegeben Häufig
Mehr6. Statistische Hypothesentests
6. Statistische Hypothesentests Ausgangssituation erneut: ZV X repräsentiere einen Zufallsvorgang X habe die unbekannte VF F X (x) Interessieren uns für einen unbekannten Parameter θ der Verteilung von
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 19. Januar 2011 1 Nichtparametrische Tests Ordinalskalierte Daten 2 Test für ein Merkmal mit nur zwei Ausprägungen
MehrStochastik für die Naturwissenschaften
Stochastik für die Naturwissenschaften Dr. C.J. Luchsinger 5. Erwartungswert E und Varianz V Literatur Kapitel 5 * Storrer: (37.9)-(37.12), (38.4), (40.6)-(40.9), (41.2) * Stahel: Kapitel 5 und 6 (nur
MehrMathematik für Naturwissenschaften, Teil 2
Lösungsvorschläge für die Aufgaben zur Vorlesung Mathematik für Naturwissenschaften, Teil Zusatzblatt SS 09 Dr. J. Schürmann keine Abgabe Aufgabe : Eine Familie habe fünf Kinder. Wir nehmen an, dass die
MehrInhaltsverzeichnis. 2 Kurzbeschreibung von SPSS Der SPSS-Dateneditor Statistische Analysen mit SPSS DieDaten...
Inhaltsverzeichnis Teil I Einführung 1 Kleine Einführung in R... 3 1.1 Installieren und Starten von R... 3 1.2 R-Befehleausführen... 3 1.3 R-Workspace speichern... 4 1.4 R-History sichern........ 4 1.5
MehrKlausur (Modulprüfung) zum Lehrerweiterbildungskurs Stochastik am von 10:00 bis 11:00 Uhr
Klausur (Modulprüfung) zum Lehrerweiterbildungskurs Stochastik am 5..201 von 10:00 bis 11:00 Uhr Bearbeiten Sie zwei der drei folgenden Aufgaben! Sätze aus der Vorlesung und den Übungen dürfen Sie ohne
MehrNumerische Methoden und Algorithmen in der Physik
Numerische Methoden und Algorithmen in der Physik Hartmut Stadie, Christian Autermann 15.01.2009 Numerische Methoden und Algorithmen in der Physik Christian Autermann 1/ 47 Methode der kleinsten Quadrate
MehrKlausur Stochastik und Statistik 31. Juli 2012
Klausur Stochastik und Statistik 31. Juli 2012 Prof. Dr. Matthias Schmid Institut für Statistik, LMU München Wichtig: ˆ Überprüfen Sie, ob Ihr Klausurexemplar vollständig ist. Die Klausur besteht aus fünf
Mehr