3 Statistische Schätzungen

Ähnliche Dokumente
1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung

Willkommen zur Vorlesung Statistik (Master)

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Einführung in die Maximum Likelihood Methodik

1 Stochastische Konvergenz 2. 2 Das Gesetz der grossen Zahlen 4. 3 Der Satz von Bernoulli 6

Mathematik für Biologen

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Klausur zu Statistik II

Einführung in die (induktive) Statistik

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

8. Konfidenzintervalle und Hypothesentests

Die Varianz (Streuung) Definition

2 Aufgaben aus [Teschl, Band 2]

3 Grundlagen statistischer Tests (Kap. 8 IS)

Statistik und Wahrscheinlichkeitsrechnung

1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...

Zufallsvariablen [random variable]

3.3 Methoden zur Evaluierung von Schätzern

Mathematik für Biologen

7.5 Erwartungswert, Varianz

die wir als Realisationen von unabhängig und identisch verteilten Zufallsvariablen

1 Dichte- und Verteilungsfunktion

Statistik. R. Frühwirth Teil 1: Deskriptive Statistik. Statistik. Einleitung Grundbegriffe Merkmal- und Skalentypen Aussagen und

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Vertiefung der. Wirtschaftsmathematik. und Statistik (Teil Statistik)

Einführung in die Induktive Statistik: Testen von Hypothesen

Schätzer und Konfidenzintervalle

10,24 ; 10,18 ; 10,28 ; 10,25 ; 10,31.

Statistische Tests für unbekannte Parameter

Kapitel 3 Schließende Statistik

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr

Scheinklausur Stochastik 1 für Studierende des Lehramts und der Diplom-Pädagogik

Zentraler Grenzwertsatz/Konfidenzintervalle

Kapitel V - Erwartungstreue Schätzfunktionen

5. Spezielle stetige Verteilungen

0, t 0,5

Webinar Induktive Statistik. - Wahrscheinlichkeitsrechnung - Stichprobentheorie

Klassifikation von Signifikanztests

Statistik Workshop. 12. und 14. Januar Prof. Dr. Stefan Etschberger HSA

Grundlegende Eigenschaften von Punktschätzern

Klausur (Modulprüfung) zum Lehrerweiterbildungskurs Stochastik am von 10:00 bis 11:00 Uhr

Übungsscheinklausur,

7.2 Moment und Varianz

Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK

Wahrscheinlichkeitsrechnung und schließende Statistik

Kapitel 2 Wahrscheinlichkeitsrechnung

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Auswahl von Schätzfunktionen

Definition Sei X eine stetige Z.V. mit Verteilungsfunktion F und Dichte f. Dann heißt E(X) :=

3.4 Asymptotische Evaluierung von Sch atzer Konsistenz Konsistenz Definition 3.4.1: konsistente Folge von Sch atzer

Anliegen: Beschreibung von Versuchsergebnissen mit Zahlen, um mit Zahlen bzw. bekannten Funktionen rechnen zu können.

Allgemeines zu Tests. Statistische Hypothesentests

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1

Statistische Tests (Signifikanztests)

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Wahrscheinlichkeitstheorie und Statistik vom

3.1 Punktschätzer für Mittelwert µ und Varianz σ 2. Messungen x 1,..., x N, die unabhängig voneinander auf gleiche Weise gewonnen worden sind

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Übungsaufgaben zu Statistik II

Programm. Wiederholung. Gleichverteilung Diskrete Gleichverteilung Stetige Gleichverteilung. Binomialverteilung. Hypergeometrische Verteilung

Hypergeometrische Verteilung

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

Mathematik für Naturwissenschaften, Teil 2

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen

4 Testen von Hypothesen

Klausur Stochastik und Statistik 31. Juli 2012

9 Die Normalverteilung

Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007

Einführung in die Stochastik für Informatiker Übungsaufgaben mit Lösungen

Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung

Übung zu Empirische Ökonomie für Fortgeschrittene SS 2009

Institut für Stochastik, SoSe K L A U S U R , 13:

Jost Reinecke. 7. Juni 2005

Lösungen zur Klausur WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK (STOCHASTIK)

Klausur zum Fach GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK. für Studierende der INFORMATIK

Statistik III. Walter Zucchini Fred Böker Andreas Stadie

Stetige Verteilungen Rechteckverteilung

Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen

Wir gehen wieder von einem allgemeinen (parametrischen) statistischen Modell aus, (

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

Nachhol-Klausur - Schätzen und Testen - Wintersemester 2013/14

A: Beispiele Beispiel 1: Zwei Zufallsvariablen X und Y besitzen die beiden folgenden Wahrscheinlichkeitsfunktionen:

Statistik-Übungsaufgaben

Grundlagen der Mathematik II (LVA U)

Statistik II für Betriebswirte Vorlesung 1

Varianz und Kovarianz

Grundgesamtheit und Stichprobe

VU mathematische methoden in der ökologie: räumliche verteilungsmuster 1/5 h.lettner /

Mathematische und statistische Methoden II

Grundgesamtheit und Stichprobe

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

ETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig)

Lösungen ausgewählter Übungsaufgaben zum Buch. Elementare Stochastik (Springer Spektrum, 2012) Teil 3: Aufgaben zu den Kapiteln 5 und 6

1 Erwartungswert und Kovarianzmatrix von Zufallsvektoren

Prüfungsvorbereitungskurs Höhere Mathematik 3

Die Momentenmethode. Vorteil: Oft einfach anwendbar. Nachteil: Güte kann nur schwer allgemein beurteilt werden; liefert zum Teil unbrauchbare

Statistik-Klausur vom

9. Schätzen und Testen bei unbekannter Varianz

Übungen mit dem Applet Vergleich von zwei Mittelwerten

Transkript:

3 Statistische Schätzungen In der Wahrscheinlichkeitstheorie geht es darum, über Modelle Ereignisse zu bewerten bzw. Voraussagen über ihr Eintreten zu treffen. Sind nun umgekehrt Daten bekannt, und wollen wir aus diesen entweder Parameter für die statistischen Verteilungen berechnen oder Voraussagen über Ereignisse treffen, so müssen wir diese aus den Daten schätzen. Wir unterscheiden dabei Punktschätzer, das sind Schätzungen von (unbekannten) Parametern einer bekannten Verteilung, und Intervallschätzer, das sind Schätzer, die ein Intervall angeben, in dem der unbekannte Parameter mit einer bestimmten Wahrscheinlichkeit liegt. 3.1 Punktschätzungen Wir wollen aus Beobachtungen einen uns unbekannten Parameter einer bekannten Verteilung schätzen. Beispiel 3.1 Daten X i : 7.3 31.5 8.4 30.1 31.0 Wir nehmen an, dass X i N(µ, σ ) Welcher Schätzwert µ ist nun sinnvoll für das unbekannte µ? Welcher Schätzwert σ ist sinnvoll für das unbekannte σ? Für den unbekannten Erwartungswert µ wird meist der Mittelwert µ = X = 1 n X i = 9.66 genommen. Eine andere Wahl wäre aber auch µ = med(x) = 30.1. Welcher dieser beiden Schätzer ist sinnvoll? Als Schätzer für die Varianz nehmen wir die Stichprobenvarianz Ist dies gerechtfertigt? σ = s = 1 n 1 (X i X) = 1.77. Was muss für einen Schätzer gelten? Sinnvoll ist doch, dass der Erwartungswert des Schätzers dem tatsächlichen Wert entsprechen soll, und nicht von diesem abweichen soll. Noch dazu soll der geschätzte Wert den tatsächlichen möglichst genau treffen. Eine Grundvoraussetzung ist die Konsistenz des Schätzers, d. h., je mehr Daten zur Verfügung stehen, desto genauer soll er den geschätzten Wert bestimmen. Dazu dienen folgende Definitionen. 1

Definition 3.1 (erwartungstreu, unverzerrt) Ein Schätzwert ϑ heißt erwartungstreu (unverzerrt, unbiased), falls E ϑ ( ϑ) = ϑ für alle ϑ. Definition 3. (effizient) Seien ϑ 1 und ϑ zwei erwartungstreue Schätzwerte. Falls Var ϑ ( ϑ 1 ) Var ϑ ( ϑ ) für alle möglichen Parameter ϑ, so heißt ϑ 1 besser als ϑ. Der Schätzer mit der kleinsten Varianz heißt effizient (efficient). Beispiel 3. µ = 1 n n X i ist erwartungstreu für den Mittelwert µ der Normalverteilung. s = 1 n 1 n (X i X) ist erwartungstreu für die Varianz, da E(s ) = 1 E( n n 1 = 1 E( n n 1 = 1 E( n n 1 (X i X) ) [(X i µ) (X µ)] ) [(X i µ) (X i µ)(x µ) + (X µ) ]) (X i µ) + n(x µ) ) (X i µ) (X µ)n 1 n n (X i µ) + n(x µ) ) (X i µ) n(x µ) + n(x µ) ) (X i µ) n(x µ) ) E((X i µ) ) ne((x µ) )] = 1 n 1 E( n (X i µ) (X µ) n = 1 n 1 E( n = 1 n 1 E( n = 1 n 1 E( n = 1 n 1 [ n = 1 n 1 [nσ n σ = σ n ] Das Maximum-Likelihood Prinzip Es ist das wichtigste Konstruktionsprinzip von Schätzern, es funktioniert aber nur dann, wenn die den Daten zu Grunde liegende Verteilung bekannt ist. Sei f(x, ϑ) eine Familie von Dichten, wobei ϑ ein Parameter (oder Parametervektor) ist, der die Dichten näher bestimmt. Wir schreiben P ϑ für die Wahrscheinlichkeit, E ϑ für den Erwartungswert und Var ϑ für die Varianz. Da die Zufallsvariablen X i unabhängig sind, ist die gemeinsame Dichte f(x 1,..., X n ; ϑ) gleich dem Produkt der einzelnen Dichten f(x i, ϑ) Vorgangsweise: Setze die Daten in die Dichte ein: l(ϑ) n f(x i, ϑ) = f(x 1, ϑ) f(x n, ϑ)

Finde jenes ϑ, welches die Likelihood-Funktion l(ϑ) = n f(x i, ϑ) oder die Log-Likelihood log(l(ϑ)) = log f(x i, ϑ) maximiert (Logarithmieren von Dichten verändert die Lage des Maximums nicht, da der Logarithmus eine streng monoton wachsende Funktion ist und die Dichten positive Funktionen sind). ϑ ist der Maximum Likelihood Schätzer. Beispiel 3.3 (Parameter der Poissonverteilung) X 1,..., X n Poisson(λ) λ λx Wahrscheinlichkeitsfunktion: f(x, λ) = e, x = 0, 1,, 3,... x! Maximum nun direkt ausrechnen, d.h., die Wahrscheinlichkeitsfunktion f(x 1 = X 1, x = X,..., x n = X n ; λ) = Π n f(x i, λ) = e λ λx 1 λxn e λ X 1! X n! maximieren (Likelihood), oder einfach über die log-likelihood = e nλ λx1+ +Xn X 1! X n! log n f(x i, λ) = log e nλ λx 1 + +Xn X 1! X n! = nλ + (X 1 + + X n ) log λ log(x 1! X n!) Wir erhalten den Schätzer durch Maximieren in λ, d. h., durch Differenzieren nach λ: n + (X 1 + + X n ) 1 λ = 0 λ = X 1 + + X n n = X λ = 1 n n X i ist erwartungstreu für den Parameter λ der Poissonverteilung: E( λ) = E( 1 n (X 1 + + X n ) = 1 n n E(X i) = E(X i ) = λ. Beispiel 3.4 (Parameter der Normalverteilung) X 1,..., X n N(µ, σ ) 3

Wahrscheinlichkeitsdichte f(x, µ, σ) = 1 σ ( π exp 1 ) σ (x µ) n log f(x i, µ, σ) = 1 (X σ i µ) n log( π) n log σ. Maximieren in µ und σ : µ : 1 σ (X i µ) = 0 X i = n µ µ = n 1 X i = X σ : 1 σ 4 (X i µ) n σ = 0 σ = n 1 (X i µ) Der obige ML-Schätzer σ ist nicht erwartungstreu (vgl. Beispiel 3.)! Beispiel 3.5 (Anteilswert einer Binomialverteilung) Sei X eine binomial verteilte Zufallsvariable, X B(n, p). Welche Wahrscheinlichkeit p ist am wahrscheinlichsten, wenn eine Anzahl x von Ausfällen des Experiments beobachtet wurde? ) p x (1 p) n x Likelihood l(p) = f(x, p) = ( n x [ log p ( n x ) ] + x log p + (n x) log(1 p) = 0 x p n x 1 p = 0 x(1 p) = (n x) p p = x n Beispiel 3.6 Seien X 1, X unabhängig exponential-verteilt mit E(X i ) = γ. Für das unbekannte γ stehen folgende Schätzer zur Auswahl: γ 1 = X 1 + X oder γ = min(x 1, X ). Wir wissen: Var(X i ) = γ, E(X i ) = γ E( γ 1 ) = γ, Var( γ 1 ) = γ. min(x 1, X ) exponential-verteilt mit E( γ ) = γ, Var( γ ) = γ. Wir sehen, dass γ 1 besser (effizienter, genauer) als γ ist (γ 1 ), da weniger Schwankungsbreite (Varianz) gegeben ist. 4

3. Intervallschätzungen, Konfidenzintervalle Ein Punktschätzer ϑ eines Parameters alleine enthält noch keine Information über dessen Genauigkeit. Durch einen Intervallschätzer wird ein Unsicherheitsbereich angegeben, der als Maß für die Genauigkeit gelten kann, d. h., der geschätzte Parameter ϑ liegt mit einer gewissen Wahrscheinlichkeit in dem geschätzte Intervall. Definition 3.3 Ein ermitteltes Intervall Î heißt Konfidenzbereich (confidence region) zum Niveau 1, falls für alle Parameter ϑ gilt: P ϑ {ϑ Î} 1. Der Konfidenzbereich (das Konfidenzintervall, der Intervallschätzer) überdeckt den wahren Parameter ϑ mit einer Wahrscheinlichkeit von mindestens 1. Dies ist das sogenannte Signifikanzniveau, ist die Irrtumswahrscheinlichkeit. Je nach Verwendung sprechen wir auch von Toleranz- oder von Prognose-Intervallen. Die gesuchten Parameter liegen mit Wahrscheinlichkeit 1 in diesen Intervallen. Da eine Vollerhebung oft teuer bis unmöglich ist, sollen Voraussagen, etwa Wahlprognosen, auch mit Teilerhebungen getroffen werden. Dabei ist es wichtig zu wissen, wie viele Daten N L erhoben werden müssen (Stichprobenumfang, sample size), um ein Prognoseintervall der Länge L zu erhalten, d. h., eine maximale Abweichung um L/. Achtung! Je sicherer wir ein Intervall angeben wollen, d. h., klein, desto größer wird das Intervall, desto ungenauer also die Schätzung für den Parameter. Üblich: = 0.05 Ökonomie, Soziologie = 0.01 Biologie, Psychologie, Naturwissenschaften = 0.001 Medizin Im Abschnitt über das statistische Testen werden wir uns noch genauer mit dieser Thematik beschäftigen. Mittelwert einer Normalverteilung (Varianz bekannt) Voraussetzung: X 1,..., X n N(µ, σ ) oder n > 30 σ bekannt X µ σ = X σ µ = n X X σ µ N(0, 1) n Stichprobenumfang: N L ( σ L Φ 1 (1 )) Wurde die Stichprobe mit Zurücklegen gezogen und ist n > 0.05, wobei N die Größe N der Grundgesamtheit ist, so wird σ X mit einer Endlichkeitskorrektur versehen, d. h., σ X = σ n N n N 1 statt σ X = σ n 5

wird in den Berechnungen verwendet. P µ { n X µ σ Umrechnen in ein Konfidenzintervall: ( Φ 1 1 ) ( σ Φ 1 1 ) n Konfidenzintervall: X + σ ( Φ 1 1 ) n Î = (1 Φ 1 ) } = 1 n X µ σ Φ 1 (1 µ X σ n Φ 1 ( 1 µ X σ ( Φ 1 1 ) n [X n σ ( Φ 1 1 ), X + σ ( Φ 1 1 ) ] n ) ) Der Intervallschätzer kann auch kurz durch X ± σ ( Φ 1 1 ) n angegeben werden. Bemerkung 3.1 (Stichprobenumfang) Ein Intervall der Länge L erhalten wir, falls wir das Intervall X ± L betrachten. Daraus ergibt sich L = σ NL Φ 1 (1 ) also N L ( σ L Φ 1 (1 )). Bemerkung 3. Wir wollen zeigen, dass X σ µ = n X σ µ N(0, 1). n X i N(µ, σ ) heißt, dass i X i N( µ, σ ), also i X i N(nµ, nσ ). Da X = 1 n Xi ist, folgt und E(X) = 1 n E( X i ) = µ Var(X) = Var( 1 n Xi ) = Var( 1 n X i) = [E(( 1 n X i) ) E( 1 n X i) ] = [E( 1 n X i ) E( 1 n X i) ] = 1 n [E(X i ) E(X i ) ] = 1 n σ = 1 n σ. Es wird auch oft die Bezeichnung σ X = σ n verwendet. D. h., X N(µ, σ n ), also folgt die Behauptung nach Standardisierung. 6

Mittelwert einer Normalverteilung (Varianz unbekannt) Voraussetzung: X 1,..., X n N(µ, σ ) oder n > 30 σ unbekannt s = 1 (X n 1 i X), s = s X n. X µ s = n X µ X s t(n 1) Stichprobenumfang: N L ( σ L t n 0 1,1 /) Das n 0 in obiger Formel für den Stichprobenumfang ist nicht leicht zu ermitteln, der kritische t-wert kann aber bei großen Stichproben durch den entsprechenden Wert der Normalverteilung ersetzt werden. Wurde die Stichprobe mit Zurücklegen gezogen und ist n > 0.05, wobei N die Größe N der Grundgesamtheit ist, so wird σ X mit einer Endlichkeitskorrektur versehen, d. h., σ X = σ n N n N wird in den Berechnungen verwendet. P µ { n X µ s Wir rechnen dies in ein Konfidenzintervall um } t n 1;1 / = 1 X + t n 1,1 s n t n 1,1 s n t n 1,1 n X s µ t n 1,1 X µ s n t n 1,1 µ X s n t n 1,1 Konfidenzintervall: [ Î = X s t n 1,1, X + s ] t n n 1,1 n Beispiel 3.7 Verteilungsmodell : X i N(µ, σ ) Daten X i : 7.3 31.5 8.4 30.1 31.0 X = 9.66 = 0.05, t 4,0.975 =.77. Das 95% Konfidenzintervall für µ ist [9.66 1.77 5.77, 9.66 + 1.77 5.77] = [7.47, 31.85] 7

Varianz einer Normalverteilung Voraussetzung: X 1,..., X n N(µ, σ ) s = 1 (X n 1 i X) (n 1)s σ χ (n 1) P {χ n 1, (n 1)s χ σ n 1,1 } = 1 Das zugehörige Konfidenzintervall für σ ergibt sich zu [ ] (n 1)s (n 1)s Î =, χ n 1,1 χ n 1, Anteilswert p einer Binomialverteilung Voraussetzung: X B(n, p), np(1 p) 9 beobachten m Erfolge bei n Versuchen p = m n, p(1 p) σ p = n 1 m n p σ p N(0, 1) Stichprobenumfang N L ( L 1 Φ 1 (1 )) P p m n p σ p Φ 1 ( 1 ) 1 Wir rechnen in ein Konfidenzintervall für p um ( Φ 1 1 ) ( m np Φ 1 1 ) np(1 p) m ( np(1 p)φ 1 1 ) np m + ( np(1 p)φ 1 1 ) p(1 p) p n Φ (1 1 ) p(1 p) p p + Φ (1 1 ) n Da das unbekannte p in den Intervallgrenzen vorkommt, muss es dort durch den Schätzwert p ersetzt werden. Also ergibt sich das Konfidenzintervall: [ p(1 p) ( Î = p Φ 1 1 ) p(1 p) (, p + Φ 1 1 ) ] n n Da dieses Konfidenzintervall auf einer Approximation beruht, hält es nur für große n das Niveau. 8

Da für 0 p 1 stets p(1 p) 1, wird auch oft das größere, aber schneller zu berechnende Konfidenzintervall [ Î = p 1 (1 n Φ 1 ), p + 1 (1 n Φ 1 ) ] verwendet. Bemerkung 3.3 Eigentlich betrachten wir ein Binomial-Experiment, d. h., Ziehen mit Zurücklegen. Falls n p > 5 und n(1 p) > 5 ist, kann obige Approximation durch die Normalverteilung verwendet werden. Bei großen Grundgesamtheiten kann dieses Konfidenzintervall auch im Fall der hypergeometrischen Verteilung verwendet werden, d. h., bei einem Experiment ohne Zurücklegen. Beispiel 3.8 Vor einer Volksabstimmung erklären 316 von 1000 befragten Leuten mit Nein stimmen zu wollen. Wir suchen das 99% Konfidenzintervall für den erwarteten Anteil p der Nein- Stimmen. Antwort: 0.316 0.684 0.316 0.684 Î = [0.316.57, 0.316 +.57] = [0.78, 0.353] 1000 1000 Bemerkung 3.4 Die Wilson-Score-Methode gibt ein auch schon bei kleinen p besseres Intervall [p 1, p ], das durch p 1/ = m + (Φ 1 (1 )) ± Φ 1 (1 ) (Φ 1 (1 )) + 4m(1 m n ) [n + (Φ 1 (1 )) ] berechnet werden kann. Ebenso können die Pearson-Clopper Werte p 1 = p = mf m,(n m+1);/ (n m + 1) + mf m,(n m+1);/ (m + 1)F (m+1),(n m);1 / (n m) + mf (m+1),(n m);1 / verwendet werden. 9

Differenz zweier Erwartungswerte (Vor-Nach Vergleiche) Wir gehen von verbundenen Stichproben aus und betrachten gepaarte Differenzen. Etwa Ergebnisse von Sehtests am rechten und am linken Auge. Mit den Differenzen d i = X i Y i wird dann so wie im Falle eines Mittelwertes bei bekannter bzw. unbekannter Varianz verfahren. Voraussetzung: X 1,..., X n N(µ X, σ X ) Y 1,..., Y n N(µ Y, σ Y ) σ X, σ Y bekannt, σ d = σ X + σ Y Cov(X, Y ) d i = X i Y i N(µ x µ y, σ d ) n (X Y ) (µ X µ Y ) σ d N(0, 1) Î = [(X Y ) σ d n Φ 1 (1 ), (X Y ) + σ d n Φ 1 (1 )] Sind die Varianzen σ X und σ Y unbekannt, so gilt: Voraussetzung: X 1,..., X n N(µ x, σx ) Y 1,..., Y n N(µ y, σy ) σx, σ Y unbekannt d i = X i Y i, s d = 1 (di d) n 1 (X Y ) (µ n X µ Y ) s d t(n 1) Î = [(X Y ) s d n t n 1,1, (X Y ) + s d n t n 1,1 ] Differenz zweier Erwartungswerte (Varianzen bekannt) Voraussetzung: X 1,..., X n N(µ X, σx ) oder n > 30 Y 1,..., Y m N(µ Y, σy ) oder m > 30 X i, Y i unabhängig σx und σ Y bekannt, σ D = σ X n + σ Y m (X Y ) (µ X µ Y ) σ D N(0, 1) Î = [(X Y ) σ D Φ 1 (1 ), (X Y ) + σ DΦ 1 (1 )] Differenz zweier Erwartungswerte (Varianzen unbekannt) Hier unterscheiden wir wiederum zwei Fälle: unbekannte aber gleiche Varianzen, und unbekannte und verschiedene Varianzen der unabhängigen Stichproben. 10

Voraussetzung: X 1,..., X n N(µ X, σx ) Y 1,..., Y n N(µ Y, σy ) X i, Y i unabhängig σx und σ Y unbekannt und σ X = σ Y s D = ( n 1 + m 1 ) (n 1)s X + (m 1)s Y n + m (X Y ) (µ X µ Y ) s D t(n + m ) Î = [(X Y ) s D t n+m,1, (X Y ) + s Dt n+m,1 ] Sind die unbekannten Varianzen σ X und σ Y Voraussetzung: X 1,..., X n N(µ X, σx ) Y 1,..., Y n N(µ Y, σy ) X i, Y i unabhängig σx und σ Y unbekannt und σ X σ Y verschieden, so gilt: s 4 D s D = (s X n + s Y m ), n D = ( s X s n ) Y ( n 1 + m ) m 1 (X Y ) (µ X µ Y ) s D t(n D ) Falls n, m > 30 können wir statt der t-verteilung die Standardnormalverteilung verwenden. Î = [(X Y ) s D t nd,1, (X Y ) + s Dt nd,1 ] Differenz zweier Anteilswerte Voraussetzung: X 1,..., X n N(µ X, σx ) Y 1,..., Y m N(µ Y, σy ) X i, Y i unabhängig beobachtete Anteile p X und p Y s p = p X(1 p X ) n + p Y (1 p Y ) m ( p X p Y ) (p X p Y ) s p N(0, 1) Î = [( p X p Y ) s p Φ 1 (1 ), ( p X p Y ) + s p Φ 1 (1 )] 11

Aufgaben zum Schätzen Projekt Schätzen: Generiere 1000 Standard-normalverteilte Samples (N(0, 1)) und transformiere diese so, dass bei Angabe zweier beliebiger Parameter µ und σ aus diesen N(µ, σ )-verteilte Samples werden. Generiere damit N(17, 5)-verteilte Samples und wähle (extrahiere) aus diesen zufällig n Daten (n zufällige Indizes aus den Indizes 1 1000). Berechne sodann den Mittelwert und die Sample-Varianz dieser n Daten. Berechne weiters ein Konfidenzintervall für den Erwartungswert (einmal mit Kenntnis der Varianz der Grundgesamtheit, einmal ohne), und ebenfalls ein Konfidenzintervall für die Varianz der Grundgesamtheit (natürlich unter der Annahme, dass diese unbekannt ist). Setze n = 10, 5, 70, 10 und vergleiche die Ergebnisse. 3.1 Die Stichprobenvariablen X 1, X, X 3, X 4 seien stochastisch unabhängig und identisch verteilt mit E(X j ) = µ. Zur Schätzung des arithmetischen Mittels µ wird eine Stichprobenfunktion der allgemeinen Form verwendet. X = f(x 1, X, X 3, X 4 ) = g 1 X 1 + g X + g 3 X 3 + g 4 X 4 Es sei: a) g 1 = 1 g = 0 g 3 = 1 g 4 = 1 b) g 1 = 1 g 3 = 1 g 3 = 1 g 4 = 5 3 1 c) g 1 = g 8 = 3 g 8 3 = 3 g 8 4 = 1 8 1 d) g 1 = g 4 = 1 g 4 3 = 1 g 4 4 = 1 4 Welches der Gewichtssysteme a) bis d) liefert unverzerrte Schätzer? Ordne die erwartungstreuen Schätzer nach ihrer relativen Effizienz! 3. Gegeben sei eine Stichprobe (x 1,, x n ) von unabhängigen Realisierungen einer Zufallsvariablen X. Wir betrachten folgende Schätzfunktion für µ: G = 1 n a i x i a) Unter welchen Bedingungen ist G erwartungstreu? b) Für welche a i ist G der effizienteste Schätzer? 1

3.3 Ein Werkstück zerbricht bei der Verarbeitung mit einer konstanten Wahrscheinlichkeit von p. Die Zufallsvariable X sei die Anzahl der verarbeiteten Werkstücke vor dem ersten Bruch. a) Begründe, dass die Wahrscheinlichkeitsfunktion von X folgende Formel hat: f(x) = q x p mit q = 1 p b) Bei einer Stichprobe wurde beobachtet, dass n Stücke vor dem ersten Bruch verarbeitet wurden. Leite die Formel für den Maximum-Likelihood-Schätzer von p her! c) Wie groß ist die P (x > 3) bei p = 0.10? 3.4 In einer Telefonzentrale wird zu zehn zufällig gewählten Zeitpunkten jeweils festgestellt, wie viele Verbindungen innerhalb einer Minute hergestellt werden. Dabei ergeben sich folgende Werte: 1 0 1 1 0 3 1 0 X sei die Zufallsgröße Anzahl Anrufe innerhalb einer Minute. Es wird angenommen, dass X Poisson-verteilt ist (Begründung?) mit unbekanntem Erwartungswert µ. a) Bestimme eine Maximum-Likelihood-Schätzung für µ! b) Ist diese Schätzung erwartungstreu? c) Beweise, dass die Varianz der Stichprobe eine erwartungstreue Schätzung von µ ist, und berechne ihren Wert für das angegebene Beispiel! 3.5 Eine Taxifirma hat ihre Taxis mit Nummern von 1 bis n versehen, n ist unbekannt. Alle Taxis gelangen mit gleicher Wahrscheinlichkeit zum Einsatz. Zur Schätzung von n wird an einem bestimmten Ort der Verkehr solange beobachtet, bis zum ersten Mal ein Taxi der betreffenden Firma auftaucht. Die beobachtete Nummer dieses Taxis sei x. Es liegt also eine Stichprobe mit einem einzigen Element, nämlich x vor. a) Bestimme eine Maximum-Likelihood-Schätzung für n für diese Stichprobe! b) Ist diese Schätzung erwartungstreu? c) Wenn nein, bestimme eine erwartungstreue Schätzung für n! 13

3.6 Gegeben ist folgende Stichprobe aus einer normalverteilten Grundgesamtheit mit unbekanntem Erwartungswert µ: 88. 91.6 93.9 90.4 91. 91.0 87.9 89.4 91.8 Gesucht sind: a) ein 90 % Konfidenzintervall für µ bei bekannter Varianz σ = 4. b) ein 90 % Konfidenzintervall für µ bei unbekannter Varianz σ. c) Wie groß muss der Stichprobenumfang n in Aufgabe a) gewählt werden, damit das Konfidenzintervall bei gleichem = 90% nur noch ein Viertel so lang ist? 3.7 Bei einer Wahlumfrage (Stichprobenerhebung) wird eine Konfidenzschätzung für den Anteil eines Kandidaten angestrebt, deren maximaler Fehler 4 % betragen soll. Wie groß ist der Stichprobenumfang zu wählen, wenn ein Konfidenzniveau von 95 % voraussetzt wird? Wie ändert sich das Ergebnis, wenn aus einer Vorerhebung bekannt ist, dass der Anteil des Kandidaten etwa um die 0 % beträgt? 3.8 Bei der Produktion von Lebensmittelkonserven werden in gewissen Zeitabständen Kontrollen des Dosengewichts vorgenommen: Umfang mittl. Dosengewicht 1. Stichprobe 100 300 g. Stichprobe 10 310 g Aus langjährigen Beobachtungen ist bekannt, dass die gemeinsame Varianz der Dosengewichte 64g beträgt. Berechne ein symmetrisches Konfidenzintervall für den Unterschied der Mittelwerte in den beiden Grundgesamtheiten, denen die Stichproben entnommen wurden! 3.9 Vor Beginn einer Werbekampagne kennen von 1000 Befragten 10 eine bestimmte Marke. Nach der Werbekampagne kennen 160 von 1000 Befragten eine bestimmte Marke. Berechne ein 99 % Konfidenzintervall für die Differenz der Anteile! 14

3.10 Von der Zufallsvariable X mit Var(X) = 36 wird eine Stichprobe vom Umfang n = 36 gezogen. Daraus ergibt sich ein Mittelwert von X = 108. a) Gib ein 95 % (99 %) Konfidenzintervall für den Mittelwert an! b) Wie groß muss der Stichprobenumfang gewählt werden, damit das Konfidenzintervall eine Länge von höchstens hat (95 % und 99 %)? 3.11 In einer Zementfabrik wird der laufende Abfüllvorgang von Zementsäcken durch die fallweise Entnahme von Stichproben überwacht. Bei einer Stichprobe wurden folgende Abfüllgewichte festgestellt: 101.0 100.0 99.0 10.5 10.0 103.0 97.5 97.0 98.0 a) Berechne ein symmetrisches Konfidenzintervall für das mittlere Abfüllgewicht unter der Voraussetzung, dass die Abfüllgewichte normalverteilt sind (=99 %)! b) Berechne ein symmetrisches Konfidenzintervall für σ! 3.1 Aus einer laufenden Produktion von Transistoren wird eine Stichprobe vom Umfang 400 Stück entnommen und einer Funktionsprüfung unterzogen. 40 der geprüften Transistoren erwiesen sich als defekt. Bestimme ein 95 % Konfidenzintervall für den Anteil der funktionstüchtigen Transistoren! 3.13 In seinem Buch The Advanced Theory of Language as Choice and Chances bringt G. Herdan zwei Statistiken über die Länge von Wörtern, gemessen durch die Silbenanzahl, bei Goethe und Lichtenberg: Anzahl der Silben Goethe Lichtenberg 1 587 539 410 317 3 146 136 4 49 49 5 8 7 n 100 1048 a) Berechne ein Konfidenzintervall für die mittlere Wortlänge (95 %)! b) Berechne ein Konfidenzintervall für die Differenz der mittleren Wortlänge, wenn gleiche Varianz der Datenreihen vorausgesetzt wird (95 %)! 15

c) Berechne die 95 % Konfidenzintervalle für die Anteile der einsilbigen Wörter bei Lichtenberg und Goethe! d) Berechne das 95 % Konfidenzintervall für die Differenz der Anteilswerte der einsilbigen Wörter bei Goethe und Lichtenberg! 16