3 PARAMETERSCHÄTZUNG. Inhalt: 3.1 Datenbeschreibung bei einem Merkmal 3.2 Schätzfunktionen 3.3 Intervallschätzung 3.



Ähnliche Dokumente
Statistik Einführung // Konfidenzintervalle für einen Parameter 7 p.2/39

Wissenschaftliches Arbeiten Studiengang Energiewirtschaft

15.4 Diskrete Zufallsvariablen

n 1,n 2,n 3,...,n k in der Stichprobe auftreten. Für die absolute Häufigkeit können wir auch die relative Häufigkeit einsetzen:

3. Einführung in die Statistik

2 Vollständige Induktion

h i Deskriptive Statistik 1-dimensionale Daten Daten und Häufigkeiten Seite 1 Nominal Ordinal Metrisch (Kardinal) Metrisch - klassiert

Statistik I/Empirie I

Formelsammlung Mathematik

Statistik mit Excel Themen-Special. Peter Wies. 1. Ausgabe, Februar 2014 W-EX2013S

Übungen zur Vorlesung Funktionentheorie Sommersemester Musterlösung zu Blatt 0

Auch im Risikofall ist das Entscheidungsproblem gelöst, wenn eine dominante Aktion in A existiert.

Kapitel 6: Statistische Qualitätskontrolle

Innerbetriebliche Leistungsverrechnung

Wirksamkeit, Effizienz

Vl Statistische Prozess und Qualitätskontrolle und Versuchsplanung Übung 3

3 PARAMETERSCHÄTZUNG. W. Timischl: Statistik, Parameterschaetzung_14_Text.doc

Stichproben im Rechnungswesen, Stichprobeninventur

Beschreibende Statistik Kenngrößen in der Übersicht (Ac)

Gliederung. Value-at-Risk

BINOMIALKOEFFIZIENTEN. Stochastik und ihre Didaktik Referentin: Iris Winkler

Vl Statistische Prozess- und Qualitätskontrolle und Versuchsplanung Übung 5

Testumfang für die Ermittlung und Angabe von Fehlerraten in biometrischen Systemen

Arbeitsplätze in SAP R/3 Modul PP

Nachklausur - Analysis 1 - Lösungen

4 Punkt- und Intervallschätzung

Korrekturrichtlinie zur Studienleistung Wirtschaftsmathematik am Betriebswirtschaft BB-WMT-S

Prof. Dr. Roland Füss Statistik II SS 2008

Stochastik für WiWi - Klausurvorbereitung

Übung zur Vorlesung Statistik I WS Übungsblatt 8

Statistische Maßzahlen. Statistik Vorlesung, 10. März, Beispiel. Der Median. Beispiel. Der Median für klassifizierte Werte.

2. Diophantische Gleichungen

Übungsblatt 1 zur Vorlesung Angewandte Stochastik

= 3. = 14,38... = x neu x = 0, = 97,87...%. Wie verändert sich der arithmetische Mittelwert von 20 Zahlen, wenn...

Statistik. Prof. Dr. K. Melzer.

AUFGABENSTELLUNG (ZUSAMMENFASSUNG) 2 SPEZIFIKATION 2. Datenfluß und Programmablauf 2. Vorbedingung 3. Nachbedingung 3. Schleifeninvariante 3

Qualitätskennzahlen für IT-Verfahren in der öffentlichen Verwaltung Lösungsansätze zur Beschreibung von Metriken nach V-Modell XT

x 1, x 2,..., x n ist eine Liste von n reellen Zahlen. Das arithmetische Mittel x der Zahlen ist x = x 1 + x x n n

Variiert man zusätzlich noch die Saatstärke (z.b. 3 Stärkearten), würde man von einer zweifaktoriellen Varianzanalyse sprechen.

2. Repetition relevanter Teilbereiche der Statistik

Wirksamkeit, Effizienz

4 Schwankungsintervalle Schwankungsintervalle 4.2

Aufgaben und Lösungen der Probeklausur zur Analysis I

GIBS. Übungsaufgaben zur Vertiefung. V1. Beschriften Sie die Konstruktionen! n n n n ' ' ' ' Modul 1.5. Geometrische Optik 1 58.

Finanzmathematische Formeln und Tabellen

Kleines Matrix-ABC. Fachgebiet Regelungstechnik Leiter: Prof. Dr.-Ing. Johann Reger. 1 Elementares

Institut für Stochastik Prof. Dr. N. Bäuerle Dipl.-Math. S. Urban

6 Vergleich mehrerer unverbundener Stichproben

1 Analysis T1 Übungsblatt 1

Kapitel 6 : Punkt und Intervallschätzer

Übungen mit dem Applet erwartungstreu

Reader Teil 1: Beschreibende Statistik

Kapitel 6: Quadratisches Wachstum

Statistische Formelsammlung Begleitende Materialien zur Statistik - Vorlesung des Grundstudiums im Fachbereich IK

,,, xn. 3. Intervallschätzungen Zufallsstichproben und Stichprobenfunktionen Zufallsstichproben. Zufallsvariablen mit

Zufallsvariable. Die Wahrscheinlichkeitsverteilung p (probability function) ist definiert durch: p(x i ) := P (X = x i ),

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

Evaluierung einer Schulungsmaßnahme: Punktezahl vor der Schulung Punktezahl nach der Schulung. Autoritarismusscore vor/nach Projekt

Kryptologie: Kryptographie und Kryptoanalyse Kryptologie ist die Wissenschaft, die sich mit dem Ver- und Entschlüsseln von Informationen befasst.

Parameter von Häufigkeitsverteilungen

Wirksamkeit, Effizienz. Beispiel: Effizienz. Mittlerer quadratischer Fehler (MSE) Konsistenz im quadratischen Mittel

Versicherungstechnik

Abschlussprüfung 2013 an den Realschulen in Bayern

h i :=h a i f i = h a i n Absolute Häufigkeit: Relative Häufigkeit: h 2 h 4 h 6 :=h der Elemente mit der Ausprägung i=6 zu der Anzahl n aller Werte

Klausur vom

e) ( 4a + 8b + 9a + 18b ) : a + 2b f) 2 log (x) + 3 log (2y) 0.5 log (z)

Lerneinheit 2: Grundlagen der Investition und Finanzierung

Vereinheitlichung Einheitlicher Maßstab der Risikoeinschätzung. Limitierung / Steuerung Messung und Limitierung ist fundamental für die Steuerung

Tests statistischer Hypothesen

Allgemeine Lösungen der n-dimensionalen Laplace-Gleichung und ihre komplexe Variable

Ausgangspunkt: Über einen endlichen Zeitraum wird aus einem Kapital (Rentenbarwert RBW v n,i

... a ik) i=1...m, k=1...n A = = ( a mn

Weitere Lagemaße: Quantile/Perzentile I

Empirische Verteilungsfunktion

Kennwerte Univariater Verteilungen

3 Vergleich zweier unverbundener Stichproben

elektr. und magnet. Feld A 7 (1)

BILANZ. Bilanzbericht

Beurteilung des Businessplans zur Tragfähigkeitsbescheinigung

Die Gasgesetze. Die Beziehung zwischen Volumen und Temperatur (Gesetz von J.-L. und J. Charles): Gay-Lussac

Aufgabenblatt 4. A1. Definitionen. Lösungen. Zins = Rate Zinskurve = Zinsstruktur Rendite = Yield

Wahrscheinlichkeit & Statistik Musterlösung Serie 13

2. Schätzverfahren 2.1 Punktschätzung wirtschaftlicher Kennzahlen. Allgemein: Punktschätzung eines Parameters:

Lösungen der Aufgaben zur Vorbereitung auf die Klausur Mathematik für Informatiker I

Die notwendigen Verteilungstabellen finden Sie z.b. hier:

Kapitel VI. Einige spezielle diskrete Verteilungen

Umrechnung einer tatsächlichen Häufigkeitsverteilung in eine prozentuale Häufigkeitsverteilung

Gruppe 108: Janina Bär Christian Hörr Robert Rex

Statistik I Februar 2005

Wahrscheinlichkeit & Statistik

VAIO-Link Kundenservice Broschüre

Kapitel 5: Schließende Statistik

Es werden 120 Schüler befragt, ob sie ein Handy besitzen. Das Ergebnis der Umfrage lautet: Von 120 Schülern besitzen 99 ein Handy.

Kunde. Kontobewegung

Empirische Methoden I

Satz Ein Boolescher Term t ist eine Tautologie genau dann, wenn t unerfüllbar ist.

2.2.1 Lagemaße. Exkurs: Quantile. und n. p n

Weitere Lagemaße: Quantile/Perzentile II. Weitere Lagemaße: Quantile/Perzentile I. Weitere Lagemaße: Quantile/Perzentile IV

Auszüge der nichtparametrischen Statisik

Transkript:

1 3 PARAMETERSCHÄTZUNG Ihalt: 3.1 Datebeschreibug bei eiem Merkmal 3. Schätzfuktioe 3.3 Itervallschätzug 3.4 Übugsbeispiele Lerziele: - Aus Stichprobewerte die Variatio eies quatitative Merkmals durch eie Häufigkeitsverteilug (mit bzw. ohe Klassebildug) darstelle köe; - uivariate Statistike (Mittelwert, Stadardabweichug/Variaz, Stadardfehler des Mittelwerts, Modalwert, Quatile) aus Stichprobewerte bestimme ud iterpretiere köe; - die Merkmalsvariatio durch ei Boxplot veraschauliche köe; - eidimesioale Stichprobe zetriere ud stadardisiere köe; - die Verteilug des Stichprobemittels eier ormalverteilte Zufallsvariable kee ud die praktische Bedeutug des zetrale Grezwertsatzes agebe köe; - Kofidezitervalle für de Mittelwert, die Variaz ud die Stadardabweichug eier ormalverteilte Zufallsvariable bereche ud iterpretiere köe; - Kofidezitervalle für die Erfolgswahrscheilichkeit eier Zweipuktverteilug sowie de Mittelwert der Poisso-Verteilug bereche ud iterpretiere köe; W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

3.1 DATENBESCHREIBUNG BEI EINEM MERKMAL Was ist der Zweck der Parameterschätzug? Die Merkmalsvariatio wird i. Allg. durch Wahrscheilichkeitsverteiluge (Wahrscheilichkeitsfuktioe bzw. Dichtefuktioe) mit ubekate Parameter modelliert. Für diese Parameter sid - mit Hilfe vo Zufallsstichprobe - Schätzwerte zu ermittel. Grudgesamtheit X Wahrscheilichkeitsdichte N(µ, σ ) Zufallsauswahl Zufallsstichprobe x 1, x,..., x µ σ X Stichprobemittel Stichprobefuktioe Parameterschätzug: Schätzwert Kofidezitervall Stichprobestadardabweichug Wie beschreibt ma die Merkmalsvariatio i eidimesioale Stichprobe? - durch grafische Darstellug der Merkmalswerte i Form vo Puktdiagramme (Dot-Plots) vor allem bei kleie Stichprobe; - tabellarisch durch eie Häufigkeitsverteilug ohe (bzw. mit) Klassebildug, die Aufschluss gibt über die Wahrscheilichkeitsfuktio (Wahrscheilichkeitsdichte) eies diskrete (bzw. stetige) Merkmals, ud dere grafische Darstellug durch Stabdiagramme bzw. Histogramme; - umerisch durch Maßzahle, die markate Eigeschafte der Verteilug zum Ausdruck brige, ud dere grafische Darstellug (Mittelwerte mit Fehlerbalke, Boxplots). Wie erstellt ma ei Puktdiagramm? Die Verteilug vo Merkmalswerte i kleie Stichprobe wird sehr aschaulich i Form vo eidimesioale Diagramme dargestellt, i dem ma über der Merkmalsachse die Werte als Pukte eiträgt. W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

3 Werde zwei oder mehrere Messreihe auf diese Weise i eiem Diagramm zusammegefasst, köe Uterschiede i de Verteiluge visuell gut erfasst werde. Beispiel 3.1: Die Aufahme vo Mg-Ioe wurde i 6 Versuchspflaze i 3 Nährlösuge utersucht. Für die erste Nährlösug ergabe sich die Mg-Kozetratioe (i µmol pro g Trockesubstaz): 08, 175, 196, 181, 01, 166; die etsprechede Messwerte für die Nährlösug ud 3 ware: 184, 161, 155, 185, 03, 166 bzw. 18, 193, 166, 145, 135, 151. Ma stelle die Messreihe gemeisam i eiem Pukt- Plot dar. Lösug mit R: R-Script: # Beispiel 3.1a: Eimdimesioale Puktdiagramme x1 <- c(08, 175, 196, 181, 01, 166) x <- c(184, 161, 155, 185, 03, 166) x3 <- c(18, 193, 166, 145, 135, 151) x <- data.frame(x1, x, x3); x stripchart(x,group.ames=c("1. Lös.", ". Lös.", "3. Lös."), method="stack", pch=16, cex=1.5, cex.lab=1.5, cex.axis=1.5, xlab="mg-kozetratio i mikromol/100g Trockegewicht", mai="pukt-plots für drei Messreihe", cex.mai=1.4) R-Cosole: Beispiel 3.1a: Eimdimesioale Puktdiagramme > x1 <- c(08, 175, 196, 181, 01, 166) > x <- c(184, 161, 155, 185, 03, 166) > x3 <- c(18, 193, 166, 145, 135, 151) > x <- data.frame(x1, x, x3); x x1 x x3 1 08 184 18 175 161 193 3 196 155 166 4 181 185 145 5 01 03 135 6 166 166 151 > stripchart(x,group.ames=c("1. Lös.", ". Lös.", "3. Lös."), + method="stack", pch=16, cex=1.5, cex.lab=1.5, cex.axis=1.5, + xlab="mg-kozetratio i mikromol/100g Trockegewicht", + mai="pukt-plots für drei Messreihe", cex.mai=1.4) R-Grafik: Pukt-Plots für drei Messreihe 1. Lös.. Lös. 3. Lös. 140 160 180 00 Mg-Kozetratio i mikromol/100g Trockegewicht W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

4 Wie ermittelt ma eie Häufigkeitsverteilug ohe Klassebildug? Es sei X ei quatitatives diskretes Merkmal mit k (verschiedee) Werte a 1, a,..., a k. Beobachtug vo X a Utersuchugseiheite Stichprobe x 1, x,..., x Abzähle der Utersuchugseiheite mit dem Merkmalswert a i ergibt die absolute Häufigkeit H i ; Divisio der absolute Häufigkeit H i durch de Stichprobeumfag ergibt die relative Häufigkeit h i = H i /. Beispiel 3.: A 40 Exemplare eier Pflaze (Biscutella laevigata) wurde die Azahl X der Zähe des größte Grudblattes bestimmt. Ma stelle die Merkmalsvariatio durch eie Häufigkeitserteilug dar. 1 0 5 0 3 3 4 0 4 3 1 4 5 6 4 3 0 3 3 0 3 4 3 3 3 3 1 3 3 4 Lösugshiweise: Die absolute Häufigkeit der Ausprägug a 1 =0 ist H 1 =5, die etsprechede relative Häufigkeit h 1 =5/40=0.15, usw. Alle Auspräguge ud die zugeordete Häufigkeite werde i der Häufigkeitstabelle zusammegefasst. Errichtet ma über der Merkmalsachse Stäbe mit de Häufigkeite (z.b. ausgedrückt i %) als Läge, erhält ma eie grafische Darstellug der Verteilug i Form eies Stabdiagramms. Lösug mit R: R-Cosole: > optios(digits=3) > zaehe <- c( + 1,,0,5,,,0,3,3,4, + 0,,4,3,1,,4,5,6,4, + 3,,0,3,3,0,3,,,4, + 3,,,3,3,3,1,3,3,4) > <- legth(zaehe); # Stichprobeumfag [1] 40 > Xdefmege <- mi(zaehe):max(zaehe); Xdefmege [1] 0 1 3 4 5 6 > absolute_h <- table(zaehe); absolute_h # Tabelle mit absolute Häufigkeite zaehe 0 1 3 4 5 6 5 3 10 13 6 1 > relative_h <- table(zaehe)/ # Tabelle mit relative Häufigkeite > htab <- cbid(xdefmege, absolute_h, relative_h) + # Zusammefasse der abs. u. rel. Häufigk. i eier Tabelle > htab # Ausgabe der Häufigkeitstabelle Xdefmege absolute_h relative_h 0 0 5 0.15 1 1 3 0.075 10 0.50 3 3 13 0.35 4 4 6 0.150 5 5 0.050 W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

5 6 6 1 0.05 Darstellug der Verteilug der Azahl der Zähe durch ei Stabdiagramm mit absolute Häufigkeite > barplot(absolute_h, xlab="az. der Zähe", ylab="abs. Häufigkeit", + mai="häufigkeitsverteilug =40") Darstellug der Verteilug der Azahl der Zähe durch ei Stabdiagramm mit relative Häufigkeite > barplot(relative_h, xlab="az.d.zähe", ylab="rel.häufigkeit", + mai="häufigkeitsverteilug d.az.d.zähe, =40") R-Grafike: Häufigkeitsverteilug =40 Häufigkeitsverteilug d.az.d.zähe, =40 Abs. Häufigkeit 0 4 6 8 10 1 rel.häufigkeit 0.00 0.05 0.10 0.15 0.0 0.5 0.30 0 1 3 4 5 6 Az. der Zähe 0 1 3 4 5 6 Az.d.Zähe Wie ermittelt ma eie Häufigkeitsverteilug mit Klassebildug? Es sei X ei stetiges Merkmal ud x 1, x,..., x eie Stichprobe vo X; Zerlegug der Merkmalsachse i gleich lage, aeiadergrezede Itervalle (Klasse) I 1,I,..., I k Klasseeiteilug Klassebreite b: 3 b IQR / Klassegreze: Festlegug der utere Greze c 0 der erste Klasse I 1 derart, dass c 0 < x mi c 1 =c 0 + b I 1 =(c 0, c 1 ]; c 1 = c 0 + b ist die utere Greze der zweite Klasse I = (c 1, c ]; c = c 1 + b die utere Greze der dritte Klasse I 3 = (c, c 3 ] usw. Abzähle der Utersuchugseiheite i der Klasse I i ergibt die absolute Klassehäufigkeit H i vo I i (= Azahl der Merkmalswerte x i mit c i-1 < x i c i ); ma beachte: H 1 + H + + H k =. W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

6 Divisio der absolute Klassehäufigkeit H i durch de Stichprobeumfag führt zur relative Klassehäufigkeit y' i = H i /; ma beachte: y 1 + y + + y k = 1. Divisio der relative Klassehäufigkeit y i durch die Klassebreite b ergibt die Häufigkeitsdichte g i = h i /b. Histogramm: Über jede Klasse I i wird das Rechtecke mit der Breite b ud der Höhe g i errichtet (dieses Histogramm heißt flächeormiert, weil die gesamte "Histogrammfläche" = 1 ist) Beispiel 3.3: Die folgede Tabelle ethält die Blutgeriugszeite (i s) vo 30 Probade. Ma beschreibe die Merkmalsvariatio tabellarisch ud grafisch durch eie geeiget gewählte Häufigkeitsverteilug.,7 4,0 4,4 5,8 5,9 6,0 6,4 6,6 6,6 6,8 7,0 7,7 7,8 8,0 8,0 8,1 8,7 8,7 8,8 9,0 9,0 9,0 30,0 30,1 31,1 31,8 3,0 33,0 33,7 35,0 Lösug mit R: R-Cosole: > x <- c( +.7, 4.0, 4.4, 5.8, 5.9, 6.0, 6.4, 6.6, 6.6, 6.8, + 7.0, 7.7, 7.8, 8.0, 8.0, 8.1, 8.7, 8.7, 8.8, 9.0, + 9.0, 9.0, 30.0, 30.1, 31.1, 31.8, 3.0, 33.0, 33.7, 35.0) > <- legth(x) > optios(digits=4) Histogramm mit abs. Klassehäufigkeite > grafik_1 <- hist(x, freq=true, + xlab="blutgeriugszeite i s", ylab="abs. Klassehäufigkeit", + mai="grafik 1: Histogramm mit abs. Klassehäufigkeite, =30") > Histogramm mit rel. Klassehäufigkeitsdichte (Flächeormierug auf 1) > grafik_ <- hist(x, freq=f, xlab="blutgeriugszeite i s", + ylab="klassehäufigkeitsdichte", + mai="grafik : Flächeormiertes Histogramm, =30") > Häufigkeitstabelle > ames(grafik_1) [1] "breaks "couts" "itesities" "desity" "mids" "xame" [7] "equidist" > az_klasse <- legth(grafik_1$mids) > az_klasse [1] 7 > klassebreite <- (max(grafik_1$breaks)-mi(grafik_1$breaks))/az_klasse > klassebreite [1] > klassemitte <- grafik_1$mids > abs_klasse_h <- grafik_1$couts > rel_klasse_h <- abs_klasse_h/ > klasse_h_dichte <- rel_klasse_h/klassebreite > prit(cbid(klassemitte, abs_klasse_h, rel_klasse_h, klasse_h_dichte)) klassemitte abs_klasse_h rel_klasse_h klasse_h_dichte [1,] 3 0.06667 0.03333 [,] 5 4 0.13333 0.06667 W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

7 [3,] 7 9 0.30000 0.15000 [4,] 9 8 0.6667 0.13333 [5,] 31 4 0.13333 0.06667 [6,] 33 0.06667 0.03333 [7,] 35 1 0.03333 0.01667 Ma beachte die Normieruge der diverse Häufigkeite! R-Grafike: Grafik 1: Histogramm mit abs. Klassehäufigkeite, =30 Grafik : Flächeormiertes Histogramm, =30 abs. Klassehäufigkeit 0 4 6 8 Klassehäufigkeitsdichte 0.00 0.05 0.10 0.15 4 6 8 30 3 34 36 Blutgeriugszeite i s 4 6 8 30 3 34 36 Blutgeriugszeite i s R-Cosole (Forts.): Erstellug eies Histogramms mit vorgegebee Klassegreze: > x_mi <- mi(x); x_max <- max(x); <- legth(x) > IQR <- quatile(x, 0.75)-quatile(x, 0.5); b <- *IQR/^(1/3) > prit(cbid(x_mi, x_max,, IQR, b)) x_mi x_max IQR b 75%.7 35 30 3.15.08 > klassebreite <- roud(b[[1]],digits=0) # gerud.klassebreite > az_klasse <- truc((x_max-x_mi)/klassebreite)+1 > c0 <- truc(x_mi) # like Greze der 1. Klasse > ck <- c0+az_klasse*klassebreite # rechte Greze der oberste Klasse > prit(cbid(az_klasse, klassebreite, c0, ck)) az_klasse klassebreite c0 ck [1,] 7 36 > klassegreze <- seq(from=c0, to=ck, by=klassebreite); klassegreze [1] 4 6 8 30 3 34 36 > grafik_3 <- hist(x, breaks=klassegreze, freq=true, + xlab="blutgeriugszeite i s", ylab="abs. Klassehäufigkeit", + mai="grafik 3: Histogramm mit vorgegebee Klasse, =30") R-Grafik: W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

8 Grafik 3: Histogramm mit vorgegebee Klasse, =30 abs. Klassehäufigkeit 0 4 6 8 4 6 8 30 3 34 36 Blutgeriugszeite i s Was sid die wichtigste Verteilugskewerte (uivariate Statistike)? Es sei X ei quatitatives Merkmal mit de a Utersuchugseiheite beobachtete Werte x 1, x,..., x Lagemaß: Arithmetisches Mittel x = 1 x i= 1 = 1 x + x + L + 1 i x Ma beachte: i= 1 ( x x) = 0 ud ( x ξ ) = mi! für ξ x i i = i= 1 Streuugsmaße: Variaz s, Stadardabweichug s s 1 = 1 i = 1 ( x i x ), s = s Wozu diet der Mittelwert? a) um de "wahre" Wert µ vo X zu schätze (dabei wird ageomme, dass sich die Messwerte additiv aus dem wahre Wert ud eiem regellos um Null streuede Messfehler zusammesetze) b) um de Mittelwert µ vo X zu schätze (dabei wird ageomme, dass X a sich zufällig variiert) Ma beachte: Je größer, desto "besser" die Mittelwertschätzug! W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

9 Stadardfehler (Maß für die Zufallsstreuug des Mittelwerts): SE = s/ Beispiel 3.4: (Mittelwert ud Stadardfehler zu Beispiel 3.): 1 x = 40 1 s = 39 ( 0 5 + 1 3 + 10 + 3 13 + 4 6 + 5 + 6 1) =,55; 1,45 [( 0,55) 5 + L+ ( 6,55) 1] =,1; s =,1 = 1,45; SE = 0, 3 = 40 Amerkug: Messergebisse stellt ma oft i der Form x ± SE =,55 ± 0, 3dar. Welche weitere Lagemaße fide bei der Datebeschreibug Awedug? der Modalwert x mod (häufigster Merkmalswert) der kleiste ud größte Merkmalswert x mi bzw. x max das p -Quatil x p (0 p < 1): uter dem p-quatil eier (quatitative) Stichprobe vom Umfag ka ma sich grob gesproche jee Wert vorstelle, der vo p Stichprobewerte uterschritte ud vo (1-p) Stichprobewerte überschritte wird; ist p icht gazzahlig, so ehme ma dafür de auf die ächste gaze Zahl gerudete Wert. Im Folgede wird eie geaue Defiitio des p-quatils (ämlich jee, die i der R- Fuktioe summary oder quatile verwedet wird) agegebe. Wie bestimmt ma das p-quatil aus eier Stichprobe? Eie Stichprobe der Variable X umfasse die metrische Werte x 1, x,..., x. Die Aordug der Stichprobewerte ach aufsteigeder Größe führt auf die geordete Stichprobe x (1), x (),..., x (). Wir bestimme die Zahl u = 1+(-1)p ud daraus die größte gaze Zahl [u] kleier oder gleich u; ferer setze wir v= u-[u]. Da ist das p-quatil x p der Stichprobewerte gegebe durch: x p = ( 1 v) x([ u ]) + vx([ u ] + 1) Soderfälle: p = 50% (Media x 0.5 ) p = 5% (uteres Quartil x 0.5 ) p = 75% (oberes Quartil x 0.75 ) Beispiel 3.5: Ma bestimme das 5%-, 50%- ud 75%-Quatil für die Stichprobe W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

10 8, 1, 14,, 5, 5, 30. Was ergibt sich, we ma die Stichprobe um de Wert 35 vergrößert? Lösug: a) Stichprobe: 8, 1, 14,, 5, 5, 30 (=7) p=0,5: u= 1+(-1)p=,5; [u]=, v=0,5 x 0,5 = 0,5x () +0,5x (3) =13; p=0,5: u= 4; [u]=4, v=0 x 0,5 = 1x (4) +0x (5) =; p=0,75: u= 5,5; [u]=5, v=0,5 x 0,75 = 0,5x (5) +0,5x (6) =5. b) Stichprobe: 8, 1, 14,, 5, 5, 30, 35 (=8) p=0,5: u= 1+(-1)p=,75; [u]=, v=0,75 x 0,5 = 0,5x () +0,75x (3) =13,5; p=0,5: u= 4,5; [u]=4, v=0,5 x 0,5 = 0,5x (4) +0,5x (5) =3,5; p=0,75: u= 6,5; [u]=6, v=0,5 x 0,75 = 0,75x (6) +0,5x (7) =6,5. Amerkuge: - Es gibt mehrere Defiitioe für die Quatile; sowohl Excel als auch z.b. SPSS verwede adere Defiitioe. - Speziell für die Quartile x 0.5 ud x 0.75 fidet ma auch die folgede Defiitioe: Das Quartil x 0.5 (x 0.75 ) ist der Media der Merkmalswerte kleier (größer) als x 0.5 ; die so berechete Statistike werde im Eglische auch als higes bezeichet ud fide z.b. i R bei der Berechug der Quartile i der Fuktio boxplot() Awedug. - Die Beschreibug der Variatio eier Stichprobe mit de 5 Kezahle x mi, x 0.5, x 0.5, x 0.75, x max wird als 5-Pukte-Zusammefassug (egl. Five-umber summary) bezeichet (R-Fuktio: fiveum()). Beispiel 3.6: a) Ma stelle die Variatio der Blutgeriugswerte vo Beispiel 3. durch ei Boxplot dar. Lösug: = 30; p=0,5: u= 1+(-1)p=8,5; [u]=8, v=0,5 x 0,5 = 0,75x (8) +0,5x (9) =6,6; p=0,5: u= 15,5; [u]=15, v=0,5 x 0,5 = 0,5x (15) +0,5x (16) =8,05; p=0,75: u=,75; [u]=, v=0,75 x 0,75 = 0,5x () +0,75x (3) =9,75. IQR = x 075 - x 0,5 = 3,15. Whisker-Läge: x mi =,7; x max = 35. x mi x 0.5 x 0.5 x 0.75 x max X 3 5 7 9 31 33 35 Lösug mit R: R-Cosole: > x <- c( +.7, 4.0, 4.4, 5.8, 5.9, 6.0, 6.4, 6.6, 6.6, 6.8, + 7.0, 7.7, 7.8, 8.0, 8.0, 8.1, 8.7, 8.7, 8.8, 9.0, + 9.0, 9.0, 30.0, 30.1, 31.1, 31.8, 3.0, 33.0, 33.7, 35.0) > summary(x) W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

11 Mi. 1st Qu. Media Mea 3rd Qu. Max..70 6.60 8.05 8.39 9.75 35.00 > grafik_1 <- boxplot(x, rage=0, horizotal=true) > ames(grafik_1) [1] "stats" "" "cof" "out" "group" "ames" > grafik_1$stats [,1] [1,].70 [,] 6.60 [3,] 8.05 [4,] 30.00 [5,] 35.00 Ma beachte: Das utere ud obere Quartil werde als higes berechet! > grafik_1$stats[4,1] # oberes Quartil (upper hige) [1] 30 > IQR <- grafik_1$stats[4,1]-grafik_1$stats[,1] [1] 3.4 Ma beachte: IQR ist hier mit dem obere ud utere hige berechet! R-Grafik (Boxplot): 4 6 8 30 3 34 b) Ma zeige: Für ei N(µ, σ )-verteilte Zufallsvariable X ist P= P(x 0.5 1,5IQR <X< x 0.75 +1,5IQR) 99,3%, d.h. außerhalb des Itervalls [x 0.5 15IQR, x 0.75 + 1,5IQR] liegede Werte sid uwahrscheilich ud daher "ausreißerverdächtig". Lösug: x 0,75 =µ+z 0,75 σ ; x 0,5 =µ+z 0,5 σ = µ-z 0,75 σ IQR=x 0,75 x 0,5 = z 0,75 σ x 0.75 +1,5IQR=µ+4z 0,75 σ ; x 0.5 1,5IQR=µ 4z 0,75 σ P= P((x 0.5-1,5IQR µ)/σ <(X-µ)/σ < (x 0.75 +1,5IQR-µ)/σ)= P( 4z 0,75 <(X-µ)/σ <4z 0,75 ); z 0,75 = (Tabelle)=0,675 P=P(-,7< (X-µ)/σ <,7) = Φ(,7)-Φ(-,7) = Φ(,7)-1=(Tabelle)= 0,9965-1=0,993. Wie beschreibt ma die Asymmetrie eier Häufigkeitsverteilug? Das Maß für die Asymmetrie heißt Schiefe. Schiefe g = S xxx ( s 1 1/ ) 3, Sxxx = i= 1 3 ( x x) i W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

1 Beispiel 3.7: Ma bereche die Schiefe der Häufigkeitsverteilug vo X (Azahl der Zähe des größte Grudblattes) mit de Date vo Beispiel 3.. Lösug mit R: R-Cosole: > optios(digits=3) > x <- c( + 1,,0,5,,,0,3,3,4, + 0,,4,3,1,,4,5,6,4, + 3,,0,3,3,0,3,,,4, + 3,,,3,3,3,1,3,3,4) > <- legth(x) > mw <- mea(x) > std <- sd(x) > g <- sum((x-mw)^3)//(std*sqrt(1-1/))^3 # Schiefe > prit(cbid(, mw, std, g)) mw std g [1,] 40.55 1.45-0.0494 Hiweis: Die folgede Grafik zeigt die beide grudsätzlich mögliche Asymmetrietype. Für symmetrische Verteiluge ist die Schiefe ull. Was versteht ma uter eier zetrierte Stichprobe, was uter eier stadardisierte Stichprobe? X X Z Z c S = X x X x = s (Zetriere) (Stadardisiere) W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

13 3. SCHÄTZFUNKTIONEN Wie schätzt ma de Mittelwert µ eier N(µ, σ )-verteilte Zufallsvariable X? Zur Schätzug vo Verteilugsparameter werde Schätzfuktioe verwedet. Es sei X 1, X,..., X eie Zufallsstichprobe, i der die Variable X i (i = 1,,, ) die Ergebisse vo Beobachtuge ausdrücke. Die Schätzug des Mittelwerts eier ormalverteilte Zufallsvariable erfolgt mit Hilfe des Stichprobemittels: 1 X = L + 1 ( X + X + ) Es gilt: X i N ( µ, σ ) X N ( µ, σ / ) X = Zufallsvariable mit de Werte 1 ud 0, wobei P(X=1)=p; X 1, X,..., X = Zufallsstichprobe vo X. Da ist der Ateil X = ( X + X + L X ) / der Wiederholuge mit X i = 1 B,p - 1 + X verteilt mit dem Mittelwert E [ X ] = p ud der Variaz Var [ X ] = p(1 p) /. Für großes gilt die die Approximatio (Satz vo Moivre-Laplace): 1 p(1 p) X = ( X1 + X + L + X ) N p, X = Zufallsvariable mit dem Mittelwert µ ud der Variaz σ ; X 1, X,..., X = Zufallsstichprobe vo X. Da ist E [X ] = µ, Var [ X ] = σ / ud für großes (ab 30) gilt die Approximatio µ σ (Zetraler Grezwertsatz): X N(, / ) Beispiel 3.8: Ma betrachte ei Beroulli-Experimet, d.h. ei Experimet mit Ausgäge, die wir mit a bzw. b (z.b. violette Blütefarbe bzw. weiße Blütefarbe) bezeiche. Die Ergebismege des Zufallsexperimets ist also Ω ={a, b}. Auf dieser Mege defiiere wir eie Zufallsvariable X derart, dass X de Wert 1 aimmt, we der Ausgag a eitritt, ud de Wert 0, we der Ausgag b eitritt. Die Wahrscheilichkeit, dass bei Durchführug des Experimets der Ausgag a eitritt, also die Wahrscheilichkeit P(X=1), sei p. Das Beroulli-Experimet wird -mal wiederholt. Jedem dieser Experimete orde wir - wie ebe ausgeführt - eie Zufallsvariable zu, der erste Wiederholug die Zufallsvariable X 1, der zweite die Zufallsvariable X usw. Die Summe Y = X 1 + X +... + X dieser Variable bedeutet die Azahl jeer Wiederholuge, bei dee der Ausgag a eitritt. Dividiert ma Y durch, bildet ma also de Mittelwert der vo X 1, W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

14 X,..., X, so erhält ma de Ateil der Wiederholuge mit dem Ausgag a. Dieser Mittelwert (oder Ateil) ist eie Stichprobefuktio; dere Mittelwert ist gleich dem Mittelwert jedes eizele X i (d.h. gleich der Wahrscheilichkeit p); die Variaz vo Y/ ist gleich p(1-p)/, d.h. gleich der durch geteilte Variaz eies jede X i. Ma zeige diese Zusammehäge a Had eier Simulatio des 9-stufige Beroulli-Experimetes recherisch ud grafisch auf ud zeiche i das (flächeormierte) Histogramm der Stichprobemittelwerte die Dichtekurve der etsprechede Normalverteilug ei. Die Simulatio möge aus 10000 Wiederholuge des 9-stufige Beroulli-Experimetes bestehe. Lösug mit R: R-Cosole: Simulatio des 9-stufige Beroulli-Experimets > _sim <- 10000 # Azahl der Simulatioe > zaehler <- c(1: _sim) > omega <- c(1,0) # Ergebismege > p <- 0.4 # Erfolgswahrscheilichkeit > ws <- c(p, 1-p) # Wahrscheilichk. der Elemete 1 ud 0 i der Ergebismege Schätzug des Mittelwerts ud der Stadardabweichug aus de Simulatioe > mittel_9 <- c() > for (i i zaehler){ + beroulli_9 <- sample(omega, 9, replace=true, prob=ws) + mittel_aktuell <- mea(beroulli_9) # Mittelwert + mittel_9 <- apped(mittel_9, mittel_aktuell)} > mittelwert_9 <- mea(mittel_9) # Mittelwert aller Erfolgsateile > std_9 <- sd(mittel_9) # Stadardabweichug aller Erfolgsateile > variaz_9 <- std_9*std_9 > prit(cbid(mittelwert_9, variaz_9)) mittelwert_9 variaz_9 [1,] 0.400444 0.067947 Theoretischer Mittelwert ud theoretische Stadardabweichug > mittelwert <- p > variaz <- p*(1-p)/9 > prit(cbid(mittelwert, variaz)) mittelwert variaz [1,] 0.4 0.0666667 Verteilug des Stichprobemittels (Ateils) beim 9-stufige Beroulli-Experimet > hist(mittel_9, breaks=10, xlab="ateil", ylab="dichte/flächeormiert", + mai="9-stufiges Beroulli-Experimet", freq=false) > x <- mittel_9 > curve(dorm(x, mea=p, sd=sqrt(p*(1-p)/9)), add=t) W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

15 R-Grafik: 9-stufiges Beroulli-Experimet Dichte/flächeormiert 0.0 0.5 1.0 1.5.0.5 0.0 0. 0.4 0.6 0.8 1.0 Ateil Wie schätzt ma die Variaz eier N(µ, σ )-verteilte Zufallsvariable X? Es sei X 1, X,..., X eie Zufallsstichprobe ud [( ) ( ) ( X X ) ] 1 S = X1 X + X X + L + 1 die Stichprobevariaz. Da gilt: ( 1) S σ χ 1 d.h. (-1)S /σ ist eie chiquadratverteilte Zufallsvariable mit f = - 1 Freiheitsgrade. Beispiel 3.9: Ma zeiche uter Verwedug der R-Fuktio dchisq() die Dichtekurve der Chiquadratverteiluge mit de Freiheitsgrade 1, 3 ud 5. R-Cosole: Dichtekurve vo ausgewählte Chiquadrat-Verteiluge > curve(dchisq(x, 1), from=0, to=4, ylim=c(0, 0.5), xlab ="X", + ylab="dichte", col="red", mai="dichtekurve der Chiquadratverteilug") W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

16 > curve(dchisq(x, 3), add=t, lty=, col="blue") > curve(dchisq(x, 5), add=t, lty=3, col="black") > text(0.8, 0.4, col="red", expressio("f=1")) > text(0.4, 0.15, col="blue", expressio("f=3")) > text(1, 0.04, col="black", expressio("f=5")) R-Grafik: Dichtekurve der Chiquadratverteilug Dichte 0.0 0.1 0. 0.3 0.4 0.5 f=3 f=1 f=5 0 1 3 4 X Welche Eigeschafte solle Schätzfuktioe habe? Es sei ˆ π ˆ = π ( X1, X, K, X ) eie Schätz(Stichprobe)fuktio für de Verteilugsparameter π. Die Beurteilug der Güte eier Schätzfuktio ka mit der erwartete mittlere quadratische Abweichug (dem mittlere quadratische Fehler) MSE ˆ ( E[ ˆ π ] ) = E[( π π ) ] = Var[ π ] + π ˆ erfolge, die gleich der Summe aus der Variaz der Schätzfuktio ud dem Quadrat der Verzerrug (Bias) ist. Forderuge a "gute" Schätzfuktioe: 1. Für soll der Erwartugswert E[ ˆ π ] der Schätzfuktio gege de Parameter π strebe, d.h. die Schätzwerte solle mit wachseder Wahrscheilichkeit um π kozetriert sei. dies trifft zu, we die Schätzfuktio uverzerrt (erwartugstreu) ist.. Variaz soll für gege Null strebe. W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

17 Amerkuge: Schätzfuktioe, die die Forderug 1 erfülle, heiße asymptotisch erwartugstreu. Gilt sogar E[ ˆ π ] = π für alle =1,,, et ma die Schätzfuktio erwartugstreu. Schätzfuktioe, die de Forderuge 1 ud geüge, heiße kosistet (im quadratische Mittel). Das Stichprobemittel π = X = ( X + X + K X ) ist eie ˆ 1 + / erwartugstreue Schätzfuktio für µ, d.h. E [ X ] = µ Bias = 0. Überdies gilt: Var[ X ] σ / 0. = ˆ π = ist eie i Die Stichprobevariaz S = ( X X ) /( 1) i= 1 erwartugstreue Schätzfuktio für σ, d.h. E[ S ] = σ Bias = 0. 4 Überdies gilt: Var S ] σ /( 1) 0. Dagege ist S ist keie [ = erwartugstreue Schätzfuktio für σ. Es gilt ämlich: Γ E[ S] = k mit σ k = < 1 1 1 Γ Γ bezeichet die Gamma-Fuktio mit der Eigeschaft Γ(x+1) = x Γ(x) für alle x>0. Speziell ist Γ(1)=1 ud Γ(1/)= π. Z.B. ergibt sich damit für =5: k 5 = (1/ )Γ(5/)/Γ() = (1/ ) 1 (3/)(1/) π = 0,94. Wie kommt ma zu gute Schätzfuktioe? Es seie X eie (diskrete) Zufallsvariable mit der vo dem zu schätzede Parameter π abhägige Wahrscheilichkeitsfuktio f(x π) ud x 1, x,..., x eie Zufallsstichprobe vo X. Wir bilde die so geate Likelihood-Fuktio: L 1 f ( x i ~ ) i= 1 ~ π ( π = π x, x, K, x ) = Die Likelihood-Fuktio ist die Wahrscheilichkeit dafür, dass X die Realisatioe x 1, x,..., x aimmt, we π ~ der Schätzwert für π ist. Maximum Likelihood-Prizip: Der Maximum Likelihood - Schätzer (kurz ML-Schätzer) für π ist jees π ~, für das die Likelihood - Fuktio de größte Wert aimmt, d.h. die Maximumstelle vo L. Hiweise: Bei stetige Zufallsvariable tritt a die Stelle der Wahrscheilichkeitsfuktio die Wahrscheilichkeitsdichte. W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

18 Die ML-Schätzug des Mittelwertes ist gleichwertig mit der sogeate Kleiste Quadrat-Schätzug (LS-Schätzug: "optimaler" Schätzwert ist jeer, der die Summe der Quadrate der Abweichuge der Beobachtugswerte vom Schätzwert miimiert) Beispiel 3.10: Es sei X ~ N(µ, σ ). Wir bestimme de ML-Schätzer für de Mittelwert µ uter der Aahme, dass σ bekat ist. l L ( µ = ~ µ = l( π ) d d ~ l µ L = 0 x, x, 1 K l σ ~ µ = x, x ) 1 i = 1 ( x µ ) i ~ / σ 3.3 INTERVALLSCHÄTZUNG Was sid ud wie berechet ma Kofidezitervalle? Wir bezeiche als Kofidezitervall für eie ubekate Parameter π eier Verteilug das Itervall [U, O] der Zahlegerade, das de Parameter π mit eier vorgegebee hohe Wahrscheilichkeit 1-α eischließt, d.h., P(U π O) = 1-α. Zusätzlich gebe wir die Symmetrieforderug vor: P(U > π) = P(O < π) = α/ Wie berechet ma ei (1-α)-Kofidezitervall für die Variaz eier N(µ, σ )- verteilte Zufallsvariable? [ 1) S / χ,( 1) S / χ ] ( 1,1 α / 1, α / Beispiel 3.11: Es sei X ormalverteilt mit dem Mittelwert µ ud der Variaz σ. Vo eier Stichprobe sei bekat: =30, s = 7.93. Ma bestimme ei 95%iges Kofidezitervall (CI) für σ. Lösug mit Tabelle: χ 9,0.975= (Tabelle)=45,7; χ 9,0.05= (Tabelle)=16,05 95%-CI für σ : [5,03; 14,33] 95%-CI für σ: [,4; 3,79]. Lösug mit R: R-Cosole: R-Fuktio mit Übergabeparameter: (Stichprobeumfag), var (Variaz), alpha (Irrtumsrisiko) > CI_var <- fuctio(, var, alpha){ + ug <- (-1)*var/qchisq(1-alpha/, -1) + og <- (-1)*var/qchisq(alpha/, -1) W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

19 + greze <- cbid(ug, og) + retur(greze)} > optios(digits=4) Fuktiosaufruf mit =30, var=7.93, alpha=5% > CI_var(30, 7.93, 0.05) ug og [1,] 5.03 14.33 CI für die Stadardabweichug > CI_sd <- sqrt(ci_var(30, 7.93, 0.05)) > CI_sd ug og [1,].43 3.786 Wie berechet ma ei (1-α)-Kofidezitervall für de Mittelwert eier N(µ, σ )- verteilte Zufallsvariable? Das (1-α)-Kofidezitervall für de Mittelwert µ ist ei um das X d, X + d mit der halbe Stichprobemittel symmetrisches Itervall [ ] Itervallbreite d = t 1, a α / S /. Die Größe t -1,1-α/ ist das (1-α/)- Quatil der t-verteilug mit -1 Freiheitsgrade. Beispiel 3.1: Ma zeiche uter Verwedug der R-Fuktio dt() die Dichtekurve der t- Verteiluge mit de Freiheitsgrade 1ud 5 ud stelle sie gemeisam mit der Stadardormalverteilug i eiem Diagramm dar. R-Cosole: # Dichtekurve vo ausgewählte t-verteiluge curve(dt(x, 1), from=-3, to=3, ylim=c(0, 0.5), xlab ="X", ylab="dichte", col="red", mai="dichtekurve der t-verteilug") curve(dt(x, 5), add=t, lty=, col="blue") curve(dorm(x), add=t, lty=3,lw=, col="black") text(0, 0.4, col="black", expressio("n(0,1)")) text(0, 0.34, col="blue", expressio("t(f=5)")) text(0, 0.7, col="red", expressio("t(f=1)")) R-Grafik: Dichtekurve der t-verteilug Dichte 0.0 0.1 0. 0.3 0.4 0.5 N(0,1) t(f=5) t(f=1) -3 - -1 0 1 3 X W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

0 Beispiel 3.13: Es sei X ormalverteilt mit dem Mittelwert µ ud der Variaz σ. Für de Mittelwert ud die Stadardabweichug vo X wurde mit Hilfe eier Stichprobe vom Umfag =0 die Schätzwerte 5 bzw. 5 bestimmt. Ma bestimme zum Niveau 1-α =0.95 ei Kofidezitervall (CI) für de Mittelwert vo X. Lösug mit Tabelle: t 19,0.975 = (Tabelle)=,093; s/ =1,118; d=,34 95%-CI für µ: 5 ±.34. Lösug mit R: R-Cosole: Beachte: ß-Quatil t_(f, ß) = qt(ß, f) Fuktio mit Übergabeparameter: mw (Mittelwert, (Stichprobeumfag, std (Stadardabweichug), alpha (Irrtumsrisiko) > CI_mittel <- fuctio(mw,, std, alpha){ + d <- std/sqrt()*qt((1-alpha/), -1) + ug <- mw-d + og <- mw+d + greze <- cbid(ug, og) + retur(greze)} Futiosaufruf mit mw=5, =0, std=5, alpha=5% > optios(digits=4) > CI_mittel(5, 0, 5, 0.05) ug og [1,].66 7.34 Hiweis: Für große Stichprobe gilt die Approximatio (z 1-α/ = (1-α/ )-Quatil der N(0,1)-Verteilug): [ d X + d] X, mit d = z1 α / Folgerug: Faustformel für de Mideststichprobeumfag zur Schätzug eies Mittelwerts mit der vorgegebee Geauigkeit ±d ud der vorgegebee Sicherheit 1-α : z 1 α / Beispiel 3.14: Der Mittelwert µ eier N(µ, σ )-verteilte Zufallsvariable soll mit eier Geauigkeit vo ±0,5 ud eier Sicherheit vo 99% bestimmt werde. Vo eier Vorutersuchug sei bekat, dass σ 1,5 ist. a) Wie groß ist der erforderliche Mideststichprobeumfag zu plae? b) Ma stelle i Abhägigkeit vo d (0,1 d 0,3) für 1- α=0.95 ud 0.99 dar! Lösug mit Tabelle (ur a): α=0,01 1-α/=0,995 z 0,995 =(Tabelle)=,58; d=0,5; σ=1,5 39,63 40. d σ S W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

1 Lösug mit R: R-Cosole: Aufgabe a) R-Fuktio mit Übergabeparameter: geauigkeit (d), sicherheit (1-alpha), sigma > _midest <- fuctio(geauigkeit, sicherheit, sigma){ + alpha <- 1-sicherheit + <- (qorm(1-alpha/)*sigma/geauigkeit)^ + retur()} > optios(digits=4) Fuktiosaufruf mit geauigkeit=0.5, sichheit=0.99, sigma=1.5 > _midest(0.5, 0.99, 1.5) [1] 38.9 Aufgabe b) Erzeuge der Folge der d-werte vo 0,1 bis 0,3 i Schritte vo 0,01 > d <- seq(from=0.1, to=0.3, by=0.01) > d [1] 0.10 0.11 0.1 0.13 0.14 0.15 0.16 0.17 0.18 0.19 0.0 0.1 0. 0.3 0.4 [16] 0.5 0.6 0.7 0.8 0.9 0.30 Bereche der de d-werte etsprechede Mideststichprobeumfäge > _midest_95 <- _midest(d, 0.95, 1.5) > _midest_95 [1] 864.33 714.3 600.3 511.44 440.98 384.15 337.63 99.08 66.77 39.43 [11] 16.08 195.99 178.58 163.39 150.06 138.9 17.86 118.56 110.5 10.77 [1] 96.04 > _midest_99 <- _midest(d, 0.99, 1.5) > _midest_99 [1] 149.9 133.8 1036.7 883.3 761.7 663.5 583.1 516.6 460.8 413.5 [11] 373. 338.5 308.4 8. 59. 38.9 0.8 04.8 190.4 177.5 [1] 165.9 Grafische Darstellug der Abhägigkeit der Mideststichprobeumfäge vo d > plot(d, _midest_95, type="p", col="blue", xlab="geauigkeit", + ylab="", mai="midest- bei Mittelwertschätzug") > lies(d, _midest_95, col="blue", lty=1, lwd=) > lies(d, _midest_99, col="red", lty=, lwd=) > text(0.15, 00, col="blue", expressio("sicherheit = 95%")) > text(0.5, 400, col="red", expressio("sicherheit = 99%")) R-Grafik: Midest- bei Mittelwertschätzug 00 400 600 800 Sicherheit = 95% Sicherheit = 99% 0.10 0.15 0.0 0.5 0.30 Geauigkeit W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

Wie berechet ma ei (1-α)-Kofidezitervall für de Parameter p (Wahrscheilichkeit) eier Zweipuktverteilug? Ei approximatives (1-α)-Kofidezitervall für de Parameter p (Wahrscheilichkeit) eier Zweipuktverteilug ist das Agresti-Coull- Itervall. Es sei X eie zweistufig skalierte Zufallsvariable mit de Werte 1 ud 0, p = P(X =1) bzw. q = 1-p = P(X=0) die Wahrscheilichkeite, mit dee diese Werte ageomme werde. Ferer seie x 1, x,..., x eie Zufallsstichprobe vom Umfag ud m die Azahl der Wiederholuge mit x i = 1 ud y = m/ der Ateil der Wiederholuge mit x i = 1. Da sid die utere ud obere Greze u A bzw. o A eies (1-α) - Kofidezitervalls für p gegebe durch u m A W = m W l m + z = + A, o A = m W + l A mit 1 α / / mw (1 mw ) ud l A= z1 α / z1 α / + z1 α / Voraussetzug für die Approximatio: y (1-y ) > 9 Ei exaktes (1-α)-Kofidezitervall für de Parameter p ist das Clopper-Pearso-Itervall mit de Greze u o C C = = mf m + 1+ mf ( m + 1) F m,( m+ 1), α / m + ( m + 1) F m,( m+ 1), α / ( m+ 1),( m),1 α / ( m+ 1),( m),1 α /, Die Größe F f1, f, α/ ud F f1, f, 1-α/ sid das α/- bzw. (1-α/)-Quatil der F-Verteilug mit de Freiheitsgrade f1 ud f. ma beachte, dass F f1, f, α = 1/ F f, f1, 1-α gilt. Beispiel 3.15: Ma zeiche uter Verwedug der R-Fuktio df() die Dichtekurve der F- Verteiluge mit de Freiheitsgrade 5 ud sowie 10 ud 40. W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

3 Dichtekurve der F-Verteilug Dichte 0.0 0. 0.4 0.6 0.8 1.0 F(f=5,) F(f=10,40) 0.0 0.5 1.0 1.5.0.5 3.0 X R-Cosole: # Dichtekurve vo ausgewählte F-Verteiluge curve(df(x, 5, ), from=0, to=3, ylim=c(0, 1), xlab ="X", ylab="dichte", col="red", mai="dichtekurve der F-Verteilug") curve(df(x, 10, 40), add=t, lty=, col="blue") text(1.8, 0.4, col="blue", expressio("f(f=10,40)")) text(1, 0.4, col="red", expressio("f(f=5,)")) Beispiel 3.16: Es soll die Erfolgsrate p eier eue Behadlugsmethode, also die Wahrscheilichkeit, dass bei eier mit der eue Methode behadelte Perso eie Verbesserug eitritt, geschätzt ud ei 95%iges Kofidezitervall für p bestimmt werde. I eier Studie mit =50 Probade erwies sich die eue Methode bei m=35 Persoe erfolgreich. Lösug mit R: R-Cosole: pproximatives Kofidezitervall (Agresti-Coull-Itervall) > m <- 35 # Azahl der Persoe mit der iteressierede Merkmalsausprägug > <- 50 # Stichprobeumfag > alpha <- 0.05 Irrtumsrisiko Fehler: Uerwartete(s) Symbol i "alpha <- 0.05 Irrtumsrisiko" > y <- m/ # Schätzwert für p Voraussetzug: > *y*(1-y) # muss größer als 9 sei! [1] 10.5 > zq <- qorm(1-alpha/) > mw <- (m+zq^/)/(+zq^) # Itervallmitte > la <- zq*sqrt(mw*(1-mw)/(+zq^)) > ua <- mw-la; oa <- mw+la > prit(cbid(y, mw, la, ua, oa)) y mw la ua oa [1,] 0.7 0.6857 0.14 0.5617 0.8097 Exakte Rechug (Pearso/Clopper Itervall) > CI_pexakt <- fuctio(m,, alpha){ + quatil_1 <- qf(alpha/, *m, *(-m+1)) + pu <- m*quatil_1/(-m+1+m*quatil_1) + quatil_ <- qf(1-alpha/, *(m+1), *(-m)) W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

4 + po <- (m+1)*quatil_/(-m+(m+1)*quatil_) + greze <- cbid(pu, po) + retur(greze)} Fuktiosaufruf mit m=35, =50, alpha=5% > CI_pexakt(35, 50, 0.05) pu po [1,] 0.5539 0.814 Hiweis 1: Das exakte Kofidezitervall ka direkt mit der R-Fuktio biom.test bestimmt werde. Aufruf: biom.test(m,, 1-alpha) > biom.test(35, 50, cof.level=0.95) Exact biomial test data: 35 ad 50 umber of successes = 35, umber of trials = 50, p-value = 0.0066 alterative hypothesis: true probability of success is ot equal to 0.5 95 percet cofidece iterval: 0.5539 0.814 sample estimates: probability of success 0.7 Hiweis : Beide CI köe mit der R-Fuktio biom.cofit() im Paket "biom" bestimmt werde > library(biom) > biom.cofit(m,, methods=c("agresti-coull", "exact")) method x mea lower upper 1 agresti-coull 35 50 0.7 0.5617 0.8097 exact 35 50 0.7 0.5539 0.814 Hiweis: Aus dem approximative Itervall ergibt sich eie grobe Faustformel für de Mideststichprobeumfag zur Schätzug eier Wahrscheilichkeit mit der vorgegebee Geauigkeit ±d ud der vorgegebee Sicherheit 1-α: z d 1 α / Beispiel 3.17: Die Keimfähigkeit p vo Blumezwiebel (d.h. die Wahrschei-lichkeit, dass ei ausgesetzter Zwiebel keimt) soll i eiem Feldversuch mit der Geauigkeit ±0,1 ud der Sicherheit 1-α= 0,95 geschätzt werde. Welcher Stichprobeumfag ist zu plae? Lösug mit Tabelle: d=0,1; α=0,05; 1-α/=0,975; z 0,975 =1,96 (Tabelle) (Faustformel) 96,04 97. Lösug mit R: R-Cosole: Approximativer Mideststichprobeumfag für die Schätzug eier Wahrscheilichkeit zur vorgegebee Geauigkeit d ud Sicherheit S = 1-alpha R-Fuktio mit Übergabeparameter: d (Geauigkeit=halbe Itervallbreite), S (Sicherheit) > _approx <- fuctio(d, S){ + alpha <- 1-S + quatil <- qorm(1-alpha/) + <- (quatil//d)^ W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

5 + retur()} Fuktiosaufruf mit d=0.1, S=0.95 > _approx(0.1, 0.95) [1] 96.04 Wie berechet ma ei (1-α)-Kofidezitervall für de Parameter λ der Poisso-Verteilug? Es seie X eie Poisso-verteilte Zufallsvariable mit dem Parameter λ, d.h. X P λ ud x = 0, 1,, die Realisieruge vo X. Da gilt: Ei -seitiges (1-α)-Kofidezitervall λ u λ λ o für λ ist ei Itervall mit der Eigeschaft P(λ u λ λ o ) = 1-α; die Itervallgreze sid: λ 1 1 u = χ x, α / ud λo = χx+,1 α / 1-seitige (1-α)-Kofidezitervalle für λ sid Itervalle der Form λ λ o bzw. λ λ u mit der Eigeschaft P(λ λ o ) = P(λ λ u ) = 1-α; λ o ud λ u heiße obere bzw. utere Vertrauesschrake für λ zur Sicherheit 1-α ud sid zu bereche aus: λ 1 χ bzw. λ = = o x+,1 α u 1 χ Beispiel 3.18: Nach der ISO-Norm 13408-1 soll i eier Alage zur aseptische Abfüllug bei der Prozessüberprüfug mit icht weiger als 3000 Eiheite der Ausschussateil vo 0,1% icht überschritte werde (Media fill-forderug). Bei eiem Prüflauf mit 3000 Eiheite wurde eie kotamiierte Eiheit festgestellt. Ist die Media fill-forderug erfüllt, we bei der Schätzug der Ausschussquote der ugüstigste Wert (d.h. die zu eier vorgegebee Sicherheit vo 95% berechete obere Vertrauesschrake) ageomme wird? Lösug mit Tabelle: Es sei X die Azahl der Eiheite, die vo de isgesamt =3000 abgefüllte Eiheite kotamiiert sid. Approximativ gilt: X P λ mit λ = p (p ist der Ausschussateil, d.h. die Kotamiierugsrate). Vo X liegt die Realisierug x=1 vor. Zu bereche ist die 95%ige obere Vertrauesschrake λ o für λ. Mit x+ = 4 ud 1-α = 0,95 ist χ x+,1-α = χ 4, 0.95 = 9,488 λ o = χ 4, 0.95/ = x, α W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

6 4,744. Divisio durch ergibt de Schätzwert pˆ = λ o / = 0,158% > 0,1%. Die Media Fill-Forderug ist daher icht erfüllt. 3.5 ÜBUNGSBEISPIELE Eifache Übugsbeispiele: 1. Die achfolgede Tabelle ethält die Gesamtzahl der bis zum Aussterbe abgelegte Puparie für 40 (mit jeweils 15 geschlüpfte Weibche gebildete) Kohorte vo Tsetsefliege (Glossia p. palpalis). Ma stelle die Verteilug der Merkmalswerte durch eie Häufigkeitstabelle ud ei Histogramm dar. Ferer bestimme ma das arithmetische Mittel ud die Stadardabweichug sowie de Media ud die Quartile. (Mittelwert/Stadardabw./Media/Quartile: 60.38, 9.87, 60, 53, 68) 55 79 55 61 55 55 40 7 69 54 51 48 53 61 44 6 50 71 7 51 63 86 5 57 73 74 6 66 6 55 63 7 5 53 65 59 53 69 67 54. Nach eier Kfz-Ufallstatistik ist die Azahl X der Ufälle pro Versicherte ierhalb vo 0 Jahre wie folgt verteilt: X 0 1 3 4 5 6 7 8 9 10 11-0 rel.häufigk.% 10 0 15 10 8 7 6 5 4 3 je 1 Welcher Prozetsatz der Fahrer hat eie über dem arithmetische Mittelwert (über dem Media) vo X liegede Ufallzahl? 3. Ma vergleiche die durch die folgede Stichprobe gegebee Variatio vo X (Spaltöffugsläge i µm) bei diploide ud tetraploide Biscutella laevigata mit Hilfe der etsprechede Box-Plots. (Media/Quartile 5, 3, 6; 30, 8, 3) diploid 7, 5, 3, 7, 3, 5, 5,, 5, 3, 6, 3, 4, 6, 6 tetraploid 8, 30, 3, 9, 8, 33, 3, 8, 30, 31, 31, 34, 7, 9, 30 4. Die Messug der Ozokozetratio währed der Sommermoate ergab für eie Großstadt die i der folgede Tabelle ethaltee Werte (Agabe i 10 - ppm). Ma stelle die Verteilug der Ozokozetratio dar (tabellarisch, grafisch) ud bereche de Mittelwert, die Stadardabweichug, de Media ud die Quartile. (5.1, 1.85, 5.4, 4.1, 6.5) 3.6 1.5 6.6 6.0 4. 6.7.5 5.4 4.5 5.4.5 3.0 5.6 4.7 6.5 6.7 1.7 5.3 4.6 7.4 5.4 4.1 5.1 5.6 5.4 W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013 6.1 7.6 6. 6.0 5.5 5.8 8. 3.1 5.8.6 9.5 3.4 8.8 7.3 1.3 6.9 3. 4.7 3.8 5.9 6.6 4.4 5.7 4.5 7.7

7 5. Ma ehme eie geeigete Klassebildug vor ud stelle die Verteilug vo X (größte Grudblattläge vo Biscutella laevigata i mm) tabellarisch ud graphisch dar. Zusätzlich bestimme ma das arithmetische Mittel, de Media ud die Variaz aus de klassierte Date ud vergleiche die erhaltee Ergebisse mit de direkt aus der Beobachtugsreihe berechete Kegrößewerte. (exakte Werte: 69.13, 8.86, 65) 50 48 75 90 65 50 64 91 3 6 48 5 77 84 15 80 65 6 95 7 85 137 51 67 36 36 78 4 63 70 39 58 97 48 66 70 140 63 138 48 6. Die Sprosshöhe X eier Pflaze sei N(µ, σ )-verteilt. a) Aus eier Stichprobe vom Umfag =5 ergibt sich die Stichprobevariaz s =7714. Ma gebe ei Kofidezitervall zum Niveau 1-α=0.95 für σ a. b) Für de Mittelwert ud die Stadardabweichug vo X wurde mit Hilfe eier Stichprobe vom Umfag =40 die Schätzwerte 96 ud 105 für de Mittelwert bzw. die Stadardabweichug bestimmt. Ma bestimme zum Niveau 1-α=0.95 ei Kofidezitervall für de Mittelwert vo X. ([68.6, 1.]; [6.4, 39.6]) 7. Im folgede wird X als N(µ, σ )-verteilt vorausgesetzt. Welcher Stichprobeumfag ist jeweils zu plae? a) Der mittlere Glykoalkaloidgehalt X (i mg/100 mg Frischgewicht) eier Kartoffelsorte soll mit eier Geauigkeit vo ± 0.4 bei eier Sicherheit vo 99% bestimmt werde. Vo eier Vorutersuchug sei bekat, dass σ ist. b) Das Normgewicht vo 10-jährige Kabe soll auf ± 0.5 kg geau mit eier Sicherheit vo 95% bestimmt werde. Für die Stadardabweichug möge die Abschätzug σ.5 kg zutreffe. (167; 96) 8. Für de Mittelwert ud die Variaz vo eier als ormalverteilt ageommee Variable X wurde mit Hilfe eier Stichprobe vom Umfag =15 die Werte 40 bzw. 10 bestimmt. Ma bestimme ei 95%- Kofidezitervall für de Mittelwert vo X. Um wie viel % größer ist die Itervallläge eies 99%ige Kofidezitervalls? ([38.5, 41.75]; [37.57, 4.43]; 38.8%) 9. Die Masse X (i mg) eier Substaz i eiem Präparat soll absolut auf +/-0,5 geau mit eier Sicherheit vo 95% bestimmt werde. Für die Stadardabweichug möge die Abschätzug s zutreffe. Wie viele Probe müsse utersucht werde, we X als ormalverteilt vorausgesetzt werde ka? (6) 10. Vo eier Messstelle wurde die folgede Werte der Variable X (SO - Kozetratio der Luft i mg/m 3 ) gemeldet: 9, 110, 47, 35, 65, 69, 9, 10. a) Ma bestimme ei 95%-Kofidezitervall für de Mittelwert ud die Stadardabweichug vo X. b) Welcher Midest-Stichprobeumfag müsste geplat werde, um bei gleicher Sicherheit die Mittelwertschätzug mit eier Geauigkeit vo +/-5 durchführe zu köe? (a) [18.39, 75.11]; [.43, 69.05], b) 177) W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

8 11. I eier Studie wurde 33 Persoe mit eiem Präparat behadelt. Der Behadlugserfolg wurde auf eier -stufige Skala mit de Skalewerte "Verbesserug" ud "keie Verbesserug" dargestellt. Es ergab sich bei 13 Persoe eie Verbesserug. Ma bestimme ei 95%iges Kofidezitervall für die Wahrscheilichkeit p eier Verbesserug. Welcher Stichprobeumfag müsste geplat werde, um die Wahrscheilichkeit p mit eier Geauigkeit vo +/- 0,1 ud eier Sicherheit vo 95% schätze zu köe? ([0.7, 0.561]; 97) 1. I eiem Supermarkt wurde 100 Milchpackuge überprüft ud dabei festgestellt, dass i 15 Fälle die Milch im Begriffe war, sauer zu werde. Ma bestimme ei Kofidezitervall zum Niveau 1-α=95% für de Ateil der saure Milchpackuge. ([0.08, 0.]) 13. Die Wahrscheilichkeit für das Auftrete eier Erkrakug soll i eier Risikogruppe mit eier Sicherheit vo 95% ud eier vorgegebee Geauigkeit vo ± 0.05 bestimmt werde. Wie viele Probade beötigt ma für die Studie? (385) 14. Vo eier Pflaze erhielt Medel isgesamt 6 Same, vo dee 44 gelb ud 18 grü gefärbt ware. Ma bestimme ei 95%iges Kofidezitervall für die Wahrscheilichkeit p dafür, dass ei gelber Same gebildet wird. Welcher Stichprobeumfag müsste geplat werde, um die Wahrscheilichkeit p mit eier Geauigkeit vo +/- 0,05 ud eier Sicherheit vo 90% schätze zu köe? ([0.597, 0.83]; 71) Aspruchsvollere Übugsbeispiele: 15. A siebe Patiete wurde der systolische Blutdruck im Sitze (i mm Hg) vor eier Behadlug (Variable X v ) ud achher (Variable X ) gemesse; es ergabe sich die i der folgede Tabelle ageführte Werte. Ma bestimme de Mittelwert ud die Variaz des durch die Differez X - X v ausgedrückte Behadlugseffektes. Wie häge diese Statistike mit de Mittelwerte bzw. Variaze vo X v ud X zusamme? (-1, 190) X v 175 155 195 173 154 180 178 X 140 143 157 170 133 150 170 16. Rutherford ud Geiger studierte die Emissio vo α-teilche, idem sie die Azahl X der i Zeititervalle der Läge 7,5s emittierte α-teilche zählte. Die Auswertug vo 608 Zeititervalle ergab die i der folgede Tabelle zusammegefasste Häufigkeite H. Uter der Aahme, dass X Poisso-verteilt ist, schätze ma de Verteilugsparameter λ ud bestimme die erwartete Häufigkeite E. (λ = 3.867, E-Werte: siehe Tabelle) X H E 0 57 54.54 1 03 10.94 383 407.89 3 55 55.81 4 53 508.37 5 408 393.1 W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

9 6 73 53.44 7 139 140.0 8 45 67.69 9 7 9.09 10 16 11.5 >10 0 5.75 17. I eier Studie über die Behadlug vo akute Herzifarktpatiete wurde 151 Patiete mit Hepari therapiert, vo dee 19 ierhalb vo 8 Tage verstarbe. a) Ma schätze die Wahrscheilichkeit p, dass ei Patiet ierhalb vo 8 Tage ach Herzifarkt stirbt, ud bestimme für p ei 95%- Kofidezitervall. b) Welcher Mideststichprobeumfag ist otwedig, um bei gleicher Sicherheit ei halb so großes Kofidezitervall fü p zu erhalte? (a) approx. 0.079, 0.1787; exakt: 0.0775, 0.1895; b) 1373) 18. Vo eiem metrische Merkmal X liegt eie (fiktive) Zufallsstichprobe aus 100 Messwerte vor. 3.995 6.6 9.445 6.795 7.075 6.987 6.53 4.709.38 4.959 6.46 8.375 6.160 6.307 5.739 3.618 4.118 6.60 5.55 4.413 5.077 7.636 7.939 5.851 5.639 6.099 5.904 6.043 4.869.697 3.18 7.19 6.618 6.038 5.131 6.513 3.17 8.669 6.467 5.05 6.897 3.698 3.868 4.547 3.350 8.394 5.57.390 3.65 5.50 5.673 5.44 5.80 8.657 4.616 5.848 4.487 3.974 4.176 5.165 5.913.393 5.148 3.06 5.987 7.863 6.30 6.371 3.964 7.747 6.67 5.951 7.91 7.83 5.484 3.163 3.916 4.83 3.38 6.17 3.78 7.161 3.904 3.109 5.698 3.317 5.37 6.893 6.35 3.930 5.956 5.886 7.755 6.191 5.734 6.63 6.819 8.910 6.839 4.633 a) Ma lege eie geeiget Klasseeiteilug fest ud stelle die Verteilug vo X mit eier Häufigkeitstabelle dar, die die Klassegreze, die Klassemitte, die absolute ud relative Klassehäufigkeite sowie die Klassehäufigkeitsdichte ethält. b) Ma veraschauliche die Häufigkeitsverteilug mit eiem flächeormierte Histogramm ud zeiche i die Grafik zusätzlich die a die Date agepasste Normalverteilugsdichte ei. c) Ma stelle die Variatio vo X mit Hilfe eies Boxplots dar. Welcher Prozetsatz der Messwerte liegt ierhalb des -fache Iterquartilabstades um de Media? Ma bestimme de Prozetsatz empirisch (d.h. aus de Messdate). Welcher Prozetsatz ergibt mit Hilfe der agepasste Normalverteilug? # R-Script, Aufgabe 18 x <- c( 3.995, 6.6, 9.445, 6.795, 7.075, 6.987, 6.53, 4.709,.38, 4.959, 6.46, 8.375, 6.160, 6.307, 5.739, 3.618, 4.118, 6.60, 5.55, 4.413, 5.077, 7.636, 7.939, 5.851, 5.639, 6.099, 5.904, 6.043, 4.869,.697, 3.18, 7.19, 6.618, 6.038, 5.131, 6.513, 3.17, 8.669, 6.467, 5.05, 6.897, 3.698, 3.868, 4.547, 3.350, 8.394, 5.57,.390, 3.65, 5.50, 5.673, 5.44, 5.80, 8.657, 4.616, 5.848, 4.487, 3.974, 4.176, 5.165, 5.913,.393, 5.148, 3.06, 5.987, 7.863, 6.30, 6.371, 3.964, 7.747, 6.67, 5.951, 7.91, 7.83, 5.484, 3.163, 3.916, 4.83, 3.38, 6.17, W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

30 3.78, 7.161, 3.904, 3.109, 5.698, 3.317, 5.37, 6.893, 6.35, 3.930, 5.956, 5.886, 7.755, 6.191, 5.734, 6.63, 6.819, 8.910, 6.839, 4.633) # Histogramm ud Häufigkeitstabelle grafik <- hist(x, breaks=10, freq=f, xlab="x", ylab="häufigkeitsdichte", mai="flächeormiertes Histogramm, =100") ames(grafik) absh <- grafik$couts relh <- grafik$itesities k <- legth(absh); k uklgr <- grafik$breaks[1:k] b <- uklgr[]-uklgr[1] oklgr <- uklgr + b Klmitte <- grafik$mids relhdichte <- relh/b htab <- cbid(uklgr, oklgr, Klmitte, absh, relh, relhdichte) htab # Häufigkeitstabelle # Eizeiche der agepasste Normalverteilug mw <- mea(x) std <- sd(x) curve(dorm(x, mw, std), col="red", ad=t) # Boxplot boxplot(x) # Ateil zwische -fache IQR um Media - empirisch q5 <- quatile(x, 0.5); q5 q75 <- quatile(x, 0.75); q75 q50 <- quatile(x, 0.5); q50 IQR <- q75 - q5 a <- q50 - *IQR; b <- q50 + *IQR x1 <- x[x < a] x <- x[x > b] 1 <- legth(x1); <- legth(x); <- legth(x) <- -1 -; # Azahl der Merkmalswert i (x50-iqr, x50+iqr) ateil <- /; ateil #Ateil der Merkmalswert i (x50-iqr, x50+iqr) # Ateil zwische -fache IQR um Media - theoretisch q5t <- qorm(0.5, mw, std); q5t q75t <- qorm(0.75, mw, std); q75t q50t <- qorm(0.50, mw, std); q50t IQRt <- q75t - q5t at <- q50t - *IQRt; bt <- q50t + *IQRt ateilt <- porm(bt, mw, std) - porm(at, mw, std); ateilt 19. I eiem Simulatiosexperimet zum Medelsche Kreuzugsversuch vo mischerbige violett-blühede Erbse (F1-Geeratio) wurde 0 Same etomme ud die Azahl X der violett-blühede F-Pflaze gezählt. Bei 80 Wiederholuge des Experimetes ergabe sich folgede Werte für X: 18 19 17 15 1 16 15 15 14 16 14 15 18 14 17 17 15 1 18 18 16 14 16 15 15 14 11 17 14 16 16 15 16 14 17 17 17 15 17 13 17 14 14 16 14 16 14 13 14 13 17 18 15 15 18 15 16 11 13 15 14 13 15 17 17 15 13 11 15 17 15 16 19 13 18 17 13 17 18 16 a) Ma beschreibe die Verteilug vo X tabellarisch ud grafisch. b) Nach der Medelsche Spaltugsregel ist X biomialverteilt mit de Parameter =0 ud p=0.75. Ma ergäze die Verteilugsgrafik durch die theoretische Verteilug vo X. W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013

31 c) Ma bestimme aus de Date de Mittelwert ud die Variaz vo X ud vergleiche diese Kewerte der Häufigkeitsverteilug mit de etsprechede Kewerte der theoretische Verteilug. # R-Script: x <- c( 18, 19, 17, 15, 1, 16, 15, 15, 14, 16, 14, 15, 18, 14, 17, 17, 15, 1, 18, 18, 16, 14, 16, 15, 15, 14, 11, 17, 14, 16, 16, 15, 16, 14, 17, 17, 17, 15, 17, 13, 17, 14, 14, 16, 14, 16, 14, 13, 14, 13, 17, 18, 15, 15, 18, 15, 16, 11, 13, 15, 14, 13, 15, 17, 17, 15, 13, 11, 15, 17, 15, 16, 19, 13, 18, 17, 13, 17, 18, 16) # Häufigkeitstabelle absh <- table(x); absh relh <- absh/legth(x); relh mwerte <- mi(x):max(x); mwerte htab <- cbid(mwerte, absh, relh); htab # theoretische Verteilug - B(0, 0.75) biom <- dbiom(mwerte, 0, 0.75) matrix <- rbid(relh, biom) rowames(matrix) <- c("häufigk. Vert.", "Theoret. Vert.") matrix # Stabdiagramm barplot(matrix, beside=t, col=c("red", "blue"), xlab="az.f-violett", ylab="rel. Häufigk.", mai="häufigkeitsvert. (=80) ud Biomialwahrsch.", leged.text=t) # Häufigkeitspolygo (alterativ zu Stabdiagramm) plot(mwerte, relh[], type="b", xlab="az.f-violett", col="red", ylab="rel. Häufigk.", mai="häufigkeitsvert. (rot) ud Biomialwahrsch. (blau)") lies(mwerte, biom, col="blue", lty=3) # Kewerte mw_x <- mea(x) var_x <- var(x) mw_biom <- 0*0.75 var_biom <- 0*0.75*0.5 kewerte <- matrix(c(mw_x, mw_biom, var_x, var_biom), col=, byrow=f) rowames(kewerte) <- c("häufigk.vert.", "Biomialvert.") colames(kewerte)=c("mittelwert", "Variaz") kewerte W. Timischl: Statistik, Parameterschaetzug_13_Text.doc 18.11.013