Modellanpassung und Parameterschätzung. A: Übungsaufgaben

Ähnliche Dokumente
Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

$ % + 0 sonst. " p für X =1 $

Beispiel Zusammengesetzte Zufallsvariablen

Aufgabe 1 10 ECTS. y i x j gering mittel hoch n i Hausrat KFZ Unfall Reiserücktritt n j

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = ,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Statistische Thermodynamik I Lösungen zur Serie 1

Stochastische Eingangsprüfung,

Klausur: Einführung in die Statistik

9. Schätzen und Testen bei unbekannter Varianz

Stochastik für WiWi - Klausurvorbereitung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Ein möglicher Unterrichtsgang

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/

Teil I Beschreibende Statistik 29

Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2010/2011. Aufgabe 1

R ist freie Software und kann von der Website.

1 Statistische Grundlagen

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

i x k k=1 i u i x i v i 1 0, ,08 2 0, ,18 3 0, ,36 4 0, ,60 5 1, ,00 2,22 G = n 2 n i=1

Statistik im Bachelor-Studium der BWL und VWL

5. Schließende Statistik Einführung

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

, dt. $+ f(x) = , - + < x < +, " > 0. " 2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) =

Monte-Carlo Simulation

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), Michael Roers (Übung),

Versuch: Zufälliges Ziehen aus der Population

Kapitel 4: Binäre Regression

Kapitel 18. Die Maximum-Likelihood Methode Grundidee

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Stetige Verteilungsmodelle

Zufallsgrößen. Vorlesung Statistik für KW Helmut Küchenhoff

Unsupervised Kernel Regression

Jetzt lerne ich Stochastik für die Oberstufe

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/31

Bei vielen Zufallsexperimenten interessiert man sich lediglich für das Eintreten bzw. das Nichteintreten eines bestimmten Ereignisses.

Statistik I für Betriebswirte Vorlesung 5

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35

Präsenzübungsaufgaben zur Vorlesung Elementare Sachversicherungsmathematik

RUPRECHTS-KARLS-UNIVERSITÄT HEIDELBERG

Ausarbeitung des Seminarvortrags zum Thema

Mini-Skript Wahrscheinlichkeitstheorie und Statistik

Konfidenzintervalle so einfach wie möglich erklärt

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis:

Finanzmarktökonometrie: Einführung in die Optionsbewertung Sommersemester 2014

Übungsrunde 7, Gruppe 2 LVA , Übungsrunde 7, Gruppe 2, Markus Nemetz, markus.nemetz@tuwien.ac.at, TU Wien, 11/2006

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

3.3. Aufgaben zur Binomialverteilung

Schätzer (vgl. Kapitel 1): Stichprobenmittel X N. Stichprobenmedian X N

Statistische Auswertung der Daten von Blatt 13

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. . Studiengang.

8. Februar Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

Weiterbildungskurs Stochastik

Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall

Risikomessung und Value at Risk Wintersemester 2013/14

Statistik II für Betriebswirte Vorlesung 3

Nachholklausur STATISTIK II

Monte Carlo Methoden in Kreditrisiko-Management

13.5 Der zentrale Grenzwertsatz

Monty Hall-Problem. Wochen 3 und 4: Verteilungen von Zufallsvariablen. Lernziele. Diskrete Verteilungen

Die Binomialverteilung

2. Eindimensionale (univariate) Datenanalyse

Multivariate Statistik

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

Statistik im Versicherungs- und Finanzwesen

Sozialwissenschaftliche Methoden und Statistik I

Einführung in die Statistik

Einführung in die Geostatistik (2) Fred Hattermann (Vorlesung), Michael Roers (Übung),

1 Von den Ereignissen U und V eines Zufallsexperiments kennt man die Eigenschaften (1) bis (3) :

Eine Einführung in R: Statistische Tests

Musterlösung zum Projekt 3: Splice Sites

Statistik I für Betriebswirte Vorlesung 11

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

3 Monte-Carlo-Simulationen

Stichprobenauslegung. für stetige und binäre Datentypen

Business Value Launch 2006

Beispiel: Sonntagsfrage. Einführung in die induktive Statistik. Statistische Tests. Statistische Tests

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50, ,5 51,7 48,8

Verteilungsmodelle. Verteilungsfunktion und Dichte von T

Kapitel 13 Häufigkeitstabellen

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Beispiele zur UE Wirtschaftsstatistik 1 bei Nagel

Wiederholung: Statistik I

Einfache Statistiken in Excel

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

W-Rechnung und Statistik für Ingenieure Übung 11

Risiko und Symmetrie. Prof. Dr. Andrea Wirth

Einführung in Statistik und Messwertanalyse für Physiker

Credit Metrics. Wird in erster Linie für die Evaluierung von Bond Portfolios verwendet. (Siehe Crouhy et al. (2000), J.P.Morgan Inc.

Modellgestützte Analyse und Optimierung Übungsblatt 4

Überblick über die Tests

Kugel-Fächer-Modell. 1fach. 3fach. Für die Einzelkugel gibt es 3 Möglichkeiten. 6fach. 3! Möglichkeiten

Fragestellungen der Schließenden Statistik

4. Erstellen von Klassen

Multinomiale logistische Regression

Kursthemen 12. Sitzung. Spezielle Verteilungen: Warteprozesse. Spezielle Verteilungen: Warteprozesse

Analog definiert man das Nichteintreten eines Ereignisses (Misserfolg) als:

B 2. " Zeigen Sie, dass die Wahrscheinlichkeit, dass eine Leiterplatte akzeptiert wird, 0,93 beträgt. (genauerer Wert: 0,933).!:!!

Transkript:

7 Modellanpassung und Parameterschätzung 1 Kapitel 7: Modellanpassung und Parameterschätzung A: Übungsaufgaben [ 1 ] Bei n unabhängigen Wiederholungen eines Bernoulli-Experiments sei π die Wahrscheinlichkeit eines Erfolges und x i, i = 1,2,...,n das Resultat des i-ten Experiments (x i = 1 bei Erfolg, x i = 0 bei Misserfolg). Welche der folgenden Aussagen sind WAHR? Kreuzen Sie sie an. a) Der Maximum-Likelihood-Schätzer des Parameters π der Binomialverteilung ist ˆπ = x n, d.h. gleich dem Anteil der Erfolge bei n Versuchen. b) Der Standardfehler des Schätzers von π ist π(1 π)/n. c) Der Standardfehler des Schätzers von π ist eine Zufallsvariable. d) Bei der ML Methode erhält man denselben Schätzer für π wie mit der Methode der Momente. e) Der Standardfehler des Schätzers von π wird durch x/ n geschätzt. [ 2 ] Die Zufallsvariable X sei exponentialverteilt. Es wurde eine Stichprobe der Größe n = 64 gezogen und in R unter x abgespeichert. Ihnen ist folgender R Ausdruck gegeben: > sum(x) [1] 107.0801 > sum(x^2) [1] 222.0044 Schätzen Sie µ = 1 und berechnen Sie den geschätzten Standardfehler des Schätzers von µ. λ Der Wert des Schätzers von µ ist: Der Wert des geschätzten Standardfehlers des Schätzers von µ ist: Bestimmen Sie den Bias und den geschätzten mittleren quadratischen Fehler. Bias(x) = MQF =

7 Modellanpassung und Parameterschätzung 2 [ 3 ] Die ersten 20 Ziffern x i, i = 1,2,...,20 einer Zufallszahlentafel sind: 0,3,4,7,9,3,6,3,8,6,3,4,6,9,4,7,3,7,6,1 Bei einer Zufallszahlentafel treten die Ziffern 0 9 mit der selben Wahrscheinlichkeit auf. a) Berechnen Sie x. x : b) Wie groß ist der Fehler des Schätzers x für den Erwartungswert E X? (Hinweis: Fehler(x)= x E X) Fehler des Schätzers x : c) Wie groß ist der Bias von x? Bias(x) : d) Wie groß ist der geschätzte Standardfehler von x? ŜE(x) :

7 Modellanpassung und Parameterschätzung 3 [ 4 ] An 1000 zufällig ausgewählten Betriebstagen eines Großrechners wird die Anzahl der Zusammenbrüche X des Betriebssystems pro Tag ermittelt: i Anzahl der Zusam- Häufigkeit menbrüche/tag x 1 0 670 2 1 269 3 2 53 4 3 7 5 4 1 Es wird vermutet, die Zahl der Zusammenbrüche X des Betriebssystems pro Tag sei poissonverteilt. Schätzen Sie den Parameter λ und die Standardabweichung des Schätzers (geschätzter Standardfehler). Der Schätzer von λ ist: Der geschätzte Standardfehler des Schätzers von λ ist: [ 5 ] Welche der folgenden Aussagen sind wahr? Kreuzen Sie sie an. a) Der Schätzer eines unbekannten Parameters einer Verteilung ist eine Zufallsvariable und besitzt deshalb selber eine Verteilung. b) Die Varianz des Fehlers Var( ˆθ θ) eines Schätzers ist gleich der Varianz des Schätzers Var( ˆθ). c) Hat der Schätzer einen Bias, so wird der zu schätzende Parameter im Durchschnitt weder über- noch unterschätzt. d) Bias( ˆθ) = E( ˆθ θ) e) Der zu schätzende Parameter liegt immer im Intervall Schätzer ± Standardfehler.

7 Modellanpassung und Parameterschätzung 4 [ 6 ] Die Parameter der Normalverteilung werden geschätzt durch ˆµ = x = 1 xi ˆσ 2 = S 2 = 1 (xi x) 2 n n Welche der folgenden Aussagen sind WAHR? Kreuzen Sie sie an. a) Der Schätzer x ist erwartungstreu. b) Der geschätzte Standardfehler von S 2 wird geschätzt durch S 2 2(n 1)/n 2. c) Der Bias von S 2 ist 0. d) Für x gilt: geschätzter mittlerer quadratischer Fehler ist S2 n. e) Der geschätzte Standardfehler von x wird geschätzt durch σ n. [ 7 ] Welche der folgenden Begriffe (bzw. Symbole) sind Zufallsvariablen? Kreuzen Sie sie an. a) ˆµ b) σ 2 c) Bias d) Fehler des Schätzers, z.b. ˆµ µ e) E X

7 Modellanpassung und Parameterschätzung 5 [ 8 ] Ein fairer Würfel wird n-mal geworfen. Die entsprechende (unvollständige) Häufigkeitstabelle enthält die relativen Häufigkeiten n i n und die relativen kumulierten Häufigkeiten k i n, i = 1,...,6. Runden Sie die Ergebnisse auf 3 Stellen. n i k i i x i n n 1 1 0.14 2 2 3 3 0.10 0.40 4 4 5 5 0.15 0.80 6 6 Berechnen Sie den Mittelwert der Stichprobe x. x : Geben Sie den Fehler von x an, d.h. x E X. Fehler (x): Berechnen Sie die Varianz des Schätzers. Var (x): Berechnen Sie die geschätzte Varianz des Schätzers. Var (x): Wie groß ist der Bias von x? Bias (x): [ 9 ] Eine Grundgesamtheit besitzt hinsichtlich der Variablen X eine N(µ,σ 2 )-Verteilung. Aus der Grundgesamtheit wird eine Zufallsstichprobe vom Umfang n > 2 gezogen. x bezeichnet dabei das arithmetische Mittel der Variablen X in der Stichprobe. Welche der folgenden Aussagen sind WAHR? Kreuzen Sie sie an. a) E(x) = µ b) Bias(x) = E (x) µ = 0 c) Für den Schätzer x des Erwartungswertes µ gilt: x µ σ n N(0,1) d) Standardfehler von x = σ n e) MQF(x) = Bias 2 + Standardfehler 2 = σ 2 n

7 Modellanpassung und Parameterschätzung 6 [ 10 ] Bei einer Stichprobe der Größe 100 wurden als Stichprobenmittelwert x = 6 und als Stichprobenvarianz S 2 = 9 geschätzt. Wie groß ist die geschätzte Varianz des Schätzers? Var(x) : Wie groß ist der Standardfehler? Standardfehler : Wie groß ist der Bias von x? Bias (x): Wie groß ist der geschätzte mittlere quadratische Fehler des Schätzers des Erwartungswertes E X? MQF = [ 11 ] Gegeben sei die Dichtefunktion einer Zufallsvariablen X: { a für 1 x < 0 f (x) = 1 a für 0 x 1 0 sonst Der Parameter a soll mit Hilfe der Maximum-Likelihood-Methode aus einer Stichprobe der Größe n geschätzt werden. Dabei sei m die Anzahl der negativen Werte in der Stichprobe. Hinweis: Unter Stichprobe der Größe n verstehen wir eine Folge von n unabhängigen Ziehungen, die die Unabhängigkeit der entsprechenden n Zufallsvariablen nach sich zieht: f (x 1,x 2,...,x n a) = n f (x i a). Geben Sie die Likelihoodfunktion an, und bestimmen Sie den Schätzer für a nach der Maximum- Likelihood-Methode. L(a x 1,x 2,...,x m,...,x n ) = â =

7 Modellanpassung und Parameterschätzung 7 [ 12 ] Die Zufallsvariable X sei exponentialverteilt mit dem Parameter λ. Die Ergebnisse einer Stichprobe seien x 1,x 2,...,x n. Geben Sie die zugehörige Log-Likelihood- Funktion logl = logl(λ x 1,x 2,...,x n ) sowie die Ableitungsfunktion von logl nach λ an. logl = d logl dλ = [ 13 ] Nehmen Sie an, eine Poissonverteilung mit dem Parameter λ sei ein gutes Modell für die folgenden Beobachtungen: 0,3,2,1,5,6,3,0,1,0,2,0,4,3,1,1. a) Berechnen Sie aus den Daten den Wert des Schätzers λ b) Berechnen Sie) aus den Daten den Wert desgeschätzten mittleren quadratischen Fehler des Schätzers (also MQF (ˆλ ). ) a) λ = b) MQF (ˆλ = [ 14 ] Gegeben sei die Dichtefunktion einer Zufallsvariablen X: { f (x) = α x α 1 für 0 x 1,α > 0 0 sonst Der Parameter α soll mit Hilfe der Maximum-Likelihood-Methode aus einer zufälligen Stichprobe x 1,x 2,...,x n geschätzt werden. a) Geben Sie die Likelihoodfunktion L(α x 1,x 2,...,x n ) an. b) Bestimmen Sie α ML, den Schätzer für α nach der Maximum-Likelihood-Methode. c) Bestimmen Sie α MM, den Schätzer für α nach der Methode der Momente. L(α x 1,x 2,...,x n ) = α ML = α MM =

7 Modellanpassung und Parameterschätzung 8 [ 15 ] Betrachten Sie als Grundmodell die Altersverteilung der Bewohner der Bundesrepublik Deutschland im Jahre 2000. Das Alter sei in Jahren von 1 bis 100 angegeben. Nehmen Sie an, dass Sie diese Verteilung durch ein Histogramm mit K Klassen approximieren wollen und dass Sie gegebenenfalls Stichproben zur Schätzung verwenden. Welche der folgenden Aussagen sind WAHR? Kreuzen Sie diese an. a) Falls eine Totalerhebung zur Verfügung steht, ist nur der Fehler durch Approximation zu berücksichtigen. b) Der Fehler durch Approximation nimmt mit wachsender Klassenzahl ab. c) Der Fehler durch Schätzung hängt von der Stichprobe ab und ist daher eine Zufallsvariable. d) Wenn eine Stichprobe verwendet wird, um die Altersverteilung zu schätzen, ist nur der Fehler durch Schätzung zu berücksichtigen. e) Beide Fehler, der Fehler durch Approximation und der Fehler durch Schätzung nehmen mit wachsender Klassenzahl ab. [ 16 ] Welche der folgenden Aussagen sind WAHR? Kreuzen Sie sie an. a) Der Fehler durch Approximation ist eine Zufallsvariable. b) In der Regel wird der Fehler durch Schätzung mit steigender Anzahl der Parameter kleiner. c) Modelle mit vielen Parametern sind flexibler und sind daher in jedem Fall Modelle mit wenigen Parametern vorzuziehen. d) Der Gesamtfehler setzt sich aus dem Fehler durch Approximation und dem Fehler durch Schätzung zusammen. e) Der Fehler durch Approximation ist Null, wenn das Grundmodell zur approximierenden Modellfamilie gehört. [ 17 ] Es sei folgende Dichtefunktion gegeben: { α 2 x e αx 2 x > 0,α > 0 f (x) = 0 x 0 a) Geben Sie die Log Likelihoodfunktion an. Log Likelihoodfunktion = b) Berechnen Sie den ML Schätzer für α. α =

7 Modellanpassung und Parameterschätzung 9 [ 18 ] Welche der folgenden Aussagen sind WAHR? Kreuzen Sie sie an. a) Der Maximum Likelihood Schätzer eines Parameters ist der Wert des Parameters, der den Beobachtungen die größte Wahrscheinlichkeit gibt. b) Der Maximum Likelihood Schätzer eines Parameters stimmt niemals mit dem Schätzer nach der Methode der Momente überein. c) Maximum Likelihood-Schätzer haben niemals einen Bias. Daher schätzt man mit der ML Methode den Parameter immer genau richtig. d) Der Schätzer eines Parameters nach der Methode der Momente ist eine Zufallsvariable. e) Der Schätzer eines Parameters sollte eine möglichst kleine Streuung besitzen und im Mittel den Parameter weder unter- noch überschätzen. [ 19 ] Gegeben sei die Zufallsvariable X mit folgender Dichtefunktion: { λ f (x) = 2 x e λ x x 0,λ > 0 0 sonst a) Geben Sie die Log Likelihoodfunktion an. Log Likelihoodfunktion = b) Berechnen Sie den ML Schätzer für λ. λ =

7 Modellanpassung und Parameterschätzung 10 B: Klausuraufgaben [ 20 ] II07S In R liegt der Datensatz Corngewicht vor. In diesem ist das tatsächliche Gewicht von 300 Cornflakes- Packungen, die mit 500 g gefüllt sein sollten, abgespeichert. Gehen Sie davon aus, dass das Gewicht normalverteilt ist. Folgende R-Ausdrücke liegen vor: > sum(corngewicht) [1] 149908.9 > sum((corngewicht-mean(corngewicht))^2) [1] 2630.44 Berechnen Sie den Schätzer von µ und den geschätzten Standardfehler von ˆµ. µ = ŜE( µ) = [ 21 ] IV07S Die Verteilung einer stetigen Zufallsvariablen X hänge von einem Parameter α ab und es gelte E(X) = α. Es liegen die folgenden 10 Beobachtungen vor, die in R unter dem Namen x gespeichert wurden: α 1 > x [1] 2.0 1.1 6.5 1.4 5.8 1.4 1.5 1.8 4.8 4.9 > sum(x) [1] 31.2 > sum(x^2) [1] 137.56 Verwenden Sie die Methode der Momente, um den Parameter α zu schätzen. α = [ 22 ] II07S1 Welche der folgenden Aussagen sind WAHR? Kreuzen Sie sie an. a) Ein Histogramm vermittelt einen Eindruck, wie die zu schätzende Dichtefunktion aussehen könnte. b) Jedes Histogramm hat alle Eigenschaften einer Dichtefunktion. c) Ein normiertes Histogramm ist nichtnegativ und die Summe aller Flächen ist Eins. d) Ein normiertes Histogramm kann verwendet werden, um gewisse Wahrscheinlichkeiten zu schätzen. e) Die Wahl der Klassen für ein Histogramm und inbesondere die Anzahl der Klassen ist unbedeutend für die Güte und damit die Aussagekraft eines Histogramms.

7 Modellanpassung und Parameterschätzung 11 [ 23 ] IV07S Es sei X eine diskrete Zufallsvariable mit der Wahrscheinlichkeitsfunktion { θ(1 θ) x x = 0,1,2,... P(x) = 0 sonst Nehmen Sie an, dass Beobachtungen x 1,x 2,...,x n gegeben sind. Bestimmen Sie den Maximum Likelihood Schätzer von θ. θ =

7 Modellanpassung und Parameterschätzung 12 C: Lösungen 1) a, b, d 2) 1.673 ; 0.209 ; 0 ; 0.044 3) 4.95 ; 0.45 ; 0 ; 0.55 4) 0.4 ; 0.02 5) a, b, d 6) a, b, d 7) a, d 8) 3.71 ; 0.21 ; 2.917 n 9) a, b, c, d, e 10) 0.09 ; 0.3 ; 0 ; 0.09 ; 2.866 n ; 0 11) a m (1 a) n m 12) nlogλ λ n x i ; n λ n 13) 2 ; 0.125 14) α n n 15) a, b, c x α 1 x i i ; n n ; logx i x 1 x 16) d, e 17) nlogα + nlog2 + n logx i α n xi 2 ; 18) a, d, e 19) 2nlogλ + n logx i λ n x i ; 20) 499.696 ; 0.171 2n n x i n n xi 2 21) 1.472 22) a, c, d 23) 1 1 + x