Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2011/12 Aufgabe 1 Übungsleiter Peter stellt seinen Studierenden gerne Fragen, um sie zur Mitarbeit zu motivieren. Er wartet jedoch seiner Meinung nach jedesmal unnötig lange auf Wortmeldungen. Aus Erfahrung weiß er, dass die Zeit zwischen zwei Wortmeldungen im Mittel 5 Minuten beträgt. a) Wie und mit welchem Parameter ist die Wartezeit zwischen zwei Wortmeldungen verteilt? b) Wie wahrscheinlich ist es, dass Peter länger als 8 Minuten auf eine Wortmeldung wartet? c) Wie wahrscheinlich ist es, dass er zwischen 4 und 6 Minuten auf eine Wortmeldung wartet? Ein Kollege von Peter macht ihn darauf aufmerksam, dass es besser wäre, die Anzahl von Wortmeldungen innerhalb von 10 Minuten zu betrachten. Peter weiß, dass in 10 Minuten durchschnittlich 2 Wortmeldungen kommen. d) Wie und mit welchem Parameter ist die Anzahl der Wortmeldungen in 10 Minuten verteilt? e) Stellen Sie zur Schätzung des Parameters aus Teilaufgabe d) die Likelihood auf (nicht ausrechnen!). Wie müssen Sie weiter vorgehen, um eine ML-Schätzung des Parameters durchzuführen? (nur Schritte beschreiben, keine Rechnungen!) Peter kann eine Frage mit 80% Wahrscheinlichkeit beantworten. Insgesamt werden ihm 10 Fragen gestellt. f) Wie und mit welchen Parametern ist die Anzahl der beantworteten Fragen verteilt? g) Wie groß ist die Wahrscheinlichkeit, dass er genau 4 Fragen beantworten kann?
Aufgabe 2 Herr Dr. Klöbner lässt im Laufe eines 90 minütigen Vollbads im Mittel seine Gummiente 54-mal zu Wasser (die sofort von seinem Badepartner, Herrn Müller-Lüdenscheid, wieder herausgefischt wird). a) Wie und mit welchem/n Parameter(n) ist die Zufallsvariable X Häufigkeit, mit der die Ente pro Stunde in die Badewanne gesetzt wird verteilt? Ermitteln Sie außerdem die Standardabweichung von X. b) Wie groß ist die Wahrscheinlichkeit, dass Herr Dr. Klöbner in den ersten 60 Minuten des Vollbads die Ente mindestens 40 mal ins Wasser setzt? Verwenden Sie hierzu eine geeignete Approximation (überprüfen Sie auch explizit, ob die Approximationsregeln erfüllt sind). c) Manchmal baden die beiden Herren noch eine halbe Stunde länger. Während der letzten fünf Vollbadverlängerungen hat Herr Dr. Klöbner die Ente in diesen 30 Minuten 8-mal, 9-mal, 13-mal, 12-mal und 8-mal zu Wasser gelassen. Ermitteln Sie ein (approximatives) 95%-iges Konfidenzintervall für den Mittelwert. d) Welches Stichprobenmittel hätten Sie basierend auf den ursprünglichen Angaben erwartet? Würden Sie auf Grund der Ergebnisse aus Teilaufgabe c) noch davon ausgehen, dass die durchschnittliche Häufigkeit, mit der die Ente ins Wasser gesetzt wird, (proportional) zu den ersten 90 Bademinuten gleich geblieben ist (kurze Begründung)?
Aufgabe 3 Hobby-Gourmetkoch Paul Délicieux wagt den Schritt in die Gastronomie. Seinen wöchentlichen Bedarf an 420 Austern der Sorte B bezieht er zu exakt gleichen Teilen von den zwei Großhändlern Remy und Linguini. Am Tag der Lieferung muss er entsetzt feststellen, dass insgesamt 126 Stück nicht der bestellten Sorte entsprechen. Dabei wurden 1/3 der Meeresfrüchte der falschen Sorte von Händler Remy geliefert. In der Hoffnung, dass die Gäste den Unterschied nicht bemerken, serviert Paul je eine Auster als Vorspeise. a) Erstellen Sie die komplette Kontingenztabelle für Händler vs. Sorte mit den in der Stichprobe vorgefundenen Häufigkeiten. [Ersatzergebnis: Falls Sie die Teilaufgabe nicht lösen konnten (bitte nur dann), verwenden Sie im Folgenden die nachstehende Tabelle als Ersatz:] Händler Sorte B B Remy 180 100 Linguini 150 120 b) Wie groß ist die Wahrscheinlichkeit, dass eine zufällig ausgewählte Auster von Linguini stammt und nicht der Sorte B angehört? c) Wie groß ist die Wahrscheinlichkeit, dass eine zufällig ausgewählte Auster der Sorte B angehört, wenn sie von Remy geliefert wurde? d) Erstellen Sie nun eine Tabelle mit den Häufigkeiten, die Paul Délicieux erwartet hätte, wenn die betrachteten Variablen voneinander unabhängig wären. e) Überprüfen Sie mit einer Irrtumswahrscheinlichkeit von 5% die Behauptung, dass die Anzahl falsch gelieferter Austern vom Händler abhängt.
Aufgabe 4 Für die Dissertationen von fünf deutschen Politikern liegen die Seitenanzahl (X) und die Anzahl an Seiten unter Plagiatsverdacht (Y) vor. Politiker i 1 2 3 4 5 Seitenanzahl X 322 168 59 432 213 Anz. verdächtig Y 106 100 43 208 111 Das Stichprobenmittel für die Seitenanzahl X betrug für diese fünf Arbeiten 238,8 Seiten. Mit einer linearen Regression der Form Y i = α 0 + α 1 x i + U i (mit U i N(0, σ 2 ) und stochastisch unabhängig) wurde der Einfluss der Seitenanzahl auf die Anzahl an verdächtigen Seiten geschätzt. Mit Hilfe der KQ-Methode ergab sich hierbei folgendes Ergebnis: ˆα 0 = 22, 6447 und ˆα 1 = 0, 3809 a) Interpretieren Sie den Wert für den Parameterschätzer ˆα 1. b) Ermitteln Sie die geschätzte Residuenvarianz und den Standardfehler (d.h. die Stichprobenstandardabweichung) für ˆα 1. Fertigen Sie hierfür zunächst eine geeignete Arbeitstabelle an. c) Ein Blogger behauptet, dass die Anzahl verdächtiger Seiten mit jeder zusätzlichen Seite um mindestens 0,25 steigt. Führen Sie einen geeigneten Test mit einer Irrtumswahrscheinlichkeit von 10% durch um zu klären, ob Sie ihm Recht geben können. [Falls Sie in b) kein Ergebnis ermitteln konnten, verwenden Sie als Standardfehler 0,09]. Aus einer etwas umfangreicheren Analyse (n=14) liegen nun Ergebnisse als R-Output vor: Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 28.3459 26.7308 1.060 0.3098 Seitenz 0.2912 0.1119 2.602 0.0232 * --- d) Wie lautet die Nullhypothese zum t value für Seitenz (vgl. obigen R-Output)? Stellen Sie für den Parameterschätzer zu Seitenz die zugehörige Testsituation grafisch dar. Markieren Sie den kritischen Bereich und den z-wert für das beobachtete α 1.
Lösung zu Aufgabe 1 a) X exp( 1 /5) b) P (X > 8) = 0, 2019 c) P (4 X 6) = 0, 1481 d) Y Poi(2) e) L = n i=1 f(λ; X) = n λ X exp{ λ} i=1 X! Weiteres Vorgehen: 1. Loglikelihood 2. Scorefunktion=0/Maximieren: Ableiten und =0 setzen f) Z Bin(10; 0, 8) g) P (X = 4) = 0, 0055
Lösung zu Aufgabe 2 a) X P oi(36) b) Approximation: X N(36, 36) P (X 40) = 0, 281 c) KI: [7,09; 12,91] d) Y: Häufigkeit, mit der die Ente in der Verlängerung ins Wasser gesetzt wird. E(X) = 54 E(Y ) = 1 E(X) = 18 3 Da 18 größer als die KI-Obergrenze aus c) ist, kann man davon ausgehen, dass die Ente in der Verlängerung seltener zu Wasser gelassen wird.
Lösung zu Aufgabe 3 a) B B Σ X 168 42 210 Y 126 84 210 294 126 420 b) P (Y B) = 0.2 c) P (B X) = 0.8 d) B B Σ X 147 63 210 Y 147 63 210 294 126 420 e) χ 2 = 20 > χ 2 0.95 (1) = 3.841 Folglich Ablehnung der H 0 : p ij = p i. p.j, d.h. es kann auf einen Zusammenhang zwischen Händler und der Anzahl falsch gelieferter Austern geschlossen werden.
Lösung zu Aufgabe 4 a) Mit jeder zusätzlichen Seite steigt die Anzahl an Seiten unter Plagiatsverdacht um 0,38. b) ˆσ 2 = 737, 4 V ar( ˆα 1 ) = 0, 095 c) Nullhypothese: α 1 < 0, 25 vs. α 1 0, 25 Entscheidungsregel: ˆα 1 α 0 1 > t 1 α;n 2 V ar( ˆα 1 ) Teststatistik: z = 1, 38 < t 1 α;n 2 = 1, 64 Die Nullhypothese wird nicht abgelehnt. Die Daten stützen die Aussage des Bloggers nicht ausreichend. d) Nullhypothese: α 1 = 0 Skizze: Dichte 0.0 0.1 0.2 0.3 0.4 0.0232/2 2.602 4 2 0 2 4 (α^ 1 α10 ) ^ Var(α^ 1 )