Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Aufgabe 1: Grundzüge der Wahrscheinlichkeitsrechnung 19 P. Als Manager eines großen Verlages sind Sie verantwortlich für den Vertrieb der drei Zeitschriften Frau im Glück, Rot in Not und Herz und Schmerz. Aus Statistiken ist Ihnen bekannt, dass jeder zehnte Bundesbürger die Frau im Glück, aber nur fünf Prozent der deutschen Bevölkerung Rot in Not und nur zwei Prozent die Herz und Schmerz lesen. Da alle drei Zeitschriften in unterschiedlichen Druckereien gedruckt werden, unterscheidet sich auch der Anteil der fehlerhaft gedruckten Ausgaben. So liegt der Anteil der fehlerhaften Ausgaben beim Druck der Frau im Glück bei vier Prozent, während der Anteil der fehlerhaften Ausgaben beim Druck von Rot in Not bei zwei Prozent und beim Druck von Herz und Schmerz bei nur einem Prozent liegen. a) Zur Überprüfung der Fehldruckquote wählen Sie zufällig eine Zeitschrift aus. Nach einer eingehenden Analyse der Zeitschrift stellen Sie fest, dass es sich um eine fehlerlose Ausgabe handelt. Wie groß ist die Wahrscheinlichkeit dass es sich bei der Zeitschrift um eine Ausgabe von Herz und Schmerz handelt? b) Sie nehmen an, dass die Anzahl der verkauften Exemplare der drei Zeitschriften unabhängig voneinander sind. Wie groß ist die Wahrscheinlichkeit, dass eine Person alle drei Zeitschriften liest? c) Wie groß ist die Wahrscheinlichkeit, dass eine Person genau zwei der drei Zeitschriften liest? Nehmen Sie auch hier an, dass die Anzahl der verkauften Exemplare der drei Zeitschriften unabhängig voneinander sind. d) Nehmen Sie Stellung zu folgenden Aussagen: (Tipp: Skizzieren Sie die Sachverhalte) (5 PUNKTE) 1. Zwei sich ausschließende (disjunkte) Ereignisse sind immer stochastisch unabhängig. 2. Zwei stochastisch unabhängige Ereignisse sind immer disjunkt.
Aufgabe 2: Zufallsvariablen 18 P. a) Die Verteilungsfunktion einer Zufallsvariable X kann folgendermaßen dargestellt werden: F(x) 1 0,6 0,4 0 1 2 3 x Zeichnen Sie dazugehörige Wahrscheinlichkeitsfunktion. b) Folgende Dichtefunktion einer Zufallsvariablen X sei gegeben: f( x) = 0, 5x 0, 5 für 1< x < a b 1 ) b 2 ) b 3 ) b 4 ) Für welchen Wert von a ist f(x) eine Dichtefunktion? Berechnen Sie den Erwartungswert von X. Verwenden Sie hierfür Ihr Ergebnis aus der Aufgabe b 1. Berechnen Sie die dazugehörige Verteilungsfunktion. Berechnen Sie die Wahrscheinlichkeit, dass X Werte annimmt, die zwischen 1,5 und 4 liegen. Aufgabe 3: Punktschätzung 12 P. Aufgrund von rückläufiger Werbeeinnahmen ist die Zeitschrift Rot in Not seit einigen Monaten in den roten Zahlen. Um eingehendere Analysen vornehmen zu können, wollen Sie zunächst die Anzahl der Seiten mit Werbung ermitteln. Sie nehmen an, dass die Anzahl der Werbeseiten folgende Dichtefunktion hat: 4 λx 3 λ e x für x > 0 f(x) = 3! 0 sonst
Eine zufällige Stichprobe von fünf Ausgaben ergab folgende Anzahl von Werbeseiten: 6 ; 9 ; 5 ; 8 ; 12. a) Leiten Sie den allgemeinen Maximum-Likelihood-Schätzwert für λ her. b) Bestimmen Sie den Schätzwert für diese Stichprobe. c) Aus welchem Grund ist die Schätzfunktion 1 σ ˆ = S = (X X) ungeeignet, um die n 2 2 2 i n i = 1 Varianz der Grundgesamtheit σ ² zu schätzen. (3 PUNKTE) Aufgabe 4: Intervallschätzung 18 P. Die Zeitschrift Frau im Glück ist die erfolgreichste Ihrer Zeitschriften. Da diese Zeitschrift erwartungsgemäß insbesondere von Frauen gelesen wird, interessieren sich besonders Kosmetikfirmen für Anzeigen in dieser Zeitschrift. Aufgrund Ihrer nicht unumstrittenen Stellung im Gesamtunternehmen, sehen Sie sich gezwungen, auf der nächsten Vorstandssitzung eine genauere Analyse der Kosmetikanzeigen in der Frau im Glück zu präsentieren. Aus den letzten fünf Jahrgängen nehmen Sie der Einfachheit halber eine zufällige Stichprobe von 5 Ausgaben (mit Zurücklegen) der Zeitschrift. Dabei ergaben sich für die Anzahl der Seiten mit Kosmetikwerbung folgende Werte. Anzahl der Seiten mit Kosmetikwerbung: 4 ; 5 ; 1 ; 8 ; 2 Die Frau im Glück erscheint monatlich. Gehen Sie des Weiteren davon aus, dass die Anzahl der Seiten mit Kosmetikwerbung normalverteilt ist. a) Bestimmen Sie das 95%-Konfidenzintervall für die durchschnittliche Anzahl der Seiten mit Kosmetikwerbung. b) Berechnen Sie den Punktschätzer für die durchschnittliche Anzahl der Seiten mit Kosmetikwerbung. Beschreiben Sie kurz Vor- und Nachteile der Punktschätzung gegenüber der Methode der Intervallschätzung. (6 PUNKTE) c) Begründen Sie, warum ein Stichprobenumfang, der größer ist als 30, von entscheidender Bedeutung ist für die Angabe eines Konfidenzintervalls für den Mittelwert einer Grundgesamtheit µ. (4 PUNKTE) Aufgabe 5: Parametertests 19 P. Die Absatzzahlen der Herz und Schmerz sind rückläufig. Sie vermuten, dass das Problem darin besteht, dass die Zeitschrift einen zu geringen Bekanntheitsgrad hat. Eine Befragung (mit Zurücklegen) unter 60 zufällig ausgewählten Personen ergab, dass nur 9 Personen die Zeitschrift kannten.
a) Allgemein wird in der Verlagswirtschaft davon ausgegangen, dass eine Zeitschrift nur erfolgreich sein kann, wenn der Bekanntheitsgrad bei mehr als 20 Prozent liegt. Testen Sie, ob der Bekanntheitsgrad der Herz und Schmerz unterhalb der 20-Prozent-Grenze liegt ( α=0,10 ). Interpretieren Sie das Ergebnis. b) Berechnen Sie den P-Value des Tests. c) Um Ihrem Marketingchef besser angreifen zu können, wollen Sie das Ergebnis erhalten, dass der Bekanntheitsgrad kleiner als 20 Prozent ist. Wie groß müsste Ihre Stichprobe mindestens sein, damit Sie diese Aussage treffen können. Gehen Sie davon aus, dass der Bekanntheitsgrad der Stichprobe unverändert bleibt. Aufgabe 6: Tests im linearen Regressionsmodell 20 P. Die Zeitschrift Frau im Glück ist die einzige Zeitschrift, bei der ein Gewinn abfällt. Um auch die anderen beiden Zeitschriften so bald wie möglich in die Gewinnzone zu bringen, entschließen Sie sich, das Erfolgsgeheimnis der Frau im Glück näher zu erforschen. Hierzu führen Sie eine lineare Regression durch. Dabei nehmen Sie an, dass der Absatz der Frau im Glück (ABSATZ in Mio. Stück) vom Verkaufspreis (PREIS in ), von der Anzahl der Werbeseiten (WERBUNG) und von der Existenz eines Mannes auf der Titelseite (TITEL 1: Mann auf Titelseite ; 2: kein Mann auf Titelseite) abhängt. Ordinary Least Squares Dependent Variable ABSATZ Number of Observations 20 Mean of Dep. Variable 4.950 Std. Dev. of Dep. Var. 2.0150 Std. Error of Regr. 1.035 Sum of Squared Residuals 33447 R - squared 0.726 Adjusted R - squared 0.6750 F(???,???)????? Prob. Value for F 0.0000 ============================================================================= Variable Coefficient Std. Error t-ratio Prob t >x Mean of X Std.Dev.of X ----------------------------------------------------------------------------- Constant 7.553 1.668 4.529 0.000 PREIS -1.650????? -2.458 0.026 2.180 0.3978 WERBUNG -0.058 0.112-0.515 0.614 5.700 2.2070 TITEL 2.508 0.522 0.670 0.000 0.750 0.1804 a) Was besagt das Bestimmtheitsmaß? Interpretieren Sie den konkreten Wert für das Bestimmtheitsmaß. b) Führen Sie einen ausführlichen F-Test durch ( α = 0,05 ). Interpretieren Sie das Ergebnis. c) Berechnen Sie den Standardfehler des Preiskoeffizienten. d) Interpretieren Sie die Koeffizienten der Regression und beurteilen Sie die Signifikanz der Koeffizienten ( α=0,05 ).
Aufgabe 7: Verteilungstests 14 P. Ihre Chefin wirft eine provokante These in den Raum: Frauen kaufen andere Zeitschriften als Männer. Diese These verlangt nach einer wissenschaftlichen Analyse. Eine Stichprobe ergab für die Anzahl der Leser der drei Zeitschriften aufgeteilt nach dem Geschlecht folgende Ergebnisse: Zeitschrift Frau im Glück Rot in Not Herz und Schmerz Geschlecht Mann 20 30 30 Frau 50 20 10 a) Testen Sie mithilfe eines geeigneten Tests, ob die Leserpräferenz und das Geschlecht einer Person voneinander abhängen (Signifikanzniveau = 10%). Interpretieren Sie das Ergebnis. b) Begründen Sie, warum die H 0 -Hypothese beim Chi-Quadrat-Unabhängigkeitstest immer wie folgt gebildet wird: (4 PUNKTE) H 0 : Die Zufallsvariablen sind voneinander unabhängig