Statistik Zusätzliche Beispiele WS 2018/19 Blatt 3: Schließende Statistik 1. I Ein Personalchef führt so lange Vorstellungsgespräche durch bis der erste geeignete Bewerber darunter ist und stellt diesen an. Bei der letzten Stellenvergabe führte er fünf Gespräche. Schätzen Sie den wahren, aber unbekannten Parameter p, also den Anteil der geeigneten Bewerber mittels Maximum-Likelihood-Methode. 2. I Der Aktienkurs wurde an fünf Tagen beobachtet. Schätzen Sie daraus den Erwartungswert und die Volatilität des Aktienkurses, wenn Sie unterstellen können, dass der Aktienkurs normalverteilt ist a) erwartungstreu und b) mit Hilfe der Maximum-Likelihood-Methode. 12,5 18 10,2 14 16,3 3. Zur Beschreibung der wirtschaftlichen und sozialen Lage von BWL-Studierenden einer Universität wurden 201 Studenten zufällig ausgewählt und befragt. Die befragten Studenten gaben ihre zeitliche Gesamtbelastung durch Studium und Erwerbstätigkeit während der Vorlesungszeit mit durchschnittlich 42,8 Stunden pro Woche an; die Standardabweichung der erhobenen Daten betrug dabei 11,35 Stunden. Die zeitliche Belastung wird als normalverteilt angenommen. a) Bestimmen Sie das nach oben begrenzte 90-%-Konfidenzintervall für µ. b) Zu welchem Konfidenzniveau gehört das mit 40 Stunden und 43 Minuten nach unten begrenzte Intervall für µ? 4. In einem Seminar soll im Rahmen eines Projektes eine Studie über das Wahlverhalten der Steirer erarbeitet werden. 350 zufällig ausgewählte Steirer wurden unter anderem danach befragt, ob sie mit den landespolitischen Entscheidungen der Landesregierung zufrieden seien. 84 Befragte beantworteten diese Frage mit einem: Ja. a) Welchen Stichprobenumfang würden Sie in der Vorbereitungsphase der Erhebung empfehlen, wenn noch keine Informationen über den Stichprobenanteil vorliegen und die Forderung gestellt ist, dass das Konfidenzintervall höchstens die Länge 0,08 bei einem Konfidenzniveau von 0,99 haben soll? b) Welchen Mindeststichprobenumfang empfehlen Sie, wenn Sie die von den Studenten bereits durchgeführte Erhebung als Vorabinformation nutzen? Statistik Zusätzliche Beispiele Blatt 3 1 WS 2018/19
5. a) Von 320 befragten Personen gaben 104 an, im Vorjahr eine Auslandsreise gemacht zu haben. Bestimmen Sie ein zweiseitiges Konfidenzintervall für den Anteilswert p der Auslandsreisenden des Jahres 2004. Niveau 90 % (Niveau 99 %) b) Geben Sie ein nach oben abgeschlossenes einseitiges 90-Prozent-Konfidenzintervall an und interpretieren Sie ihr Ergebnis! c) Führen Sie dieselbe Rechnung wie in a) durch, wenn von 32.000 Befragten 10.400 angaben, im Vorjahr eine Auslandsreise unternommen zu haben. Wie ändert sich das Konfidenzintervall? 6. Wie viele Daten muss man (im ungünstigsten Fall) erheben, um einen Anteilswert eines Merkmals mit einer Sicherheit von 90 Prozent auf plus/minus einen Prozentpunkt bestimmen zu können? 7. Die Zeitschrift NEUES schreibt: Aufgrund einer Befragung von 800 Studierenden konnten wir feststellen, dass 23,7 Prozent (plus/minus 3 Prozentpunkte) der Studenten ihr Studium vorwiegend selbst finanzieren. Welche Treffsicherheit hat (zu welchem Niveau gehört) dieses Konfidenzintervall? 8. Eine Zufallsgröße unterliege einer Normalverteilung N (µ; 6). Eine Stichprobe vom Umfang n = 49 ergab den Mittelwert 56,9. a) Testen Sie zum Niveau α = 0,1 die Nullhypothese H 0 : µ = 55 gegen H 1 : µ 55 b) Innerhalb welcher Grenzen muss der beobachtete Mittelwert liegen, damit die Nullhypothese akzeptiert wird? 9. Eine Zufallsgröße X sei N(µ; 3)-verteilt. a) Testen Sie zum Niveau α = 0,01 die Hypothese H 0 : µ 5 aufgrund einer Stichprobe vom Umfang n = 400, die einen Mittelwert von 5,19 ergab. b) Wie ist zu den Niveaus α = 0,25 (bzw. α = 0,001) zu entscheiden? c) Zu welchem Signifikanzniveau gehört der realisierte Mittelwert von 5,19, d. h. für welches α ist dieser die Grenze des kritischen Bereiches für den Mittelwert? d) Der wahre Erwartungswert µ wahr sei nun 5,2, die Nullhypothese ist also offensichtlich falsch. Mit welcher Wahrscheinlichkeit wird dann die H 0 abgelehnt, d. h. erkennt der Test die H 0 als falsch? Statistik Zusätzliche Beispiele Blatt 3 2 WS 2018/19
10. Ein Test zur Messung der sozialen Anpassungsfähigkeit von Schulkindern ist genormt auf Mittelwert µ = 50 und Varianz σ 2 0 = 36. Ein Soziologe glaubt, eine Möglichkeit zur Organisation des Unterrichts gefunden zu haben, die den Umgang der Schüler miteinander u. a. durch vermehrte Teamarbeit fördert und damit die soziale Anpassungsfähigkeit erhöht. Aus der Grundgesamtheit aller Schülerinnen und Schüler werden 60 zufällig ausgewählt und entsprechend dieses neuen Konzepts unterrichtet. Nach Ablauf eines zuvor festgelegten Zeitraums wird bei diesen Kindern ein mittlerer Testwert für die soziale Anpassungsfähigkeit von 52 beobachtet. a) Lässt sich damit die Beobachtung des Soziologen stützen? D.h. entscheiden Sie über die Behauptung des Soziologen anhand eines geeigneten statistischen Tests zum Niveau α = 0,05. Formulieren Sie zunächst die Fragestellung als statistisches Testproblem. b) Was ändert sich in a), wenn i. der Stichprobenumfang n = 20, ii. der beobachtete Mittelwert x = 51, iii. die Standardabweichung σ = 10 beträgt? 11. Eine Verbraucherzentrale möchte überprüfen, ob ein bestimmtes Medikament Übelkeit bei den Konsumenten auslöst. In einer Studie mit zehn Personen wird bei sieben Personen nach dem Genuss dieses Medikaments eine auftretende Übelkeit registriert. a) Überprüfen Sie zum Signifikanzniveau α = 0,05 die statistische Nullhypothese, dass der Anteil der Personen mit Übelkeitssymptomen nach dem Genuss dieses Produkts in der Grundgesamtheit höchstens 50 % beträgt. b) Wie groß ist die Wahrscheinlichkeit für die ungerechtfertigte Akzeptanz (Beibehalten) der H 0, d. h. die Wahrscheinlichkeit für einen Fehler 2. Art, wenn der tatsächliche Anteil siebzig Prozent beträgt? 12. Von 10 zufällig ausgewählten Bauarbeitern waren drei nicht ordnungsgemäß angemeldet, (d. h. illegal beschäftigt). a) Lässt sich damit die Behauptung: Die Illegalenquote liegt über zehn Prozent signifikant bestätigen? Formulieren Sie die Hypothesen und bestimmen Sie den kritischen Bereich für die Anzahl der Illegalen unter 10 Überprüften. (Niveau α = 0,05). Wie ist demnach bezüglich H 0 und H 1 zu entscheiden? Was bedeutet das inhaltlich? b) Wie groß ist die Wahrscheinlichkeit für die ungerechtfertigte Akzeptanz (Beibehalten) der H 0, d. h. die Wahrscheinlichkeit für einen Fehler 2. Art, wenn der tatsächliche Illegalenanteil zwanzig Prozent beträgt? Statistik Zusätzliche Beispiele Blatt 3 3 WS 2018/19
13. An einem viel befahrenen Straßenstück wurde die Lärmbelastung an 20 Tagen gemessen und man erhielt folgende Daten: 77 82 69 68 59 61 66 68 71 73 59 59 66 63 64 60 70 68 59 61 Nun wurden an derselben Stelle auch nach Montage einer Lärmschutzeinrichtung an 12 Tagen Messungen durchgeführt: 66 57 58 68 62 59 57 80 56 59 62 62 Rechnen Sie unter Annahme normalverteilter Werte und Varianzhomogenität! a) Lässt sich aus diesen Daten mit einer Signifikanz von 5 Prozent, d. h. zum Testniveau α = 0,05 zeigen, dass die Lärmbelastung nun geringer ist? b) Lässt sich zeigen, dass die Maßnahme die Belastung um mehr als 2 db verringern konnte? 14. Innerhalb einer Woche wurden im LKH Feldbach sechs männliche Kinder geboren, deren Gewicht bei der Geburt und genau 12 Tage danach gemessen wurde: Geburtsgeweicht 3245 3671 2678 2398 3723 3678 Gewicht nach 12 Tagen 3257 3670 2749 2428 3759 3711 Lässt sich mit einer Sicherheit von 90 % und ohne Annahme normalverteilter Grundgesamtheiten zeigen, dass innerhalb der ersten zwölf Lebenstage eine Gewichtszunahme vorliegt? 15. I In einem Betrieb wurden für acht Lehrlinge jeweils der Notenschnitt des Abschlusszeugnisses aus der Schule und eine im Betrieb ermittelte Leistungskennzahl miteinander verglichen. Für die Leistungskennzahl wurden dabei Bewertungen zwischen 1 (= sehr schlecht ) und 6 (= ausgezeichnet ) vergeben. Lehrling 1 2 3 4 5 6 7 8 Notenschnitt 1,5 2,6 2,1 1,8 2,5 3,2 1,3 1,4 L-Kennzahl 2 3 4 5 4 1 6 5 Lässt sich mit diesen Daten folgende Behauptung bestätigen : Ein guter Notenschnitt in der Schule geht mit einer hohen Leistungskennzahl im Betrieb einher? Testen Sie unter Verwendung der Rangkorrelation zum Testniveau α = 0,1! 16. I In Deutschland wird das Abitur zentral gestellt und mit Punkten von 0 bis 15 bewertet. Acht Abiturienten erreichten in den Fächern Deutsch und Mathematik die folgenden Punktezahlen: Deutsch 13 14 8 10 15 1 12 11 Mathematik 15 8 1 7 9 4 5 10 Lässt sich mit diesen Daten folgende Behauptung bestätigen : Eine hohe Punktezahl in Deutsch entspricht auch einer hohen Punktezahl in Mathematik? Testen Sie parametrisch zum Testniveau α = 0,05! 17. Man prüfe, ob die Zufallsgröße X = Anzahl der täglichen Übertragungsfehler in einem firmeninternen Kommunikationsnetz einer Poissonverteilung mit Erwartungswert 2 unterliegen kann! (D. h. man erwartet im Durchschnitt zwei Fehler pro Tag.) An den 254 Arbeitstagen des Jahres 2014 wurden dabei folgende Anzahlen von Fehlern festgestellt: Fehleranzahl x 0 1 2 3 vier oder mehr Tage mit x Fehlern 26 61 78 34 55 a) Welcher Test ist durchzuführen? Formulieren Sie Null und Gegenhypothese. b) Testen Sie zum Niveau α = 0,1 und interpretieren Sie Ihr Ergebnis genau! Statistik Zusätzliche Beispiele Blatt 3 4 WS 2018/19
18. I Prüfen Sie, ob die Zufallsgröße, (Anzahl von Lackfehlern pro Flächeneinheit) die den folgenden Daten zu Grunde liegt, einer Poissonverteilung unterliegen kann: Fehleranzahl x 0 1 2 3 4 5 mehr als 5 Häufigkeit des Auftretens 37 21 10 6 4 2 0 Schätzen Sie dazu vorerst den Erwartungswert hier zugleich der Parameter der Verteilung und führen Sie den modifizierten Chiquadrat-Anpassungstest durch! Testniveau α = 0,1. Fassen Sie, wenn das nötig ist, Klassen zusammen! Die mit I gekennzeichneten Beispiele sind für den interessierten Leser gedacht und sind in dieser Form (Rechenbeispiel) derzeit nicht prüfungsrelevant. Statistik Zusätzliche Beispiele Blatt 3 5 WS 2018/19
Lösungen 1. P (X = 5) = (1 p) 4 p L = 4(1 p) 3 ( 1) p + (1 p) 4 = 0 (1 p) 4 = 4(1 p) 3 p (1 p) = 4p 5p = 1 ˆp = 1 5 2. a) x = 1 71 = 14,2 5 s 2 = 1 4 (1.045,98 5 14,22 ) = 9,445 s = 3,073 b) ˆµ = 14,2, ˆσ = 2,749 f(x) = 1 e (x µ)2 2σ 2 2πσ L = l = 5 [ 5 l µ = 5 1 e (x i µ)2 2σ 2 2πσ ln( 2π) ln(σ) (x i µ) 2 ] 2(x i µ) 2σ 2 = 0 5 x i 5µ = 0 ˆµ = 1 5 x i 5 [ l σ = 5 1 σ + 2(x i µ) 2 2σ 3 5 5σ 2 = (x i µ) 2 ˆσ 2 = 1 5 (x i µ) 2 5 ˆσ = 1 ( x i 1 ) 2 5 x i 5 5 ] = 0 2σ 2 3. a) ] ; 43,829] b) 99,5 % 4. a) 1.037 b) 757 Statistik Zusätzliche Beispiele Blatt 3 6 WS 2018/19
5. a) K = [0,282; 0,368] (K = [0,258; 0,392]) b) K = [0; 0,359] c) Schwankungsbreite nur noch ein Zehntel. 6. n > 2.500 z 2 0,95( 1,645 2 ) = 6763,859, also 6764 7. 95,4 % 8. a) t 0 = 2,217 Der Unterschied ist signifikant. b) [53,59; 56,41] 9. a) t 0 = 1,267 K =]2,326; [ H 0 beibehalten. b) K =]0,674; [ H 0 verworfen. (K =]3,09; [ H 0 beibehalten.) c) 0,103 d) 0,16 10. a) Gauß-Test; H 1 : µ > 50 H 0 : µ 50 t 0 = 2,582 K =]1,645; [ H 1 bestätigt. Ja. b) i. t 0 = 1,491 H 1 nicht bestätigt. Nein. 11. n = 10 t 0 = 7 ˆp = 0,7 ii. t 0 = 1,291 H 1 nicht bestätigt. Nein. iii. t 0 = 1,549 H 1 nicht bestätigt. Nein. a) α = 0,05 H 0 : p 0,5 gegen H 1 : p > 0,5 B(10; 0,5) k F (k) 0 0,001 1 0,011 2 0,055 3 0,172 4 0,377 5 0,623 6 0,828 7 0,945 8 0,989 9 0,999 10 1 F (c 2) < 1 α F (c 1) F (7) < 0,95 F (8) c 2 = 7 c 1 = 8 c = 9 K = {9,10} t 0 / K H 0 beibehalten b) p = 0,7 X B(10; 0,7) P (X < 9) = P (X 8) = F (8) = 0,851 Statistik Zusätzliche Beispiele Blatt 3 7 WS 2018/19
12. n = 10 t 0 = 3 ˆp = 0,3 a) α = 0,05 H 0 : p 0,1 gegen H 1 : p > 0,1 B(10; 0,1) k F (k) 0 0,349 1 0,736 2 0,930 3 0,987 4 0,998 5 1.. F (c 2) < 1 α F (c 1) F (2) < 0,95 F (3) c 2 = 2 c 1 = 3 c = 4 K = {4, 5..., 10} t 0 / K H 1 nicht bestätigt. Nein. b) p = 0,2 X B(10; 0,2) P (X < 4) = P (X 3) = F (3) = 0,879 13. a) H 1 : µ y µ x < 0 gegen H 0 : µ y µ x 0 n 1 = 20 n 2 = 12 x = 66,15 ȳ = 62,167 s 2 x = 41,187 s 2 y = 45,061 19 41,187 + 11 45,061 s = = 6,527 30 + 12 2 62,167 66,15 20 12 t 0 = 6,527 20 + 12 = 1,671 K =] ; t ν;γ [ ν = 20 + 12 2 = 30 α = 0,05 t 30;0,95 = 1,697 K =] ; 1,697[ t 0 / K Nein. b) H 1 : µ y + 2 < µ x gegen H 0 : µ y + 2 >= µ x 64,167 66,15 20 12 t 0 = 6,527 20 + 12 = 0,832 t 0 / K Nein. 14. H 1 : d 0,5 > 0 w + = 20 t 0 = 1,99 K =]1,282; [ Ja. Statistik Zusätzliche Beispiele Blatt 3 8 WS 2018/19
15. n = 8, α = 0.1 Version 1) d = i d 2 i = 144 H 1 : korr < 0 gegen H 0 : korr 0 E(D) = n3 n = 83 8 = 84 6 6 n (n + 1) σ d = 6 t 0 = n 1 = 8 9 6 7 = 31,749 144 84 31,749 = 1,890 γ = 0.9, K =]1,282; [, t 0 K, H 1 bestätigt, ja. Version 2) d = i d 2 i = 22 H 1 : korr > 0 gegen H 0 : korr 0 22 84 t 0 = 31,749 = 1,953 γ = 0.9, K =] ; 1,282[, t 0 K, H 1 bestätigt, ja. 16. α = 0,05 x = 10,5, s x = 4,44 ȳ = 7,375, s y = 4,241 s xy = 10,643 ˆr = 10,643 4,44 4,241 = 0,565 H 1 : r > 0 gegen H 0 : r 0 0,565 t 0 = 6 = 1,678 1 0,565 2 t 6; 0,95 = 1,943, K = [1,943; [ t 0 / K, H 1 nicht bestätigt, nein. Statistik Zusätzliche Beispiele Blatt 3 9 WS 2018/19
17. X P (2) P (X = 0) = 20 0! e 2 = e 2 = 0,1353 P (X = 1) = 21 1! e 2 = 2e 2 = 0,2707 P (X = 2) = 22 2! e 2 = 2e 2 = 0,2707 P (X = 3) = 23 3! e 2 = 8 6 e 2 = 0,1804 (( P (X 4) = 1 1 + 2 + 2 + 4 ) ) e 2 3 = 1 19 3 e 2 = 0,1429 a) Chiquadrat-Anpassungstest k 0 1 2 3 4 H 0 : p k 0,1353 0,2707 0,2707 0,1804 0,1429 H 1 anders verteilt b) n = 254 α = 0,1 n k 26 61 78 34 55 n p k 34,38 68,75 68,75 45,83 36,3 n p k > 5 k (26 34,38)2 (55 36,3)2 t 0 = +... + = 16,8594 34,38 36,3 χ 4; 0,9 = 7,779 K =]7,779; [ t 0 K H 0 verworfen, anders verteilt 0 37 + 1 21 + 2 10 + 3 6 + 4 4 + 5 2 18. E(X) = 37 + 21 + 10 + 6 + 4 + 2 n = 80 = 85 80 = 17 16 = 1,0625 k 0 1 2 3 4 5 > 5 p k 0,3456 0,3672 0,1951 0,0691 0,0184 0,0039 0,0008 n p k 27,6473 29,3752 15,6056 5,5270 1,4681 0,3120 0,0649 n k 37 21 10 6 4 2 0 n p k < 5 für k {4,5, > 5} k 0 1 2 3 p k 0,3456 0,3672 0,1951 0,0921 n p k 27,6473 29,3752 15,6056 7,3719 n k 37 21 10 12 n p k > 5 k (37 27,6473)2 (21 29,3752)2 (10 15,6056)2 (12 7,3719)2 t 0 = + + + = 10,4708 27,6473 29,3752 15,656 7,3719 α = 0,1 k = 4 t = 1 χ k t 1; γ = χ 2; 0,9 = 4,605 K =]4,605; [ t 0 K H 0 verworfen, nicht poissontverteilt Statistik Zusätzliche Beispiele Blatt 3 10 WS 2018/19