Übungen: Wahrscheinlichkeitsrechnung, Zufallsvariablen & Co. Woche 1-3

Ähnliche Dokumente
Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Biomathematik für Mediziner, Klausur SS 2001 Seite 1

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Schließende Statistik

1.6 Der Vorzeichentest

I. Deskriptive Statistik 1

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1

Statistik II. Statistische Tests. Statistik II

Hinweis: Es sind 4 aus 6 Aufgaben zu bearbeiten. Werden mehr als 4 Aufgaben bearbeitet, werden nur die ersten vier Aufgaben gewertet.

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Jost Reinecke. 7. Juni 2005

Beurteilende Statistik

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Statistik-Übungsaufgaben

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

Kapitel 3 Schließende Statistik

Univariate Kennwerte mit SPSS

Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36)

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

Kapitel 10 Mittelwert-Tests Einstichproben-Mittelwert-Tests 10.2 Zweistichproben Mittelwert-Tests

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

2. Übung zur Vorlesung Statistik 2

Vorlesung Wirtschaftsstatistik 2 (FK ) Wiederholungen deskriptive Statistik und Einleitung Normalverteilungsverfahren. Dipl.-Ing.

Einführung in die computergestützte Datenanalyse

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

1 Dichte- und Verteilungsfunktion

Hypothesentest, ein einfacher Zugang mit Würfeln

Kapitel 12 Stetige Zufallsvariablen Dichtefunktion und Verteilungsfunktion. stetig. Verteilungsfunktion

Test auf den Erwartungswert

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung


Statistik 2 RE Statistik f. Soziologen Klausur MÄRZ 2009 LÖSUNGSVORSCHLAG

Statistik und Wahrscheinlichkeitsrechnung

Über den Autor 7 Über den Fachkorrektor 7. Einführung 19

Kenngrößen von Zufallsvariablen

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Übung/Tutorate Statistik II: Schließende Statistik SS 2007

Mathematik für Biologen

Signifikanztests zur Prüfung von Unterschieden in der zentralen Tendenz -Teil 1-

Kapitel VII. Punkt- und Intervallschätzung bei Bernoulli-Versuchen

Webinar Induktive Statistik. - Wahrscheinlichkeitsrechnung - Stichprobentheorie

Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007

1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...

Übung zur Vorlesung: Geostatistik 1 Philipp, Mo. 15: Türcode: 1516

Statistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von

R. Brinkmann Seite

Zufallsvariablen [random variable]

Wahrscheinlichkeitsrechnung und schließende Statistik

Mathematik für Biologen

Um zu entscheiden, welchen Inhalt die Urne hat, werden der Urne nacheinander 5 Kugeln mit Zurücklegen entnommen und ihre Farben notiert.

Vertiefung der. Wirtschaftsmathematik. und Statistik (Teil Statistik)

ETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig)

Statistik 2 für SoziologInnen. Normalverteilung. Univ.Prof. Dr. Marcus Hudec. Themen dieses Kapitels sind:

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Beschreibende Statistik Deskriptive Statistik. Schließende Statistik Inferenzstatistik. Schluss von der Stichprobe auf die Grundgesamtheit

Abiturvorbereitung Stochastik. neue friedländer gesamtschule Klasse 12 GB Holger Wuschke B.Sc.

Das Histogramm ist glockenförmig. Es würde bei mehr als vier Fehlerquellen sich der Glockenform noch besser annähern.

3 Konfidenzintervalle

Standardab er des. Testwert = % Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere

Übung 1: Wiederholung Wahrscheinlichkeitstheorie

Stetige Verteilungen. A: Beispiele Beispiel 1: a) In den folgenden Abbildungen sind die Dichtefunktionen von drei bekannten Verteilungen graphisch

Statistische Tests für unbekannte Parameter

Bitte am PC mit Windows anmelden!

Übungen mit dem Applet Vergleich von zwei Mittelwerten

Willkommen zur Vorlesung Statistik (Master)

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Zeit zum Kochen [in min] [10, 20[ [20, 30[ [30, 40[ [40, 50[ [50,60[ [60, 100] Hi

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS

Klausur Statistik I. Dr. Andreas Voß Wintersemester 2005/06

Lösungen zu den Übungsaufgaben in Kapitel 10

Biostatistik, Winter 2011/12

Wahrscheinlichkeitstheorie und Statistik vom

STATISTIK Teil 2 Wahrscheinlichkeitsrechnung und schließende Statistik. Mögliche Ergebnisse, auch Elementarereignisse bezeichnet

Übung zu Empirische Ökonomie für Fortgeschrittene SS 2009

A: Beispiele Beispiel 1: Zwei Zufallsvariablen X und Y besitzen die beiden folgenden Wahrscheinlichkeitsfunktionen:

Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen

Übungsaufgaben, Statistik 1

8. Konfidenzintervalle und Hypothesentests

VS PLUS

R. Brinkmann Seite

Grundlegende Eigenschaften von Punktschätzern

3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft

Vorwort Zufallsvariable X, Erwartungswert E(X), Varianz V(X) 1.1 Zufallsvariable oder Zufallsgröße Erwartungswert und Varianz...

Zufallsgröße. Würfelwurf mit fairem Würfel. Wahrscheinlichkeitsverteilung einer diskreten

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Anpassungstests VORGEHENSWEISE

Statistik II: Grundlagen und Definitionen der Statistik

7.2 Moment und Varianz

Auf dem Schulfest bietet Peter als Spielleiter das Glücksspiel "GlücksPasch" an.

P-Test Motivation: Einsatz des Tests auf p im Krankenhausmanagement Theorie zum Test auf p

b) Bestimmen Sie die Varianz der beiden Schätzer. c) Ist ein oder sind beide Schätzer konsistent? Begründen Sie!

Klausur Stochastik und Statistik 31. Juli 2012

Chi-Quadrat Verfahren

Transkript:

Wahrscheinlichkeitsrechnung Zufallsvariable Woche 1-3 Wahrscheinlichkeitsfunktion einer diskreten ZV Verteilungsfunktion einer diskreten ZV Erwartungswert und Varianz einer diskreten ZV 1) Die Wirtschaftsforschungsinstitute prognostizieren das Wirtschaftswachstum. Ein Experte hält einen Aufschwung und eine Stagnation für gleich wahrscheinlich. Einen Abschwung hält er für doppelt so wahrscheinlich wie einen Aufschwung. a) Geben Sie für die drei Ereignisse die Wahrscheinlichkeiten an. b) Was ist das Komplementärereignis zum Abschwung? 2) Sie führen ein Zufallsexperiment des zweimaligen Werfens einer 2- -Münze durch. Wie groß ist die Wahrscheinlichkeit, dass erscheint? a) zweimal Zahl b) mindestens einmal Zahl c) keinmal Zahl 3) A sei das Ereignis, dass ein Bochumer Studierenden-Haushalt mit einer Mikrowelle ausgestattet ist. B sei das Ereignis, dass ein zufällig ausgewählter Student in einem Haushalt mit 500 300 100 Spülmaschine lebt. Es gilt: P(A)=, P(B)=, P(A B)=. Berechnen und 1000 1000 1000 interpretieren Sie die Wahrscheinlichkeit der folgenden Ereignisse: a) A, B b) A B c) A B 4) Das Mikrofon der Professorin ist ausgefallen. In der Mikrofontasche liegen 8 Ersatzbatterien, von denen allerdings zwei schon leer sind. a) Wie groß ist die Wahrscheinlichkeit, beim ersten Versuch eine funktionstüchtige Batterie herauszugreifen? b) Wie groß ist die Wahrscheinlichkeit, beim zweiten Versuch eine funktionstüchtige Batterie herauszugreifen, wenn zuerst eine leere gezogen wurde (ohne Zurücklegen)? 1

5) Die drei Fahrstühle im Gebäude AW Lennershofstraße 140½ arbeiten vollständig unabhängig voneinander und haben eine Ausfallwahrscheinlichkeit von 0,05 0,1 und 0,15. Wie groß ist die Wahrscheinlichkeit, a) dass alle Fahrstühle ausfallen, b) dass kein Fahrstuhl ausfällt, c) dass mindestens einer funktioniert? 6) Welche der genannten Phänomene können zweckmäßig durch eine diskrete oder durch eine stetige Zufallsvariable beschrieben werden? a) Anzahl der Sonnentage auf Mallorca, b) Anzahl der Raucher im Audimax, c) Benzinverbrauch eines Pkw in Litern je 100 km, d) Gewicht einer Person, e) Wartezeit an der Bushaltestelle, f) Quadratmeterpreis einer Mietwohnung, g) Anzahl der ausgegebenen Mensaessen pro Tag. 7) In der Grafik ist die Wahrscheinlichkeitsfunktion f(x) für die Zufallsvariable Anzahl Wappen bei vier Würfen angegeben. a) Wie groß ist die Wahrscheinlichkeit, genau 2 mal Wappen zu werfen? b) Wie groß ist die Summe aller Wahrscheinlichkeiten? c) Wie groß ist die Wahrscheinlichkeit höchstens 2 mal Wappen zu werfen? d) Skizzieren Sie die Verteilungsfunktion F(x) der Zufallsvariablen Anzahl Wappen. Anzahl Wappen bei 4 Würfen 40 % 35 % 37.5 30 % 25 % 25.0 25.0 20 % 15 % 10 % 5 % 6.3 6.3 0 % 0 1 2 3 4 2

Achtung: Der Häufigkeiten beim 1. und 5. Balken sind gerundet, eigentlich sind es 6,25. 8) Werfen Sie 6.000 mal einen Würfel (bzw. stellen Sie sich vor, Sie hätten 6.000 mal geworfen und notieren Sie jeweils das Ergebnis. Skizzieren Sie die Wahrscheinlichkeitsfunktion und die Verteilungsfunktion der diskreten Zufallsvariable Augenzahl. 9) Eine Bank bieten eineanlagemöglichkeit mit folgenden diskreten Renditechancen (in %) an: Rendite x i in % -5 3 5 10 Wahrscheinlichkeitsfunktion f(x i ) 0,1 0,3 0,4 0,2 Berechnen Sie den Erwartungswert und die Varianz und die Standardabweichung der Rendite. 10) Wie groß ist die Wahrscheinlichkeit, dass von vier Geschwistern a) alle vier Jungen sind? b) der Älteste ein Junge und alle folgenden Mädchen sind? c) die drei Ältesten Jungen und das Jüngste ein Mädchen ist? d) zwei Jungen und zwei Mädchen sind? 3

Woche 4-6 Dichtefunktion einer stetigen ZV Verteilungsfunktion einer stetigen ZV Erwartungswert und Varianz einer stetigen ZV 1) Der wöchentliche Pommes-Verbrauch (in Zentnern) der Mensa sei eine stetige Zufallsvariable mit folgender Dichtefunktion: f 0, 02x ( x) = 0, 08x 0 + 0, 1 + 0, 6 für 0 x 5 für 5 < x 7, 5 sonst. Berechnen Sie bzw. lesen Sie aus der Dichtefunktion oder aus der Verteilungsfunktion ab: a. Wie groß ist die Wahrscheinlichkeit, zwischen 5 und 7,5 Zentner Pommes zu verbrauchen? b. Wie groß ist die Wahrscheinlichkeit, höchstens 5 Zentner Pommes zu verbrauchen? c. Wie groß ist die Wahrscheinlichkeit, mindestens 5 Zentner Pommes zu verbrauchen? d. F(5)? e. P(1 X 5)? f. F(5)-F(1)? g. 1. Quartil? h. 3. Quartil? i. Median? 4

0,25 0,2 0,15 f(x) 0,1 0,05 0 0 1 2 3 4 5 6 7 8 x F(x) 1,1 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 0 1 2 3 4 5 6 7 8 x 2) Die Dichtefunktion einer stetigen Zufallsvariablen Wartezeit auf den Bus sei f(x)=0,005x für 0 X 20. a) Schätzen Sie aus der Grafik die Wahrscheinlichkeit zwischen 5 und 15 Minuten zu warten ab. b) Berechnen Sie die funktionale Form der Verteilungsfunktion. c) Schätzen Sie aus der Grafik die Wahrscheinlichkeit, höchstens 5 Minuten zu warten ab. d) Berechnen Sie den Erwartungswert der Zufallsvariablen Wartezeit. e) Wo liegt das 1. Quartil, das 3. Quartil und der Median? f) Ist die Verteilung linkssteil oder rechtssteil? Stimmt das Größenverhältnis von Median zu Mittelwert? 5

f(x) 0,11 0,1 0,09 0,08 0,07 0,06 0,05 0,04 0,03 0,02 0,01 0 0 5 10 15 20 25 x 3) Die Dichtefunktion einer Zufallsvariable sei 0, 15 f (x) = 0, 05 0 Berechnen Sie den Erwartungswert der Zufallsvariable. für für für 0 x 5 5 < x 10 sonst 4) Gegeben sei ein Bestand von 1000 Risiken einer Versicherung. Für jedes Risiko sei die Eintrittswahrscheinlichkeit für einen Schaden 0,1. Es soll angenommen werden, dass nur Schäden zwischen 1 und 30.000 auftreten. Diese seien (diskret) gleichverteilt. Die Einzelwahrscheinlichkeit für den Einzelschaden X i des i-ten Risikos sind demnach 0, 9 0, 1 ( X = k) = 30000 0 P i F(x) 1,1 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 0 5 10 15 20 25 für für für k = 0 Euro k = 1,2,...,30000 Euro sonst Berechnen Sie den Erwartungswert des Einzelschadens. x 6

Woche 7-9 Datei: einkomm.sav und einkomm stich.sav Binomialverteilung Gegeben sei eine Erhebung von 880 Personen hinsichtlich folgender Variablen: v1 Alter Schulabschluss (1=Volksschule, 2=Mittlere Reife, 3=Fachhochschulreife, v2 4=Abitur) v3 Monatliches Nettoeinkommen v4 Nummer v5 laufende Nummer in einer Stichprobe vom Umfang 40 v6 Indikatorvariable für Element in der i-ten Stichprobe, i=1,...,22 v7 Erhebungsgebiet (0=West, 1=Ost) v8 Geschlecht (0=männlich, 1=weiblich) v9 Familienstand (0=verheiratet, 1=nichtverheiratet) Ein Auszug aus der Daten-Datei ist unten angegeben. 7

v1 v2 v3 v4 v5 v6 v7 v8 v9 49 4 3580 1 1 1 0 0 0 37 2 1430 2 2 1 1 0 0 57 1 1230 3 3 1 0 1 0 31 1 1330 4 4 1 0 0 1 63 1 1020 5 5 1 0 0 1 47 1 1640 6 6 1 0 0 0 63 1 1020 7 7 1 0 0 0 42 1 1790 8 8 1 0 0 0 29 4 1230 9 9 1 0 1 1 55 1 1790 10 10 1 0 0 0 39 1 1020 11 11 1 1 1 0 37 2 1280 12 12 1 0 1 0 49 1 1280 13 13 1 0 0 0 20 2 920 14 14 1 1 1 1 44 3 1230 15 15 1 0 0 1 59 4 1410 16 16 1 1 0 0 36 2 890 17 17 1 1 1 0 28 2 1020 18 18 1 1 0 1 24 1 1120 19 19 1 0 1 0 54 3 3070 20 20 1 0 0 0 36 2 1280 21 21 1 1 0 0 45 1 2300 22 22 1 0 0 0 26 2 920 23 23 1 1 0 1 41 1 1230 24 24 1 0 1 0 40 2 1120 25 25 1 1 0 0 37 4 2560 26 26 1 0 0 1 27 2 970 27 27 1 1 1 1 51 1 1010 28 28 1 0 1 0 44 2 1070 29 29 1 1 0 1 36 2 1280 30 30 1 1 0 1 19 2 460 31 31 1 0 0 1 58 1 770 32 32 1 1 1 0 30 1 1280 33 33 1 0 0 1 39 2 1000 34 34 1 1 1 0 25 4 920 35 35 1 0 1 1 61 1 1020 36 36 1 0 0 0 22 2 1070 37 37 1 1 0 0 36 2 1020 38 38 1 0 1 1 26 1 1840 39 39 1 0 0 0 29 2 380 40 40 1 1 1 1 48 1 1690 41 1 2 0 0 0 36 2 1940 42 2 2 0 0 0 26 1 1070 43 3 2 0 1 1 58 1 920 44 4 2 1 0 0 26 1 820 45 5 2 0 1 1 25 4 1640 46 6 2 1 1 1 59 3 2300 47 7 2 0 0 0 39 4 3070 48 8 2 0 0 0 60 1 1230 49 9 2 1 0 0 50 1 1280 50 10 2 1 0 0 18 1 360 51 11 2 0 0 1 35 4 1280 52 12 2 1 1 0 24 4 520 53 13 2 0 1 1 46 4 1530 54 14 2 1 1 1 29 2 1530 55 15 2 0 1 1 26 3 1380 56 16 2 0 1 1 55 4 2300 57 17 2 0 0 0 47 4 2350 58 18 2 0 0 1 59 1 540 59 19 2 1 1 0 48 2 1480 60 20 2 0 1 1 36 1 970 61 21 2 0 1 1 59 4 1790 62 22 2 0 1 1 32 1 1380 63 23 2 0 0 1 30 2 950 64 24 2 1 0 1 38 1 870 65 25 2 0 1 0 35 4 1020 66 26 2 0 1 1 43 2 650 67 27 2 1 1 1 21 2 1280 68 28 2 1 0 1 46 1 1690 69 29 2 0 0 0 52 2 2050 70 30 2 0 0 0 38 4 1430 71 31 2 0 0 1 42 2 1120 72 32 2 1 0 0 61 2 3070 73 33 2 0 0 0 48 1 1180 74 34 2 0 1 1 22 2 1230 75 35 2 0 1 1 57 1 1790 76 36 2 0 0 1 43 1 1530 77 37 2 0 0 1 27 4 1090 78 38 2 0 1 1 42 4 3070 79 39 2 0 0 0 29 2 1280 80 40 2 0 0 1 49 1 1180 81 1 3 0 1 1 21 1 1200 82 2 3 0 0 1 59 4 2560 83 3 3 1 0 1 29 2 740 84 4 3 1 0 1 56 4 2050 85 5 3 0 1 0 8

usw. 1) Wie ist die Variable Erhebungsgebiet, Geschlecht und Familienstand verteilt? 2) Wie ist die Variable Alter, Schulabschluss und Monatliches Nettoeinkommen verteilt? 3) Es sei folgender SPSS-Ausdruck gegeben: Wie viele Frauen gibt es in der Stichprobe und wie viele Ost-Personen? Statistiken N Mittelwert Median Modus Summe Gültig Fehlend v7 v8 v9 880 880 880 0 0 0,36,36,41,00,00,00 0 0 0 321 319 364 v7 Gültig Gültige Kumulierte Häufigkeit Prozent Prozente Prozente 0 559 63,5 63,5 63,5 1 321 36,5 36,5 100,0 Gesamt 880 100,0 100,0 v8 Gültig Gültige Kumulierte Häufigkeit Prozent Prozente Prozente 0 561 63,8 63,8 63,8 1 319 36,3 36,3 100,0 Gesamt 880 100,0 100,0 v9 Gültig Gültige Kumulierte Häufigkeit Prozent Prozente Prozente 0 516 58,6 58,6 58,6 1 364 41,4 41,4 100,0 Gesamt 880 100,0 100,0 4) Wie viele nicht verheiratete gibt es in der Stichprobe? 9

5) Die Datei einkomm.sav enthält 880 Fälle. Interpretieren Sie diese 880 Fälle nun als Grundgesamtheit und ziehen Sie gedanklich 22 Stichproben im Umfang von je 40 ohne Zurücklegen aus der Grundgesamtheit und berechnen Sie die jeweiligen Summen der 0-1- Variablen v7 Erhebungsgebiet, v8 Geschlecht und v9 Familienstand. Das brauchen Sie übrigens nicht selber tun, denn in der Datei einkomm stich.sav ist das bereits gemacht worden: Aus den 880 Fällen sind 22 Stichproben vom jeweiligen Umfang 40 ohne Zurücklegen gezogen worden. Ohne Zurücklegen heißt, dass man unabhängige Zufallsexperimente hat! Jede der 22 Stichproben enthält die Summen der Variablen aus jeder 40er-Stichprobe, d.h. Stichprobe v7 (Summe Erhebungsgebiet Ost=1, West=0) v8 (Summe Geschlecht, männlich=0, weiblich=1) v9 (Summe Familienstand, verheiratet=0, nicht verheiratet=1)... 1 Summe der Variable v7 aus der 1. Stichprobe vom Umfang 40, z.b., wenn in der ersten Stichprobe 16 Ostpersonen sind, beträgt die Summe = 16 2 Summe der Variable v7 aus der 2. Stichprobe vom Umfang 40, z.b., wenn in der zweiten Stichprobe 11 Ostpersonen sind, beträgt die Summe = 11 Summe der Variable v8 aus der 1. Stichprobe vom Umfang 40 Summe der Variable v8 aus der 2. Stichprobe vom Umfang 40 Summe der Variable v9 aus der 1. Stichprobe vom Umfang 40 Summe der Variable v9 aus der 2. Stichprobe vom Umfang 40............ 22 Summe der Variable v1 aus der 22. Stichprobe vom Umfang 40 Summe der Variable v8 aus der 22. Stichprobe vom Umfang 40 Summe der Variable v9 aus der 22. Stichprobe vom Umfang 40 Die SPSS-Ausgabe über die Summen der Variablen V7, V8, V9 in den 22 Stichproben ist unten angegeben. 10

v6 v7 v8 v9 1 16 15 16 2 11 18 24 3 19 12 21 4 18 13 21 5 19 11 17 6 23 13 17 7 7 16 17 8 13 14 19 9 9 15 16 10 18 14 13 11 14 16 12 12 19 13 14 13 11 13 16 14 13 14 16 15 13 22 18 16 14 12 18 17 15 12 14 18 13 13 14 19 15 15 17 20 13 15 11 21 15 18 18 22 13 15 15 6) Wenn Sie für das obige Beispiel eine beliebige Stichprobe vom Umfang 40 gezogen haben, wie groß sind dann die Parameter der entsprechenden Binomialverteilung z.b. für die Anzahl der Ostpersonen? 7) In den 22 Stichproben vom Umfang 40, wie viele Frauen können theoretisch in jeder Stichprobe mindestens und höchstens vorkommen? 8) Ist es wahrscheinlich, dass in einer Stichprobe gar keine Frau oder nur Frauen vorkommen? 9) Was würden Sie vermuten, wie viele Frauen im Schnitt in den 22 Stichproben vorkommen? 10) Betrachten Sie für die Datei einkomm stich.sav die Verteilung der Variable Summe Frauen. Wie viele Frauen kommen in den 22 Stichproben tatsächlich mindestens und höchstens vor? Welches ist eine typische Frauenanzahl in den Stichproben, d.h. welches ist der Erwartungswert der Frauenanzahl? 11

Gültig 11 12 13 14 15 16 18 22 Gesamt v8 Gültige Kumulierte Häufigkeit Prozent Prozente Prozente 1 4,5 4,5 4,5 3 13,6 13,6 18,2 5 22,7 22,7 40,9 3 13,6 13,6 54,5 5 22,7 22,7 77,3 2 9,1 9,1 86,4 2 9,1 9,1 95,5 1 4,5 4,5 100,0 22 100,0 100,0 v8 5 4 Häufigkeit 3 2 1 0 11 12 13 14 v8 15 16 18 22 11) Am häufigsten nämlich in 5 von 22 Stichproben kommen 13 bzw. 15 Frauen je Stichprobe vor. Hätten Sie diesen Wert auch vorab abschätzen können? 12) In den 22 Stichproben vom Umfang 40, wie viele Ostpersonen können theoretisch in jeder Stichprobe mindestens und höchstens vorkommen? 13) Ist es wahrscheinlich, dass in einer Stichprobe gar keine Ostperson oder nur Ostpersonen vorkommen? 12

14) Was würden Sie vermuten, wie viele Ostpersonen im Schnitt in den 22 Stichproben vorkommen? 15) Betrachten Sie für die Datei einkomm stich.sav die Verteilung der Variable Summe Ostpersonen. Wie viele Ostpersonen kommen in den 22 Stichproben tatsächlich mindestens und höchstens vor? Welches ist eine typische Ostpersonenanzahl in den Stichproben, d.h. welches ist der Erwartungswert der Ostpersonenanzahl? v7 Gültig 7 9 11 13 14 15 16 18 19 23 Gesamt Gültige Kumulierte Häufigkeit Prozent Prozente Prozente 1 4,5 4,5 4,5 1 4,5 4,5 9,1 2 9,1 9,1 18,2 6 27,3 27,3 45,5 2 9,1 9,1 54,5 3 13,6 13,6 68,2 1 4,5 4,5 72,7 2 9,1 9,1 81,8 3 13,6 13,6 95,5 1 4,5 4,5 100,0 22 100,0 100,0 v7 6 5 4 Häufigkeit 3 2 1 0 7 9 11 13 14 v7 15 16 18 19 23 16) Am häufigsten nämlich in 6 von 22 Stichproben kommen 13 Ostpersonen je Stichprobe vor. Hätten Sie diesen Wert von zwischen auch vorab schon abschätzen können? 17) In den 22 Stichproben vom Umfang 40, wie viele nicht verheiratete können theoretisch in jeder Stichprobe mindestens und höchstens vorkommen? 13

18) Ist es wahrscheinlich, dass in einer Stichprobe gar keine nicht verheiratete oder nur verheiratete vorkommen? 19) Was würden Sie vermuten, wie viele nicht verheiratete im Schnitt in den 22 Stichproben vorkommen? 20) Betrachten Sie für die Datei einkomm stich.sav die Verteilung der Variable Summe nicht verheiratete. Wie viele nicht verheiratete kommen in den 22 Stichproben tatsächlich mindestens und höchstens vor? Welches ist eine typische nicht verheirateten-anzahl in den Stichproben, d.h. welches ist der Erwartungswert der Anzahl der nicht verheirateten? v9 Gültig 11 12 13 14 15 16 17 18 19 21 24 Gesamt Gültige Kumulierte Häufigkeit Prozent Prozente Prozente 1 4,5 4,5 4,5 1 4,5 4,5 9,1 1 4,5 4,5 13,6 3 13,6 13,6 27,3 1 4,5 4,5 31,8 4 18,2 18,2 50,0 4 18,2 18,2 68,2 3 13,6 13,6 81,8 1 4,5 4,5 86,4 2 9,1 9,1 95,5 1 4,5 4,5 100,0 22 100,0 100,0 v9 4 3 Häufigkeit 2 1 0 11 12 13 14 15 16 v9 17 18 19 21 24 21) Am häufigsten nämlich in 4 von 22 Stichproben kommen 16 bzw. 17 nicht verheiratete je Stichprobe vor. Hätten Sie diesen Wert auch vorab schon abschätzen können? 14

Woche 10-12 Datei: Normalgewicht.sav v1 v2 v3 v4 Standardnormalverteilung und Normalverteilung Standardisieren von Zufallsvariablen z 1-α/2 -Quantil Gewicht Standardnormalverteilte ZV Mondgewicht Wintergewicht 1000 Personen wurden hinsichtlich Ihres Gewichts befragt. Die wichtigsten Statistiken und die Häufigkeitstabelle des SPSS-Ausdrucks ist unten angegeben. v1 N Statistiken Gültig 1000 Fehlend 0 Mittelwert 64,22 Median 64,00 Modus 66 Standardabweichung 10,376 Schiefe,052 Standardfehler der Schiefe,077 Kurtosis,037 Standardfehler der Kurtosis,155 Perzentile 25 57,00 50 64,00 75 71,00 15

v1 Gültig 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 91 92 93 95 99 101 Gesamt Gültige Kumulierte Häufigkeit Prozent Prozente Prozente 1,1,1,1 2,2,2,3 1,1,1,4 3,3,3,7 2,2,2,9 2,2,2 1,1 3,3,3 1,4 2,2,2 1,6 6,6,6 2,2 7,7,7 2,9 11 1,1 1,1 4,0 11 1,1 1,1 5,1 5,5,5 5,6 9,9,9 6,5 16 1,6 1,6 8,1 13 1,3 1,3 9,4 10 1,0 1,0 10,4 17 1,7 1,7 12,1 28 2,8 2,8 14,9 17 1,7 1,7 16,6 31 3,1 3,1 19,7 24 2,4 2,4 22,1 41 4,1 4,1 26,2 37 3,7 3,7 29,9 37 3,7 3,7 33,6 29 2,9 2,9 36,5 39 3,9 3,9 40,4 38 3,8 3,8 44,2 34 3,4 3,4 47,6 29 2,9 2,9 50,5 31 3,1 3,1 53,6 46 4,6 4,6 58,2 38 3,8 3,8 62,0 40 4,0 4,0 66,0 32 3,2 3,2 69,2 35 3,5 3,5 72,7 35 3,5 3,5 76,2 29 2,9 2,9 79,1 26 2,6 2,6 81,7 29 2,9 2,9 84,6 23 2,3 2,3 86,9 19 1,9 1,9 88,8 17 1,7 1,7 90,5 8,8,8 91,3 17 1,7 1,7 93,0 12 1,2 1,2 94,2 10 1,0 1,0 95,2 13 1,3 1,3 96,5 5,5,5 97,0 2,2,2 97,2 5,5,5 97,7 4,4,4 98,1 5,5,5 98,6 5,5,5 99,1 1,1,1 99,2 3,3,3 99,5 1,1,1 99,6 1,1,1 99,7 1,1,1 99,8 1,1,1 99,9 1,1,1 100,0 1000 100,0 100,0 16

1) Betrachten Sie die Häufigkeitstabelle und Häufigkeitsverteilung und das Histogramm der Variable v1 Gewicht. Ist die Verteilung schief oder symmetrisch? v1 50 40 Häufigkeit 30 20 10 0 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63 65 67 69 71 73 75 77 79 81 83 85 87 89 92 95 101 v1 Histogramm 120 100 80 Häufigkeit 60 40 20 0 40 60 v1 80 100 Mittelwert =64,22 Std.-Abw. =10,376 N =1.000 17

2) Lesen Sie aus der SPSS-Ausgabe für die Variable v1 Gewicht die wichtigsten Kenngrößen der Verteilung ab. Wo liegt der Mittelwert, die Standardabweichung? 3) Betrachten Sie das Histogramm der Variable v1 Gewicht Vergleichen Sie die Balken mit der Linie der Dichtefunktion der Normalverteilung. Würden Sie die Variable Gewicht als normalverteilt ansehen? 4) Nehmen Sie an, dass eine Variable v2 Standardnormalverteilte ZV normalverteilt ist mit Erwartungswert 0 und Standardabweichung 1. Wie groß wäre dann theoretisch die Wahrscheinlichkeit, dass jemand eine Merkmalsausprägung im Intervall [-1;1] hat, d.h P(-1 X 1)= [-2;2] hat, d.h P(-2 X 2)= [-3;3] hat, d.h P(-3 X 3)= (- ;-1] hat, d.h. P(X -1)= (- ;-2] hat, d.h. P(X -2)= (- ;-3] hat, d.h. P(X -3)= (- ;1] hat, d.h. P(X 1)= (- ;2] hat, d.h. P(X 2)= (- ;3] hat, d.h. P(X 3)= 5) Betrachten Sie für die Variable v1 Gewicht die kumulierten Häufigkeiten in Prozent. Schätzen Sie aus der kumulierten Häufigkeitstabelle ab. Verwenden Sie dabei die Bedingung zum Standardisieren von ZV z = x µ bzw. x = z σ + µ : σ a. Welcher Anteil der Merkmalsträger erreicht höchstens einen Wert von x = 1 10, 38 + 64, 22 = 53, 84? b. Welcher Anteil der Merkmalsträger erreicht höchstens einen Wert von x = 2 10, 38 + 64, 22 = 43, 46? c. Welcher Anteil der Merkmalsträger erreicht höchstens einen Wert von x = 3 10, 38 + 64, 22 = 33, 08? d. Welcher Anteil der Merkmalsträger erreicht höchstens einen Wert von x = 1 10, 38 + 64, 22 = 74, 6? e. Welcher Anteil der Merkmalsträger erreicht höchstens einen Wert von x = 2 10, 38 + 64, 22 = 84, 98? f. Welcher Anteil der Merkmalsträger erreicht höchstens einen Wert von x = 3 10, 38 + 64, 22 = 95, 36? g. Bestimmen Sie das Gewicht, das 50% der Personen höchstens haben (Median). h. Bestimmen Sie das Gewicht, das 25% der Personen höchstens haben (1. Quartil). i. Bestimmen Sie das Gewicht, das 75% der Personen höchstens haben (3. Quartil). j. Bestimmen Sie das Gewicht, das 2,5% der Personen höchstens haben. 18

k. Bestimmen Sie das Gewicht, das 97,5% der Personen höchstens haben. 6) Ordnen Sie alle Aussagen zu: Das Gewicht, das 2,5% der Personen höchstens haben. Das Gewicht, das 97,5% der Personen höchstens haben. Das Gewicht, das 99,5% der Personen höchstens haben. Das Gewicht, das 0,5% der Personen höchstens haben. Das Gewicht, das die schwersten 2,5% der Personen mindestens haben. Das Gewicht, das die schwersten 0,5% der Personen mindestens haben. Z α/2 -Quantil für α=0,01. Z α/2 -Quantil für α=0,05. Z 1-α/2 -Quantil für α=0,01. Z 1-α/2 -Quantil für α=0,01. Z 1-α/2 -Quantil für α=0,05. Z 1-α/2 -Quantil für α=0,05. 7) Nehmen Sie an, dass die Variable v1 Gewicht normalverteilt ist mit Erwartungswert 64,22 und Standardabweichung 10,38. Verwenden Sie dabei die Bedingung zum Standardisieren von ZV z = x µ bzw. x = z σ + µ. Wie groß wäre dann theoretisch die Wahrscheinlichkeit, dass σ jemand ein Gewicht im Intervall [53,84;74,6] hat, d.h P(53,84 X 74,6)= [43,46;84,99] hat, d.h P(43,46 X 84,99)= [33,08;95,36] hat, d.h P(33,08 X 95,36)= (- ;53,84] hat, d.h. P(X 53,84)= (- ;43,46] hat, d.h. P(X 43,46)= (- ;33,08] hat, d.h. P(X 33,08)= 8) Betrachten Sie die Häufigkeitsverteilung der neuen Variable v2 Standardisierte ZV, die v1 64, 22 folgendermaßen berechnet wurde: v2 =. Vergleichen Sie die Gestalt der Verteilung, 10, 38 Erwartungswert und Standardabweichung von v2 mit der Variablen v1. 19

Statistiken v2 N Gültig 1000 Fehlend 0 Mittelwert -,0003 Median -,0212 Modus,17 Standardabweichung,99998 Schiefe,052 Standardfehler der Schiefe,077 Kurtosis,037 Standardfehler der Kurtosis,155 Perzentile 25 -,6958 50 -,0212 75,6534 20

StandardisierteZV Gültig -2,82-2,72-2,62-2,53-2,43-2,33-2,24-2,14-2,05-1,95-1,85-1,76-1,66-1,56-1,47-1,37-1,27-1,18-1,08 -,98 -,89 -,79 -,70 -,60 -,50 -,41 -,31 -,21 -,12 -,02,08,17,27,36,46,56,65,75,85,94 1,04 1,14 1,23 1,33 1,42 1,52 1,62 1,71 1,81 1,91 2,00 2,10 2,20 2,29 2,39 2,58 2,68 2,77 2,97 3,35 3,54 Gesamt Gültige Kumulierte Häufigkeit Prozent Prozente Prozente 1,1,1,1 2,2,2,3 1,1,1,4 3,3,3,7 2,2,2,9 2,2,2 1,1 3,3,3 1,4 2,2,2 1,6 6,6,6 2,2 7,7,7 2,9 11 1,1 1,1 4,0 11 1,1 1,1 5,1 5,5,5 5,6 9,9,9 6,5 16 1,6 1,6 8,1 13 1,3 1,3 9,4 10 1,0 1,0 10,4 17 1,7 1,7 12,1 28 2,8 2,8 14,9 17 1,7 1,7 16,6 31 3,1 3,1 19,7 24 2,4 2,4 22,1 41 4,1 4,1 26,2 37 3,7 3,7 29,9 37 3,7 3,7 33,6 29 2,9 2,9 36,5 39 3,9 3,9 40,4 38 3,8 3,8 44,2 34 3,4 3,4 47,6 29 2,9 2,9 50,5 31 3,1 3,1 53,6 46 4,6 4,6 58,2 38 3,8 3,8 62,0 40 4,0 4,0 66,0 32 3,2 3,2 69,2 35 3,5 3,5 72,7 35 3,5 3,5 76,2 29 2,9 2,9 79,1 26 2,6 2,6 81,7 29 2,9 2,9 84,6 23 2,3 2,3 86,9 19 1,9 1,9 88,8 17 1,7 1,7 90,5 8,8,8 91,3 17 1,7 1,7 93,0 12 1,2 1,2 94,2 10 1,0 1,0 95,2 13 1,3 1,3 96,5 5,5,5 97,0 2,2,2 97,2 5,5,5 97,7 4,4,4 98,1 5,5,5 98,6 5,5,5 99,1 1,1,1 99,2 3,3,3 99,5 1,1,1 99,6 1,1,1 99,7 1,1,1 99,8 1,1,1 99,9 1,1,1 100,0 1000 100,0 100,0 21

Histogramm 120 100 80 Häufigkeit 60 40 20 0-2,00 0,00 2,00 4,00 Mittelwert =-2,89E-4 Std.-Abw. =1,00 N =1.000 StandardisierteZV Tragen Sie folgende Maße für die Variablen v1 und v2 in die Tabelle ein: V1 Gewicht V2 Standardisierte ZV Erwartungswert Streuung 1. Quartil 3. Quartil Wölbung Schiefe 9) Auf dem Mond wiegen alle Menschen nur ein Siebtel des Gewichts auf der Erde. Bilden Sie eine neue Variable v3 Mondgewicht = 7 1 v. Vergleichen Sie über die Gestalt der Verteilung, Erwartungswert und Standardabweichung von v3 Mondgewicht mit der Variable v1 Gewicht. 22

Statistiken Mondgewicht N Gültig Fehlend Mittelwert Median Modus Standardabweichung Varianz Schiefe Standardfehler der Schiefe Kurtosis Standardfehler der Kurtosis 1000 0 9,1739 9,1429 9,43 1,48226 2,197,052,077,037,155 Spannweite Minimum Maximum Perzentile 25 50 75 9,43 5,00 14,43 8,1429 9,1429 10,1429 23

Mondgewicht Gültig 5,00 5,14 5,29 5,43 5,57 5,71 5,86 6,00 6,14 6,29 6,43 6,57 6,71 6,86 7,00 7,14 7,29 7,43 7,57 7,71 7,86 8,00 8,14 8,29 8,43 8,57 8,71 8,86 9,00 9,14 9,29 9,43 9,57 9,71 9,86 10,00 10,14 10,29 10,43 10,57 10,71 10,86 11,00 11,14 11,29 11,43 11,57 11,71 11,86 12,00 12,14 12,29 12,43 12,57 12,71 13,00 13,14 13,29 13,57 14,14 14,43 Gesamt Gültige Kumulierte Häufigkeit Prozent Prozente Prozente 1,1,1,1 2,2,2,3 1,1,1,4 3,3,3,7 2,2,2,9 2,2,2 1,1 3,3,3 1,4 2,2,2 1,6 6,6,6 2,2 7,7,7 2,9 11 1,1 1,1 4,0 11 1,1 1,1 5,1 5,5,5 5,6 9,9,9 6,5 16 1,6 1,6 8,1 13 1,3 1,3 9,4 10 1,0 1,0 10,4 17 1,7 1,7 12,1 28 2,8 2,8 14,9 17 1,7 1,7 16,6 31 3,1 3,1 19,7 24 2,4 2,4 22,1 41 4,1 4,1 26,2 37 3,7 3,7 29,9 37 3,7 3,7 33,6 29 2,9 2,9 36,5 39 3,9 3,9 40,4 38 3,8 3,8 44,2 34 3,4 3,4 47,6 29 2,9 2,9 50,5 31 3,1 3,1 53,6 46 4,6 4,6 58,2 38 3,8 3,8 62,0 40 4,0 4,0 66,0 32 3,2 3,2 69,2 35 3,5 3,5 72,7 35 3,5 3,5 76,2 29 2,9 2,9 79,1 26 2,6 2,6 81,7 29 2,9 2,9 84,6 23 2,3 2,3 86,9 19 1,9 1,9 88,8 17 1,7 1,7 90,5 8,8,8 91,3 17 1,7 1,7 93,0 12 1,2 1,2 94,2 10 1,0 1,0 95,2 13 1,3 1,3 96,5 5,5,5 97,0 2,2,2 97,2 5,5,5 97,7 4,4,4 98,1 5,5,5 98,6 5,5,5 99,1 1,1,1 99,2 3,3,3 99,5 1,1,1 99,6 1,1,1 99,7 1,1,1 99,8 1,1,1 99,9 1,1,1 100,0 1000 100,0 100,0 24

Mondgewicht 50 40 Häufigkeit 30 20 10 0 5,00 5,43 5,86 6,29 6,71 7,14 7,57 8,00 8,43 8,86 9,29 9,71 10,14 10,57 11,00 11,43 11,86 12,29 12,71 13,29 14,43 Mondgewicht v1 50 40 Häufigkeit 30 20 10 0 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63 65 67 69 71 73 75 77 79 81 83 85 87 89 92 95 101 v1 25

Histogramm 120 100 80 Häufigkeit 60 40 20 0 5,00 7,50 10,00 12,50 15,00 Mittelwert =9,17 Std.-Abw. =1,482 N =1.000 Mondgewicht 26

Tragen Sie folgende Maße für die Variablen v1 und v3 in die Tabelle ein: V1 Gewicht V3 Mondgewicht Erwartungswert Streuung 1. Quartil 3. Quartil Wölbung Schiefe 10) Alle untersuchten Personen sollen nun in Winterkleidung gewogen werden. Das Gewicht eines jeden erhöht sich um 2 kg. Betrachten Sie eine neue Variable v4 Wintergewicht = v 1+ 2. Vergleichen Sie die Gestalt der Verteilung, Erwartungswert und Standardabweichung von v4 Wintergewicht mit der Variable v1 Gewicht. N Statistiken v1 Wintergewicht Gültig 1000 1000 Fehlend 0 0 Mittelwert 64,22 66,2170 Median 64,00 66,0000 Modus 66 68,00 Standardabweichung 10,376 10,37582 Varianz 107,658 107,658 Schiefe,052,052 Standardfehler der Schiefe,077,077 Kurtosis,037,037 Standardfehler der Kurtosis,155,155 Spannweite 66 66,00 Minimum 35 37,00 Maximum 101 103,00 Perzentile 25 57,00 59,0000 50 64,00 66,0000 75 71,00 73,0000 27

v1 50 40 Häufigkeit 30 20 10 0 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63 65 67 69 71 73 75 77 79 81 83 85 87 89 92 95 101 v1 Wintergewicht 50 40 Häufigkeit 30 20 10 0 37,00 40,00 43,00 46,00 49,00 52,00 55,00 58,00 61,00 64,00 67,00 70,00 73,00 76,00 79,00 82,00 85,00 88,00 91,00 95,00 103,00 Wintergewicht Tragen Sie folgende Maße für die Variablen v1 und v4 in die Tabelle ein: 28

Erwartungswert Streuung 1. Quartil 3. Quartil Wölbung Schiefe V1 Gewicht V4 Wintergewicht 11) Beschriften Sie in der untenstehenden Dichtefunktion einer standardnormalverteilten Zufallsvariable die jeweils die schraffierten und die nicht schraffierten Flächen mit ihrer Größe. a) b) f(z) f(z) 0,4 0,4 0,3 0,3 0,2 0,2 0,1 0,1 0-4 -3-2 -1 0 1 2 3 4 z 0-4 -3-2 -1 0 1 2 3 4 z 0,4 f(z) 0,4 f(z) 0,3 0,3 0,2 0,2 0,1 0,1 0-4 -3-2 -1 0 1 2 3 4 z 0-4 -3-2 -1 0 1 2 3 4 z c) d) 29

Woche 13-14 Datei: einkomm.sav und einkomm stich.sav Konfidenzintervalle für den Mittelwert Konfidenzintervalle für den Anteilswert v1 Alter Schulabschluss (1=Volksschule, 2=Mittlere Reife, 3=Fachhochschulreife, v2 4=Abitur) v3 Monatliches Nettoeinkommen v4 Nummer v5 laufende Nummer in einer Stichprobe vom Umfang 40 v6 Indikatorvariable für Element in der i-ten Stichprobe, i=1,...,22 v7 Erhebungsgebiet (0=West, 1=Ost) v8 Geschlecht (0=männlich, 1=weiblich) v9 Familienstand (0=verheiratet, 1=nichtverheiratet) 1) Wie groß ist der Mittelwert der Variable v3 Einkommen in der Stichprobe der 880 Personen in der Datei einkommen.nsf? v3 N Statistiken Gültig 880 Fehlend 0 Mittelwert 1473,78 2) Betrachten Sie den SPSS-Ausdruck für das 95 % Konfidenzintervall und 99 % Konfidenzintervall für den Mittelwert des Einkommens. Wie lauten die Intervallgrenzen und welches Intervall ist länger? Deskriptive Statistik Statistik Standard fehler v3 Mittelwert 1473,78 20,995 1432,58 1514,99 30

Median 1330,00 Varianz 387901,819 Standardabweichung 622,818 Minimum 260 Maximum 3580 Spannweite 3320 Interquartilbereich 770 Schiefe,962,082 Kurtosis 1,020,165 Deskriptive Statistik Standa rdfehle Statistik r v3 Mittelwert 1473,78 20,995 99% Konfidenzintervall Untergrenze 1419,59 1527,98 Median 1330,00 Varianz 387901,819 Standardabweichung 622,818 Minimum 260 Maximum 3580 Spannweite 3320 Interquartilbereich 770 Schiefe,962,082 Kurtosis 1,020,165 3) Berechnen Sie das 95%-Konfidenzintervall und das 99%-Konfidenzintervall für den Mittelwert mit der Hand und vergleichen Sie die Ergebnisse mit denen von SPSS. 4) Wie groß ist der Anteilswert der Frauen in der Stichprobe der 880 Personen in der Datei einkommen.sav? v8 N Statistiken Gültig 880 Fehlend 0 Mittelwert,36 Summe 319 5) Betrachten Sie die SPSS-Ausgabe für das 95 % Konfidenzintervall und 99 % Konfidenzintervall für den Anteilswert an. Wie lauten die Intervallgrenzen und welches Intervall ist länger 31

Deskriptive Statistik Statistik Standardfehler v8 Mittelwert,36,016,33,39 Median,00 Varianz,231 Standardabweichung,481 Minimum 0 Maximum 1 Spannweite 1 Interquartilbereich 1 Schiefe,573,082 Kurtosis -1,675,165 Deskriptive Statistik Statistik Standardfehler v8 Mittelwert,36,016 99% Konfidenzintervall Untergrenze,32,40 Median,00 Varianz,231 Standardabweichung,481 Minimum 0 Maximum 1 Spannweite 1 Interquartilbereich 1 Schiefe,573,082 Kurtosis -1,675,165 6) Berechnen Sie das 95%-Konfidenzintervall und das 99%-Konfidenzintervall für den Anteilswert mit der Hand und vergleichen Sie die Ergebnisse mit denen von SPSS. 7) Interpretieren Sie nun die 880 Personen als Grundgesamtheit und ziehen Sie eine Teilstichprobe im Umfang von 40 aus der Grundgesamtheit. Berechnen Sie das Durchschnittsalter in der Teilstichprobe (Punktschätzung). (Trick, um das in SPSS durchzuführen: In der Datei einkomm.sav gibt es die Indiaktorvariable v6, die alle 40 Fälle um einen hochgezählt wird. Setzen Sie nun durch WERKZEUGE\FÄLLE AUSWÄHLEN die Indikatorvariabel v6=1. Wählen Sie dann ANALYSE\UNIVARIATE STATISTIKEN für die Variable v1 und Sie erhalten u.a. den Mittelwert für das Alter in der ersten (von 22) Stichprobe, die den Umfang 40 hat.) Lassen Sie sich auch das Konfidenzintervall ausgeben (Intervallschätzung). 32

Deskriptive Statistik v1 Standardfe Statistik hler Mittelwert 39,78 1,986 35,76 43,79 Median 38,00 Varianz 157,769 Standardabweichung 12,561 Minimum 19 Maximum 63 Spannweite 44 Interquartilbereich 20 Schiefe,275,374 Kurtosis -,892,733 8) Wiederholen Sie Aufgabe 7) sukzessive für die weiteren 21 Teilstichproben, d.h. zuerst die Indikatorvariable auf 2 setzen, dann das Konfidenzintervall ausgeben lassen, dann die Indikatorvariable auf 3 setzen usw...bis die Indikatorvariable letztendlich auf 22 gesetzt wird, so dass Sie letztendlich 22 95%-Konfidenzintervalle erhalten. (Trick, um das in SPSS viel viel schneller durchzuführen: Wählen Sie ANALYSE\DESKRIPTIVE STATISTIKEN/EXPLORATIVE DATENANALYSE und dort als Variable v1 Alter und als Gruppenvariable v6 Indikatorvariable. Klicken Sie beim Optionsschalter das 95%-Konfidenzintervall an und Sie erhalten die tabellarische Darstellung aller 22 Konfidenzintervalle. Deskriptive Statistik v6 Statistik Standardfehler v1 1 Mittelwert 39,78 1,986 35,76 43,79 2 Mittelwert 40,38 2,001 36,33 44,42 3 Mittelwert 40,73 1,910 36,86 44,59 4 Mittelwert 38,93 2,026 34,83 43,02 33

5 Mittelwert 41,30 1,919 37,42 45,18 6 Mittelwert 39,23 2,086 35,01 43,44 7 Mittelwert 39,08 1,611 35,82 42,33 8 Mittelwert 39,20 2,002 35,15 43,25 9 Mittelwert 40,38 1,490 37,36 43,39 10 Mittelwert 41,60 1,679 38,20 45,00 11 Mittelwert 37,53 1,525 34,44 40,61 12 Mittelwert 38,95 1,657 35,60 42,30 13 Mittelwert 39,58 1,800 35,93 43,22 14 Mittelwert 38,68 1,658 35,32 42,03 15 Mittelwert 39,13 1,741 35,60 42,65 16 Mittelwert 38,90 1,821 35,22 34

42,58 17 Mittelwert 39,55 2,082 35,34 43,76 18 Mittelwert 38,53 1,451 35,59 41,46 19 Mittelwert 38,93 1,878 35,13 42,72 20 Mittelwert 43,58 1,613 40,31 46,84 21 Mittelwert 38,20 1,790 34,58 41,82 22 Mittelwert 39,58 1,939 35,65 43,50 v1 Alter Bericht v6 Mittelwert N Standardabw eichung 1 39,78 40 12,561 2 40,38 40 12,653 3 40,73 40 12,083 4 38,93 40 12,811 5 41,30 40 12,136 6 39,23 40 13,192 7 39,08 40 10,191 8 39,20 40 12,662 9 40,38 40 9,426 10 41,60 40 10,621 11 37,53 40 9,645 12 38,95 40 10,481 13 39,58 40 11,386 14 38,68 40 10,484 15 39,13 40 11,011 16 38,90 40 11,515 35

17 39,55 40 13,166 18 38,53 40 9,176 19 38,93 40 11,878 20 43,58 40 10,200 21 38,20 40 11,319 22 39,58 40 12,266 Insgesamt 39,62 880 11,401 9) In der Tabelle sind für die 22 Teilstichproben vom Umfang 40 für die Variable Alter die Konfidenzintervallgrenzen angegeben. Welche Intervalle enthalten zufällig besonders alte Personen? Welche Intervalle enthalten zufällig besonders junge Personen? Sind die Intervalle alle gleich lang und wenn nicht, warum nicht? 10) Überdecken alle Intervalle den Mittelwert der Grundgesamtheit, d.h. das Durchschnittsalter der 880 Personen von 39,62 Jahren? 11) Welchen Schätzfehler würde man begehen, wenn man das Durchschnittsalter in der Grundgesamtheit anhand der Teilstichprobe Nr. 20 abschätzen wollte? Eine Überschätzung oder eine Unterschätzung des Alters in der Grundgesamtheit? 12) Wie viele verrutschte, für die Grundgesamtheit untypische 95%-Konfidenzintervalle, die den Mittelwert der Grundgesamtheit NICHT überdecken, würden Sie bei 22 Teilstichproben erwarten? 13) Wie viele verrutschte, für die Grundgesamtheit untypische 95%-Konfidenzintervalle, die den Mittelwert der Grundgesamtheit NICHT überdecken, würden Sie bei 100 Teilstichproben erwarten? 14) Wie viele verrutschte, für die Grundgesamtheit untypische 99%-Konfidenzintervalle, die den Mittelwert der Grundgesamtheit NICHT überdecken, würden Sie bei 100 Teilstichproben erwarten? 15) In unten stehender SPSS-Ausgabe sind 22 50 % -Konfidenzintervalle für die Variable V1 Alter ausgegeben. Wie viele Konfidnezintervalle überdecken den wahren Mittelwert von 39,62 Jahren NICHT? 16) Wie viele verrutschte, für die Grundgesamtheit untypische 50%-Konfidenzintervalle, die den Mittelwert der Grundgesamtheit NICHT überdecken, würden Sie bei 100 Teilstichproben erwarten? Deskriptive Statistik 1 v6 1 2 Standardfe Statistik hler Mittelwert 39,78 1,986 50% Konfidenzintervall Untergrenze 38,42 41,13 Mittelwert 40,38 2,001 50% Konfidenzintervall Untergrenze 39,01 41,74 36

3 Mittelwert 40,73 1,910 50% Konfidenzintervall Untergrenze 39,42 42,03 4 5 6 7 8 9 10 11 12 13 14 15 Mittelwert 38,93 2,026 50% Konfidenzintervall Untergrenze 37,55 40,30 Mittelwert 41,30 1,919 50% Konfidenzintervall Untergrenze 39,99 42,61 Mittelwert 39,23 2,086 50% Konfidenzintervall Untergrenze 37,80 40,65 Mittelwert 39,08 1,611 50% Konfidenzintervall Untergrenze 37,98 40,17 Mittelwert 39,20 2,002 50% Konfidenzintervall Untergrenze 37,84 40,56 Mittelwert 40,38 1,490 50% Konfidenzintervall Untergrenze 39,36 41,39 Mittelwert 41,60 1,679 50% Konfidenzintervall Untergrenze 40,46 42,74 Mittelwert 37,53 1,525 50% Konfidenzintervall Untergrenze 36,49 38,56 Mittelwert 38,95 1,657 50% Konfidenzintervall Untergrenze 37,82 40,08 Mittelwert 39,58 1,800 50% Konfidenzintervall Untergrenze 38,35 40,80 Mittelwert 38,68 1,658 50% Konfidenzintervall Untergrenze 37,55 39,80 Mittelwert 39,13 1,741 50% Konfidenzintervall Untergrenze 37,94 40,31 37

16 Mittelwert 38,90 1,821 50% Konfidenzintervall Untergrenze 37,66 40,14 17 18 19 20 21 22 Mittelwert 39,55 2,082 50% Konfidenzintervall Untergrenze 38,13 40,97 Mittelwert 38,53 1,451 50% Konfidenzintervall Untergrenze 37,54 39,51 Mittelwert 38,93 1,878 50% Konfidenzintervall Untergrenze 37,65 40,20 Mittelwert 43,58 1,613 50% Konfidenzintervall Untergrenze 42,48 44,67 Mittelwert 38,20 1,790 50% Konfidenzintervall Untergrenze 36,98 39,42 Mittelwert 39,58 1,939 50% Konfidenzintervall Untergrenze 38,25 40,90 38

Woche 15 Datei: einkomm.sav und einkomm stich.sav Test auf Mittelwertunterschiede Test für den Erwartungswert Zweiseitige Tests Einseitige Tests v1 Alter Schulabschluss (1=Volksschule, 2=Mittlere Reife, 3=Fachhochschulreife, v2 4=Abitur) v3 Monatliches Nettoeinkommen v4 Nummer v5 laufende Nummer in einer Stichprobe vom Umfang 40 v6 Indikatorvariable für Element in der i-ten Stichprobe, i=1,...,22 v7 Erhebungsgebiet (0=West, 1=Ost) v8 Geschlecht (0=männlich, 1=weiblich) v9 Familienstand (0=verheiratet, 1=nichtverheiratet) 1) Wenn Sie testen wollen, ob in der Datei einkomm.sav die Ost- und Westpersonen ein unterschiedliches Einkommen haben, welche Hypothesen müssen Sie aufstellen? Wie heißt die Nullhypothese? Wie heißt die Gegenhypothese? 2) Betrachten Sie den SPSS-Ausdruck für den t-test auf Mittelwertunterschiede für die Variable Einkommen und die Gruppenvariable Erhebungsgebiet. Welchen Wert hat die t-test- Statistik? Sind die Mittelwertunterschiede signifikant? Muss die Nullhypothese abgelehnt werden? Gruppenstatistiken Einkommen v7 N Mittelwert Standarda bweichung Standardfehler des Mittelwertes v3 0=West 560 1660,70 648,523 27,405 1=Ost 320 1146,69 403,972 22,583 Test bei unabhängigen Stichproben v3 Varianzen sind gleich Varianzen sind nicht gleich Levene-Test der Varianzgleichheit T-Test für die Mittelwertgleichheit 95% Konfidenzintervall Mittlere Standardfehle der Differenz F Signifikanz T df Sig. (2-seitig) Differenz r der Differenz Untere Obere 64,702,000 12,826 878,000 514,009 40,077 435,352 592,666 14,475 871,637,000 514,009 35,511 444,312 583,706 3) Berechnen Sie die t-test-statistik mit der Hand. 39

4) Wie lautet das t -Quantil und dem t -Quantil der Student-t-Verteilung für ein α 2 Signifikanzniveau α = 0,05. 1 α 2 5) Wenn Sie testen wollen, ob in der Datei einkomm.sav Frauen und Männer einen unterschiedlichen Schulabschluss haben, welche Hypothesen müssen Sie aufstellen? Wie heißt die Nullhypothese? Wie heißt die Gegenhypothese? Was kommt raus? V2=Schulabschluss (1=Volksschule, 2=Mittlere Reife, 3=Fachhochschulreife, 4=Abitur) Gruppenstatistiken Schulabschluss v8 N Mittelwe rt Standar dabweic hung Standardfehler des Mittelwertes v2 0=Mann 560 2,13 1,104,047 1=Frau 320 2,39 1,065,060 Test bei unabhängigen Stichproben v2 Varianzen sind gleich Varianzen sind nicht gleich Levene-Test der Varianzgleichheit T-Test für die Mittelwertgleichheit 95% Konfidenzintervall Mittlere Standardfehle der Differenz F Signifikanz T df Sig. (2-seitig) Differenz r der Differenz Untere Obere,495,482-3,366 878,001 -,257,076 -,407 -,107-3,399 683,855,001 -,257,076 -,406 -,109 6) In der Teilstichprobe Nummer 20 (Indikatorvariable v6=20) beträgt der Altersmittelwert x = 43,58 und die Standardabweichung s = 10, 2 Testen Sie für die Teilstichprobe Nummer 20, dass das Durchschnittsalter 39,62 Jahre (das war das Durchschnittsalter der Grundgesamtheit) beträgt. Die Gegenhypothese soll sein, dass das Durchschnittsalter ungleich 39,62 Jahre ist (zweiseitiger Test). Statistik bei einer Stichprobe Standardfehl N Mittelwert Standardabw eichung er des Mittelwertes v1 40 43,58 10,200 1,613 Test bei einer Sichprobe Testwert = 39.62 95% Konfidenzintervall der Differenz Mittlere T df Sig. (2-seitig) Differenz Untere Obere v1 2,452 39,019 3,955,69 7,22 40

7) Der Mittelwert in der Gesamtstichprobe beträgt 39,62 und die Standardabweichung 11,41, der Stichprobenumfang 880. Testen Sie für die Gesamtstichprobe, dass das Durchschnittsalter 38 Jahre beträgt. Die Gegenhypothese soll sein, dass das Durchschnittsalter ungleich 38 Jahre ist (zweiseitiger Test). Statistik bei einer Stichprobe Standardfehl N Mittelwert Standardabw eichung er des Mittelwertes v1 880 39,62 11,401,384 Test bei einer Stichprobe Testwert = 38 95% Konfidenzintervall der Differenz Mittlere T df Sig. (2-seitig) Differenz Untere Obere v1 4,219 879,000 1,622,87 2,38 41

Datei: einkomm.sav Test für den Anteilswert 1) Der Frauenanteil in der Stichprobe der Datei einkomm.nsf beträgt 36,2% Es wird allerdings behauptet, dass der Frauenanteil in der Stichprobe 40% beträgt. Testen Sie die Nullhypothese p=0,4 gegen die Gegenhypothese p<0,4, d.h., dass Frauen deutlich unterrepräsentiert sind (einseitiger Test) Deskriptive Statistik N Minimum Maximum Mittelwert Standardabw eichung v8 880 0 1,36,481 Gültige Werte (Listenweise) 880 Test bei einer Sichprobe Testwert = 0.4 95% Konfidenzintervall der Differenz Mittlere T df Sig. (2-seitig) Differenz Untere Obere v8-2,241 879,025 -,036 -,07,00 2) Ein Lieferant von Glühbirnen behauptet, dass höchstens 4% der Glühbirnen kaputt sind. In einer Stichprobe vom Umfang 300 werden allerdings 15 kaputte Birnen entdeckt. Ein skeptischer Kunde vermutet daraufhin eine höhere Ausschussquote. Prüfen Sie die Vermutung des Kunden bei einem Signifikanzniveau von 0,05. 42