Kapitel 1 Beschreibung von Daten 1.1 Beispiele zum Üben 1.1.1 Aufgaben Achtung: die Nummerierung ist nicht ident mit der im Buch; Bsp. 1-1 enspricht Bsp 2-20 im Buch, 1-2 2-21 im Buch usw. 1 1 In einem Versicherungsunternehmen besteht ein Team aus vier Arbeitnehmern, welche im Mittel die folgenden Zeiten (in Stunden) zur Bearbeitung eines Versicherungsfalles benötigen: Arbeitnehmer A B C D benötigte Zeit 2 3 3 5 Wie lange benötigt das Team im Mittel zur Bearbeitung eines übernommenen Falles? Welcher Mittelwert ist zur Bearbeitung der Fragestellung geeignet? 1 2 Die folgende Tabelle enthält Daten der österreichischen Volkszählungen 1951 und 1991. Privathaushalte mit... Personen Jahr 1 2 3 4 5 6 Insges. 1951 386004 598769 489728 330290 183777 216591 2205159 1991 893529 837116 533437 449915 179839 119170 3013006 a) Zeichnen Sie Kreisdiagramme zum Vergleich der Verteilung der Haushaltsgrößen. b) Bestimmen Sie die durchschnittliche Haushaltsgröße im Jahre 1991, unter der (unrealistischen) Annahme, dass es keinen Haushalt mit 5
6 Beschreibung von Daten mehr als 6 Personen gab. Vergleichen sie die Lösung mit jener zu Aufgabe 1 14. Inwieweit beinflusst die getroffene Annahme die Ergebnisse. 1 3 Berechne einen Schiefekoeffizienten für folgende Stichprobe von Beobachtungen: 12, 12, 5, 14, 1, 9, 10, 4 Ist ihre Verteilung eher rechts- oder linksschief? 1 4 Folgende Tabelle basiert auf Daten aus dem Jahr 1990 und enthält eine Einteilung der 232800 österreichischen landwirtschaftlichen Betriebe in Größenklassen nach der Nutzfläche in Hektar. Berücksichtigt wurden nur Betriebe mit mindestens einem Hektar und höchstens 80 Hektar Nutzfläche. Nutzfläche in ha 1 5 5 10 10 20 20 50 50 80 Anteil der Betriebe in % 37.3 20.6 23.9 15.2 3 Zeichnen Sie ein Histogramm und ein Summenpolygon zu den Daten. Ermitteln Sie dann anhand des Summenpolygons (ungefähr) den Median der Betriebsgrößen. 1 5 Die Flugline ADUAL AIR hat für eine Flugroute folgende Tabelle für die Verspätungen beim Abflug ermittelt: Minuten 0-10 10 20 20 30 30 50 50 90 Anzahl 100 80 60 50 20 Berechne das arithmetische Mittel der Verspätungen! 1 6 Fünf Freunde feiern eine Party und trinken dabei jeweils einen Liter Wein. Bei der Heimfahrt werden alle fünf kontrolliert und müssen sich einem Alkoholtest unterziehen. Dabei wurden folgende Promillewerte ermittelt: 2.2, 1.6, 2.4, 1.8, 1.9 a) Zeichnen Sie die empirische Verteilungsfunktion zu den Messungen. b) Welchen Wert nimmt die empirische Verteilungsfunktion an den Stellen 1.8 und 2.5 an? Ermitteln Sie daraus jenen Anteil der Freunde, deren Alkoholgehalt im Blut mehr als 1.8 und höchstens 2.5 betrug!
Beschreibung von Daten 7 1 7 Ein Film wird 100 zufällig ausgewählten Testpersonen gezeigt, welche eine Bewertung auf einer Skala von 0 20 abgaben. Die folgende Tabelle fasst die Bewertungen zusammen. Punkte 0-2 2-5 5-8 8-11 11-14 14-17 17-20 Anzahl 2 15 23 26 21 10 3 Berechne den Quartilsabstand zu den Daten. 1 8 Die folgende Tabelle enthält die Verzinsung eines Bankguthabens in 5 aufeinanderfolgenden Jahren. Jahr 92 93 94 95 96 Verzinsung 1.2% 3.5% 4.4% 4.8% 6.1% Wie hoch war die mittlere Verzinsung? Beschreibung von Daten... 1 9 Welche Lagemaßzahlen kann man in den folgenden Situationen berechnen? a) Gewichte aus einer Stichprobe von 50 Konservendosen,,Pfirsichtraum mit symmetrischer Verteilung. b) Einkommen der 200 Arbeitnehmer eines Betriebs mit schiefer Verteilung. c) Religionsbekenntnisse der Bewohner einer bestimmten Stadt. d) Wertveränderung (in %) einer Aktie in fünf aufeinanderfolgenden Jahren.
8 Beschreibung von Daten 1 10 Nach einer Umfrage wurden die monatlichen Ausgaben von 100 dreiköpfigen Familien für Hygiene- und Körperpflegeprodukte folgendermaßen zusammengefasst: 100 100 500 500 1000 > 1000 6 48 38 8 a) Berechnen Sie den Median der Ausgaben. b) Welche Probleme treten bei der Berechnung des arithmetischen Mittels auf? 1 11 Um eine bestimmte Strecke zurückzulegen gibt es zwei Möglichkeiten. Entweder mit dem PKW: 1/2 der Strecke Autobahn (durchschnittlich 130 km/h), 1/4 der Strecke durch Städte (durchschnittlich 35 km/h), 1/4 der Strecke Landstraße (durchschnittlich 60 km/h), oder mit der Bahn: 1/2 der Strecke Land (durchschnittlich 100 km/h), 1/2 der Strecke Brücken und Tunnels (durchschnittlich 60 km/h). Mit welcher Möglichkeit erreicht man die größere Durchschnittsgeschwindigkeit? 1 12 Von 14 Männern im Alter von 20 30 Jahren wurden die Körpergewichte in kg gemessen: 72, 75, 78, 61, 64, 86, 92, 85, 69, 75, 89, 76, 81, 82. Erstellen Sie ein Stamm & Blatt Diagramm sowie ein Bo & Whisker Diagramm. 1 13 Ermitteln Sie den Median der Daten in Aufgabe 1 4 rechnerisch. 1 14 Betrachte nochmals die Volkszählungsergebnisse von Aufgabe 1 2. Dazu ist noch bekannt, dass im Jahre 1951 6856756 Personen und 1991 7660464 Personen in Privathaushalten lebten. Berechne für 1951 und 1991 jeweils die mittleren Haushaltsgrößen! Wie groß sind die Haushalte mit mehr als 6 Personen im Mittel?
Beschreibung von Daten 9 1 15 Berechnen Sie den Median, das arithmetische Mittel und die Varianz zu folgender Stichprobe von Beobachtungen: 7, 12, 5, 14, 1, 9, 10, 4. 1 16 In einem Betrieb wurde folgende Einkommensverteilung (in 1000 EURO) erhoben: von bis 1 1.4 1.4 2 2 3 3 5 5 9 Anzahl 80 120 40 50 20 a) Zeichne ein Histogramm mit Gesamtfläche 1. Wie hoch ist der Balken der ersten Klasse? b) Wie lautet das Verhältnis der Höhe des Balkens der zweiten Klasse zur Höhe des Balkens der ersten Klasse? c) Berechnen Sie den Median der Einkommen des Betriebs! 1 17 Betrachten Sie die Daten aus 1 4, und berechnen Sie arithmetisches Mittel und Standardabweichung der Betriebsgröße! 1 18 Bei welchen der sechs angegebenen Kurven kann es sich prinzipiell um Summenkurven handeln? (Auch die Achsenbeschriftung beachten!) (a) (b) (c) X (d) (e) (f)
10 Beschreibung von Daten 1 19 Eine Aktie wies in vier aufeinanderfolgenden Jahren folgende prozentualen Wertveränderungen (der Kurse am Jahresende) auf: +20%, +112%, +5%, 14% a) Wenn der Emissionspreis (Anfangspreis) 10 EURO betrug, wie groß waren die Kurse am Ende der ersten vier Jahre? Stellen Sie dieses Kurse grafisch dar. b) Wie hoch war die mittlere Wertveränderung (in Prozent)? c) Angenommen für eine andere Aktie war die Wertveränderung in jedem Jahr die gleiche. Wir groß ist die jährliche Wertveränderung, wenn Emissionspreis und Wert der Aktie am Ende des vierten Jahres die gleichen sind wie in a). 1 20 Eine Familie teilt Ihre Monatsausgaben von 2200 EURO folgendermaßen auf: Nahrung: 400 EURO, Wohnen: 800 EURO, Freizeit: 300 EURO, Bekleidung: 200 EURO, Sparen: 500 EURO. Wenn Sie ein Kreisdiagramm zeichnen wollen, welchen Winkel hat der Abschnitt für die Nahrung? (Ganzer Kreis = 360.) 1 21 Betrachten Sie das folgende Histogramm mit Fläche 1: 0.0 0.2 0.4 0.6 1 3 4 5 a) Wie groß ist die relative Häufigkeit der Klasse von 1 3? b) Wenn man die ersten beiden Klassen zusammenfasst, welche Höhe hat dann der Balken der neu entstandenen Klasse? c) Berechnen Sie den Median zum Histogramm!
Beschreibung von Daten 11 1 22 Betrachte nochmals Beispiel??. Wie viele der 60 Teilnehmer konnten nur höchstens 1/4 der vorgesetzten Torte essen? 1 23 Ein Unternehmen bestellt regelmäßig Büromaterial. Dabei ergaben sich Wartezeiten zwischen Bestellung und Lieferung, die in folgender Tabelle zusammengefasst wurden: Wartezeit in Tagen 0-1 1-4 4-8 8-12 12-20 20-50 h i 1 6 8 16 16 30 Erstellen sie ein Flächenhistogramm zur Darstellung der Häufigkeitsverteilung der Wartezeiten! 1 24 Die folgende Tabelle gibt die Durchschnittsgeschwindigkeit von Usain Bolt über Abschnitte von jeweils 20 m bei seinem Weltrekordlauf (2009) (Quelle: APA): Abschnitt Durchschnittstempo (km/h) 0-20 m 24,9 20-40 m 41,1 40-60 m 43,1 60-80 m 44,7 80-100 m 43,4 Berechnen Sie seine Durchschnittsgeschwindigkeit! 1 25 Gegeben sind folgende klassifizierten Daten: Klasse 0-30 30-35 35-40 40-50 abs. Häufigkeit h i 8 47 36 9 rel. Häufigkeit f i F i Klassenbreite Balkenhöhe für Histogramm Klassenmittelpunkt i a) Vervollständigen Sie die Tabelle! b) Ermitteln Sie den Mittelwert! c) Ermitteln Sie die Varianz! d) Ermitteln Sie grafisch den Median und das 3. Quartil! e) Ermitteln Sie rechnerisch den Median und das 3. Quartil! f) Zeichnen Sie das Histogramm und das Summenpolygon!
12 Beschreibung von Daten 1 26 Eine Oktave besteht aus den Halbtonschritten C, cis, d, dis, e, f, fis, g, gis, a, ais, h, c. Die Frequenz von c ist doppelt so gross wie die von C. Wie groß ist das Frequenz-Verhältnis zweier aufeinanderfolgender Halbtöne im Mittel? 1 27 Eine Aktie hat nach drei Jahren 20 % Wertsteigerung erfahren. In den ersten beiden Jahren waren die Gewinne 2% und 5%. Wie groß war die Wertsteigerung im 3. Jahr? Wie groß war die durchschnittliche Verzinsung über die drei Jahre? 1 28 Der Notendurchschnitt ist eine beliebte Größe zur Charakterisierung der Leistung einer Schulklasse. Ist er auch sinnvoll? 1.1.2 Lösungen 1 2: a) Relative Häufigkeiten und Winkel: Personen im Haushalt Jahr 1 2 3 4 5 6 relative Häufigkeiten 1951 0.175 0.272 0.222 0.15 0.083 0.098 1991 0.297 0.278 0.177 0.149 0.060 0.040 Winkel in Grad 1951 63 98 80 54 30 35 1991 107 100 64 54 21 14 Daraus erhält man folgende Kreisdiagramme: 2 1 2 1 3 6 u. mehr 6 u. mehr 5 4 5 3 4 b) = 2.5. 1 4: Das Flächenhistogramm findet man unten neben dem Summenpolygon. Zur Ermittlung des Summenpolygons benötigen wir die kumulierten relativen Häufigkeiten F i:
Beschreibung von Daten 13 i 1 5 10 20 50 80 F i 0 0.373 0.579 0.818 0.97 1 rel. Haeuf. pro ha 0.0 0.025 0.050 0.075 Fi 1 20 50 80 0.0 0.50 1.00 Median 0 20 40 60 80 Groesse in ha Flächenhistogramm Summenpolygon Durch Ablesen von der Kurve bei y = 0.5 sieht man, dass der Median nahe bei 8 liegt. 1 6: a) Empirische Verteilungsfunktion: F 1.4 1.6 1.8 2.0 2.2 2.4 2.6 b) DurchAblesenausobigerGrafikfindetman:F n(1.8) = 0.4,F n(2.5) = 1. Der gesuchte Anteil ist F n(2.5) F n(1.8) = 0.6.
14 Beschreibung von Daten 1 8: Mittlere Verzinsung: 3.987%. 1 10: a) Median: 466.67. b) Die Klassen ganz außen sind sogenannte offene Randklassen. Ohne zusätzliche Annahmen kann man deren Klassenmitten, die in die Berechnung des arithmetischen Mittels eingehen, nicht bestimmen. 1 12: 6 : 149 7 : 25568 8 : 12569 9 : 2 Stamm und Blatt 60 65 70 75 80 85 90 Bo & Whisker Diagramm 1 14: Zur Berechnung der mittleren Haushaltsgröße ermitteln wir zunächst die durchschnittliche Größe der Haushalte, die 6 und mehr Personen umfassen: Sie betrug 7.22 (1951) bzw. 6.56 (1991). Damit erhält man als mittlere Haushaltsgröße 3.11 (für 1951), bzw. 2.54 (für 1991). 1 16: a) Höhe: 0.645. b) Verhältnis: 1:1. c) Median: 1.775. 1 18: Summenkurven sind: (a), (b) und (f). Die Kurven (c) und (e) sind nicht monoton wachsend, während (d) nicht von 0 bis 1 geht. 1 20: Einen Winkel von 65.5. 1 22: 15 Personen. 1 24: 37.56km/h. 1 26: 1.06. 1 28 Nein. Schulnoten sind ordinalskalierte Merkmale, daher ist die Durchschnittsbildung nicht sinnvoll. Aussagekräftiger sind Median und die beiden Quartile.