6. Übung Themenkomplex: Zweidimensionale Häufigkeitsverteilung Aufgabe 1 Der Pearsonsche Korrelationskoeffizient a) beschreibt Richtung und Stärke des Zusammenhangs zweier Zuvallsvariabeln. b) beschreibt nur die Richtung des Zusammenhangs zweier Zuvallsvariabeln. c) beschreibt nur die Stärke des Zusammenhangs zweier Zuvallsvariabeln. d) nimmt immer Werte zwischen -1 und 1 an. e) nimmt immer Werte zwischen 0 und 1 an. Aufgabe 2 Beschreiben Sie den Zusammenhang zwischen zwei Zufallsvariabeln, wenn der Pearsonsche Korrelationskoeffizient (r xy ) gleich 0,3 ist. a) Kein Zusammenhang b) Schwacher Zusammenhang c) Mittelstarker Zusammenhang d) Starker Zusammenhang e) Perfekter Zusammenhang
Aufgabe 3 Beschreiben Sie den Zusammenhang zwischen zwei Variabeln, wenn der Pearsonsche Korrelationskoeffizient (r xy ) gleich -0,8 ist. a) Kein Zusammenhang b) Schwacher Zusammenhang c) Mittelstarker Zusammenhang d) Starker Zusammenhang e) Perfekter Zusammenhang Aufgabe 4 Die Regressionsgerade sei y = 0,2x+2. Welche Aussagen treffen zu? a) Da die Regressionsgerade eine positive Steigung hat (b=0,2), besteht ein positiver Zusammenhang zwischen x und y. b) Die Regressionsfunktion sagt nichts über die Richtung des Zusammenhangs zwischen X und Y aus. c) Die Regressionsfunktion sagt nichts über die Stärke des Zusammenhangs zwischen X und Y aus. d) Da die Regressionsgerade einen sehr schwachen Anstieg hat ( b=0,2), besteht nur ein kleiner Zusammenhang zwischen X und Y. e) Wird x um eine Einheit reduziert, verkleinert sich y um das doppelte.
Aufgabe 5 Die Regressionsgeraden x(y) und y(x) a) haben immer die gleiche Steigung. b) haben immer den gleichen y-achsenabschnitt. c) sind immer identisch. d) schneiden sich nicht. e) schneiden sich immer im Punkt [ x y ]. Aufgabe 6 Wo befinden sich alle Punkte, wenn r x, = 1? a) Alle Punkte befinden sich auf der Gerade y = x+1. b) Alle Punkte befinden sich auf der Gerade y = x. c) Alle Punkte befinden sich auf der Gerade y = -x. d) Alle Punkte befinden sich auf einer Gerade mit der Steigung 1. e) Alle Punkte befinden sich auf einer Gerade mit positiver Steigung.
Aufgabe 7 Welche Zusammenhänge untersucht die Regressionsanalyse a) zwischen zwei deterministischen Größen b) zwischen zwei zufälligen Größen c) zwischen zwei messbaren Merkmalen d) zwischen einer messbaren Zufallsgröße und einer messbaren deterministischen Größe e) zwischen einem attributiven und einem messbaren Merkmal Aufgabe 8 Der Steigungsparameter der Regressionsgerade b wird geschätzt mit a) b = S x,y S x 2 b) b = S2 x,y S x 2 c) b = S x,y S y 2 d) b = S x,y S x 2 S y 2 e) S x,y b = S x S y
Aufgabe 9 Worin unterscheiden sich das lineare Regressionsmodell und der Pearsonsche Korrelationskoeffizient? a) Der Korrelationskoeffizient misst lediglich Stärke und Richtung des linearen Zusammenhangs. b) Je kleiner der Fehlerterm ε, desto mehr strebt der Korrelationskoeffizient gegen null. c) Im Gegensatz zum linearen Regressionsmodell kann man mit Hilfe des Pearsonschen Korrelationskoeffizienten Aussagen für die Zukunft treffen. d) Auch wenn der Korrelationskoeffizient gleich null ist, d.h. r= 0, lässt sich eine Regressionsgerade ermitteln. e) Ist der Korrelationskoeffizient gleich null, d.h. r = 0, so lässt sich keine Regressionsgerade ermitteln. Aufgabe 10 Welche Zusammenhänge untersucht die Korrelationsanalyse a) Die Abhängigkeit zwischen zwei deterministischen Größen b) Die Abhängigkeit zwischen zwei zufälligen Größen c) zwischen zwei messbaren Größen d) Die Stärke der Abhängigkeit zwischen zwei messbaren Merkmalen von Zufallsgrößen e) mehrseitige stochastische Zusammenhänge
Aufgabe 11 Zehn Schwimmer einer Gruppe trainieren mehr oder weniger intensiv und erreichen natürlich auch verschiedene Zeiten im Wettkampf: Wöchentliche Trainingsdauer X (in Stunden) Wettkampfleistung Y (in Minuten) 6,2 5,7 3,6 5,9 10,0 8,6 3,8 7,7 9,9 3,7 1,10 1,12 1,19 1,11 1,07 1,04 1,20 1,09 1,06 1,20 Ermitteln und interpretieren Sie den Pearsonschen Korrelationskoeffizienten. Bestimmen Sie die Regressionsgerade von Y bez. X und die Reststreuung. Aufgabe 12 Während der Testphase eines neuentwickelten Autotyps wurden die Bremswege y i (in m) eines Testwagens für verschiedene Geschwindigkeiten x i (in km/h) ermittelt und in folgender Tabelle zusammengefasst: x i 40 60 90 100 120 130 160 y i 16 33 61 72 96 123 171 a) Zeichnen Sie das Streuungsdiagramm. Welches zu verwendende Regressionsmodell können Sie daraus ablesen? b) Ermitteln Sie für das Modell in a) die Regressionsfunktion. c) Welcher Bremsweg ist bei einer Geschwindigkeit von 75 km/h zu erwarten?
Aufgabe 13 An 12 Stahlstäben gleicher Länge und gleichen Querschnitts, aber unterschiedlichen Kohlenstoffgehalts (in %) wird die Zugfestigkeit (in MPa) gemessen: i x i y i i x i y i 1 0,10 3,58 7 0,40 6,25 2 0,20 4,34 8 0,25 5,01 3 0,20 4,45 9 0,25 4,73 4 0,55 7,83 10 0,55 7,58 5 0,20 4,11 11 0,40 6,50 6 0,40 6,10 12 0,50 7,21 (xi Kohlenstoffgehalt, yi Zugfestigkeit) a) Man stelle die Ergebnisse in einem Koordinatensystem dar und ermittle mit Hilfe der Methode der kleinsten Quadrate die konkrete empirische Regressionsgerade y(x) = b 1 + b 2 x. b) Man ermittle die konkrete empirische Restvarianz S R 2 = n 1 n 2 (y i y(x i )) 2 i 1 Aufgabe 14 Bei Frostempfindlichkeitsuntersuchungen für eine Apfelsorte ergaben sich nach 12stündiger Frostbelastung bei den Temperaturen t 1,, t 10 folgende Werte (angegeben in %) für die Überlebensfähigkeit F: t 1 = 10 C f 1 = 13,2 % t 6 = 5 C f 6 = 22,8 % t 2 = 9 C f 2 = 14,8 % t 7 = 4 C f 7 = 28,2 % t 3 = 8 C f 3 = 16,5 % t 8 = 3 C f 8 = 31,7 % t 4 = 7 C f 4 = 17,1 % t 9 = 2 C f 9 = 50,8 % t 5 = 6 C f 5 = 20,0 % t 10 = 1 C f 10 = 97,6 % Für die Regressionsgerade (bez. τ) f(τ) = β 1 + β 1 τ mit τ = 1 t (d.h. τ i = 1 t i (i = 1,..., 10)) ermittle man die konkreten empirischen Regressionskoeffizienten b 1 und b 2 sowie die konkrete empirische Restvarianz s R 2.
Aufgabe 15 Ein Testinstitut untersucht die Abhängigkeit des Benzinverbrauchs von der Geschwindigkeit bestimmter PKW-Typen. Zu diesem Zweck werden mit verschiedenen PKW s eines Typs 120 Testfahrten durchgeführt. Bei diesen Testfahrten wird mit besonderen Messgeräten die Geschwindigkeit (in km/h) und der Benzinverbrauch (in l/100 km) gemessen. Die Ergebnisse der Testfahrten sind in der folgenden Tabelle zusammengefasst. Geschwindigkeit (X) Benzinverbrauch (Y) von... bis von... bis unter... l/100 km Σ unter... km/h 4-6 6-8 8-10 10-12 12-14 14-16 20 40 1 5 7 12 25 40 60 3 7 2 12 60 80 4 5 9 80 100 12 6 18 100 120 6 5 11 120 140 2 6 8 140 160 2 6 6 4 18 160 180 1 6 12 19 Σ 22 21 16 14 19 28 120 a) Bestimmen Sie die gemeinsame Häufigkeitsverteilung der beiden Merkmale sowie die Randverteilungen! b) Bestimmen Sie die bedingten Verteilungen der beiden Merkmale und interpretieren Sie je eine! c) Bei welchem Anteil von Testfahrten war der Verbrauch höher als 11 l/100 km? d) Berechnen Sie x und y, s X 2 und s Y 2 sowie die bedingten Mittelwerte und Varianzen x (y j ) und y (x i ), s X 2 (y j ) und s Y 2 (x i ) für alle i und j! e) Stellen Sie die Regressionslinien x (Y) und y (X) graphisch dar! f) Sind die beiden Merkmale statistisch unabhängig? g) Berechnen Sie den Korrelationskoeffizienten und interpretieren Sie das Ergebnis!
Aufgabe 16 Zur Überprüfung der Wirkung eines Düngemittels für Getreide wurden sechs benachbarte Versuchsfelder von jeweils einem Hektar Größe in verschiedenem Maße gedüngt. Die Düngemittelmengen und die Erträge sind in der folgenden Tabelle dargestellt (Angaben jeweils in kg): Feld Menge des Düngemittels (X) Ertrag (Y) A 80 2700 B 200 3250 C 240 3500 D 140 3100 E 400 4000 F 320 3800 a) Stellen Sie die Werte der Tabelle graphisch dar und überprüfen Sie anhand dieser Zeichnung, ob es gerechtfertigt ist, einen linearen Zusammenhang zwischen den beiden Merkmalen anzunehmen! b) Berechnen Sie die Parameter der ausgleichenden Regressionsgeraden Y (X), interpretieren Sie diese Werte und zeichnen Sie die Gerade in das Streuungsdiagramm ein! c) Lohnt sich der Einsatz des Düngemittels, wenn 1 kg 0,80 Euro kostet und für einen Doppelzentner Getreide ein Preis von 30,-- Euro erzielt werden kann? d) Welchen Hektar-Ertrag könnte man bei globaler Gültigkeit der in Teilaufgabe b) berechneten Regressionsgeraden bei einem Düngemitteleinsatz von 1500 kg pro Hektar erwarten? Ist dieses Ergebnis realistisch?
Aufgabe 17 In der folgenden Tabelle ist der Bestand an Gütermotorschiffen der Binnenschifffahrt eines westeuropäischen Landes an einem bestimmten Stichtag nach dem Alter (Y) und der Tragfähigkeit (X) aufgegliedert. Alter (in Jahren) unter 20 bis 40 bis 60 bis 80 und ins- Tragfähigkeit (t) 20 unter 40 unter 60 unter 80 mehr ges. Unter 400 60 60 170 200 40 530 400 b.u. 1000 80 280 370 380 170 1280 1000 b.u. 3000 370 280 130 50 20 850 insgesamt 510 620 670 630 230 2660 a) Bestimmen Sie die ausgleichende Regressionsgerade X (Y) = b 0 + b 1 Y! Berechnen und interpretieren Sie den Wert X (36)! Gehen Sie bei Ihren Berechnungen davon aus, dass kein Güterschiff älter als 100 Jahre ist! b) Geben Sie, ohne die Parameter der ausgleichenden Regressionsgeraden Y (X) = a 0 + a 1 X zu berechnen, das Vorzeichen des Parameters a 1 an! c) Berechnen Sie die Parameter a 0 und a 1! d) Berechnen Sie den Pearsonschen Korrelationskoeffizienten und interpretieren Sie diesen! Aufgabe 18 Eine lineare Regressionsbeziehung werde durch Y (X) = 6 + 1,5 X beschrieben. Es sei ferner x = 12 und r = 0,9. Man bestimme die Regressionsgerade X (Y)! Aufgabe 19 Aus den folgenden Angaben sind die Parameter der beiden Regressionsgeraden Y (X) und X (Y) abzuleiten: r = 0,7, s X 2 = 4,0, s Y 2 = 16,0, x = 20 und y = 40!
Aufgabe 20 Ein kleines Taxiunternehmen besitzt zwei Fahrzeuge. Zu jedem Zeitpunkt hat jedes Taxi die Wahrscheinlichkeit ⅓ besetzt zu sein. Falls ein Taxi besetzt ist, befördert es mit gleicher Wahrscheinlichkeit einen, zwei, drei oder vier Fahrgäste. X gebe die Anzahl der besetzten Taxen an und Y die Anzahl der Fahrgäste, die von beiden Taxen transportiert werden. a) Man bestimme die gemeinsame Wahrscheinlichkeitsfunktion von X und Y sowie die Randverteilungen von X und Y. b) Man berechne E(X) und E(Y). c) Die Zufallsvariable Z = Y gebe die Anzahl der Fahrgäste pro Taxi an, falls X mindestens ein Taxi besetzt ist. Man bestimme die mittlere Anzahl von Fahrgästen unter dieser Bedingung. Aufgabe 21 In einer Stahlfabrik werden zwei Blechsorten A und B hergestellt, Die Qualitätskontrollabteilung teilt die Zugfestigkeit [kg/mm 2 ] von Blechen in drei Gruppen ein und ermittelt für die zwei Blechsorten folgende Wahrscheinlichkeiten: Zugfestigkeit [kg/mm 2 ] P (Sorte A hat Zugfestigkeit ) 40 0,20 0,30 41 0,40 0,40 42 0,40 0,30 P (Sorte B hat Zugfestigkeit ) a) Man gebe die gemeinsame Verteilungsfunktion der Stahlsorten A und B an, wenn man weiß, dass die Zugfestigkeiten der beiden Blechsorten unabhängig voneinander sind. b) Man bestimme die durchschnittliche Zugfestigkeit der Blechsorten A und B. c) Man bestimme den Korrelationskoeffizienten zwischen den Zugfestigkeiten der beiden Blechsorten.
Referenzen Die in der Übung aufgeführten Aufgaben wurden folgenden Lehr- und Arbeitsbüchern entnommen: Beyer, O.; Hackel, H.; Pieper, V.; Tiedge, J.: Mathematik für Ingenieure, Naturwissenschaftler, Ökonomen und Landwirte - Wahrscheinlichkeitsrechnung und mathematische Statistik, Bd. 17, Leipzig: B.G. Teubner 1985. Böhm, P.: Induktive Statistik und Wahrscheinlichkeitsrechnung Arbeitsbuch II. Berlin: Studeo Verlag 2004. Böhm, P.; Ringhut, S.; Engler, S.; Deskriptive Statistik Arbeitsbuch II. Berlin: Studeo Verlag 2004. Heller, W.-D.; Lindenberg, H.; Nuske, M.; Schriever, K.-H.: Wahrscheinlichkeitsrechung Teil 2. Basel, Boston, Stuttgart: Birkhäuser Verlag 1979. Gillert, H.; Nollau, V.; Pieper, V.; Tiedge, J.: Mathematik für Ingenieure, Naturwissenschaftler, Ökonomen und Landwirte Übungsaufgaben zur Wahrscheinlichkeitsrechnung und mathematische Statistik, Bd. Ü4, Leipzig: B.G. Teubner1989. Maibaum, G.: Wahrscheinlichkeitsrechnung. Frankfurt (Main): Harri Deutsch, 1980. Menges, G.: Grundriß der Statistik Teil 1: Theorie. Opladen: Westdeutscher Verlag 1972. Nollau,V.; Patzsch, L.; Storm, R; Lange, C: Wahrscheinlichkeitsrechnung und Statistik in Beispielen und Aufgaben. Stuttgart Leipzig: B.G. Teubner Verlagsgesellschft 1997 Vogel, F.: Beschreibende und schließende Statistik Aufgaben und Beispiele. München Wien: Oldenbourg Wissenschaftsverlag 2001