Qualität und Zuverlässigkeit - Statistik Master MB Material zum Kapitel : Regressionsanalyse Beispiel 3: Lineare Regression X - Alter des Fahrers Y - Geschwindigkeitsüberschreitung in km/h Fachbereich Grundlagenwissenschaften Prof Dr Viola Weiÿ Sommersemester 015 Daten und Arbeitstabelle: x i y i x i x i y i 0 400 440 3 59 506 4 40 576 960 59 3 3481 1357 55 34 305 1870 6 676 57 3 104 704 9 1 841 609 43 8 1849 104 38 7 1444 106 31 5 961 775 36 9 196 1044 416 315 1610 11067 Berechnung von a und b: x a i y i x i (x i y i ) n x i ( x i ) b 1610 315 416 11067 1 1610 416 3, 18 n (x i y i ) x i y i n x i ( x i ) 1 11067 416 315 1 1610 416 0, 087 Ergebnis: Regressionsfunktion: ŷ 3, 18 + 0, 087x Bestimmtheitsmaÿ: B r xy 0, 035 1
Elimination des Ausreiÿers (4, 40) Regressionsfunktion: ŷ 17, 9718 + 0, 197x Bestimmtheitsmaÿ: B rxy 0, 365 Elimination von zwei Ausreiÿern (4, 40) und (59, 3) Regressionsfunktion: ŷ 1, 717 + 0, 375x Bestimmtheitsmaÿ: B r xy 0, 831
Beispiel 4: Regressionskurve für eine Exponentialfunktion Die Entladung eines Kondensators mit Kapazität C über einen Ohmschen Widerstand R erfolgt nach dem Exponentialgesetz u(t) u 0 e t RC t 0 mit der Anfangsspannung u 0 zur Zeit t 0 In einem Experiment wurden folgende Werte gemessen (t in s und u in V): t i 1,0 4,0 7,0 10,0 15,0 u i 80, 45,5 4,5 13,9 4,7 Aus diesen Daten sollen die Anfangsspannung u 0 und die Zeitkonstante RC geschätzt werden Des weiteren soll der Zeitpunkt bestimmt werden, wo die Spannung 0,1V unterschreitet Transformation in eine lineare Funktion durch Logarithmieren: ln u ln u 0 + ( 1 RC ) t Arbeitstabelle: Berechnung von a ln u 0 und b 1 RC : t i u i ln u i t i 1 80, 4,38454 1 t i ln u i 4 45,5 3,81771 16 7 4,5 3,198673 49 10 13,9,631889 100 15 4,7 1,547563 5 37 15,580361 391 91,578411 a t i ln u i t i (t i ln u i ) n t i ( t i ) 391 15, 580361 37 91, 578411 5 391 37 4, 6135 b n (t i ln u i ) t i ln u i n t i ( t i ) 1 91, 578411 37 15, 580361 5 391 37 0, 04 u 0 e 4,6135 100, 84 RC 1 0,04 Regressionsfunktion: û(t) 100, 84 V e 0, 1 100, 84 V e t 4,94 s t 34, 17 s 4, 94 t 4,94 s 3
Beispiel 5: Logistische Regression Die folgende Tabelle zeigt die prozentuale Ausstattung von Haushalten einer deutschen Groÿstadt mit Videorecordern: 199 1993 1994 1995 1996 1997 1998 3 8 19 33 50 63 74 Berechnen Sie zur Beschreibung der Entwicklung eine logistische Regressionsfunktion ŷ mit Sättigungsgrenze k 80 Schätzen Sie den Ausstattungsgrad für das Jahr 000 Lösung: Logistische Funktion: ŷ k, b < 0 mit bekannter Sättigungsgrenze k 1 + ea+bx k 1 + e a+bx a x i ln( k y i 1) x i (x i ln( k y i 1)) n x i ( x i ) b n (x i ln( k y i 1)) x i ln( k y i 1) n x i ( x i ) Arbeitstabelle: Verwenden dabei folgende Zeittransformation: x i Jahr 1991 Jahr x i x i y i ln( 80 y i 1) x i ln( 80 y i 1) 199 1 1 3 3,45193 3,45193 1993 4 8,1975 4,394449 1994 3 9 19 1,166435 3,499305 1995 4 16 33 0,353640 1,414560 1996 5 5 50-0,51086 -,55418 1997 6 36 63-1,30991-7,85958 1998 7 49 74 -,51306-17,586139 8 140,69440-15,44689 a 140, 69440 8 ( 15, 44689) 7 140 8 800, 617683 196 4, 084784 b 7 ( 15, 44689) 8, 69440 181, 74834 7 140 8 196 0, 973 Ergebnis: ŷ 80 1 + e 4,085 0,97x Schätzwert für 000: ŷ(9) 80 78, 887 1 + e4,085 0,97 9 4
Aufgaben zum Kapitel : 1 Bei der Messung des Bremswegs s (in m) eines bestimmten PKW-Typs in Abhängigkeit von der Geschwindigkeit v (in km/h) erhielt man folgende Meÿwerte: v 0 40 50 70 80 100 10 s 3 8 13 3 31 47 63 (a) Beschreiben Sie den Bremsweg in Abhängigkeit von der Geschwindigkeit durch eine lineare Regressionsfunktion nach der Methode der kleinsten Quadrate (b) Schätzen Sie mit dieser Regressionsfunktion den Bremsweg für eine Geschwindigkeit von 140 km/h Ein Expertenteam erforscht Möglichkeiten der Reduzierung des Kraftstoverbrauchs eines PKW-Typs mit dem Ziel, ein sparsames 3-Liter-Auto zu entwickeln Folgende Stufen beim mittleren Verbrauch in l pro 100 km wurden erreicht: Jahr 1 3 4 5 Verbrauch 8,1 7,3 6,6 5,5 4,6 (a) Beschreiben Sie die zeitliche Entwicklung des Kraftstoverbrauchs X durch eine Exponentialfunktion x(t) a b t nach der Methode der kleinsten Quadrate (b) Wann ist mit dem Erreichen des Forschungsziels zu rechnen? 5
3 Die Konzentration eines bestimmten Wirkstos im Blut erreicht Stunden nach dessen Verabreichung ihren höchsten Wert und fällt danach ab Für folgende Meÿwerte Zeit t i,5 3 3,5 4 Konzentration x i 7 70 65 60 53 wurde die lineare Regressionsfunktion ˆx 9, 8 9, 6 t ermittelt Bestimmen Sie die erklärte Streuung und die Reststreuung sowie das Bestimmtheitsmaÿ? 4 Beschreiben Sie die Abhängigkeit der Viskosität y einer Mischung von Wachsen von der Temperatur T durch einen Exponentialansatz der Form y b 0 e b 1T für folgende Daten: Temperatur T 100 90 80 70 60 Viskosität y 3,0 5,3 8, 14,7 0,1 5 Zwischen zwei Meÿgröÿen X und Y erwartet man aufgrund zusätzlicher Informationen einen funktionalen Zusammenhang vom Typ Es seien folgende Meÿwerte gegeben: y ax + b x x i - -1 1 4 y i 1-0,5 5,6 3,8 3,3 Bestimmen Sie für diese Meÿwerte eine Regressionskurve obigen Typs Welchen y-wert erhält man mit dieser Regressionsfunktion für x 3? Hinweis: Führen Sie alle nichtlinearen Regressionsprobleme durch geeignete Transformationen zurück auf das lineare Problem Lösungen: 1 a 15, 388, b 0, 616 dh ŝ 15, 388 + 0, 616v Zwischenergebnisse: v i 480, si 188, v i 4000, Schätzwert: ŝ(140) 70, 863 vi s i 17380 a 9, 61, b 0, 868 dh ˆx(t) 9, 61 0, 868 t, t 1,, 5 Zwischenergebnisse: t i 15, (ti ) 55, lg xi 3, 9945, ti lg x i 11, 369 Mit dem Erreichen des Forschungszieles ist nach 9 Jahren zu rechnen 3 Reststreuung: 7,6 erklärte Streuung: 30,4 Gesamtstreuung: 38 Bestimmtheitsmaÿ: 0,968 4 b 0 e 5,9713 39, 015, b 1 0, 048, dh ŷ(t) 39, 015 e 0,048 T Zwischenergebnisse: T i 400, (Ti ) 33000, ln yi 10, 5590, Ti ln y i 796, 47809, 4897x + 3, 0059 5 a, 4897, b 3, 0059 dh ŷ x Zwischenergebnisse: 1 x i 0, 5, yi 13,, ( 1 x i ), 565, Schätzwert: ŷ(3) 3, 49 1 x i y i 8, 35 6