Dr. Reate Prust: Eführug quattatve Forschugsmethode Bvarate Maße: Przp "Proportoal Reducto of Error" (PRE) E 1 - E Fehler be Regel 1 - Fehler be Regel = E 1 Fehler be Regel 1 Regel 1: Vorhersageregel ur mt der abhägge (zu erklärede) Varable Regel : Vorhersageregel mt Kets der uabhägge (erklärede) Varable Fehler: Falschvorhersage Alle PRE-Maße versuche Aussage der Form: Um wevel Prozet ka der Vorhersagefehler für de abhägge Varable durch de Esatz der Regel reduzert werde, d.h. durch de Kets der uabhägge Varable?
Dr. Reate Prust: Eführug quattatve Forschugsmethode Bvarate Maße: Überscht über de PRE-Maße λ (Lambda) η (Eta) r Regel 1 Modus der abh. Var. für alle UE (beste Vorhersage) AM der abh. Var. für alle UE (beste Vorhersage) AM der abh. Var. für alle UE (beste Vorhersage) Regel Bedgter Modus der abh. Var. (für jede Kategore der uabh. Var. getret) Bedgtes AM der abh. Var. (für jede Kategore der uabh. Var. getret) Wert der Regressosgerade für alle UE Fehler Azahl der UE mt falscher Vorhersage Summe der quadrerte Abwechuge der Vorhersagewerte vo de tatsächlche Werte Summe der quadrerte Abwechuge der Vorhersagewerte vo de tatsächlche Werte UE: Utersuchugsehet(e) AM: Arthmetsches Mttel
Dr. Reate Prust: Eführug quattatve Forschugsmethode Bespel Ergebsse bvarater Auswertug Berechug vo (Lambda) V1 Geschlecht V4 Fersehkosum 1 mälch weblch 1 sehr oft 0 5 5 oft 0 5 5 3 kaum 50 30 80 row 4 e 0 50 70 colum 110 90 00 Fehlerdefto: Azahl der Falschvorhersage Regel 1 (ohe uabh. Var.): Bester Schätzer st der Modus: h=3 Fehler E 1 = 5+5+70 = 10 Regel (mt uabh. Var.): Bester Schätzer st der bedgte Modus: h m = 3 ud h w = 4 (Modus der Subgruppe der mälche Persoe) (Modus der Subgruppe der weblche Persoe Fehler E = 0+0+0 + 5+5+30 = 100 = (E 1 - E ) / E 1 = (10-100) / 10 = 0.17, d.h. De Vorhersage für de abhägge Varable kote durch Kets der uabhägge Varable um 17 % verbessert werde. Lambda st da ubrauchbar, we de Vertelug der abhägge Varable sehr schef st, wel da häufg der Gesamtmodus mt de bedgte Mod de Subgruppe überestmmt. I dem Fall st Lambda Null, auch we offeschtlch e Zusammehag besteht so we m folgede Bespel
Dr. Reate Prust: Eführug quattatve Forschugsmethode Bespel Ergebsse bvarater Auswertug Problem: Lambda = 0 Verarbetete Fälle Fälle Gültg Fehled Gesamt N Prozet N Prozet N Prozet V87C Wochearbetsstude klass. * v55 98 99,4% 18,6% 946 100,0% V87C Wochearbetsstude klass. * v55 Kreuztabelle Gesamt,00 1,00 bs 0,00 0,5-39,5 3,00 40-40,5 4,00 41 ud mehr Azahl % vo v55 Azahl % vo v55 Azahl % vo v55 Azahl % vo v55 Azahl % vo v55 Azahl % vo v55 v55 1 MANN FRAU Gesamt 63 888 150 43,8% 59,8% 51,9% 10 103 113,7% 6,9% 3,9% 193 9 4 13,4% 15,4% 14,4% 117 339 15,4% 7,9% 11,6% 387 147 534 6,8% 9,9% 18,% 1444 1484 98 100,0% 100,0% 100,0% Lambda =,000 V =,99 C =,87
Dr. Reate Prust: Eführug quattatve Forschugsmethode Bespel Ergebsse bvarater Auswertug Berechug vo bzw. (Eta) Rego Stadt Lad 0 35 5 40 1 45 5 50 Kderzahl 10 10 0 3 5 45 50 4 5 35 40 100 100 00 Fehler: Summe der quadrerte Abwechuge zwsche Schätzwert ud tatsächlchem Wert Regel 1 (ohe uabh. Var.): Bester Schätzer st das AM: x = (040 + 150 + 0 + 350 + 440)/00 = De Berechug des Fehlers basert also auf de Abwechuge zwsche AM ud tatsächlchem Wert: E 1 = 40 (0-) + 50 (1-) + 0 (-) + 50 (3-) + 40 * (4-) = 40 Regel (mt uabh. Var.): Bester Schätzer st das bedgte AM, d.h. das AM de Subgruppe S ud L x S = (035 + 145 + 10 + 35 + 45 )/100 = 1 x L = (05 + 15 + 10 + 345 + 435)/100 = 3 E = 35 (0-1) + 45 (1-1) + 10 (-1) + 5 (3-1) + 5 * (4-1) + 5 (0-3) + 5 (1-3) + 10 (-3) + 45 (3-3) + 35 * (4-3) = 0 Eta = (E 1 - E ) / E 1 = (40-0) / 40 = 0.48; Eta = Eta = 0.69
Dr. Reate Prust: Eführug quattatve Forschugsmethode Bvarate Maße: r als PRE-Maß für zwe metrsche Varable Regel 1: Regel : Fehler: Vorhersage auf Bass des Mttelwertes: ȳ Vorhersage auf Bass der Regressosgerade: ŷ Summe der quadrerte Abwechuge zwsche Schätzwert ud tatsächlchem Wert E 1 : Summe aller quadrerte Abwechuge vo ȳ: Σ (y ȳ) E : Summe aller quadrerte Abwechuge vo der Regressosgerade: Σ (y ŷ ) r E1 E E 1 1 y) 1 1 y) yˆ ) r wrd als Determatoskoeffzet bzw. Bestmmthetsmaß bezechet. Es gbt de Atel der Varato der abhägge Varable a, der durch de uabhägge Varable erklärt wrd. Das Zusammehagsmaß r st r sg( b) r wobe sg(b) = 1, we de Regressosgerade stegt (also b > 0), sg(b) = -1, we se fällt (also b < 0). (sg: sgum=vorzeche) De Berechug der Regressosgerade erfolgt für e Bespel mt 15 Utersuchugsehete:
Regresso ud das PRE-Maß Pearso-R (oder r) E Bespel aus dem Datesatz Schülergewalt (1996): Hägt de Höhe des Taschegelds vom Alter der Schülere ud Schüler ab? Varable: V008: Alter V93a: Moatlches Taschegeld (Wevel Taschegeld hast Du zu Deer free Verfügug?... DM m Moat) Für de Berechuge wurde aus dem Datesatz per Zufall 15 SchülerIe ausgewählt: r bula V007 V008 V93a 100118 Sachse weblch 15 30 1086 Sachse mälch 14 5 118406 Sachse mälch 14 40 0007 Sachse weblch 15 55 16307 Sachse mälch 11 10 8307 Sachse mälch 13 45 30104 Sachse weblch 16 80 336111 Sachse mälch 1 0 366113 Sachse mälch 1 0 378904 Sachse weblch 13 50 386116 Sachse weblch 1 38808 Sachse mälch 14 0 44808 Sachse mälch 15 50 64003 Sachse weblch 16 70 64008 Sachse mälch 15 50 Streudagramm: Alter ud moatlches Taschegeld 60 40 0 0 Moatlches Taschegeld80 11 1 13 14 15 16 Alter Es fällt auf, dass de Pukte (vo Ausreßer abgesehe) ahe a eer Gerade lege
60 40 0 0 Moatlches Taschegeld80 11 1 13 14 15 16 Alter Frage: Lässt sch ee Geradeglechug ŷ = a + b * x so bestmme, dass de Gesamtabwechug der ezele Pukte vo der Gerade möglchst kle ausfällt? 60 40 0 0 Moatlches Taschegeld80 11 1 13 14 15 16 Alter Atwort: Ja, ud zwar de Gerade mt folgede Koeffzete
b 1 ( x 1 x)( y ( x x) y) ud a y b x Berechug der Koeffzete b ud a: Alter ( x ) T-Geld ) x x (x x ) y ȳ (x x ) (y ȳ) 15 30 1,0 1,44-6,47-7,76 14 5 0,0 0,04-11,47 -,9 14 40 0,0 0,04 3,53 0,71 15 55 1,0 1,44 18,53,4 11 10 -,80 7,84-6,47 74,11 13 45-0,80 0,64 8,53-6,83 16 80,0 4,84 43,53 95,77 1 0-1,80 3,4-36,47 65,64 1 0-1,80 3,4-16,47 9,64 13 50-0,80 0,64 13,53-10,83 1-1,80 3,4-14,47 6,04 14 0 0,0 0,04-36,47-7,9 15 50 1,0 1,44 13,53 16,4 16 70,0 4,84 33,53 73,77 15 50 1,0 1,44 13,53 16,4 Σ=07 Σ=547 Σ=0,00 Σ=34,40 Σ=0,00 Σ=385,40 x =13,80 ȳ=36,47 b ( x 1 x ) y ) 385,40 34,40 ( x x ) 1 11,0 a = ȳ b * x = 36,47 11,0 13,80 = -118,14 De Glechug der Regressosgerade ŷ = a + b * x lautet somt: ŷ = 118,14 + 11,0 * x Nu lässt sch auch der Fehler ( E ) bestmme:
Fehler 1 (ohe Kets der uabhägge Var.): Summe aller quadrerte Abwechuge zwsche de tatsächlche Werte ud dem AM der abhägge Varable 80 Fehler 1 60 y = 36,47 40 0 0 11 1 13 14 15 16 Fehler (mt Kets der uabhägge Var.): Summe aller quadrerte Abwechuge zwsche de tatsächlche Werte der abhägge Varable ud dem Wert der Regressosgerade Fehler 60 40 0 0 Moatlches Taschegeld80 11 1 13 14 15 16 Alter Ma seht, dass de Summe der sekrechte Abstäde m utere Bld kleer st als m obere. Um wevel kleer zegt folgede Rechug:
Berechug vo r bzw. r T.-Geld Alter y ȳ (y ȳ) ŷ (y ŷ ) (y ŷ ) 15 30-6,47 41,8 49,91-19,91 396,44 14 5-11,47 131,48 38,71-13,71 187,89 14 40 3,53 1,48 38,71 1,9 1,67 15 55 18,53 343,48 49,91 5,09 5,90 11 10-6,47 700,48 5,10 4,90 4,04 13 45 8,53 7,8 7,50 17,50 306,11 16 80 43,53 1895,15 61,11 18,89 356,67 1 0-36,47 139,8 16,30-16,30 65,70 1 0-16,47 71,15 16,30 3,70 13,69 13 50 13,53 183,15 7,50,50 506,08 1-14,47 09,8 16,30 5,70 3,49 14 0-36,47 139,8 38,71-38,71 1498,6 15 50 13,53 183,15 49,91 0,09 0,01 16 70 33,53 114,48 61,11 8,89 78,95 15 50 13,53 183,15 49,91 0,09 0,01 Σ=07 Σ=547 Σ=0,00 8011,73 Σ=0,00 3693,91 r E1 E E 1 1 y) 1 1 y) yˆ ) 8011,73 3693,91 8011,73 0,539 d.h. de Kets der uabhägge Varable Form der Regressosgerade, de de Bezehug zwsche de bede Varable beschrebt, hat de Vorhersage um 53,9 % verbessert gegeüber der Schätzug durch das AM der abhägge Varable. Aders formulert: Durch das Alter köe kapp 54 % der Varato der Taschegeldhöhe deser 15 SchülerIe aus Sachse erklärt werde. Das st sehr vel. Demetspreched zegt das Zusammehagsmaß ee sehr hohe Wert vo: r sg( b) r ( 1) 0,539 0,73 Für alle 3147 sächssche Telehmer ergbt sch allerdgs ur e r vo 0,75, also e mttlerer Zusammehag.