Problemstellug: Bsher: Gesucht: 6. Zusammehagsmaße (Kovaraz ud Korrelato) Ee Varable pro Merkmalsträger, Stchprobe x1,, x Maße für Durchschtt, Streuug, usw. Bespel: Kurse zweer Akte ud a 9 aufeader folgede Börsetage: Zetpukt 1 2 3 4 5 6 7 8 9 Akte 5 6 11 8 13 8 10 16 13 Akte 8 7 9 10 11 10 11 12 12 Jetzt: Gesucht: Zwe (metrsche!) Varable pro Merkmalsträger, Stchprobe (x1, y1),,(x, y) Geegetes Maß für de Zusammehag 1. Schrtt: Graphsche Darstellug der Date eem zwedmesoale Streudagramm (Scatterplot) Bespele: Merkmalsträger: BA-Studete Varable 1: Körpergröße Varable 2: Gewcht Merkmalsträger: Metwohuge Sege Varable 1: Größe m 2 Varable 2: Metapres Merkmalsträger: Gebrauchtwage Varable 1: Alter Varable 2: Kaufpres Merkmalsträger: Täglche Aktekurse Varable 1: Bayer-Akte Varable 2: BASF-Akte 20,00 15,00 10,00 5,00 0,00 0,00 5,00 10,00 15,00 20,00 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 51-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 52 -
2. Schrtt: De arthmetsche Mttel ausreche 3. Schrtt: Berechug des Trefferquotete x 10 ud y 10 ud als Le das Koordatesystem zeche. 4 Quadrate 20,00 15,00 II. (-) I. (+) 20,00 15,00 II. (-) I. (+) 10,00 10,00 5,00 III. (+) IV. (-) 5,00 III. (+) IV. (-) 0,00 0,00 5,00 10,00 15,00 20,00 0,00 0,00 5,00 10,00 15,00 20,00 Quadrat I.: x x ud y y ( + + = + pos. Zshg.) Quadrat II.: x x ud y y ( + = eg. Zshg.) Quadrat III.: x x ud y y ( = + pos. Zshg.) Quadrat IV.: x x ud y y ( + = eg. Zshg.) Postver Zusammehag Häufug der Pukte I. ud III. Negatver Zusammehag Häufug der Pukte II. ud IV. Ke Zusammehag Glechmäßge Belegug der Quadrate. Belegug der ezele Quadrate: Quadrat I.: 3,5 Quadrat II.: 1,5 Quadrat III.: 3 Quadrat IV.: 1 6,5 2,5 D.h.: I ud III gewe gege II ud IV mt 6,5:2,5 ( Trefferquotet ) Trefferquotet > 1 Postver Zusammehag. Trefferquotet < 1 Negatver Zusammehag. Trefferquotet = 1 Ke Zusammehag. Aber 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 53-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 54 -
Trefferquotet st als Maß für de Zusammehag zu grob. Bespel: De uterschedlche Gewchtug erfolgt durch Betrachtug der Fläche, de de Pukte mt de arthmetsche Mttel blde. Täglche Kurse zweer Akte ud über zwe Woche: 1. Woche 2. Woche Zetpukt 1 2 3 4 5 1 2 3 4 5 Akte 10 12 11 8 9 11 13 10 9 7 Akte 10 11 12 9 8 11 13 10 9 7 x y 10 x y 10 (x 2, y 2 ) y 2 x 2 x 1 (x 1, y 1 ) y 1 14 1. Woche 2. Woche 14 13 12 11 10 9 13 12 11 10 9 Achtug! Negatve Fläche! 8 7 8 7 Für de Fläche, also de Gewchte der Pukte (x, y), = 1,,, glt: 6 6 7 8 9 10 11 12 13 14 6 6 7 8 9 10 11 12 13 14 Offeschtlch: Zusammehag st der zwete Woche ausgeprägter. Problem: Trefferquotet st bede Woche glech. x x y y > 0, falls x x ud y y oder x x ud y y = 0, falls x x oder y y < 0, falls x x ud y y oder x x ud y y Lösug: Berückschtgug der Lage der ezele Datepukte, relatv betrachtet zu de arthmetsche Mttel uterschedlche Gewchtug der Pukte (x, y) Das arthmetsche Mttel deser Gewchte ( Fläche ) st e geegetes Maß für de Zusammehag Emprsche Kovaraz 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 55-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 56 -
Emprsche Kovaraz vo ud s 1 1 x xy y Berechug der Kovaraz m Bespel: Kurse zweer Akte ud a 9 aufeader folgede Börsetage: Zetpukt 1 2 3 4 5 6 7 8 9 Akte 5 6 11 8 13 8 10 16 13 Akte 8 7 9 10 11 10 11 12 12 Arbetstabelle: x x x y y y x x y y x y 5-5 8-2 10 40 6-4 7-3 12 42 11 1 9-1 -1 99 8-2 10 0 0 80 13 3 11 1 3 143 8-2 10 0 0 80 10 0 11 1 0 110 16 6 12 2 12 192 13 3 12 2 6 156 90 0 90 0 42 942 x 10 y 10 s 1 42 9 = 4,67 Alteratv: s 1 x y x y 1 = 942/9 10 10 = 104,67 100 = 4,67 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 57-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 58 -
(!) Satz: Es glt: (!) Satz: Für de Bravas-Pearso-Korrelatoskoeffzete glt: (a) (b) r s s ( s s s s s s ) s s s y ax b mt a 0. Bravas-Pearso-Korrelatoskoeffzet s s s 1 1 ( x x)( y 1 2 1 ( x x) 1 1 y) ( y y) 2 (a) -1 r 1. (b) r = 1 y = ax + b mt a > 0 für alle. 10,00 8,00 6,00 4,00 2,00 1 3 Größter postver learer Zusammehag: Alle Pukte lege auf eer Gerade mt postver Stegug. 0,00 0,00 2,00 4,00 6,00 8,00 10,00 (c) r = -1 y = ax + b mt a < 0 für alle. Im Bespel: s 2 104 9 s 3, 40 s 2 24 9 s 1, 63 4,67 r 0, 84 3,4 1,63 10,00 8,00 6,00 4,00 2,00 4 Größter egatver learer Zusammehag: Alle Pukte lege auf eer Gerade mt egatver Stegug. 0,00 0,00 2,00 4,00 6,00 8,00 10,00 1 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 59-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 60 -
(!) Warug 1: Vorscht be r 0!!! Bedeutet r = 0, dass ke Zusammehag besteht? x y x y 1 5 s 0 0 0 5 5 ( s s -2 2-4 r s ) 0-1 0,5-0,5 0 0 0 Aber es exstert e perfekter 1 0,5 0,5 fuktoaler Zusammehag: 2 2 4 1 2 y x 0 5 0 2 Der Korrelatoskoeffzet st ur als Maß für de leare Zusammehag geeget! Stuato: Optmale Kombato vo Progose Progose des mttlere Dollarkurses 6 Moate: Progose Volatltät Commerzbak ( ) 0,60 ( x ) 0,05 ( Deutsche Bak ( ) 0,80 ( y ) 0,10 ( Aus vergagee Progose bekat: r = 0,25 s ) s ) (!) Warug 2: Gesucht: Ee Kombato der bede Progose, ud zwar derart, dass das Rsko (Volatltät) mmert wrd. Korrelato bedeutet cht otwedg Kausaltät!!! Ee hohe (postve oder egatve) Korrelato zwsche ud ka mdestes folgede Ursache habe: ( st Ursache für ) Z ud Z Zufall Naheleged: Betrachte e gewogees arthmetsches Mttel der bede Progose. Der mttlere Dollarkurs st da z 1 2 w x w y. Wähle de Gewchte w1 ud w2 so, dass sz ( bzw. sz 2 ) mmal wrd. 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 61-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 62 -
6. Zusammehagsmaße (Kovaraz ud Korrelato) - 63-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 64 -
Wesetlcher Nachtel: Der Bravas-Pearso-Korrelatoskoeffzet st ur für metrsch skalerte Merkmale defert. Allerdgs st e Zusammehag durchaus auch für ordale (oder omale) Merkmale svoll. Bespel: Merkmalsträger: 8 Agestellte Merkmal : Bldugsabschluss Merkmal : Jahresgehalt (etto) 1000 Agestellter 1 2 3 4 5 6 7 8 x Ab Hauptschule Ab Fachhochschule Hauptschule Ab Uverstät Mttlere Refe y 25 22 27 30 26 40 45 35 I.d.R. glt: Gesucht: Problem: Ausweg: Je höher der Abschluss, desto höher das Gehalt. Maß für de Zusammehag Bravas-Pearso-Korrelatoskoeffzet st cht berechebar. Ersetze de Merkmalsauspräguge durch hre Räge R(x) bzw. R(y), ud bereche de Bravas-Pearso-Korrelatoskoeffzete mt dese Räge (Voraussetzug: Wegstes ordales Nveau). 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 65-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 66 -
Ragkorrelatoskoeffzet ach Spearma r S, ( R( x ) R )( R( 1 2 ( R( x ) R 1 ) 1 y ) R ) ( R( y ) R ) 2 Ählchketsmaße Stuato: Utersuchug mt 20 Probade Befragug: Welcher Fersehseder st am sympathschste? Bldtest: Dre Colamarke; welche schmeckt am beste? Agestellter 1 2 3 4 5 6 7 8 x A HS A FH HS A U M.R. R(x) 4 7,5 4 2 7,5 4 1 6 y 25 22 27 30 26 40 45 35 R(y) 7 8 5 4 6 2 1 3 (!) Satz (Spezalfall): Lösug: rs, = 0,638 Falls be ud jewels alle Räge verschede sd, da glt: r S, 6 ( R( x ) R( y )) 1 1 ( 1) ( 1) 2 Marke Seder Marke Seder Coca Pro7 Coca Pro7 Salco MTV Peps Sat1 Salco Sat1 Peps RTL Coca RTL Salco Pro7 Peps Sat1 Salco Sat1 Coca RTL Coca Pro7 Coca Pro7 Peps RTL Peps RTL Peps MTV Peps Sat1 Coca Pro7 Salco RTL Peps RTL Gesucht: Maß für de Zusammehag Problem: Nomales Skaleveau der Date, d.h. Korrelatoskoeffzete sd cht awedbar Lösug: Betrachte cht de Zusammehag zwsche de zwe Merkmale, soder de Ählchket zweer ausgesuchter Merkmalsauspräguge jewels ees Merkmals 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 67-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 68 -
Merkmal: Fersehseder Auspräguge: RTL, Sat1, Pro7, MTV Merkmal: Colamarke Auspräguge: Coca Cola, Peps, Salco Vorgeheswese am Bespel vo Peps ud Sat1 Trasformere omale Date dchotome (bäre) Date (0 oder 1). Merkmal st erfüllt (Ausprägug vorhade) = 1 Peps schmeckt am beste = 1 Frage: Sollte ee Werbug für Peps eher be Sat1 oder be RTL platzert werde? Sat1 st sympathschster Seder = 1 Merkmal st cht erfüllt (Ausprägug cht vorhade) = 0 Peps schmeckt cht am beste = 0 Sat1 st cht sympathschster Seder = 0 Führt zu eem Verglech der Ählchket zwsche Peps ud Sat1 Peps ud RTL Welche der jewels bede Merkmalsauspräguge sd sch ählcher? Gesucht: E Maß für de Ählchket Bestmme de Azahl der daraus resulterede eue Realsatoe (1,1), (0,1), (1,0) ud (0,0) Bespel: Bede Auspräguge vorhade (1,1) Marke Seder Marke Seder Coca Pro7 Coca Pro7 Salco MTV Peps Sat1 Salco Sat1 Peps RTL Coca RTL Salco Pro7 Peps Sat1 Salco Sat1 Coca RTL Coca Pro7 Coca Pro7 Peps RTL Peps RTL Peps MTV Peps Sat1 Coca Pro7 Salco RTL Peps RTL Neue Realsato (1,1) 3 Aalog ergbt sch: (0,1) 2; (1,0) 5; (0,0) 10 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 69-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 70 -
Des ergbt ver eue verschedee Häufgkete, de eer Kreuztabelle egetrage werde: Peps schmeckt am beste Sat1 st am sympathschste Erfüllt (Ja = 1) Ncht erfüllt (Ne = 0) Erfüllt (Ja = 1) 3 5 8 Ncht erfüllt (Ne = 0) Allgeme: Varable 1 2 10 12 Σ 5 15 20 Erfüllt (Ja = 1) Varable 2 Ncht erfüllt (Ne = 0) Erfüllt (Ja = 1) a c a+c Ncht erfüllt (Ne = 0) Ählchketsmaße b d b+d Σ a+b c+d a+b+c+d = Σ Σ Im Bespel (Ählchkete zwsche Peps ud Sat1): 3 10 13 SM 0, 65 20 20 3 RR 0, 15 20 3 3 J 0, 3 3 2 5 10 Als Ählchket zwsche Peps ud RTL ergbt sch: Peps schmeckt am beste 4 9 13 SM 0, 65 20 20 4 RR 0, 2 20 4 4 J 0, 36 4 3 4 11 RTL st am sympathschste Ja Ne Σ Ja 4 4 8 Ne 3 9 12 Σ 7 13 20 Smple Matchg (Efache Überestmmug) Russel ud Rao Jaccard (Tamoto) a RR a J a b c a d SM De dre Ählchketsmaße köe ur Werte zwsche 0 ud 1 (eschleßlch) aehme, d.h.: SM [0,1 ] ; RR [0,1 ] ; J [0,1 ] Je äher der Wert a der 1 legt, desto ählcher sd sch de jewelge Merkmalsauspräguge, je äher a der 0, desto uählcher. De Werbug für Peps sollte be RTL platzert werde. 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 71-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 72 -
Achtug, aufgepasst! Platz für Notze De Kaptel 1, 2, 3 ud 6 behadelte statstsche Verfahre sd aufwärtskompatbel. Bespele: Modus ud Meda köe auch auf ordale ud metrsche Date agewedet werde. Ebeso de Spawete. Der Ragkorrelatoskoeffzet ach Spearma ka auch zusamme mt metrsche Date agewadt werde. Ählchketsmaße köe auch zwsche omale ud ordale oder metrsche Date berechet werde. Voraussetzug dafür st atürlch ud selbstverstädlch de svolle Trasformato der chtomale Varable dchotome (bäre) Date (Merkmal st vorhade oder Merkmal st cht vorhade). 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 73 -