6. Zusammenhangsmaße (Kovarianz und Korrelation)

Ähnliche Dokumente
6. Zusammenhangsmaße (Kovarianz und Korrelation)

Korrelations- und Assoziationsmaße

2. Mittelwerte (Lageparameter)

Lohnkosten pro Arbeitsstunde. Wie hoch sind die Lohnkosten pro Arbeitsstunde im Jahresdurchschnitt?

Korrelations- und Regressionsanalyse

Mehrdimensionale Häufigkeitsverteilungen (1)

Statistische Grundlagen Ein kurzer Überblick (diskret)

Der Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen X und Y. Er ist durch folgende Formel charakterisiert:

2.2 Rangkorrelation nach Spearman

Statistik. ist die Kunst, Daten zu gewinnen, darzustellen, zu analysieren und zu interpretieren um zu neuem Wissen zu gelangen.

Quellencodierung I: Redundanzreduktion, redundanzsparende Codes

Einführung in die Stochastik 3. Übungsblatt

Statistische Kennzahlen für die Streuung

Zur Interpretation einer Beobachtungsreihe kann man neben der grafischen Darstellung weitere charakteristische Größen heranziehen.

5 Reproduktions- und Grenzwertsätze

Spannweite, Median Quartilsabstand, Varianz und Standardabweichung.

2. Zusammenhangsanalysen: Korrelation und Regression

Schiefe- und Konzentrationsmaße

Universitätslehrgang Sports Physiotherapy Einführung in die Statistik

Aufgaben. 1. Gegeben seien folgende Daten einer statistischen Erhebung, bereits nach Größe sortiert (Rangliste):

Lösungen. Häufigkeitsverteilung (Stabdiagramm) Aufgabe 1. Häufigkeit (h) Merkmal (x)

Konzentrationsanalyse

Histogramm / Säulendiagramm

Verdichtete Informationen

Schiefe-, Wölbungs- und Konzentrationsmaße

Regressionsrechnung und Korrelationsrechnung

Statistik mit Excel und SPSS

Im Wöhlerdiagramm wird die Lebensdauer (Lastwechsel oder Laufzeit) eines Bauteils in Abhängigkeit von der Belastung dargestellt.

Mathematik: Mag. Schmid Wolfgang & LehrerInnenteam Arbeitsblatt Semester ARBEITSBLATT 7-8 WAHRSCHEINLICHKEITSRECHNUNG UND STATISTIK

Formelsammlung für die Lehrveranstaltung Wirtschaftsmathematik / Statistik

Leitfaden zu den Indexkennzahlen der Deutschen Börse

1 1 1 x0,25 x200 0,25 x200 0,25 1 x50 x51 1 1

Prinzip "Proportional Reduction of Error" (PRE)

Schiefe- und Konzentrationsmaße

Ingrid A. Uhlemann (2015): Einführung in die Statistik für Kommunikationswissenschaftler. Online Anhang: Lösung der Übungsaufgaben Kapitel 5-8,

2 Regression, Korrelation und Kontingenz

Multiple Regression (1) - Einführung I -

Ordnungsstatistiken und Quantile

Mehrdimensionale Merkmale

Physikalische Messungen sind immer fehlerbehaftet! Der wahre Wert ist nicht ermittelbar. Der wahre Wert x ist nicht identisch mit dem Mittelwert

Investmentfonds Kennzahlen- berechnung

Geometrisches Mittel und durchschnittliche Wachstumsraten

für j=0,1,...,n Lagrange zur Lösung der Interpolation nicht geeignet, da numerisch problematisch und teuer. 1 n

Fehlerrechnung im Praktikum

Prof. Dr. H. Rommelfanger: Entscheidungstheorie, Kapitel 3 54

Der Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen X und Y. Er ist durch folgende Formel charakterisiert:

Kapitel 6: Regression

Maße zur Kennzeichnung der Form einer Verteilung (1)

Statistik. (Inferenzstatistik)

Aufgabe 4 Welche der folgenden Merkmale sind diskret oder stetig, quantitativ oder qualitativ, nominal-, ordninal- oder kardinalskaliert:

die Schadenhöhe ( = Risikoergebnis) des i-ten Versicherungsnehmers i 1,, n).

Quantitative Methoden in der klinischen Epidemiologie

Kapitel III. Lagemaße. die beobachteten Werte eines Merkmals X mit Ausprägungen a 1

Erinnerung: Funktionslernen. 5.6 Support Vector Maschines (SVM) Beispiel: Funktionenlernen. Reale Beispiele

Quellencodierung I: Redundanzreduktion, redundanzsparende Codes

WIB 2 Mathematik und Statistik Formelsammlung. Z Menge der ganzen Zahlen {...,-3,-2,-1,0,1,2,3,...}

Der Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen X und Y. Er ist durch folgende Formel charakterisiert:

Deskriptive Statistik - Aufgabe 3

Einführung in Statistik

Sozialwissenschaftliche Methoden und Statistik I

( x) eine Funktion definiert, in der nur die i-te Komponente variabel ist. Folgende Schreibweisen werden aufgrund dieser Anmerkungen auch verwendet:

Einführung Fehlerrechnung

Investmentfonds. Kennzahlenberechnung. Performance Risiko- und Ertragsanalyse, Risikokennzahlen

Regressions- und Korrelationsanalyse

4. Marshallsche Nachfragefunktionen Frage: Wie hängt die Nachfrage nach Gütern

Lage- und Streuungsmaße

Alternative Darstellung des 2-Stichprobentests für Anteile. Beobachtete Response No Response Total absolut DCF CF

Maßzahlen zur Beschreibung von Verteilungen

Erzeugen und Testen von Zufallszahlen

Intervallschätzungen geben unter Berücksichtigung des Verteilungstyps von X einen Bereich an, der den Parameter mit vorgegebener Sicherheit enthält.

Mathematische Modellierung Lösungen zum 1. Übungsblatt

= 2. Korrelationskoeffizient. Der Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen

Wie man für einen Test Peroe testet

Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz

2. Die Elementarereignisse sind die Kombinationsmöglichkeiten von: Wappen = W und:

Lösungen zum Übungs-Blatt 7 Wahrscheinlichkeitsrechnung

Beispiel zur Regression

Lageparameter (Mittelwerte) und Streuungsparameter

2. Mittelwerte (Lageparameter)

(Markowitz-Portfoliotheorie)

Beispiel zur Regression

Lösungen zum Übungs-Blatt 7 Wahrscheinlichkeitsrechnung

Kapitel XI. Funktionen mit mehreren Variablen

2. Mittelwerte (Lageparameter)

Beispielklausur BWL B Teil Marketing. 45 Minuten Bearbeitungszeit

Das virtuelle Bildungsnetzwerk für Textilberufe

Schiefe-, Wölbungs- und Konzentrationsmaße

Messfehler, Fehlerberechnung und Fehlerabschätzung

Allgemeine Prinzipien

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Maschinelles Lernen II. Clustering

REGRESSION. Marcus Hudec Christian Neumann. Eine anwendungsorientierte Einführung. Unterstützt von Institut für Statistik der Universität Wien

1.2.2 Prozentrechnung

Klausur SS 2005 Version 1

Formelsammlung Statistik

Textil & Design Formelsammlung Statistik

Varianzanalyse. Varianzanalyse. Varianzanalyse. Varianzanalyse

Ein Maß für die Ungleichheit bzw. Heterogenität kategorialer Daten ist Simpsons normiertes D:

Transkript:

Problemstellug: Bsher: Gesucht: 6. Zusammehagsmaße (Kovaraz ud Korrelato) Ee Varable pro Merkmalsträger, Stchprobe x1,, x Maße für Durchschtt, Streuug, usw. Bespel: Kurse zweer Akte ud a 9 aufeader folgede Börsetage: Zetpukt 1 2 3 4 5 6 7 8 9 Akte 5 6 11 8 13 8 10 16 13 Akte 8 7 9 10 11 10 11 12 12 Jetzt: Gesucht: Zwe (metrsche!) Varable pro Merkmalsträger, Stchprobe (x1, y1),,(x, y) Geegetes Maß für de Zusammehag 1. Schrtt: Graphsche Darstellug der Date eem zwedmesoale Streudagramm (Scatterplot) Bespele: Merkmalsträger: BA-Studete Varable 1: Körpergröße Varable 2: Gewcht Merkmalsträger: Metwohuge Sege Varable 1: Größe m 2 Varable 2: Metapres Merkmalsträger: Gebrauchtwage Varable 1: Alter Varable 2: Kaufpres Merkmalsträger: Täglche Aktekurse Varable 1: Bayer-Akte Varable 2: BASF-Akte 20,00 15,00 10,00 5,00 0,00 0,00 5,00 10,00 15,00 20,00 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 51-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 52 -

2. Schrtt: De arthmetsche Mttel ausreche 3. Schrtt: Berechug des Trefferquotete x 10 ud y 10 ud als Le das Koordatesystem zeche. 4 Quadrate 20,00 15,00 II. (-) I. (+) 20,00 15,00 II. (-) I. (+) 10,00 10,00 5,00 III. (+) IV. (-) 5,00 III. (+) IV. (-) 0,00 0,00 5,00 10,00 15,00 20,00 0,00 0,00 5,00 10,00 15,00 20,00 Quadrat I.: x x ud y y ( + + = + pos. Zshg.) Quadrat II.: x x ud y y ( + = eg. Zshg.) Quadrat III.: x x ud y y ( = + pos. Zshg.) Quadrat IV.: x x ud y y ( + = eg. Zshg.) Postver Zusammehag Häufug der Pukte I. ud III. Negatver Zusammehag Häufug der Pukte II. ud IV. Ke Zusammehag Glechmäßge Belegug der Quadrate. Belegug der ezele Quadrate: Quadrat I.: 3,5 Quadrat II.: 1,5 Quadrat III.: 3 Quadrat IV.: 1 6,5 2,5 D.h.: I ud III gewe gege II ud IV mt 6,5:2,5 ( Trefferquotet ) Trefferquotet > 1 Postver Zusammehag. Trefferquotet < 1 Negatver Zusammehag. Trefferquotet = 1 Ke Zusammehag. Aber 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 53-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 54 -

Trefferquotet st als Maß für de Zusammehag zu grob. Bespel: De uterschedlche Gewchtug erfolgt durch Betrachtug der Fläche, de de Pukte mt de arthmetsche Mttel blde. Täglche Kurse zweer Akte ud über zwe Woche: 1. Woche 2. Woche Zetpukt 1 2 3 4 5 1 2 3 4 5 Akte 10 12 11 8 9 11 13 10 9 7 Akte 10 11 12 9 8 11 13 10 9 7 x y 10 x y 10 (x 2, y 2 ) y 2 x 2 x 1 (x 1, y 1 ) y 1 14 1. Woche 2. Woche 14 13 12 11 10 9 13 12 11 10 9 Achtug! Negatve Fläche! 8 7 8 7 Für de Fläche, also de Gewchte der Pukte (x, y), = 1,,, glt: 6 6 7 8 9 10 11 12 13 14 6 6 7 8 9 10 11 12 13 14 Offeschtlch: Zusammehag st der zwete Woche ausgeprägter. Problem: Trefferquotet st bede Woche glech. x x y y > 0, falls x x ud y y oder x x ud y y = 0, falls x x oder y y < 0, falls x x ud y y oder x x ud y y Lösug: Berückschtgug der Lage der ezele Datepukte, relatv betrachtet zu de arthmetsche Mttel uterschedlche Gewchtug der Pukte (x, y) Das arthmetsche Mttel deser Gewchte ( Fläche ) st e geegetes Maß für de Zusammehag Emprsche Kovaraz 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 55-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 56 -

Emprsche Kovaraz vo ud s 1 1 x xy y Berechug der Kovaraz m Bespel: Kurse zweer Akte ud a 9 aufeader folgede Börsetage: Zetpukt 1 2 3 4 5 6 7 8 9 Akte 5 6 11 8 13 8 10 16 13 Akte 8 7 9 10 11 10 11 12 12 Arbetstabelle: x x x y y y x x y y x y 5-5 8-2 10 40 6-4 7-3 12 42 11 1 9-1 -1 99 8-2 10 0 0 80 13 3 11 1 3 143 8-2 10 0 0 80 10 0 11 1 0 110 16 6 12 2 12 192 13 3 12 2 6 156 90 0 90 0 42 942 x 10 y 10 s 1 42 9 = 4,67 Alteratv: s 1 x y x y 1 = 942/9 10 10 = 104,67 100 = 4,67 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 57-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 58 -

(!) Satz: Es glt: (!) Satz: Für de Bravas-Pearso-Korrelatoskoeffzete glt: (a) (b) r s s ( s s s s s s ) s s s y ax b mt a 0. Bravas-Pearso-Korrelatoskoeffzet s s s 1 1 ( x x)( y 1 2 1 ( x x) 1 1 y) ( y y) 2 (a) -1 r 1. (b) r = 1 y = ax + b mt a > 0 für alle. 10,00 8,00 6,00 4,00 2,00 1 3 Größter postver learer Zusammehag: Alle Pukte lege auf eer Gerade mt postver Stegug. 0,00 0,00 2,00 4,00 6,00 8,00 10,00 (c) r = -1 y = ax + b mt a < 0 für alle. Im Bespel: s 2 104 9 s 3, 40 s 2 24 9 s 1, 63 4,67 r 0, 84 3,4 1,63 10,00 8,00 6,00 4,00 2,00 4 Größter egatver learer Zusammehag: Alle Pukte lege auf eer Gerade mt egatver Stegug. 0,00 0,00 2,00 4,00 6,00 8,00 10,00 1 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 59-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 60 -

(!) Warug 1: Vorscht be r 0!!! Bedeutet r = 0, dass ke Zusammehag besteht? x y x y 1 5 s 0 0 0 5 5 ( s s -2 2-4 r s ) 0-1 0,5-0,5 0 0 0 Aber es exstert e perfekter 1 0,5 0,5 fuktoaler Zusammehag: 2 2 4 1 2 y x 0 5 0 2 Der Korrelatoskoeffzet st ur als Maß für de leare Zusammehag geeget! Stuato: Optmale Kombato vo Progose Progose des mttlere Dollarkurses 6 Moate: Progose Volatltät Commerzbak ( ) 0,60 ( x ) 0,05 ( Deutsche Bak ( ) 0,80 ( y ) 0,10 ( Aus vergagee Progose bekat: r = 0,25 s ) s ) (!) Warug 2: Gesucht: Ee Kombato der bede Progose, ud zwar derart, dass das Rsko (Volatltät) mmert wrd. Korrelato bedeutet cht otwedg Kausaltät!!! Ee hohe (postve oder egatve) Korrelato zwsche ud ka mdestes folgede Ursache habe: ( st Ursache für ) Z ud Z Zufall Naheleged: Betrachte e gewogees arthmetsches Mttel der bede Progose. Der mttlere Dollarkurs st da z 1 2 w x w y. Wähle de Gewchte w1 ud w2 so, dass sz ( bzw. sz 2 ) mmal wrd. 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 61-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 62 -

6. Zusammehagsmaße (Kovaraz ud Korrelato) - 63-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 64 -

Wesetlcher Nachtel: Der Bravas-Pearso-Korrelatoskoeffzet st ur für metrsch skalerte Merkmale defert. Allerdgs st e Zusammehag durchaus auch für ordale (oder omale) Merkmale svoll. Bespel: Merkmalsträger: 8 Agestellte Merkmal : Bldugsabschluss Merkmal : Jahresgehalt (etto) 1000 Agestellter 1 2 3 4 5 6 7 8 x Ab Hauptschule Ab Fachhochschule Hauptschule Ab Uverstät Mttlere Refe y 25 22 27 30 26 40 45 35 I.d.R. glt: Gesucht: Problem: Ausweg: Je höher der Abschluss, desto höher das Gehalt. Maß für de Zusammehag Bravas-Pearso-Korrelatoskoeffzet st cht berechebar. Ersetze de Merkmalsauspräguge durch hre Räge R(x) bzw. R(y), ud bereche de Bravas-Pearso-Korrelatoskoeffzete mt dese Räge (Voraussetzug: Wegstes ordales Nveau). 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 65-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 66 -

Ragkorrelatoskoeffzet ach Spearma r S, ( R( x ) R )( R( 1 2 ( R( x ) R 1 ) 1 y ) R ) ( R( y ) R ) 2 Ählchketsmaße Stuato: Utersuchug mt 20 Probade Befragug: Welcher Fersehseder st am sympathschste? Bldtest: Dre Colamarke; welche schmeckt am beste? Agestellter 1 2 3 4 5 6 7 8 x A HS A FH HS A U M.R. R(x) 4 7,5 4 2 7,5 4 1 6 y 25 22 27 30 26 40 45 35 R(y) 7 8 5 4 6 2 1 3 (!) Satz (Spezalfall): Lösug: rs, = 0,638 Falls be ud jewels alle Räge verschede sd, da glt: r S, 6 ( R( x ) R( y )) 1 1 ( 1) ( 1) 2 Marke Seder Marke Seder Coca Pro7 Coca Pro7 Salco MTV Peps Sat1 Salco Sat1 Peps RTL Coca RTL Salco Pro7 Peps Sat1 Salco Sat1 Coca RTL Coca Pro7 Coca Pro7 Peps RTL Peps RTL Peps MTV Peps Sat1 Coca Pro7 Salco RTL Peps RTL Gesucht: Maß für de Zusammehag Problem: Nomales Skaleveau der Date, d.h. Korrelatoskoeffzete sd cht awedbar Lösug: Betrachte cht de Zusammehag zwsche de zwe Merkmale, soder de Ählchket zweer ausgesuchter Merkmalsauspräguge jewels ees Merkmals 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 67-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 68 -

Merkmal: Fersehseder Auspräguge: RTL, Sat1, Pro7, MTV Merkmal: Colamarke Auspräguge: Coca Cola, Peps, Salco Vorgeheswese am Bespel vo Peps ud Sat1 Trasformere omale Date dchotome (bäre) Date (0 oder 1). Merkmal st erfüllt (Ausprägug vorhade) = 1 Peps schmeckt am beste = 1 Frage: Sollte ee Werbug für Peps eher be Sat1 oder be RTL platzert werde? Sat1 st sympathschster Seder = 1 Merkmal st cht erfüllt (Ausprägug cht vorhade) = 0 Peps schmeckt cht am beste = 0 Sat1 st cht sympathschster Seder = 0 Führt zu eem Verglech der Ählchket zwsche Peps ud Sat1 Peps ud RTL Welche der jewels bede Merkmalsauspräguge sd sch ählcher? Gesucht: E Maß für de Ählchket Bestmme de Azahl der daraus resulterede eue Realsatoe (1,1), (0,1), (1,0) ud (0,0) Bespel: Bede Auspräguge vorhade (1,1) Marke Seder Marke Seder Coca Pro7 Coca Pro7 Salco MTV Peps Sat1 Salco Sat1 Peps RTL Coca RTL Salco Pro7 Peps Sat1 Salco Sat1 Coca RTL Coca Pro7 Coca Pro7 Peps RTL Peps RTL Peps MTV Peps Sat1 Coca Pro7 Salco RTL Peps RTL Neue Realsato (1,1) 3 Aalog ergbt sch: (0,1) 2; (1,0) 5; (0,0) 10 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 69-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 70 -

Des ergbt ver eue verschedee Häufgkete, de eer Kreuztabelle egetrage werde: Peps schmeckt am beste Sat1 st am sympathschste Erfüllt (Ja = 1) Ncht erfüllt (Ne = 0) Erfüllt (Ja = 1) 3 5 8 Ncht erfüllt (Ne = 0) Allgeme: Varable 1 2 10 12 Σ 5 15 20 Erfüllt (Ja = 1) Varable 2 Ncht erfüllt (Ne = 0) Erfüllt (Ja = 1) a c a+c Ncht erfüllt (Ne = 0) Ählchketsmaße b d b+d Σ a+b c+d a+b+c+d = Σ Σ Im Bespel (Ählchkete zwsche Peps ud Sat1): 3 10 13 SM 0, 65 20 20 3 RR 0, 15 20 3 3 J 0, 3 3 2 5 10 Als Ählchket zwsche Peps ud RTL ergbt sch: Peps schmeckt am beste 4 9 13 SM 0, 65 20 20 4 RR 0, 2 20 4 4 J 0, 36 4 3 4 11 RTL st am sympathschste Ja Ne Σ Ja 4 4 8 Ne 3 9 12 Σ 7 13 20 Smple Matchg (Efache Überestmmug) Russel ud Rao Jaccard (Tamoto) a RR a J a b c a d SM De dre Ählchketsmaße köe ur Werte zwsche 0 ud 1 (eschleßlch) aehme, d.h.: SM [0,1 ] ; RR [0,1 ] ; J [0,1 ] Je äher der Wert a der 1 legt, desto ählcher sd sch de jewelge Merkmalsauspräguge, je äher a der 0, desto uählcher. De Werbug für Peps sollte be RTL platzert werde. 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 71-6. Zusammehagsmaße (Kovaraz ud Korrelato) - 72 -

Achtug, aufgepasst! Platz für Notze De Kaptel 1, 2, 3 ud 6 behadelte statstsche Verfahre sd aufwärtskompatbel. Bespele: Modus ud Meda köe auch auf ordale ud metrsche Date agewedet werde. Ebeso de Spawete. Der Ragkorrelatoskoeffzet ach Spearma ka auch zusamme mt metrsche Date agewadt werde. Ählchketsmaße köe auch zwsche omale ud ordale oder metrsche Date berechet werde. Voraussetzug dafür st atürlch ud selbstverstädlch de svolle Trasformato der chtomale Varable dchotome (bäre) Date (Merkmal st vorhade oder Merkmal st cht vorhade). 6. Zusammehagsmaße (Kovaraz ud Korrelato) - 73 -