Der Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen X und Y. Er ist durch folgende Formel charakterisiert:

Ähnliche Dokumente
Der Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen X und Y. Er ist durch folgende Formel charakterisiert:

Der Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen X und Y. Er ist durch folgende Formel charakterisiert:

Beispiel zur Regression

= 2. Korrelationskoeffizient. Der Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen

Der Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen X und Y. Er ist durch folgende Formel charakterisiert:

Beispiel zur Regression

Methoden der Datenanalyse AI-basierte Decision Support Systeme WS 2006/07

Statistik. ist die Kunst, Daten zu gewinnen, darzustellen, zu analysieren und zu interpretieren um zu neuem Wissen zu gelangen.

Eindimensionale Regression. Eindimensionale Regression. Regressionsgerade. Güte des Regressionsmodells. Vertrauensintervalle

Statistische Grundlagen Ein kurzer Überblick (diskret)

Regressionsrechnung und Korrelationsrechnung

2.2 Rangkorrelation nach Spearman

Prinzip "Proportional Reduction of Error" (PRE)

Regressionsgerade, lineares Modell:

Quantitative Methoden in der klinischen Epidemiologie

Alternative Darstellung des 2-Stichprobentests für Anteile. Beobachtete Response No Response Total absolut DCF CF

Stichprobenmodell der linearen Einfachregression

Korrelations- und Regressionsanalyse

Mehrdimensionale Häufigkeitsverteilungen (1)

Schiefe- und Konzentrationsmaße

Lohnkosten pro Arbeitsstunde. Wie hoch sind die Lohnkosten pro Arbeitsstunde im Jahresdurchschnitt?

Einführung Fehlerrechnung

Mehrdimensionale Merkmale

5 Reproduktions- und Grenzwertsätze

3. Das Messergebnis. Was ist ein Messergebnis?

Universitätslehrgang Sports Physiotherapy Einführung in die Statistik

Schiefe-, Wölbungs- und Konzentrationsmaße

Korrelations- und Assoziationsmaße

Einführung in die Stochastik 3. Übungsblatt

Statistik und Wahrscheinlichkeitsrechnung

Fehlerrechnung im Praktikum

Formelzusammenstellung

Verdichtete Informationen

Intervallschätzungen geben unter Berücksichtigung des Verteilungstyps von X einen Bereich an, der den Parameter mit vorgegebener Sicherheit enthält.

2. Zusammenhangsanalysen: Korrelation und Regression

6. Zusammenhangsmaße (Kovarianz und Korrelation)

Physikalische Messungen sind immer fehlerbehaftet! Der wahre Wert ist nicht ermittelbar. Der wahre Wert x ist nicht identisch mit dem Mittelwert

Schiefe- und Konzentrationsmaße

Allgemeine Prinzipien

1 Mathe Formeln Statistik und Wahrscheinlichkeitsrechnung

Spannweite, Median Quartilsabstand, Varianz und Standardabweichung.

Test für Varianz. Test für Varianz. Test für Varianz. Die Kontingenztabelle. Statistik 2 4. Vorlesung. Wiederholung: zweidimensionales Datenmaterial

Kapitel XI. Funktionen mit mehreren Variablen

( x) eine Funktion definiert, in der nur die i-te Komponente variabel ist. Folgende Schreibweisen werden aufgrund dieser Anmerkungen auch verwendet:

Aufgaben. 1. Gegeben seien folgende Daten einer statistischen Erhebung, bereits nach Größe sortiert (Rangliste):

die Schadenhöhe ( = Risikoergebnis) des i-ten Versicherungsnehmers i 1,, n).

(Markowitz-Portfoliotheorie)

Quellencodierung I: Redundanzreduktion, redundanzsparende Codes

Konzentrationsanalyse

Kapitel 6: Regression

Erzeugen und Testen von Zufallszahlen

Verteilungen und Schätzungen

Lösungen zum Übungs-Blatt 7 Wahrscheinlichkeitsrechnung

Eigenschaften der arithmetischen Mittel. Schätzer für die Varianz. Allgeimeines Method: Likelihood Funktion. Schätzer für die Wahrscheinlichkeit

Formelsammlung. Unter diesen Annahmen kann der Korrelationskoeffizient nach folgenden Schritten getestet werden:

REGRESSION. Marcus Hudec Christian Neumann. Eine anwendungsorientierte Einführung. Unterstützt von Institut für Statistik der Universität Wien

Schiefe-, Wölbungs- und Konzentrationsmaße

= k. , mit k als Anzahl der Hypothesen A i und den Daten B. Bestimmtheitsmaß:!Determinationskoeffizient

3 Bivariate und multivariate Verfahren

Übungen zur Wahrscheinlichkeitsrechnung und Schliessenden Statistik

Lösungen zum Übungs-Blatt 7 Wahrscheinlichkeitsrechnung

Lösungen. Häufigkeitsverteilung (Stabdiagramm) Aufgabe 1. Häufigkeit (h) Merkmal (x)

WIB 2 Mathematik und Statistik Formelsammlung. Z Menge der ganzen Zahlen {...,-3,-2,-1,0,1,2,3,...}

( ) ( ) ( ) ( ) è ø. P A Wahrscheinlichkeitsmaß. lim n. Dr. Christian Schwarz 4. KOMBINATORIK Permutationen

6. Zusammenhangsmaße (Kovarianz und Korrelation)

Erinnerung: Funktionslernen. 5.6 Support Vector Maschines (SVM) Beispiel: Funktionenlernen. Reale Beispiele

Histogramm / Säulendiagramm

Teil IV Musterklausuren (Univ. Essen) mit Lösungen

Zur Interpretation einer Beobachtungsreihe kann man neben der grafischen Darstellung weitere charakteristische Größen heranziehen.

Varianzfortpflanzung

Formelsammlung für die Lehrveranstaltung Statistik

1. Ökonometrische Modelle ohne Stochastik

Ordnungsstatistiken und Quantile

Deskriptive Statistik - Aufgabe 3

Formelsammlung Statistik

Practical Numerical Training UKNum

Regression und Korrelation

Allgemeine Zielstellung der Regression. Lineare Regression. Lineare Regression. Lineare Regression

2 Regression, Korrelation und Kontingenz

Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz

Statistik mit Excel und SPSS

Übung Statistik II SS 2006 Musterlösung Arbeitsblatt 6

Textil & Design Formelsammlung Statistik

Formeln für Statistik und Wahrscheinlichkeitstheorie (Dutter)

Klausur Statistik IV Sommersemester 2009

Deskriptive Statistik und Explorative Datenanalyse

Multiple Regression (1) - Einführung I -

Maße zur Kennzeichnung der Form einer Verteilung (1)

Wie man für einen Test Peroe testet

Klausur SS 2005 Version 1

für j=0,1,...,n Lagrange zur Lösung der Interpolation nicht geeignet, da numerisch problematisch und teuer. 1 n

Das "Alkomatproblem" - Statistische Tests

Formelsammlung für die Lehrveranstaltung Wirtschaftsmathematik / Statistik

Thema 5: Reduzierte Datenanforderungen II: Naive Diversifikation

Geometrisches Mittel und durchschnittliche Wachstumsraten

Scatterplots. Scatterplot Zweidimensionale Stichproben können als Punkte in der Ebene dargestellt werden. Länge und Breite von Venusmuscheln

Transkript:

Korrelatoskoeffzet Der Korrelatoskoeffzet st e Maß für de leare Zusammehag zwsche zwe Varable X ud Y. Er st durch folgede Formel charaktersert: r xy corr XY x x y y x x y y x x y x x y y y Statstk für SozologIe Regresso

Kozept der Kovaraz ( y y) ( x x) Statstk für SozologIe Regresso

Test auf Sgfkaz Wll ma Hypothese der Form H 0 : corr=0 versus H a : corr0 (zwesetg) bzw. H 0 : corr<0 versus H a : corr>0 (esetg) teste, so ka des uter der Aahme eer - dmesoale Normalvertelug mt folgeder Statstk erfolge: r t mt Frehetsgrade r Dese Teststatstk st uter der Nullhypothese t vertelt mt - Frehetsgrade Statstk für SozologIe 3 Regresso

Bvarate Normalvertelug Statstk für SozologIe 4 Regresso

Smulato aus eer -dmesoale Normalvertelug 6 Couts 0 3 4 5 6 5 4 3 0 0 3 4 5 6 5 4 3 0 9 8 7 6 5 4 3 0 3 4 5 6 Statstk für SozologIe 5 Regresso

Bespel X Y X² XY Y² 65 68 45 440 464 63 66 3969 458 4356 3 67 68 4489 4556 464 4 64 65 4096 460 45 5 68 69 464 469 476 6 6 66 3844 409 4356 7 70 68 4900 4760 464 8 66 65 4356 490 45 9 68 7 464 488 504 0 67 67 4489 4489 4489 69 68 476 469 464 7 70 504 4970 4900 Summe 800 8 5348 5407 54849 Wr wolle de Nullhypothese teste, dass de Merkmale X ud Y ukorrelert sd. Kovaraz Sxy 484 Varaz X Sxx 06 Varaz Y Syy 467 Korrelato Rxy 0,70 Teststatstk Zähler, Neer 0,7 t 3, Tabellewert t -;0,975,3 ==> Ho ablehe Statstk für SozologIe 6 Regresso

Aderes Bespel mt SPSS Statstk für SozologIe 7 Regresso

CO Emssoe Statstk für SozologIe 8 Regresso

Nchtparametrsche Korrelato Nutzug der Ragformato! Praktsch kee Korrelato! Statstk für SozologIe 9 Regresso

Korrelato ach Spearma Statstk für SozologIe 0 Regresso

Bespel zum Effekt vo Ausreßer Statstk für SozologIe Regresso

Aalyse des Datesatzes mt Bravas Pearso Deutlch sgfkates Ergebs! Statstk für SozologIe Regresso

Elmato des Ausreßers Ke sgfkates Ergebs! Statstk für SozologIe 3 Regresso

Redukto des Skaleveaus Ke sgfkates Ergebs! Statstk für SozologIe 4 Regresso

Bespel zur Regresso Bespel Lestug kw ud Kraftstoff-Verbrauch l pro 00 km vo sebe verschedee VW-Golf Bezmotore [] kw l/00km 55 6,4 74 7,6 77 6,8 85 7,9 0 9,3 50 0,8 [] Quelle: http://www.vw-ole.de/golf/dex_.htm Statstk für SozologIe 5 Regresso

Streudagramm Streudagramm: Lestug - Verbrauch Kraftstoffverbrauch l/00km 0 8 6 4 0 0 50 00 50 00 Lestug kw Statstk für SozologIe 6 Regresso

Grudmodell Zelgröße (abhägge Varable; Regressad) Y Eflussgröße (uabhägge Varable; Regressor) X Im Bespel: Y... Kraftstoffverbrauch X... Lestug Aahme: Es besteht e fuktoaler Zusammehag zwsche de bede Merkmale: Y = f(x) Statstk für SozologIe 7 Regresso

De Regressosaalyse st e Istrumet zur Utersuchug ees fuktoale Zusammehags zwsche zwe Merkmale. Im Utersched zur Korrelatosaalyse hadelt es sch also um e gerchtetes Modell Mt der Regressosaalyse ka e fuktoaler Zusammehag erkat werde ma ee solche Bezehug statstsch achwese Art ud Größe ees Zusammehags geschätzt werde fehlede oder zuküftge Werte progostzert werde Statstk für SozologIe 8 Regresso

Dabe hadelt es sch cht um ee exakte Fukto m streg mathematsche Se Aufgrud vo Messfehler ud Zufallseflüsse werde de ezele Messuge cht dealtypsch auf dem Fuktosgraphe lege, soder zufällg abweche Wr erweter user Modell daher um ee Fehlerterm (zufällge Kompoete) e, we folgt: Y = f(x) + e Statstk für SozologIe 9 Regresso

Stochastscher Fuktoszusammehag 35 30 5 0 5 0 5 0 0 4 6 8 0 Statstk für SozologIe 0 Regresso

Leare Regresso De efachste Form ees fuktoale Zusammehages stellt ee leare Fukto dar Modellvorstellug: der Zusammehag zwsche X ud Y ka (zumdest stückwese) durch ee Grade beschrebe werde: Y = b 0 + b X + e b 0... Abstad der Gerade vom Ursprug auf der Ordate b... Stegug der Gerade Statstk für SozologIe Regresso

Learer stochastscher Fuktoszusammehag 50 40 Asteg: b 30 0 0 0 b 0 0 4 6 8 0 Statstk für SozologIe Regresso

Notato De Ausgagspukt blde Beobachtugspaare (x,y ), de wr als Datepukte eem Streudagramm vsualsere köe. X Y x y x y...... x y...... x y Statstk für SozologIe 3 Regresso

Learer stochastscher Fuktoszusammehag 50 40 30 e y yˆ y Asteg: b 0 0 0 b 0 x b0 b x 0 4 6 8 0 yˆ Statstk für SozologIe 4 Regresso

Bestmmug der Regressosgerade. Idee: Gerade so wähle, dass de SUMME aller Abwechuge mmal wrd. Nachtel: kee edeutge Lösug, da postve ud egatve Abwechuge eader aufhebe köe. y - + y b b x m! 0 x Statstk für SozologIe 5 Regresso

Bestmmug der Regressosgerade. Idee: Gerade so lege, dass de Summe des BETRAGES aller Abwechuge mmal wrd Nachtele: Mathematsch aufwädg (Betragsfukto cht zwemal dfferezerbar) hat der Praxs relatv gergere Bedeutug y b b x m! 0 Statstk für SozologIe 6 Regresso

Bestmmug der Regressosgerade 3.Idee: Gerade so lege, dass de Summe der QUADRATE aller Abwechuge mmal wrd. Klest-Quadrate-Przp De optmale Regressosgerade ergbt sch da durch Lösug folgeder Optmerug: S e y b b x m! 0 Statstk für SozologIe 7 Regresso

Statstk für SozologIe 8 Regresso Mathematsche Herletug 0 0 0 x b b y b S 0 0 x x b b y b S () y b b x 0 () xy b x b x 0 Aus b y b x 0 ach Substtuto: ˆ x x y x y x b

Iterpretato der Formel für Koeffzete Stegug der Regressosgerade: Kovaraz vo X ud Y dvdert durch de Varaz vo X bˆ x y x y x x cov( X, Y) var( X ) Abstad auf der Ordate: Leare Regressosgerade verläuft durch de Schwerpukt der Pukte bˆ 0 y bx Statstk für SozologIe 9 Regresso

Tabellarsches Recheschema Nr. X Y X X*Y Y 55 6,4 305 35 40,96 74 7,6 5476 56,4 57,76 3 77 6,8 599 53,6 46,4 4 85 7,9 75 67,5 6,4 5 0 9,3 00 03 86,49 6 50 0,8 500 60 6,64 Summe 55 48,8 5655 475,5 40,5 Mttelwert vo X: 9,83 Mttelwert vo Y: 8,3 Berechug vo b : Neer 3399,00 b = 0,05 Zähler 66,0 b 0 = 3,73 bˆ x x y x b y b x 0 x y Statstk für SozologIe 30 Regresso

Graphsche Darstellug Streudagramm: Lestug - Verbrauch Kraftstoffverbrauch l/00km 0 8 y = 0,05x + 3,73 6 4 0 40,00 60,00 80,00 00,00 0,00 40,00 60,00 80,00 Lestug kw Statstk für SozologIe 3 Regresso

Automatserte Berechug mt EXCEL Statstk für SozologIe 3 Regresso

Ergebs mt SPSS Statstk für SozologIe 33 Regresso

Regressosgerade als Istrumet zur Vorhersage Basered auf de geschätzte Parameter köe wr für ee x Wert de zugehörge y Wert schätze Progose-Szeare Wert vo x Schätzwert für y 40 5,65 Statstk für SozologIe 34 Regresso

Gefahre ud Greze der Progostk Wewet ka e learer Tred svoll fortgeschrebe werde? 5 0 5 Erkee vo Wedepukte 0 5 50 00 0 4 6 8 0 50 40 00 0 00 50 80 0 0 4 6 8 0 60 40 0 Problem vo Strukturbrüche Statstk für SozologIe 35 0 0 4 6 8 0 Regresso

Wchtge Egeschafte der Regressosgerade Fehlerausglechede Gerade e De Summe der Abwechuge vo der ach dem Kl. Quadrate Przp optmale Gerade st glech Null. 0 Regressosgerade läuft durch Schwerpukt y b0 b x Statstk für SozologIe 36 Regresso

K.Q. - Gerade geht durch de Schwerpukt 40 30 y 0 0 0 x 0 4 6 8 0 Statstk für SozologIe 37 Regresso

Varabltät der Regresso y y y ŷ P( x, y ) ŷ b0 b x ŷ y ŷ y y y y ŷ ŷ y SQT SQR y y y yˆ x e x Totale Quadratsumme der Abwechuge vom arthmetsche Mttel cht erklärte (resduale) Abwechugsquadratsumme SQE yˆ y erklärte Abwechugsquadratsumme Statstk für SozologIe 38 Regresso

Statstk für SozologIe 39 Regresso

Zerlegug der Quadratsumme SQT SQR SQE y y e yˆ y r SQE SQT y y yˆ y r = Bestmmthetsmaß Atel der erklärte Varaz a der gesamte Varaz Statstk für SozologIe 40 Regresso

Iterpretato vo r² Im Leare Modell y=a+bx st r² geau das Quadrat des Korrelatoskoeffzete r² ka Werte zwsche Null (ke Zusammehag zwsche Y ud X) ud Es (alle Pukte lege exakt auf eer Gerade) aehme Je äher r² be es legt, desto besser wrd Y durch X mttels eer leare Regresso erklärt r² st der Atel der Varato vo Y, der durch X erklärt werde ka Statstk für SozologIe 4 Regresso

Bestmmug vo r² m Bespel Nr. X Y X X*Y Y e e ŷ ( y y) ˆ y ˆ y 55 6,4 305 35 40,96 6,37 0,03 0,00 3,00 -,77 3, 74 7,6 5476 56,4 57,76 7,8 0,3 0,0 0,8-0,85 0,73 3 77 6,8 599 53,6 46,4 7,4-0,6 0,39,78-0,7 0,5 4 85 7,9 75 67,5 6,4 7,8 0,09 0,0 0,05-0,33 0, 5 0 9,3 00 03 86,49 9,00 0,30 0,09,36 0,87 0,76 6 50 0,8 500 60 6,64 0,9-0, 0,0 7,,79 7,77 Summe 55 48,8 5655 475,5 40,5 48,80 0,00 0,60 3,59 0,00,99 y y Mttelwert vo X: 9,83 Mttelwert vo Y: 8,3 Berechug vo b: Neer 3399,00 b = 0,05 Zähler 66,0 b 0 = 3,73 SQT 3,59 00,0% SQR 0,60 4,4% SQE,99 95,6% Statstk für SozologIe 4 Regresso

Iferezstatstk Es wrd ageomme, daß de Werte der uabhägge Varable feste (chtzufällge) Größe sd. Es wrd ageomme, daß sch de Beobachtuge der abhägge Varable durch ee X leare Term plus eer zufällge Störkompoete ergebe. Über de Störkompoete werde folgede Aahme getroffe Kee systematsche Störug, d.h. Erwartugswert st ull E(e ) = 0 Kostate Streuug der Störkompoete Var(e ) = cost. De Störuge sd uabhägg voeader Cov(e, e j ) = 0 De Störkompoete se ormalvertelt mt Erwartugswert 0 ud der Varaz ² Statstk für SozologIe 43 Regresso

Modellaahme De bedgte Dchte vo Y für gegebee Wert vo X uterschede sch ur hrem Erwartugswert Statstk für SozologIe 44 Regresso

Sgfkaz der Regressosbezehug Frage st der Atel der erklärte Varaz sgfkat? Atwort: F-Test Erklärte durch chterklärte mttlere Quadratsumme (das st de Quadratsumme durch de Zahl der Frehetsgrade dvdert) Dese Prüfgröße st F-vertelt mt ud - Frehetsgrade F SQE / SQR /( ) r / ( r ) /( ) Statstk für SozologIe 45 Regresso

Durchführug des Tests ANOVA (Aalyss of Varace) Frehetsgrade (df) Quadratsumme (SS bzw. SQ) Mttlere Quadratsumme Prüfgröße (F) P-Wert Regresso,990,990 86,95 0,0007 Resdue 4 0,603 0,5 Gesamt 5 3,593 r²= 0,956 (-r²)= 0,044 (-r²)/4= 0,0 Statstk für SozologIe 46 Regresso

Schätzug vo ² De Schätzug der ubekate Varaz der Störkompoete st de Voraussetzug für Iferez über de Parameter bzw. für Kofdeztervalle für Progosewerte. Naheleged st de achstehede Formel (E(e)=0!) ˆ e De postve Quadratwurzel führt zum Stadardfehler der Resdue (Resdual Stadard Error) Statstk für SozologIe 47 Regresso

Kofdeztervalle ud Tests für Regressoskoeffzete Schätzug der Varaz der Regressoskoeffzete ˆ ˆ x ˆ b 0 ( x x) b ˆ ( x x) Iterpretato: Be große Werte vo x st de Varabltät der Kostate ceters parbus größer. Je stärker de x-werte streue, desto gerger st ceters parbus de Streuug beder Koeffzete Statstk für SozologIe 48 Regresso

Test für de Regressoskoeffzete Nullhypothese: b =0 Koeffzet Stadardfehler t-statstk P-Wert b 0 3,73 0,500 7,465 0,007 b 0,048 0,005 9,84 0,0007 ˆ 0,60 / 4 0,5 Iterpretato: ( x x) x x 56.55 6 9,83 5.654,8 ˆ b 0, 005 0,5 5.654,8 b 0 =0... Geht de Regresso durch de Ursprug? b=0... Ist de Stegug sgfkat vo Null verschede? Das etsprcht m Fall der Efachregresso der zuvor dskuterte Fragestellug: Ist der Atel der erklärte Varaz sgfkat? Hwes: Vergleche de p-value für de Stegug mt dem F-Test Statstk für SozologIe 49 Regresso

Kofdeztervall für de durchschttlche Progosewert T Ŷ E(Y S Ŷ ) t-vertelt mt - Frehetsgrade P(Ŷ ts E(Y ) Ŷ ts ) Ŷ Ŷ Für ee kokrete Stchprobe ergbt sch damt das folgede Kofdeztervall für de durchschttlche Progosewert (Vertrauestervall) ŷ ts Ŷ E(Y ) ŷ Ŷ ts mt ŷ b 0 b x ud s Yˆ ˆ ( x x) j ( x x) j Statstk für SozologIe 50 Regresso

Progosetervall für dvduelle Progosewert Y T Ŷ Y S F t-vertelt mt - Frehetsgrade P(Ŷ ts Y Ŷ ts ) F F Aus eer kokrete Stchprobe ergbt sch somt das folgede Kofdeztervall für de Progose ees bestmmte Ezelwertes a der Stelle x : ŷ ts F Y ŷ ts F mt ŷ b 0 b x ud s F ˆ ( x x) j ( x x) j Statstk für SozologIe 5 Regresso

Awedug m Bespel Progosetervall für Ezelwerte (dvduelle Progosewerte) x S F Progose UG OG se 0,388 50 0,477 6,88 4,887 7,437843 t:,78 55 0,4604 6,36793 5,089596 7,64664 60 0,4504 6,60758 5,35737 7,85808 65 0,446 6,8473 5,69 8,07333 70 0,434 7,08687 5,8836 8,949 75 0,48 7,365 6,3756 8,55479 80 0,437 7,5667 6,389658 8,74677 85 0,408 7,8058 6,637483 8,97447 90 0,494 8,04546 6,880947 9,09979 95 0,496 8,85 7,0006 9,4504 00 0,44 8,5476 7,354668 9,694847 05 0,448 8,7644 7,584988 9,9438 0 0,497 9,00405 7,8069 0,9704 5 0,4360 9,437 8,03305 0,45435 0 0,4438 9,48335 8,53 0,7558 Statstk für SozologIe 5 Regresso

Vertraues- ud Progosetervall Kraftstoffverbrauch l/00km 0 5 0 5 0 Vertrauestervall Progosetervall 50 00 50 00 Lestug kw Statstk für SozologIe 53 Regresso