Korrelation und Regression



Ähnliche Dokumente
Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation

Deskriptive Beschreibung linearer Zusammenhänge

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 27

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Zusammenfassung 11. Sara dos Reis.

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20

Mathematische und statistische Methoden I

Elementare Regressionsrechnung

Die Funktion f wird als Regressionsfunktion bezeichnet.

Übung V Lineares Regressionsmodell

Statistische Methoden in den Umweltwissenschaften

1 Beispiel zur Methode der kleinsten Quadrate

Bivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.154

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm

Statistik II: Signifikanztests /2

Forschungsstatistik I

7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien

5. Spezielle stetige Verteilungen

Eine zweidimensionale Stichprobe

Statistisches Testen

Korrelation - Regression. Berghold, IMI

Statistische Methoden

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II

Mittelwertvergleiche, Teil II: Varianzanalyse

Versuchsplanung und multivariate Statistik Sommersemester 2018

Instrument zur Untersuchung eines linearen Zusammenhangs zwischen zwei (oder mehr) Merkmalen.

Appendix. Kapitel 2. Ökonometrie I Michael Hauser

Mathematische und statistische Methoden I

7. Stochastische Prozesse und Zeitreihenmodelle

Brückenkurs Statistik für Wirtschaftswissenschaften

Sommersemester Marktforschung

Methoden der Ökonometrie

Vorlesung: Multivariate Statistik für Psychologen

entschieden hat, obwohl die Merkmalsausprägungen in der Grundgesamtheit voneinander abhängig sind.

Bestimmte Zufallsvariablen sind von Natur aus normalverteilt. - naturwissenschaftliche Variablen: originär z.b. Intelligenz, Körpergröße, Messfehler

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester Aufgabe 1

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

Bivariate Regressionsanalyse

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Theorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte

Prof. Dr. Marc Gürtler WS 2015/2016. Prof. Dr. Marc Gürtler. Klausur zur 10/12 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft

Teil: lineare Regression

Lösungsvorschläge zur Klausur Beschreibende Statistik und Wirtschaftsstatistik (Sommersemester 2013)

Multiple Regressionsanalyse - Kurzabriss

Anwendungen der Differentialrechnung

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

Empirische Wirtschaftsforschung

Varianzkomponentenschätzung

Statistische Tests (Signifikanztests)

erwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Quantitative Methoden der Agrarmarktanalyse und des Agribusiness

Kapitel 1 Beschreibende Statistik

Schweizer Statistiktage, Aarau, 18. Nov. 2004

Allgemeine Chemie Computer Praktikum Frühjahrssemester Regressions-Tutorial Lineare und nicht-lineare Regression

Karl Entacher. FH-Salzburg

Lineare Regression. Kapitel Regressionsgerade

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

Einführung. Ablesen von einander zugeordneten Werten

Regression I. Statistik I. Sommersemester Lineare Regression Zusammenhang und Modell Ein Beispiel: Armut und Gewaltverbrechen Zusammenfassung

Verfahren zur Überprüfung von Zusammenhangshypothesen

Wiederholung/Einführung Lineare Regression Zusammenfassung. Regression I. Statistik I. Sommersemester 2009

Der Korrelationskoezient nach Pearson

Regression und Korrelation

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Kurs Empirische Wirtschaftsforschung

2. Stochastische ökonometrische Modelle. - Modelle der ökonomischen Theorie an der Wirklichkeit überprüfen

Drittvariablenkontrolle in der linearen Regression: Trivariate Regression

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

Modul G.1 WS 07/08: Statistik

Einführung in Quantitative Methoden

Statistik II Übung 1: Einfache lineare Regression

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell

Statistik Klausur Wintersemester 2013/2014 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale

Brückenkurs Elementarmathematik

Statistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik K urs SS 2004

Transkript:

FB 1 W. Ludwig-Mayerhofer und 1 und

FB 1 W. Ludwig-Mayerhofer und 2 Mit s- und sanalyse werden Zusammenhänge zwischen zwei metrischen Variablen analysiert. Wenn man nur einen Zusammenhang quantifizieren will, aber keine Ursache-Wirkungsbeziehung angenommen werden kann, wird ein skoeffizient berechnet. Geht man von einer Ursache-Wirkungsbeziehung aus, kann man mit Hilfe der sanalyse versuchen, die Abhängigkeit des einen Merkmals (Y) vom anderen Merkmal (X) als linearen Zusammenhang durch eine Gleichung auszudrücken

FB 1 W. Ludwig-Mayerhofer und 3 Veranschaulichung: 16 14 8 Brutto-Arbeitslohn 6 4 6 8 12 14 16 18 Bildung (typische Dauer in Jahren)

FB 1 W. Ludwig-Mayerhofer und 4 Veranschaulichung: 5 Positive Einstellung erw.tätige Mutter 4 3 2 1 3 4 5 6 7 8 Alter

FB 1 W. Ludwig-Mayerhofer und 5 : : Vorstufe der Positiver Zusammenhang: Hohe Werte in der einen Variablen treten tendenziell gemeinsam mit hohen Werten in der anderen Variablen auf. Negativer Zusammenhang: Hohe Werte in der einen Variablen treten tendenziell gemeinsam mit niedrigen Werten in der anderen Variablen auf. Die gemeinsame Varianz (im Sinne von: miteinander Variieren ) zweier Variablen. s xy = 1 n n i= 1 ( x i x) ( y i y)

FB 1 W. Ludwig-Mayerhofer und 6 Bsp. (fiktiv): Bruttolohn und Bildungsjahre X i Y i X i X quer y i y quer X i X quer * y i y quer 9 - -3 3 5 16 4 8 4 16 4 4 15 9-15 -3 45 25-5 -2 Summe 15 6 5 Ar. Mittel 3 12 (Gültig für Stichpr.) Kovar.: 4

FB 1 W. Ludwig-Mayerhofer und 7 Bsp. (fiktiv): Bruttolohn und Körpergroße x i y i x i x quer y i y quer x i x quer * y i y quer 1,55 - -,17 17 5 1,65 -,7-14 4 1,8,8 8 15 1,75-15,3-45 25 1,85-5,13-65 Summe 15 8,6 Ar. Mittel 3 1,72 Kovar.:

FB 1 W. Ludwig-Mayerhofer und 8 Produkt-Moment Moment-, Pearsons (skoeffizient skoeffizient) Standardisierung der : r XY = s s X XY s Y = 1 n n i= 1 1 n n i= 1 ( x x) ( y y) i 1 n 2 ( x ) i x ( yi y) i n i= 1 2 r kann Werte zwischen 1 (perfekter negativer Zusammenhang) und +1 (perfekter positiver Zusammenhang) annehmen.

FB 1 W. Ludwig-Mayerhofer und 9 Bsp. (fiktiv): Bruttolohn und Bildungsjahre x i y i x i x quer y i y quer x i x quer * y i y quer 9 - -3 3 5 16 4 8 4 16 4 4 15 9-15 -3 45 25-5 -2 Summe 15 6 5 Ar. Mittel 3 12 Kovar.: 4 r:,96

FB 1 W. Ludwig-Mayerhofer und 25 15 25 15 5 5 V4 V3 r=,97 3 V4 V1 r=,6 3 25 25 15 15 V6 V1 r=,33 3 V6 V5 15 r=,4 25

FB 1 W. Ludwig-Mayerhofer und 11 25 25 15 15 5 V6 V2 3 V2 r=,26 r=,49 V3 3 25 25 15 15 5 5 V5 V1 3 r=,6 V1 r=,87 V2 3

FB 1 W. Ludwig-Mayerhofer und 12 : Die Grundidee visuell 16 14 8 6 4 Bruttolohn 6 8 12 14 16 18 Gesamtdauer Bildung

FB 1 W. Ludwig-Mayerhofer und 13 Grundidee verbal Wir suchen eine Gerade, die den Zusammenhang zwischen den beiden Merkmalen möglichst gut beschreibt. Möglichst gut heißt: Die gesuchte Gerade soll so gewählt werden, dass die Abstände zwischen der Geraden und den empirisch beobachteten Werten minimiert werden. (Aus bestimmten Gründen werden die quadrierten Abstände minimiert.)

FB 1 W. Ludwig-Mayerhofer und 14 y = a+ bx ˆi n n 2 e = ( ) i yi yˆ i i= 1 i= 1 Grundidee formal Wir schätzen eine Gleichung i, so dass gilt 2 = Minimum Es werden also die quadrierten Abweichungen der Geraden von den beobachten Werten minimiert ( Methode der Kleinsten Quadrate ; englisch: Ordinary Least Squares = OLS). a und b sind die aus der Stichprobe berechneten Schätzer für die unbekannten Parameter der Grundgesamtheit, meist als α und β bezeichnet.

FB 1 W. Ludwig-Mayerhofer und 15 Grundidee graphisch Bitte beachten: Y-Y und X-Achse X müssen bis verlängert gedacht werden 45 y4 ŷ 4 Einkommen 35 25 y3 ŷ 3 15 9 11 13 15 Bildung

FB 1 W. Ludwig-Mayerhofer und 16 Im Beispiel (vorherige Seite!) yˆ = + 333, 3x i bzw. sgleichung y = + 333, 3x + e i i i i Die Berechnung von a und b überlassen wir der einschlägigen Statistik-Software.

FB 1 W. Ludwig-Mayerhofer und 17 Multiple Yˆ = b + b X + b X 1 1 2 2 Y ˆ = 75 + 232 X + 63,5 X 1 2 Die skoeffizienten (oder sgewichte) b 1 und b 2 geben jeweils den um die andere Variable bereinigten Einfluss wieder; man sagt, der Einfluss der anderen Variablen wurde auspartialisiert.

FB 1 W. Ludwig-Mayerhofer und 18 bei und Nur lineare Zusammenhänge werden erfasst 12 8 6 : -,5, d.h. praktisch gleich null. Aufmerksamkeit 4 2 Das Beispiel ist fiktiv, Sie sind natürlich ständig aufmerksam! 4 6 8 Dauer der Vorlesung

FB 1 W. Ludwig-Mayerhofer und 19 bei und Nur lineare Zusammenhänge werden erfasst 26 24 22 Wohlbefinden 18 16 14 12 8 g Alkohol/Tag 3 4 Die Gerade ist quasi horizontal was nicht dem eigentlichen Zusammenhang entspricht. In der sanalyse kann man sich aber durch Tricks an die Kurve annähern

FB 1 W. Ludwig-Mayerhofer und bei und Einzelne Fälle können starken Einfluss ausüben (nicht zuletzt wegen Multiplikation) 16 14 über alle Fälle: r=,35. 8 EINKZUF 6 4 ohne Einkommen über 14.: r=,39. - 3 4 Dauer der Betriebszugehoerigkeit

FB 1 W. Ludwig-Mayerhofer und 21 bei und Einzelne Fälle können starken Einfluss ausüben (nicht zuletzt wegen Quadrierung) 5 4 Wohlbefinden 3 Die gleichen Daten wie vorhin plus einige Extremwerte (links unten, rechts oben) erzeugen einen deutlich steigende Gerade 3 4 g Alkohol/Tag