Bivariate Zusammenhänge

Ähnliche Dokumente
Das Lineare Regressionsmodell

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Annahmen des linearen Modells

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II

Bivariate Regressionsanalyse

Kurs Empirische Wirtschaftsforschung

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 27

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Übungsblätter zu Methoden der Empirischen Sozialforschung IV: Regressionsanalyse. Lösungsblatt zu Nr. 2

Inferenz im multiplen Regressionsmodell

Teil: lineare Regression

Korrelation - Regression. Berghold, IMI

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

1. Lösungen zu Kapitel 5

Statistische Methoden in den Umweltwissenschaften

Eine zweidimensionale Stichprobe

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

Analyse von Querschnittsdaten. Spezifikation der unabhängigen Variablen

Übung V Lineares Regressionsmodell

Bivariate Analyseverfahren

Statistik II. I. Einführung. Martin Huber

Klassen diskreter Variablen

5 Beschreibung und Analyse empirischer Zusammenhänge

Vorlesung 4: Spezifikation der unabhängigen Variablen

Seminar zur Energiewirtschaft:

Instrumentvariablen und Instrumentvariablenschätzer

John Komlos Bernd Süssmuth. Empirische Ökonomie. Eine Einführung in Methoden und Anwendungen. 4y Springer

1 Einführung Ökonometrie... 1

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management

Regression und Korrelation

Übungsblatt 10: Lineare Regression (Sitzung 11)

Empirische Analysen mit dem SOEP

Einführung in Quantitative Methoden

Übung 3 im Fach "Biometrie / Q1"

Wiederholung/Einführung Lineare Regression Zusammenfassung. Regression I. Statistik I. Sommersemester 2009

Drittvariablenkontrolle in der linearen Regression: Trivariate Regression

Das lineare Regressionsmodell

Einführung in die Statistik

Modul G.1 WS 07/08: Statistik

Korrelation Regression. Wenn Daten nicht ohne einander können Korrelation

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

1. Datei Informationen

Bivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.154

Mathematik für Biologen

Ziel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X.

Datenanalyse mit Excel und Gretl

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Statistik II Übung 2: Multivariate lineare Regression

Statistischer Rückschluss und Testen von Hypothesen

Statistische Tests (Signifikanztests)

Regression I. Statistik I. Sommersemester Lineare Regression Zusammenhang und Modell Ein Beispiel: Armut und Gewaltverbrechen Zusammenfassung

Statistik. Ronald Balestra CH St. Peter

Vorlesung: Statistik I für Studierende der Statistik, Mathematik & Informatik. Regression. Einfache lineare Regression

Didaktisches Seminar über Stochastik. Themen: ffl Korrelation von zwei Zufallsvariablen

Datenstrukturen. Querschnitt. Grösche: Empirische Wirtschaftsforschung

Mathematik für Biologen

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

TEIL 13: DIE EINFACHE LINEARE REGRESSION

Statistik II Übung 1: Einfache lineare Regression

5. Übung Zusammenhänge zweier Merkmale

Statistik II Übung 1: Einfache lineare Regression

Brückenkurs Statistik für Wirtschaftswissenschaften

Einführung in die Korrelationsrechnung

Multivariate Verfahren

Glossar Biometrie / Statistik. Auszug für Fragebogen Fallzahlberechnung/-begründung

Dynamische Systeme und Zeitreihenanalyse // Beschreiben von Zeitreihen 9 p.2/??

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

Wiederholungsübungen zu den Kapiteln 7 bis 11

Empirische Wirtschaftsforschung

Hypothesentests mit SPSS

9.3 Lineare Regression

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS

I. Deskriptive Statistik 1

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Statistik II Übung 2: Multivariate lineare Regression

I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03

1 Inhaltsverzeichnis. 1 Einführung...1

Kontingenztabelle: Führerschein Ja Nein Ja Nein Auto. Wie viel Prozent der Studierenden besitzen kein Auto?

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Die Regressionsanalyse

2. Generieren Sie deskriptive Statistiken (Mittelwert, Standardabweichung) für earny3 und kidsunder6yr3 und kommentieren Sie diese kurz.

Multivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.167

6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale

Skalenniveaus =,!=, >, <, +, -

Einführung in die Statistik

Wahrscheinlichkeitsrechnung und Statistik

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Mehrdimensionale Zufallsvariablen

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

Bivariate Verteilungen [bivariate data]

Institut für Soziologie Dipl. Soz. Maximilian Sonnauer. Methoden II. Zusammenhangsmaße für kategoriale und metrische Variablen

Inhalt. I. Deskriptive Statistik Einführung Die Grundgesamtheit Merkmale und Verteilungen Tabellen und Grafiken...

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Multivariate Verfahren

Transkript:

Bivariate Zusammenhänge

40 60 80 Bivariater Zusammenhang: Zusammenhang zwischen zwei Variablen weight (kg) Gibt es einen Zusammenhang zwischen Größe & Gewicht? (am Beispieldatensatz) Offensichtlich positiver Zusammenhang zwischen den Variablen Wie kann man Zusammenhang statistisch greifen? 100 120 140 Maßzahlen für (linearen) Zusammenhang zwischen zwei Variablen Kovarianz Korrelation 140 160 180 200 height (cm) 5

Covarianz / Kovarianz Positiver Zusammenhang hohe Werte in x treten (tendenziell) gemeinsam mit hohen Werten in y auf Gewicht Negativer Zusammenhang hohe Werte in x treten (tendenziell) gemeinsam mit niedrigen Werten in y auf Gewicht Größe Größe 6

Covarianz / Kovarianz Kovarianz gibt Richtung der Korrelation an, Größenordnung nicht interpretierbar Beispiel Korrelation von Größe und Gewicht Gewicht gemessen in Kilogramm Gewicht Gewicht gemessen in Gramm Größe Cov () ", aber am Zusammenhang der Größen hat sich nichts geändert 7

Pearson Korrelationskoeffizient Korrelationskoeffizient ½ Korrelationskoeffizient ½ ist dimensionslos (Einheiten kürzen sich raus) Gewicht ist normiert auf Werte -1 ½ 1 ½ = -1 ) perfekte negative Korrelation ½ = 1 ) perfekte positive Korrelation ½ = 0 ) kein Zusammenhang zwischen Variablen Größe 8

Kausalität und Korrelation 100 120 140 40 60 80 Gewicht (kg) Größe (cm) 140 160 180 200 Korrelation (Größe $ Gewicht) : ½ = 0,4775 (was heißt das?) 140 160 180 200 Größe (cm) 40 60 80 100 120 140 Gewicht (kg) Korrelation von ½ = 0.477 heißt positiver Zusammenhang zwischen Größe und Gewicht Was ist der kausale Zusammenhang (die Kausalrichtung)? steigt Größe ) steigt Gewicht oder steigt Gewicht ) steigt Größe? 9

Kausalität und Korrelation Korrelation: Es besteht ein Zusammenhang zwischen Merkmalen Korrelationskoeffizient misst die Stärke eines linearen Zusammenhangs zwischen zwei Merkmalen keine Information über Kausalrichtung! Kausalität: Ursache! Wirkungsbeziehung ) Kausalrichtung vorgegeben Körpergröße wirkt auf Gewicht (und nicht andersherum) Lernaufwand! Klausurergebnis Lebensalter! Anzahl Arztbesuche Idee über den datengenerierenden Prozess notwendig Notwendigkeit einer dahinterstehenden Theorie Theorie gibt Kausalrichtung vor Gewicht ist eine Funktion der Körpergröße 10

Das Bivariate Regressionsmodell

Bivariates Regressionsmodell Ökonomisches Modell Es besteht in der Grundgesamtheit ein Zusammenhang zwischen der abhängigen Variable y und einer unabhängigen Variablen x Kausalrichtung: x wirkt auf y (und nicht umgekehrt) Stichprobe: Zur Quantifizierung (ggf. Falsifizierung) dieses Zusammenhangs wird eine repräsentative Stichprobe aus der Grundgesamtheit gezogen 13

5 Verbrauch in l/100km 10 15 20 25 Bivariates Regressionsmodell Verbrauch eines Pkw hängt vom Gewicht des Fahrzeugs ab Hypothese / Theorie: Je schwerer ein Auto, desto mehr wird es verbrauchen Stichprobe von 74 Pkw zum Benzinverbrauch und Gewicht Scatterplot offenbart positiven Zusammenhang 500 1000 1500 2000 2500 Gewicht in kg 14

Bivariates Regressionsmodell Vermutung eines linearen Zusammenhangs Bedeutung der Koeffizienten Verbrauch 0: Achsenabschnitt 1: Steigungskoeffizient +1 Gewicht 15

Interpretation des Steigungskoeffizienten 1 Schätzgleichung: Ableitung nach x: Verbrauch 1. Ableitung ) Steigung der Funktion 1 ist der marginale Effekt von x auf y +1 steigt x um eine Einheit ) y steigt um 1 -Einheiten Gewicht 16

5 Verbrauch in l/100km 10 15 20 25 Interpretation der Schätzergebnisse Ökonomisches Model / Theorie: unterstellter wahrer Zusammenhang y = o + 1x geschätzter Zusammenhang (beachte das ^) ^y = ^ o + ^ 1x geschätzte Parameter 500 1000 1500 2000 2500 Gewicht in kg 17

Interpretation der Schätzergebnisse geschätzte Gleichung / geschätzter Zusammenhang ^y = ^ o + ^ 1x partieller / marginaler Effekt steigt das Fahrzeuggewicht um 1 Einheit (! 1 kg) ) Verbrauch steigt um 0.007 l/100km Prognose für den zu erwartenden Verbrauch (in Abhängigkeit vom Gewicht) ein Auto wiegt 1000kg ) E(y x) = 1.813 + 0.007 1000 ¼ 8.8l ein Auto wiegt 1500kg ) E(y x) ¼ 12.3l 18

Bivariate Regression als bedingter Erwartungswert geschätzter Zusammenhang ^y = ^ 0 + ^ 1x impliziert, kennt man x (Gewicht) der Beobachtung hat man durch geschätzte Parameter eine Erwartung bzgl. des Verbrauchs y E(yjx) = ^y E(yjx) = ^ 0 + ^ 1x 19

Störgröße, Residuum ^y i = ^ 0 + ^ 1x i geschätzter Zusammenhang gilt nur durchschnittlich / im Mittel bei gleichem Gewicht immer noch Unterschiede im Verbrauch Beobachtungen streuen um Regressionsgerade Störterm / Fehlerterm = Differenz zwischen tatsächlicher und erwarteter Ausprägung Störgröße Residuum Fehlerterm ^u i = y i ^y i tatsächlicher individueller Verbrauch ergibt sich als y i = ^ 0 + ^ 1x i {z } E(y i jx i ) +^u i 20

5 10 15 20 25 y i = ^ 0 + ^ 1x i + ^u i ^y = ^ 0 + ^ 1x y i u i u i ^y i E(Verbrauch Gewicht) 500 1000 1500 2000 2500 Gewicht in kg Verbrauch in l/100 km Fitted values 21

Störgröße, Residuum y i = ^ 0 + ^ 1x i + ^u i Was verbrigt sich hinter dem Residuum u i? E(y x) misst den Effekt des Fahrzeuggewichts auf den Verbrauch Störgröße ^u i = y i E(y i jx i ) fängt alle verbrauchsrelevanten Einflüsse auf, die nicht durch das Gewicht des Autos abgebildet werden Luftwiderstand (cw-wert) Übersetzung / Fahrweise Getriebart (Schaltung / Automatik) relevante Einflüsse müssen mit modelliert werden ) siehe später multivariates Regressionsmodell 22