Elementare Regressionsrechnung

Ähnliche Dokumente
Kapitel 1 Beschreibende Statistik

Kapitel 13: Statistische Signifikanztests

Korrelation und Regression

Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt 6 Gerhard Tutz, Jan Ulbricht WS 05/06.

Regressionsrechnung: Die Methode der kleinsten Quadrate

Korrelation - Regression. Berghold, IMI

Mathematik III - Statistik für MT(Master)

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell

Teil: lineare Regression

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Empirische Analysen mit dem SOEP

2. Spezielle anwendungsrelevante Funktionen

Eine zweidimensionale Stichprobe

Seminar zur Energiewirtschaft:

1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt:

Bivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.154

Datenanalyse mit Excel. Wintersemester 2013/14

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Statistik Einführung // Lineare Regression 9 p.2/72

Lösung Aufgabe 1 (Regression) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Multivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.167

5.4.2 Kovarianz und Korrelation

Lineare Modelle in R: Klassische lineare Regression

Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 27. f X Y (a i b j ) = f i j = f ij f j

6.1 Grundbegriffe und historischer Hintergrund

Die Empirische Regression

3. Das einfache lineare Regressionsmodell

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 27

12. Bivariate Datenanalyse. In den Kapiteln 4-11 wurden univariate Daten betrachtet:

Breusch-Pagan-Test I auf Heteroskedastie in den Störgrößen

Wahrscheinlichkeitsrechnung und Statistik

TEIL 13: DIE EINFACHE LINEARE REGRESSION

Seminar Einführung in die Kunst mathematischer Ungleichungen

Funktionale Formen. Kapitel 7. Ökonometrie I Michael Hauser

Statistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage

Mehrebenenanalyse. Seminar: Multivariate Analysemethoden Referentinnen: Barbara Wulfken, Iris Koch & Laura Früh

WM.3.1 Die Polynomfunktion 1. Grades

Mathematische und statistische Methoden I

4. Das multiple lineare Regressionsmodell

F u n k t i o n e n Quadratische Funktionen

1. Grundbegriffe und graphische Darstellungen

In der Praxis werden wir häufig mit relativ komplexen Funktionen konfrontiert. y

Statistik I. Übungklausur. Prof. Dr. H. Toutenburg

Tutorial: Regression Output von R

Moderne Methodik bei der Analyse von Mietspiegeln

Lineare Korrelation. Statistik für SozialwissenschaftlerInnen II p.143

Institut für Statistik und Mathematische Wirtschaftstheorie Universität Augsburg. PROGNOSE II - Vertiefung Aufgaben und Lösungen Sommersemester 2004

9.3 Lineare Regression

Tests einzelner linearer Hypothesen I

Charakterisierung der Daten: Sind es genug? Sind alle notwendig? Was ist naturgegeben, was von Menschen beeinflusst (beeinflussbar)?

Statistische Auswertung von Meß- und Versuchsdaten mit Taschenrechner und Tischcomputer

Korrelation (II) Korrelation und Kausalität

Musterlösung zur Aufgabensammlung Statistik I Teil 3

BIOL, HST HS 2014 Dr. M. Kalisch. MC-Quiz 1. Einsendeschluss: Dienstag, der :59 Uhr

Mathematik für Wirtschaftswissenschaftler Kapitel 4-6. Universität Trier Wintersemester 2013 / 2014

Statistik II Übung 1: Einfache lineare Regression

Kointegration. Kapitel 19. Angewandte Ökonometrie / Ökonometrie III Michael Hauser

3.3 Klassifikation quadratischer Formen auf R n

Mietinteressent A B C D E F G H Vorbehaltspreis a) Im Wettbewerbsgleichgewicht beträgt der Preis 250.

Formelsammlung für das Modul. Statistik 2. Bachelor. Sven Garbade

Aufgabe 1 (Exponentielles Wachstum, wird teilweise auch in Vorlesung besprochen, Teile a) bis c) sind exakt die Aufgaben von Blatt 2, Aufgabe 3))

Überschrift. Titel Prognosemethoden

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

Skalenniveaus =,!=, >, <, +, -

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Zusammenhänge zwischen metrischen Merkmalen

Differenzengleichungen

Multivariate Regression

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Übungsklausur Lineare Modelle. Prof. Dr. H. Toutenburg

Länge eines Vektors und Abstand von zwei Punkten 2. 4 = 6. Skalarprodukt und Winkel zwischen Vektoren

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

9. Kapitel: Grafische Darstellung quantitativer Informationen

Lineare Regression mit einem Regressor: Einführung

Kapitel 3 Schließende Statistik

Statistik für Ökonomen Wintersemester 2010/2011. Dr. Hendrik Hansen

11. Zeitreihen mit Trend und Saisonalität

Motivation. Jede Messung ist mit einem sogenannten Fehler behaftet, d.h. einer Messungenauigkeit

TEIL 13: DIE LINEARE REGRESSION

K8 Stetige Zufallsvariablen Theorie und Praxis

2. Korrelation, lineare Regression und multiple Regression

Prognose. Kapitel 5. Ökonometrie I Michael Hauser

IK Ökonomische Entscheidungen und Märkte LVA

3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität

Glossar Statistik 2. Bivariate Verfahren: zwei nummerische Merkmale

Die Cobb-Douglas-Produktionsfunktion

Jahreskurs Makroökonomik, Teil 2

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

6Korrelationsanalyse:Zusammenhangsanalysestetiger Merkmale

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression

Inhaltsverzeichnis. Regressionsanalyse. - Stand vom:

Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik. 7. Februar 2008

Institut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion

5. Zeitreihenanalyse und Prognoseverfahren

Transkript:

Elementare Regressionsrechnung

Motivation: Streudiagramm zweier metrisch skalierter Merkmale X und Y Y X Dr. Karsten Webel 107

Ziel: Erfassung des Zusammenhangs zwischen X und Y durch eine Gerade der Form y i = a + bx i (i = 1,...,n) Vorteile einer linearen Modellierung: einfacher und leicht berechenbarer Zusammenhang ausführlich erforschte Theorie kompliziertere Zusammenhänge oft linearisierbar (später) bzw. lokal gut durch lineare Funktion approximierbar Dr. Karsten Webel 108

Fragen: Wie bzw. nach welchen Kriterien soll die Gerade durch das Streudiagramm der Beobachtungen gelegt werden? Mit anderen Worten: Wie sollen a und b gewählt werden? Wie gut beschreibt die so ermittelte Gerade den Zusammenhang zwischen X und Y? Dr. Karsten Webel 109

Zusammenhang via Augenmaß Y X Dr. Karsten Webel 110

Zusammenhang via Extrempunkte Y X Dr. Karsten Webel 111

Zusammenhang via absolute Abweichungen Y X Dr. Karsten Webel 112

Zusammenhang via quadrierte Abweichungen Y X Dr. Karsten Webel 113

Definition 1.64: einfaches lineares Regressionsmodell & KQ-Gerade Das Modell y i = a + bx i + u i, i = 1,...,n, heißt einfaches lineares Regressionsmodell. Die Gerade ŷ i = â + ˆbx i, i = 1,...,n, durch die Punktewolke {(x i,y i )} n i=1, die die Summe der quadrierten (vertikalen) Abstände der Beobachtungen von der Geraden minimiert, heißt KQ-Gerade. Dr. Karsten Webel 114

Satz 1.65: Die Koeffizienten der KQ-Geraden sind gegeben durch: ˆb = s xy s 2 x = n (x i x a )(y i ȳ a ) i=1 â = ȳ a ˆb x a. n und (x i x a ) 2 i=1 Dr. Karsten Webel 115

Beispiel 1.66: KQ-Gerade für die Konsumausgaben in Abhängigkeit vom verfügbaren Einkommen (Fortsetzung Bsp. 1.54) Konsumausgaben 1800 1700 1600 1700 1800 1900 2000 2100 verfügbares Einkommen Dr. Karsten Webel 116

Beispiel 1.66: KQ-Gerade für die Konsumausgaben in Abhängigkeit vom verfügbaren Einkommen (Fortsetzung ) Die Koeffizienten der KQ-Geraden lauten: ˆb = s xy s 2 x = 6876,562 13298, 440 = 0,517 und â = 1716,75 0,517 1856,75 = 754,069. Die KQ-Gerade lautet damit: ŷ i = 754,069 + 0,517 x i. Dr. Karsten Webel 117

sinnlose Regression mit Zufallszahlen 1 Zufallszahlen Y 0.5 0 0.5 1 0 0.5 1 1.5 2 Zufallszahlen X Dr. Karsten Webel 118

Definition 1.67: Bestimmtheitsmaß Die Größe R 2 = s2 ŷ s 2 y = = 1 s2 û s 2 y n (ŷ i ȳ a ) 2 i=1 n (y i ȳ a ) 2 i=1 = 1 n û 2 i i=1 n (y i ȳ a ) 2 i=1 heißt Bestimmtheitsmaß. Dr. Karsten Webel 119

Beispiel 1.68: Bestimmtheitsmaß der Regression der Konsumausgaben auf das verfügbare Einkommen (Fortsetzung Bsp. 1.66) x i y i ŷ i = 754,069 + 0,517x i (ŷ i ȳ a ) 2 1710 1610 1638,139 5717,023 1750 1660 1658,819 3017,415 1770 1680 1669,159 1988,357.... 2070 1810 1824,259 12212,239 28436,210 Dr. Karsten Webel 120

Beispiel 1.68: Bestimmtheitsmaß der Regression der Konsumausgaben auf das verfügbare Einkommen (Fortsetzung) bekannt: außerdem: s 2 y = 3748,438 s 2 ŷ = 1 8 28436,210 = 3554,526 also: R 2 = 3554,526 3748,438 = 0,948 Dr. Karsten Webel 121

Satz 1.69: Eigenschaften von R 2 Für das Bestimmtheitsmaß gilt: a) 0 R 2 1. b) Je näher R 2 bei 1 liegt, desto besser erklärt die KQ-Gerade den linearen Zusammenhang zwischen X und Y. c) Je näher R 2 bei 0 liegt, desto kleiner ist der Erklärungsgehalt von X auf die Variabilität von Y (R 2 = 0 kein Erklärungsgehalt). Dr. Karsten Webel 122

Bemerkung 1.70: Anwendungen des linearen Regressionsmodells auf nichtlineare Zusammenhänge a) X = Alter des PKWs, Y = Wert des PKWs Y = a + b 1 X Y = a + bx mit X = 1 X b) Cobb-Douglas-Produktionsfunktion: Y = Output, X 1 = Arbeit, X 2 = Kapital Y = α X b 1 X c 2 Y = a + bx 1 + cx 2 mit Y = log Y, a = log α, X 1 = log X 1, X 2 = log X 2 Dr. Karsten Webel 123

Bemerkung 1.71: Fazit zur elementaren Regressionsrechnung modelliert linearen Zusammenhang zwischen zwei metrisch skalierten Merkmalen Ursache und Wirkung dabei bekannt modellierter Zusammenhang auf gegebenen Datenbereich beschränkt Dr. Karsten Webel 124