Die Regressionsanalyse

Ähnliche Dokumente
Teil: lineare Regression

Vorlesung: Statistik II für Wirtschaftswissenschaft

Empirische Analysen mit dem SOEP

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Eine Einführung in R: Das Lineare Modell

Multivariate Statistische Methoden

Ökonometrie. Hans Schneeweiß. 3., durchgesehene Auflage. Physica-Verlag Würzburg-Wien 1978 ISBN

Multivariate Statistische Methoden und ihre Anwendung

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

Seminar zur Energiewirtschaft:

Analyse von Querschnittsdaten. Signifikanztests I Basics

Annahmen des linearen Modells

Ziel der linearen Regression

Datenanalyse mit Excel und Gretl

STATISTIK 2 Teil 1 Regressionsanalyse Von: Anne Schmidt. Anordnung von Zahlen in Zeilen und Spalten (Tabelle)

Drittvariablenkontrolle in der linearen Regression: Trivariate Regression

Regressionsanalyse - Einführung in das Thema

Analyse von Querschnittsdaten. Spezifikation der unabhängigen Variablen

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management

Ergänzungsmaterial zur Vorlesung. Statistik 2. Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen

5.6 Empirische Wirtschaftsforschung

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II

Lineare Regression II

1. Lösungen zu Kapitel 7

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Institut für Soziologie Christian Ganser. Methoden 2. Regressionsanalyse III: Diagnostik

Gewöhnliche Autokorrelationsfunktion (ACF) eines stationären Prozesses {X t } t Z zum Lag h

Inhalt. I. Deskriptive Statistik Einführung Die Grundgesamtheit Merkmale und Verteilungen Tabellen und Grafiken...

Statistik II Übung 2: Multivariate lineare Regression

Lineare Regression mit einem Regressor: Einführung

3. Das einfache lineare Regressionsmodell

y t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen.

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression

Grundlagen der Statistik I

Gliederung. Analyses of Elite Swimming Performances and Their Respective Between-Gender Dierences over Time. Jasmin Abedieh. Statistik im Sport 2009

Tests einzelner linearer Hypothesen I

Analyse von Querschnittsdaten. Heteroskedastizität

I. Deskriptive Statistik 1

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

Einführung in die Statistik

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS

Statistik II Übung 1: Einfache lineare Regression

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

Biostatistik Erne Einfuhrung fur Biowissenschaftler

Regression und Korrelation

» S C H R I T T - F Ü R - S C H R I T T - A N L E I T U N G «M U L T I P L E L I N E A R E R E G R E S S I O N M I T S P S S / I B M Daniela Keller

Statistik, Geostatistik

Inhaltsverzeichnis. Teil I Einführung

Lehrinhalte Statistik (Sozialwissenschaften)

1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...

Elementare Regressionsrechnung

Vorlesung: Statistik I für Studierende der Statistik, Mathematik & Informatik. Regression. Einfache lineare Regression

Über die Autoren 9. Widmung von Roberto 9 Danksagung von Roberto 10. Einleitung 21

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Ziel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X.

Bivariate Analyseverfahren

Auswirkungen von Fahrpreisänderungen im öffentlichen Personennahverkehr

Statistik II Übung 1: Einfache lineare Regression

Statistik für das Psychologiestudium

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

4. Das multiple lineare Regressionsmodell

Glossar Statistik 2. Bivariate Verfahren: zwei nummerische Merkmale

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

Überblick über multivariate Verfahren in der Statistik/Datenanalyse

Einführung in die computergestützte Datenanalyse

Statistik für Ökonomen

Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG

Inhaltsverzeichnis. 2 Kurzbeschreibung von SPSS Der SPSS-Dateneditor Statistische Analysen mit SPSS DieDaten...

Lehr- und Übungsbuch der angewandten Statistik. Von Dr. Bärbel Elpelt und. O. Prof. Dr. Joachim Hartung Fachbereich Statistik der Universität Dortmund

Moderne Methodik bei der Analyse von Mietspiegeln

Vorbereitung auf 3. Übungsblatt (Präsenzübungen) - Lösungen

1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt:

Statistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 27

Bivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.154

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2013

Demokurs. Modul Vertiefung der Wirtschaftsmathematik Vertiefung der Statistik

Bivariate Zusammenhänge

Einführung in die Maximum Likelihood Methodik

Institut für Statistik und Mathematische Wirtschaftstheorie Universität Augsburg. PROGNOSE II - Vertiefung Aufgaben und Lösungen Sommersemester 2004

Kapitel 1 Einführung. Angewandte Ökonometrie WS 2012/13. Nikolaus Hautsch Humboldt-Universität zu Berlin

30. März Ruhr-Universität Bochum. Methodenlehre II, SS Prof. Dr. Holger Dette

2.3 Nichtlineare Regressionsfunktion

Multiple Regressionsanalyse - Kurzabriss

Ludwig von Auer. Ökonometrie. Eine Einführung. Dritte, überarbeitete Auflage mit 65 Abbildungen und 55 Tabellen. < J Springer

Korrelation - Regression. Berghold, IMI

SBWL Tourismusanalyse und Freizeitmarketing

Lineare Regression Blockpraktikum zur Statistik mit R 28. März 2012 Sören Gröttrup Institut für Mathematische Statistik Universität Münster SS 2012

Statistische Methoden in der Wirtschaftsund Sozialgeographie

Einführung in die Methoden der Empirischen Wirtschaftsforschung

Transkript:

Die Regressionsanalyse Zielsetzung: Untersuchung und Quantifizierung funktionaler Abhängigkeiten zwischen metrisch skalierten Variablen eine unabhängige Variable Einfachregression mehr als eine unabhängige Variable Mehrfach-/ Multiple Regressionsanalyse

Grundlagen der Einfachregression Ausgangspunkt: ein unterstellter Kausalzusammenhang der Form Y = a + b * X Realität: nicht nur systematische Einflüsse der erklärenden Variablen X, sondern eine Reihe weiterer Einflüsse Beobachtungen liegen selten auf der Regressionsgeraden Residuen Bestimmung der Regressionsparameter: mittels der Methode der Kleinsten Quadrate (KQ, englisch OLS) Gütekriterium der Regression: Bestimmtheitsmaß bzw. R 2

Induktive Verwendung der Regressionsanalyse I additive Überlagerung von systematischer Komponente und zufälliger Fehlervariablen abhängige Variable wird zur Zufallsvariablen Modell des wahren Zusammenhangs in der GG Y i = α + βx + ε i Aussagen über die wahren Parameter α, β erfordern Informationen oder Annahmen zu den Störeinflüssen ε i

Induktive Verwendung der Regressionsanalyse II Gängige Annahmen zu den Störeinflüssen ε i ist eine zufällige Größe E(ε i /x) = 0 Var(ε i /x) = Var(ε i ) = σ 2 (Homoskedastizität) Normalverteilung

Induktive Verwendung der Regressionsanalyse III Aufbauend auf diesen Annahmen wird es möglich Regressionskoeffizienten zu schätzen Test des Regressionsmodell und der Regressionskoeffizienten Prognose des Werts der abhängigen Variable anhand vorgegebener Werte der unabhängigen Variable Berechnung der Regressionsparameter: gängige Verfahren: KQ oder Maximum Likelihood Wichtig: Kontrolle der getroffenen Annahmen über Residuen

Grundlagen der Mehrfachregression Zwei oder mehr unabhängige Variablen Modell: Y i = α + β 1 X 1 + β 2 X 2 + β 3 X 3 +... + β m X m + ε i Voraussetzung: möglichst geringe Abhängigkeiten/Korrelationen unter den unabhängigen Variablen sonst: Problem der Multikollinearität Ansonsten prinzipiell gleiche Schätzmethoden: KQ, ML

Auswahl der einzubeziehenden Variablen 1) Theorie liegt vor: Einschluss aller theoretisch relevanter Variablen 2) Theorie fehlt, Strategie des Fischens mit dem Ziel eines möglichst guten Schätzmodells: a) Einschluss b) Rückwärts c) Vorwärts d) Schrittweise

Mögliche Probleme der Regressionsanalyse insbesondere bei Verletzung der Annahmen des Modells Autokorrelation der Residuen Multikollinearität Heteroskedastizität keine Normalverteilung der Residuen Ausreißer Inhaltlicher Art Identifikationsproblem Ökologischer Fehlschluss

Ablauf einer Regressionsanalyse 1) Theoretische Überlegungen 2) Überprüfung des Zusammenhangs 3) Rechnen der Regression 4) Überprüfung der Voraussetzungen, gegebenenfalls zurück zu 1) 5) Inhaltliche Interpretation

Einbeziehung nicht metrisch skalierter Variablen für kategoriale Variablen möglich und sinnvoll, z.b. bei zeitlichen Strukturbrüchen inhaltlichen Strukturbrüchen innerhalb der Beobachtungen Wie? Einführung von Dummy-Variablen für die x-1 Kategorien, jeweils mit den Ausprägungen 0 oder 1 Wegen Übersichtlichkeit nur sinnvoll bei wenigen Kategorien der kategorialen Variablen

Weitere Ansätze bei anderen Konstellationen und Skalenniveaus Abhängige Variable metrisch kategorial Unabhängige Variablen alle metrisch gemischt alle diskret keine Mehrfachregression Regressionsanalyse mit Dummy-Variablen Logit-, Probit-, log-lineare Ansätze Varianzanalyse multiple Korrelationsanalyse log-linearer Ansatz Quelle: Bahrenberg/Giese/Nipper 1992, S. 14.

Anwendung der Regressionsanalyse Bei Kenntnissen/Vermutungen über kausale Beziehungen Rein deskriptiv zur systematischen Zusammenfassung von Datenmaterial vs. induktive Verwendung Ursachenanalyse (z.b. zur Erklärung raumbezogene Verhaltensweisen) Wirkungsanalyse (z.b. als Grundlage räumlicher Politiken) Hilfsmethode zahlreicher anderer Verfahren, z.b. Grundlage zeitreihenanalytischer Verfahren ( Prognose!) Anwendungsbeispiele: Schätzung regionaler Produktionsfunktionen, regionaler Kosten-, Nachfrage- und Angebotsfunktionen für öffentliche Infrastruktur etc. Sehr breites Anwendungsspektrum, Arbeitspferd der empirischen Arbeit