Die Regressionsanalyse Zielsetzung: Untersuchung und Quantifizierung funktionaler Abhängigkeiten zwischen metrisch skalierten Variablen eine unabhängige Variable Einfachregression mehr als eine unabhängige Variable Mehrfach-/ Multiple Regressionsanalyse
Grundlagen der Einfachregression Ausgangspunkt: ein unterstellter Kausalzusammenhang der Form Y = a + b * X Realität: nicht nur systematische Einflüsse der erklärenden Variablen X, sondern eine Reihe weiterer Einflüsse Beobachtungen liegen selten auf der Regressionsgeraden Residuen Bestimmung der Regressionsparameter: mittels der Methode der Kleinsten Quadrate (KQ, englisch OLS) Gütekriterium der Regression: Bestimmtheitsmaß bzw. R 2
Induktive Verwendung der Regressionsanalyse I additive Überlagerung von systematischer Komponente und zufälliger Fehlervariablen abhängige Variable wird zur Zufallsvariablen Modell des wahren Zusammenhangs in der GG Y i = α + βx + ε i Aussagen über die wahren Parameter α, β erfordern Informationen oder Annahmen zu den Störeinflüssen ε i
Induktive Verwendung der Regressionsanalyse II Gängige Annahmen zu den Störeinflüssen ε i ist eine zufällige Größe E(ε i /x) = 0 Var(ε i /x) = Var(ε i ) = σ 2 (Homoskedastizität) Normalverteilung
Induktive Verwendung der Regressionsanalyse III Aufbauend auf diesen Annahmen wird es möglich Regressionskoeffizienten zu schätzen Test des Regressionsmodell und der Regressionskoeffizienten Prognose des Werts der abhängigen Variable anhand vorgegebener Werte der unabhängigen Variable Berechnung der Regressionsparameter: gängige Verfahren: KQ oder Maximum Likelihood Wichtig: Kontrolle der getroffenen Annahmen über Residuen
Grundlagen der Mehrfachregression Zwei oder mehr unabhängige Variablen Modell: Y i = α + β 1 X 1 + β 2 X 2 + β 3 X 3 +... + β m X m + ε i Voraussetzung: möglichst geringe Abhängigkeiten/Korrelationen unter den unabhängigen Variablen sonst: Problem der Multikollinearität Ansonsten prinzipiell gleiche Schätzmethoden: KQ, ML
Auswahl der einzubeziehenden Variablen 1) Theorie liegt vor: Einschluss aller theoretisch relevanter Variablen 2) Theorie fehlt, Strategie des Fischens mit dem Ziel eines möglichst guten Schätzmodells: a) Einschluss b) Rückwärts c) Vorwärts d) Schrittweise
Mögliche Probleme der Regressionsanalyse insbesondere bei Verletzung der Annahmen des Modells Autokorrelation der Residuen Multikollinearität Heteroskedastizität keine Normalverteilung der Residuen Ausreißer Inhaltlicher Art Identifikationsproblem Ökologischer Fehlschluss
Ablauf einer Regressionsanalyse 1) Theoretische Überlegungen 2) Überprüfung des Zusammenhangs 3) Rechnen der Regression 4) Überprüfung der Voraussetzungen, gegebenenfalls zurück zu 1) 5) Inhaltliche Interpretation
Einbeziehung nicht metrisch skalierter Variablen für kategoriale Variablen möglich und sinnvoll, z.b. bei zeitlichen Strukturbrüchen inhaltlichen Strukturbrüchen innerhalb der Beobachtungen Wie? Einführung von Dummy-Variablen für die x-1 Kategorien, jeweils mit den Ausprägungen 0 oder 1 Wegen Übersichtlichkeit nur sinnvoll bei wenigen Kategorien der kategorialen Variablen
Weitere Ansätze bei anderen Konstellationen und Skalenniveaus Abhängige Variable metrisch kategorial Unabhängige Variablen alle metrisch gemischt alle diskret keine Mehrfachregression Regressionsanalyse mit Dummy-Variablen Logit-, Probit-, log-lineare Ansätze Varianzanalyse multiple Korrelationsanalyse log-linearer Ansatz Quelle: Bahrenberg/Giese/Nipper 1992, S. 14.
Anwendung der Regressionsanalyse Bei Kenntnissen/Vermutungen über kausale Beziehungen Rein deskriptiv zur systematischen Zusammenfassung von Datenmaterial vs. induktive Verwendung Ursachenanalyse (z.b. zur Erklärung raumbezogene Verhaltensweisen) Wirkungsanalyse (z.b. als Grundlage räumlicher Politiken) Hilfsmethode zahlreicher anderer Verfahren, z.b. Grundlage zeitreihenanalytischer Verfahren ( Prognose!) Anwendungsbeispiele: Schätzung regionaler Produktionsfunktionen, regionaler Kosten-, Nachfrage- und Angebotsfunktionen für öffentliche Infrastruktur etc. Sehr breites Anwendungsspektrum, Arbeitspferd der empirischen Arbeit