Institut für Soziologie Christian Ganser. Methoden 2. Regressionsanalyse II: Lineare multiple Regression
|
|
- Sophia Fromm
- vor 6 Jahren
- Abrufe
Transkript
1 Institut für Soziologie Christian Ganser Methoden 2 Regressionsanalyse II: Lineare multiple Regression
2 Inhalt 1. Anwendungsbereich 2. Vorgehensweise bei multipler linearer Regression 3. Beispiel 4. Modellannahmen 5. Zusammenfassung 6. Übungsaufgabe Christian Ganser # 2
3 Anwendungsbereich I Letzte Vorlesung: Einfache lineare Regression zur Untersuchung des linearen Zusammenhangs einer unabhängigen Variable (UV) und einer abhängigen Variable (AV) Häufig interessiert man sich für mehrere unabhängige Variablen, die gemeinsam eine abhängige Variable beeinflussen Insbesondere in den Sozialwissenschaften ist die Annahme der Monokausalität nur schwer zu rechtfertigen. Die Berücksichtigung einer Vielzahl von Einflussfaktoren ist in den bisher bekannten Verfahren nicht oder nur eingeschränkt möglich (vgl. Drittvariablenkontrolle) Christian Ganser # 3
4 Anwendungsbereich II Die multiple lineare Regression stellt eine Erweiterung der einfachen linearen Regression dar, die es erlaubt, mehrere UVs simultan in die Analyse einzubeziehen Die multiple lineare Regression eignet sich bei metrischer abhängiger Variable, UVs müssen metrisch sein oder als Dummys kodiert sein Die Grundidee ist die gleiche wie bei der Einfachregression, nur werden mehr Dimensionen betrachtet Liegen zwei unabhängige Variablen vor, kann man sich die Regression vorstellen als das Hindurchlegen einer Fläche durch eine dreidimensionale Punktewolke Christian Ganser # 4
5 Anwendungsbereich III Quelle: Fox, John (2008): Applied Regression Analysis and Generalized Linear Models. Thousand Oaks: Sage. S. 87. Christian Ganser # 5
6 Vorgehensweise Grundidee Annahme: Abhängige Variable (y) und unabhängige Variablen (x 1, x 2,, x k ) sind linear additiv miteinander verknüpft: y x x x k k Wie bei der einfachen Regression wird zusätzlich ein Fehlerterm eingeführt, da sich y nicht perfekt aus den unabhängigen Variablen vorhersagen lässt: y x x x u k k Das zu lösende Problem zur Schätzung der Y-Werte lautet nach wie vor: min n i 1 u 2 i Christian Ganser # 6
7 Vorgehensweise Interpretation Interpretation erfolgt weitgehend analog zur linearen Einfachregression: 1. F-Test: Prüft die Nullhypothese, dass keine UV Einfluss auf die AV ausübt 2. R² gibt durch UVs erklärte Varianz der AV an. 3. Aber: R² steigt bei Einbezug zusätzlicher UVs immer an. Korrigiertes R² berücksichtigt dies und ist daher insbesondere für Modellvergleiche heranzuziehen 2 RSS / ( N J 1) adj. R 1 TSS / ( N 1) Christian Ganser # 7
8 Vorgehensweise Interpretation 4. Koeffizienten geben eine Veränderung der AV bei Veränderung der UV um eine Einheit bei Konstanthaltung (Drittvariablenkontrolle!) der anderen UVs an. 5. Vergleich der Stärke des Einflusses verschiedener UVs ist anhand der Koeffizienten nicht möglich, da diese von den Einheiten abhängig sind Normierung mittels der Standardabweichung der AV und der UV standardisierte Koeffizienten ( standardisiertes Beta ) geben an, um wie viele Standardabweichungen sich die AV ändert, wenn sich die UV um eine Standardabweichung ändert wenig anschaulich, ermöglicht aber Vergleich der Einflussstärke Christian Ganser # 8
9 Beispiel: BMI Gleiches Beispiel wie letzte Woche: Welche Faktoren beeinflussen den BMI? Aber: Berücksichtigung mehrerer UVs, die vermutlich einen Einfluss auf den BMI haben: Ernährung Geschlecht (Mann = 0, Frau = 1) Psychische Gesundheit Einkommen Sport Alter Christian Ganser # 9
10 Beispiel: BMI Bilden der Variablen (1) Ernährung siehe letzte Woche Geschlecht Rekodierung zu 0/1-kodierter Dummy-Variable Psychische Gesundheit siehe letzte Woche; Rekodierung zu Dummys Einkommen Imputation der kategorialen Angaben und Berechnung des Pro-Kopf-Einkommens comp eink_imputiert=v53. if v54=2 eink_imputiert=375. if v54=4 eink_imputiert=875. if v54=8 eink_imputiert=2125. (...) if v54=15 eink_imputiert=4750. if v54=19 eink_imputiert=0. comp eink_kopf=eink_imputiert/v58. Christian Ganser # 10
11 Beispiel: BMI Bilden der Variablen (2) Sport Rekodierung zu Dummys recode v18 ( =0)(3 4=1) into v18_rec1. recode v18 ( =0)(5 6 7=1) into v18_rec2. var lab v18_rec1 "Sport: 2- bis 4mal pro Monat". var lab v18_rec2 "Sport: mehrmals pro Woche". val lab v18_rec1 v18_rec2 0 "Keine Nennung" 1 "Nennung". cro v18_rec1 by v18. cro v18_rec2 by v18. Alter wie gewohnt Christian Ganser # 11
12 Beispiel: BMI Durchführen der Regressionsanalyse regression /stat coeff CI anova R /des mean /dep BMI /method=enter index_ernae frau v14_rec1 v14_rec2 eink_kopf v18_rec1 v18_rec2 alter. Christian Ganser # 12
13 Beispiel: BMI Mittelwerte (bei Dummy als Anteil der 1er zu interpretieren) und Fallzahlen der Variablen in der Regression Christian Ganser # 13
14 Beispiel: BMI Information über ggf. ausgeschlossene Variablen. Beispiel: Würde man bei einer nominalen Variable mit drei Kategorien drei Dummys erstellen und alle drei Dummys in das Modell aufnehmen wird ein Dummy als Referenz entfernt. Christian Ganser # 14
15 Beispiel: BMI R 2 = 0,112 11,2% der Varianz der abhängigen Variable BMI werden durch die unabhängigen Variablen erklärt. Korrigiertes R² mit 0,101 etwas geringer Hier insgesamt mäßige Varianzaufklärung Christian Ganser # 15
16 Beispiel: BMI F-Test höchst signifikant: Modell trägt zur Erklärung der abhängigen Variable bei mindestens eine der Einflussgrößen hat einen statistisch bedeutsamen Einfluss auf die abhängige Variable Christian Ganser # 16
17 Beispiel: BMI Ernährung, Geschlecht und mittlere Sporthäufigkeit: kein signifikanter Einfluss Übrige Variablen zeigen dagegen signifikanten Effekt Christian Ganser # 17
18 Beispiel: BMI Personen mit mittlerer (guter/sehr guter) Gesundheit haben um 1,676 (2,484) Punkte niedrigeren BMI also solche mit schlechter Gesundheit Mit jedem Euro Einkommen nimmt BMI um 0,001 ab Mehrfach pro Woche Sport treiben senkt BMI um 2,289 Christian Ganser # 18
19 Beispiel: BMI Die Regressionsfunktion lautet: BMI = 25, ,503*index_ernae + (-0,617)*frau + (-1,676)*Mittelmäß. Gesundheit + (-2,484)*Gute/sehr gute Gesundheit + (-0,001)*Einkommen + (-1,022)*Mittlere Sporthäufigkeit + (-2,289)*Hohe Sporthäufigkeit + 0,088*Alter Alle Variablen sind enthalten! Christian Ganser # 19
20 Beispiel: BMI Welchen BMI erwartet man für eine 40jährige Frau mit 1000 Euro Pro- Kopf-Einkommen, einem Ernährungsindex von 3 und mittlerer psychischer Gesundheit und Sporthäufigkeit? 25, ,503*3 0,617 1,676 0,001*1000 1, ,088*40=26,265 Was sagt in diesem Fall die Konstante aus? Ist dieser Wert sinnvoll interpretierbar? Christian Ganser # 20
21 Beispiel: BMI Von welcher Variable geht in diesem Modell der stärkste Effekt aus? Betrachtung der absoluten Werte relevant: stärkster Effekt Gute psychische Gesundheit Christian Ganser # 21
22 Basisannahmen der Regression I 1. Linearität in den Parametern muss gegeben sein (aber nicht unbedingt in den Variablen, z.b. Y = β 0 + β 1 ln(x 1 )) 2. Der bedingte Mittelwert der Residuen ist bei gegebenen Werten von x Null, d.h. E(u i x i ) = 0 für alle i 3. Die Varianz der Residuen ist für alle Werte von x gleich (Homoskedastizität), d.h. var(u i x i ) = σ 2 für alle i; andernfalls spricht man von Heteroskedastizität Christian Ganser # 22
23 Basisannahmen der Regression II 4. Für jedes gegebene Paar von Werten x i und x j ist die Korrelation zwischen den zugehörigen Fehlern stets Null (keine Autokorrelation), d.h. cov(u i,u j x i,x j ) = 0 für alle i j (Gründe: mehrere Messungen für eine Person oder mehrere Personen aus einer Gruppe/Region, z.b. aus einem Haushalt) 5. Regressor (x) und Fehler sind unkorreliert, d.h. cov(u i,x i ) = 0 für alle i Christian Ganser # 23
24 Basisannahmen der Regression III Beispiel: Linearität in den Parametern Y = β 0 + β 1 X 1 Y = β 0 + β 1 X 1 + β 2 (X 1 ) 2 Christian Ganser # 24
25 Basisannahmen der Regression IV Beispiel: Heteroskedastizität Varianz der Fehler wird mit steigendem Einkommen kleiner. Problem: Schätzer nicht mehr effizient. Die Standardfehler der Schätzer werden falsch berechnet (fälschliche Unterstellung gleicher Varianzen). Standardfehler werden für die Signifikanztests benötigt. Christian Ganser # 25
26 Basisannahmen der Regression V 6. Zahl der Beobachtungen ist größer als Zahl der Parameter sparsame Modellierung; nicht zu viele Variablen ins Modell aufnehmen 7. Werte von x müssen variieren, d.h. var(x) muss eine endliche positive Zahl sein Effekte kann man nur finden, wenn die UV Varianz aufweist 8. Das Modell ist korrekt spezifiziert, beispielsweise müssen also die relevanten Regressoren identifiziert worden sein diese Annahme ist fundamental, aber schwer zu testen; hier spielt die Theorie eine wichtige Rolle Christian Ganser # 26
27 Basisannahmen der Regression VI 9. Bei Modellen mit mehr als einer unabhängigen Variable gibt es keine perfekte Multikollinearität, d.h. keine perfekte Beziehung zwischen unabhängigen Variablen Zwei oder mehr Regressoren (unabhängige Variablen) hängen zu stark linear miteinander zusammen. Folge: Ist der Zusammenhang perfekt, sind die Schätzer nicht berechenbar. Bei geringerer Multikollinearität sind die Schätzer bestimmbar und konsistent, aber die Signifikanztests der einzelnen Koeffizienten sind nicht mehr zuverlässig, weil die Standardfehler erhöht werden. Christian Ganser # 27
28 Basisannahmen der Regression VII Sind diese 9 Modellannahmen erfüllt, sind die OLS-Schätzer BLUE (Best Linear Unbiased Estimator): Best Linear: sie haben unter allen gegebenen linearen Schätzern die geringste Varianz (Effizienz). Unbiased: sie sind unverzerrt, entsprechen im Schnitt dem wahren Parameter in der Grundgesamtheit und außerdem sind die Schätzer konsistent, das heißt, dass sie sich mit steigendem Stichprobenumfang dem wahren Populationswert annähern. Christian Ganser # 28
29 Basisannahmen der Regression VIII Für Signifikanztests der Parameter (nicht aber für die Schätzung an sich) ist zusätzlich die Annahme nötig 10. Die Fehlerterme u sind normalverteilt. Bei Verletzung: Die Signifikanztests sind streng genommen nicht mehr gültig. Aber: Es kann gezeigt werden, dass die Annahme asymptotisch, d.h. bei großem Stichprobenumfang, weiter gilt. Zudem sollte die Möglichkeit von Ausreißern und einflussreichen Fällen beachtet werden. Einzelne oder wenige Fälle können ein Regressionsergebnis maßgeblich verändern und somit irreführende Resultate herbeiführen. Christian Ganser # 29
30 Basisannahmen der Regression IX Ausblick Für einen Teil der Annahmen existieren bestimmte Testverfahren. Generell liefern auch graphische Verfahren oft wichtige Einsichten. Auf jeden Fall sollte man durch grafische Darstellung prüfen, ob ein annähernd linearer, auf jeden Fall aber monotoner Zusammenhang vorliegt. Die Variablen sollten ferner möglichst symmetrisch und eingipfelig verteilt sein. Insgesamt ist die OLS-Regression aber relativ robust gegen Verletzungen ihrer Annahmen. Genaueres folgt in der kommenden Woche Christian Ganser # 30
31 Zusammenfassung wichtiger Aspekte Was sollte ich mir mindestens merken? Zweck: Prüfung des Einflusses mehrerer metrischer oder dichotomer unabhängiger Variablen auf metrische abhängige Variable ( Drittvariablenkontrolle). Grundlegende Vorgehensweise: Erweiterung einer Geradengleichung (vgl. Einfachregression) um weitere unabhängige Variablen, minimieren der Summe der quadrierten Residuen. Christian Ganser # 31
32 Zusammenfassung wichtiger Aspekte Was sollte ich mir mindestens merken? Interpretation: R²: Anteil erklärter Varianz, korrigiertes R² berücksichtigt Aufnahme zusätzlicher UVs F-Test: Prüft H 0, dass alle UVs keinen Einfluss haben vs. H 1 mind. 1 UV hat Einfluss Koeffizienten: Bei Veränderung der UV um eine Einheit ändert sich AV um β j Einheiten. Standardisierte Koeffizienten zum Vergleich der Stärke des Einflusses: Bei Veränderung der UV um eine Standardabweichung ändert sich AV um Beta Standardabweichungen. Aus Koeffizient und Standardfehler kann T-Wert berechnet werden, der über Signifikanz einzelner UVs Auskunft gibt. Christian Ganser # 32
33 Zusammenfassung wichtiger Aspekte Was sollte ich mir mindestens merken? Regressionen basieren auf einigen Annahmen. Probleme bei der Schätzung verursachen v.a.: Nicht-Linearität Heteroskedastitzität Autokorrelation Multikollinearität nicht normalverteilte Fehler Ausreißer Christian Ganser # 33
34 Übungsaufgabe Übungsaufgabe 1 Greifen Sie auf die Modelle aus den Übungsaufgaben von letzter Sitzung zurück. Beziehen Sie die unabhängigen Variablen aus den beiden Aufgaben gemeinsam in ein Regressionsmodell ein und interpretieren Sie die Ergebnisse. Welche Variable hat den stärksten Einfluss? Prüfen Sie grafisch, ob es sinnvoll erscheint, einen nicht-linearen Einfluss des Einkommens zu modellieren. Modifizieren Sie das Modell ggf. entsprechend. Christian Ganser # 34
Institut für Soziologie Christian Ganser. Methoden 2. Regressionsanalyse III: Diagnostik
Institut für Soziologie Methoden 2 Regressionsanalyse III: Diagnostik Wiederholung Regressionsanalyse beruht auf verschiedenen Annahmen Sind Annahmen verletzt, sind bestimmte Eigenschaften der Schätzer
MehrTeil: lineare Regression
Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge
MehrInstitut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion
Institut für Soziologie Methoden 2 Regressionsanalyse IV: Transformation und Interaktion Inhalt 1. Zusammenfassung letzte Sitzung 2. Weitere Annahmen und Diagnostik 3. Transformationen zur besseren Interpretierbarkeit
MehrStatistik II Übung 4: Skalierung und asymptotische Eigenschaften
Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden
MehrDie Regressionsanalyse
Die Regressionsanalyse Zielsetzung: Untersuchung und Quantifizierung funktionaler Abhängigkeiten zwischen metrisch skalierten Variablen eine unabhängige Variable Einfachregression mehr als eine unabhängige
MehrZiel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X.
Lineare Regression Einfache Regression Beispieldatensatz: trinkgeld.sav Ziel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X. H0: Y lässt sich nicht durch X erklären, das heißt
MehrKapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell
Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur
MehrInstitut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression II
Institut für Soziologie Dipl.-Soz. Methoden 2 Logistische Regression II Bringen Sie zur nächsten Übung und in die Klausur einen (nicht programmierbaren) Taschenrechner mit! # 2 Programm Wiederholung der
MehrEmpirische Analysen mit dem SOEP
Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael
Mehr1. Lösungen zu Kapitel 7
1. Lösungen zu Kapitel 7 Übungsaufgabe 7.1 Um zu testen ob die Störterme ε i eine konstante Varianz haben, sprich die Homogenitätsannahme erfüllt ist, sind der Breusch-Pagan-Test und der White- Test zwei
MehrÜbung V Lineares Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung
MehrStatistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20
Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 20 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)
MehrEinfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)
3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation
MehrStatistik II Übung 1: Einfache lineare Regression
Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der
MehrStatistik II Übung 1: Einfache lineare Regression
Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der
MehrSchätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO
Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung
MehrSchätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II
Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Wiederholung Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
MehrSchätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief
Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte : Schätzung Statistik
MehrAnalyse von Querschnittsdaten. Spezifikation der unabhängigen Variablen
Analyse von Querschnittsdaten Spezifikation der unabhängigen Variablen Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Annahmen gegeben? kategoriale Variablen Datum 3.0.004 0.0.004
MehrDie Funktion f wird als Regressionsfunktion bezeichnet.
Regressionsanalyse Mit Hilfe der Techniken der klassischen Regressionsanalyse kann die Abhängigkeit metrischer (intervallskalierter) Zielgrößen von metrischen (intervallskalierten) Einflussgrößen untersucht
MehrAnnahmen des linearen Modells
Annahmen des linearen Modells Annahmen des linearen Modells zusammengefasst A1: Linearer Zusammenhang: y = 0 + 1x 1 + 2x 2 + + kx k A2: Zufallsstichprobe, keine Korrelation zwischen Beobachtungen A3: Erwartungswert
MehrStatistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS
Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS Verena Hofmann Dr. phil. des. Departement für Sonderpädagogik Universität Freiburg Petrus-Kanisius-Gasse 21
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
Mehr2. Generieren Sie deskriptive Statistiken (Mittelwert, Standardabweichung) für earny3 und kidsunder6yr3 und kommentieren Sie diese kurz.
Statistik II Übung : Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (6-24 Jahre alt) und der Anzahl der unter
MehrDas (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell
1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs
MehrAnalyse von Querschnittsdaten. Signifikanztests I Basics
Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004
MehrSeminar zur Energiewirtschaft:
Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable
MehrEinführung in die Statistik für Politikwissenschaftler Sommersemester 2011
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen
MehrKapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen.
Kapitel 3 Schließende lineare Regression 3.1. Einführung induktiv Fragestellungen Modell Statistisch bewerten, der vorher beschriebenen Zusammenhänge auf der Basis vorliegender Daten, ob die ermittelte
MehrPrognoseintervalle für y 0 gegeben x 0
10 Lineare Regression Punkt- und Intervallprognosen 10.5 Prognoseintervalle für y 0 gegeben x 0 Intervallprognosen für y 0 zur Vertrauenswahrscheinlichkeit 1 α erhält man also analog zu den Intervallprognosen
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS
Sommersemester 2009, Statistik mit SPSS 28. August 2009 28. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 Überblick 1. Korrelation vs. Regression 2. Ziel der Regressionsanalyse 3. Syntax für den
MehrInferenz im multiplen Regressionsmodell
1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
MehrAnalyse von Querschnittsdaten. Heteroskedastizität
Analyse von Querschnittsdaten Heteroskedastizität Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Annahmen gegeben? kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004 03.11.2004
MehrInstitut für Soziologie Christian Ganser. Methoden 2. Regressionsanalyse I: Lineare Regression
Institut für Soziologie Methoden 2 Regressionsanalyse I: Lineare Regression Inhalt 1. Grundidee und Vorgehen 2. Güte eines Regressionsmodells 3. Regressionskoeffizienten Signifikanz und Interpretation
Mehr1 Einführung Ökonometrie... 1
Inhalt 1 Einführung... 1 1.1 Ökonometrie... 1 2 Vorüberlegungen und Grundbegriffe... 7 2.1 Statistik als Grundlage der Empirischen Ökonomie... 7 2.2 Abgrenzung und Parallelen zu den Naturwissenschaften...
MehrEmpirische Wirtschaftsforschung
Empirische Wirtschaftsforschung Prof. Dr. Bernd Süßmuth Universität Leipzig Institut für Empirische Wirtschaftsforschung Volkswirtschaftslehre, insbesondere Ökonometrie 6.. Herleitung des OLS-Schätzers
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS
Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelation vs. Regression 2. Ziele der Regressionsanalyse 3. Syntax für
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test
MehrWiederholungsübungen zu den Kapiteln 7 bis 11
Mittelwert-Tests Übung Wiederholungsübungen zu den Kapiteln 7 bis 11 In dieser Übung wird der Datensatz 4 verwendet. In dem (fiktiven) Datensatz sind für 50 Personen vier Variablen erfasst: das Geschlecht,
MehrRegression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate
Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für
MehrJohn Komlos Bernd Süssmuth. Empirische Ökonomie. Eine Einführung in Methoden und Anwendungen. 4y Springer
John Komlos Bernd Süssmuth Empirische Ökonomie Eine Einführung in Methoden und Anwendungen 4y Springer 1 Einführung 1 1.1 Ökonometrie 1 2 Vorüberlegungen und Grundbegriffe 7 2.1 Statistik als Grundlage
MehrMultivariate Verfahren
Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie
MehrTests einzelner linearer Hypothesen I
4 Multiple lineare Regression Tests einzelner linearer Hypothesen 4.5 Tests einzelner linearer Hypothesen I Neben Tests für einzelne Regressionsparameter sind auch Tests (und Konfidenzintervalle) für Linearkombinationen
MehrBivariate Analyseverfahren
Bivariate Analyseverfahren Bivariate Verfahren beschäftigen sich mit dem Zusammenhang zwischen zwei Variablen Beispiel: Konservatismus/Alter Zusammenhangsmaße beschreiben die Stärke eines Zusammenhangs
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrÜbung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010
Mehr4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers
4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis
MehrDiagnostik von Regressionsmodellen (1)
Diagnostik von Regressionsmodellen (1) Bei Regressionsanalysen sollte immer geprüft werden, ob das Modell angemessen ist und ob die Voraussetzungen eines Regressionsmodells erfüllt sind. Das Modell einer
Mehr2. Stochastische ökonometrische Modelle. - Modelle der ökonomischen Theorie an der Wirklichkeit überprüfen
.1. Stochastische ökonometrische Modelle.1 Einführung Ziele: - Modelle der ökonomischen Theorie an der Wirklichkeit überprüfen - Numerische Konkretisierung ökonomischer Modelle und deren Analse. . Variierende
MehrDatenanalyse mit Excel und Gretl
Dozent: Christoph Hindermann christoph.hindermann@uni-erfurt.de Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 1 Teil 2: Gretl Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 2 Modellannahmen
Mehr1 Beispiel zur Methode der kleinsten Quadrate
1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25
MehrLineare Regression mit einem Regressor: Einführung
Lineare Regression mit einem Regressor: Einführung Quantifizierung des linearen Zusammenhangs von zwei Variablen Beispiel Zusammenhang Klassengröße und Testergebnis o Wie verändern sich Testergebnisse,
MehrHypothesentests mit SPSS
Beispiel für eine einfache Regressionsanalyse (mit Überprüfung der Voraussetzungen) Daten: bedrohfb_v07.sav Hypothese: Die Skalenwerte auf der ATB-Skala (Skala zur Erfassung der Angst vor terroristischen
MehrVorlesung 3: Schätzverfahren
Vorlesung 3: Schätzverfahren 1. Beispiel: General Social Survey 1978 2. Auswahl einer Zufallsstichprobe und Illustration des Stichprobenfehlers 3. Stichprobenverteilung eines Regressionskoeffizienten 4.
MehrKurs Empirische Wirtschaftsforschung
Kurs Empirische Wirtschaftsforschung 5. Bivariates Regressionsmodell 1 Martin Halla Institut für Volkswirtschaftslehre Johannes Kepler Universität Linz 1 Lehrbuch: Bauer/Fertig/Schmidt (2009), Empirische
MehrVorlesung: Lineare Modelle. Verschiedene Typen von Residuen. Probleme bei der Regression und Diagnose. Prof. Dr. Helmut Küchenhoff.
Vorlesung: Lineare Modelle Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München SoSe 205 5 Metrische Einflußgrößen: Polynomiale Regression, Trigonometrische Polynome, Regressionssplines, Transformationen.
MehrTrim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19
Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist
MehrVorlesung 4: Spezifikation der unabhängigen Variablen
Vorlesung 4: Spezifikation der unabhängigen Variablen. Fehlspezifikation der unabhängigen Variablen. Auswirkungen einer Fehlspezifikation a. auf die Erwartungstreue der Schätzung b. auf die Effizienz der
MehrBreusch-Pagan-Test I auf Heteroskedastie in den Störgrößen
Breusch-Pagan-Test I Ein weiterer Test ist der Breusch-Pagan-Test. Im Gegensatz zum Goldfeld-Quandt-Test ist es nicht erforderlich, eine (einzelne) Quelle der Heteroskedastizität anzugeben bzw. zu vermuten.
MehrDrittvariablenkontrolle in der linearen Regression: Trivariate Regression
Drittvariablenkontrolle in der linearen Regression: Trivariate Regression 14. Januar 2002 In der Tabellenanalyse wird bei der Drittvariablenkontrolle für jede Ausprägung der Kontrollvariablen eine Partialtabelle
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau
MehrDr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp
Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:
MehrBonus-Lektion: Prüfung der Voraussetzungen und Transformationen
Seite 1 von 8 Bonus-Lektion: Prüfung der Voraussetzungen und Transformationen Ziel dieser Lektion: Du weißt, wie Du die einzelnen Voraussetzungen für die Signifikanztests und komplexeren Modelle prüfen
MehrStatistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 27
Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 27 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)
MehrTest von Hypothesen: Signifikanz des Zusammenhangs (F-Test)
Test von Hyothesen: Signifikanz des Zusammenhangs (F-Test) Die Schätzung der Regressionsfunktion basiert auf Daten einer Stichrobe Inwiefern können die Ergebnisse dieser Schätzung auf die Grundgesamtheit
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
MehrInhaltsverzeichnis. Über die Autoren Einleitung... 21
Inhaltsverzeichnis Über die Autoren.... 7 Einleitung... 21 Über dieses Buch... 21 Was Sie nicht lesen müssen... 22 Törichte Annahmen über den Leser... 22 Wie dieses Buch aufgebaut ist... 23 Symbole, die
MehrMultiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)
Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang
MehrLineare Regression II
Lineare Regression II Varianzanalyse als multiple Regession auf Designvariablen Das lineare Regressionsmodell setzt implizit voraus, dass nicht nur die abhängige, sondern auch die erklärenden Variablen
MehrDynamische Modelle: Schätzen und Modellwahl
1 / 23 Dynamische Modelle: Schätzen und Modellwahl Kapitel 18 Angewandte Ökonometrie / Ökonometrie III Michael Hauser 2 / 23 Inhalt Dynamische Modelle und autokorrelierte Fehler Tests auf Autokorrelation
MehrOLS-Schätzung: asymptotische Eigenschaften
OLS-Schätzung: asymptotische Eigenschaften Stichwörter: Konvergenz in Wahrscheinlichkeit Konvergenz in Verteilung Konsistenz asymptotische Verteilungen nicht-normalverteilte Störgrößen zufällige Regressoren
MehrStatistik II. Regressionsanalyse. Statistik II
Statistik II Regressionsanalyse Statistik II - 23.06.2006 1 Einfachregression Annahmen an die Störterme : 1. sind unabhängige Realisationen der Zufallsvariable, d.h. i.i.d. (unabh.-identisch verteilt)
MehrDr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.
Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...
MehrInhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden
Inhaltsverzeichnis Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3 Warum Statistik? 3 Checkpoints 4 Daten 4 Checkpoints 7 Skalen - lebenslang wichtig bei der Datenanalyse
MehrAnalyse von Querschnittsdaten. Signifikanztests II Advanced Stuff
Analyse von Querschnittsdaten Signifikanztests II Advanced Stuff Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum..4..4 7..4..4..4 7..4 4..4..4
MehrDie Anwendung des globalen und partiellen F-Tests beim Regressionsmodell
Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS 2002/2003-1 Die Anwendung des globalen und partiellen F-Tests beim Regressionsmodell von XENOPHOB auf V247 und POSTMAT, MATERIAL Für unsere
Mehry t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen.
Aufgabe 1 (25 Punkte Zur Schätzung des Werbe-Effekts in einem Getränke-Unternehmen wird das folgende lineare Modell aufgestellt: Dabei ist y t = β 1 + x t2 β 2 + e t. y t : x t2 : Umsatz aus Getränkeverkauf
MehrInterne und externe Modellvalidität
Interne und externe Modellvalidität Interne Modellvalidität ist gegeben, o wenn statistische Inferenz bzgl. der untersuchten Grundgesamtheit zulässig ist o KQ-Schätzer der Modellparameter u. Varianzschätzer
MehrEs können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.
Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird
MehrFranz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum
Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst mit dem R Commander A Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist
MehrEmpirical Banking and Finance
Empirical Banking and Finance Vorlesung zur Volkswirtschaftspolitik Prof. Dr. Isabel Schnabel Lehrstuhl für Volkswirtschaftslehre, insb. Financial Economics Johannes Gutenberg-Universität Mainz Wintersemester
Mehr2.3 Nichtlineare Regressionsfunktion
Nichtlineare Regressionsfunktion Bisher: lineares Regressionsmodell o Steigung d. Regressionsgerade ist konstant o Effekt einer Änderung von X auf Y hängt nicht vom Niveau von X oder von anderen Regressoren
MehrStatistik. R. Frühwirth. Statistik. VO Februar R. Frühwirth Statistik 1/536
fru@hephy.oeaw.ac.at VO 142.090 http://tinyurl.com/tu142090 Februar 2010 1/536 Übersicht über die Vorlesung Teil 1: Deskriptive Teil 2: Wahrscheinlichkeitsrechnung Teil 3: Zufallsvariable Teil 4: Parameterschätzung
MehrSimultane Mehrgleichungssysteme: Parameterschätzung
Simultane Mehrgleichungssysteme: Parameterschätzung Stichwörter: Eigenschaften des OLS-Schätzers Hilfsvariablenschätzer 2SLS limited information Methoden 3SLS FIML full information Methoden o1-21.tex/0
MehrMehr-Ebenen-Analyse I. Regressionsmodelle für Politikwissenschaftler
Mehr-Ebenen-Analyse I Regressionsmodelle für Politikwissenschaftler Was sind strukturierte Daten? Was ist Struktur? Probleme Bisher sind wir stets von einfachen Zufallsstichproben ausgegangen (Registerstichprobe)
MehrLineare Regression 1 Seminar für Statistik
Lineare Regression 1 Seminar für Statistik Markus Kalisch 17.09.2014 1 Statistik 2: Ziele Konzepte von einer breiten Auswahl von Methoden verstehen Umsetzung mit R: Daten einlesen, Daten analysieren, Grafiken
MehrName Vorname Matrikelnummer Unterschrift
Dr. Hans-Otfried Müller Institut für Mathematische Stochastik Fachrichtung Mathematik Technische Universität Dresden Klausur Statistik II (Sozialwissenschaft, Nach- und Wiederholer) am 26.10.2007 Gruppe
MehrMultivariate Verfahren
Selbstkontrollarbeit 1 Multivariate Verfahren Diese Selbstkontrollarbeit bezieht sich auf die Kapitel 1 bis 4 der Kurseinheit 1 (Multivariate Statistik) des Kurses Multivariate Verfahren (883). Hinweise:
MehrLineare Regression (Ein bisschen) Theorie
Kap. 6: Lineare Regression (Ein bisschen) Theorie Lineare Regression in Matrixform Verteilung des KQ-Schätzers Standardfehler für OLS Der Satz von Gauss-Markov Das allgemeine lineare Regressionsmodell
MehrEinführung in die Statistik für Politikwissenschaftler Sommersemester 2013
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2013 1. Welche Aussage zur Statistik (in den Sozialwissenschaften) sind richtig? (2 Punkte) ( ) Statistik ist die Lehre von Methoden
MehrGliederung. 1. Einführung. Heute schon Musik gehört?
Regressionsanalyse Technische Universität Chemnitz Seminar: Forschungsmethodik und Evalua
MehrEmpirische Wirtschaftsforschung in R
Empirische Wirtschaftsforschung in R Schätzung der keynesianischen Geldnachfragefunktion auf Basis von Daten der dänischen Volkswirtschaft Jonas Richter-Dumke Universität Rostock, Institut für Volkswirtschaftslehre
MehrLineare Regression I
Statistische Zusammenhangsanalyse Lineare Regression I Um zu untersuchen, ob eine erklärende Variable X Einfluss auf eine abhängige Variable Y hat, wird die gemeinsame Verteilung der beiden Variablen untersucht.
MehrLehrstuhl für Statistik und emp. Wirtschaftsforschung, Prof. R. T. Riphahn, Ph.D. Bachelorprüfung, Praxis der empirischen Wirtschaftsforschung
Lehrstuhl für Statistik und emp. Wirtschaftsforschung, Prof. R. T. Riphahn, Ph.D. Bachelorprüfung, Praxis der empirischen Wirtschaftsforschung Aufgabe 1: [14,5 Punkte] Sie interessieren sich für die Determinanten
Mehr