Institut für Soziologie Christian Ganser. Methoden 2. Regressionsanalyse III: Diagnostik
|
|
- Friederike Reuter
- vor 7 Jahren
- Abrufe
Transkript
1 Institut für Soziologie Methoden 2 Regressionsanalyse III: Diagnostik
2 Wiederholung Regressionsanalyse beruht auf verschiedenen Annahmen Sind Annahmen verletzt, sind bestimmte Eigenschaften der Schätzer nicht mehr gegeben oder Signifikanztests sind nicht mehr gültig Für einige der Annahmen existieren Verfahren, um Verletzungen zu diagnostizieren # 2
3 Eigenschaften von Schätzstatistiken Erwartungstreue bzw. Unverzerrtheit ( unbiased ): tendenziell liefert die Schätzstatistik den richtigen Wert: Der wahre Wert wird also weder systematisch über- noch unterschätzt. Konsistenz: Mit steigendem N trifft der Schätzer den wahren Wert tendenziell besser Effizienz (auch Wirksamkeit): Eine erwartungstreue Schätzstatistik ist dann effizient, wenn sie unter allen konkurrierenden Schätzstatistiken die geringste Varianz aufweist # 3
4 Eigenschaften von Schätzstatistiken Weniger effizienter, aber unverzerrter Schätzer Effizienter, aber verzerrter Schätzer Wahrer Schätzer = 0 # 4
5 Eigenschaften von Schätzstatistiken Sind Modellannahmen erfüllt, ist der OLS-Schätzer BLUE (Best Linear Unbiased Estimator): Best Linear: sie haben unter allen gegebenen linearen Schätzern die geringste Varianz (Effizienz). Unbiased: sie sind unverzerrt, entsprechen im Schnitt dem wahren Parameter in der Grundgesamtheit (Unverzerrtheit). Außerdem sind die Schätzer konsistent, das heißt, dass sie sich mit steigendem Stichprobenumfang dem wahren Populationswert annähern (Konsistenz). # 5
6 Basisannahmen der Regression Grundannahmen bei der klassischen linearen Regression, bei denen hauptsächlich theoretische Reflexion hilft: Werte von x müssen variieren, d.h. var(x) muss eine endliche positive Zahl sein Effekte kann man nur finden, wenn die UV Varianz aufweist Zahl der Beobachtungen ist größer als Zahl der Parameter sparsame Modellierung; nicht zu viele Variablen ins Modell aufnehmen Modell ist korrekt spezifiziert, beispielsweise müssen also die relevanten Regressoren identifiziert worden sein Annahme ist fundamental, aber schwer zu testen; hier spielt die Theorie eine wichtige Rolle Regressor (x) und Fehler sind unkorreliert, d.h. cov(u i,x i ) = 0 für alle i # 6
7 Diagnostik Annahmen bzw. Probleme bei der klassischen linearen Regression, für die im folgenden statistische Diagnoseverfahren vorgestellt werden: Einflussreiche Fälle Multikollinearität Heteroskedastizität Autokorrelation Nicht-Normalverteilung der Fehler # 7
8 Diagnostik Dabei wird jeweils folgende Gliederung verwendet: 1. Bedeutung der Annahmeverletzung 2. Folge der Annahmeverletzung 3. Diagnose der Annahmeverletzung 4. Möglichkeiten der Abhilfe # 8
9 Beispiel Gleiches Beispiel wie letzte Woche: Welche Faktoren beeinflussen den BMI? Ernährung Geschlecht (Mann = 0, Frau = 1) Psychische Gesundheit Einkommen Sport Alter # 9
10 Diagnostik Ausreißer Bedeutung: Einige Fälle beeinflussen das Regressionsergebnis sehr stark Folgen: Beeinflussen einige wenige Fälle das Ergebnis sehr stark, kann es im Extremfall dazu kommen, dass das geschätzte Modell fast nur diese Punkte repräsentiert Möglichkeit der Diagnose: Betrachtung der sog. standardisierten DFBETA-Werte. Sie geben an, wie stark ein Fall einen Koeffizienten beeinflusst. Üblicher Grenzwert: ± 2 n Fälle, deren DFBETA-Werte größer als 2 n oder kleiner als - 2 n sind sollten genauer betrachtet werden. # 10
11 Diagnostik Ausreißer Der Befehl REGRESSION /(...) /SAVE SDBETA. erzeugt für jeden Regressionsparameter eine Variable, in der die jeweiligen DFBETAS des jeweiligen Falls stehen # 11
12 Diagnostik Ausreißer Abhilfe: Zunächst sollte man prüfen, ob es sich um Kodier- oder Messfehler handelt Kann man dies ausschließen, liegt möglicherweise ein Problem bei der Modellspezifikation vor Einfaches Weglassen der problematischen Fälle ist Datenmanipulation! Um zu überprüfen, wie stark die Koeffizienten von einflussreichen Fällen beeinflusst werden, können Regressionen ohne diese Fälle gerechnet werden, und diese mit dem ursprünglichen Modell verglichen werden. # 12
13 Diagnostik Ausreißer # 13
14 Diagnostik Ausreißer 2 2 n 693 0,076 Die Fälle, die DFBETA-Werte größer als 0,076 oder kleiner als - 0,076 haben sollten genauer betrachtet werden. Zunächst betrachten wir die für den Alterskoeffizienten einflussreichen Fälle graphisch: Syntax: temporary. sel if sdb8_1 lt or sdb8_1 gt GRAPH /SCATTERPLOT(BIVAR)=id WITH SDB8_1 BY id (NAME). # 14
15 Diagnostik Ausreißer 15
16 Diagnostik Ausreißer Mit einflussreichen Fällen Ohne einflussreiche Fälle 16
17 Diagnostik Multikollinearität Bedeutung der Annahmeverletzung: Zwei oder mehr Regressoren (unabhängige Variablen) hängen linear zusammen Folgen der Annahmeverletzung: Ist der Zusammenhang perfekt, sind die Schätzer nicht berechenbar Bei geringerer Multikollinearität sind die Schätzer bestimmbar und konsistent, aber die Signifikanztests der einzelnen Koeffizienten sind nicht mehr zuverlässig, weil die Standardfehler erhöht werden. # 17
18 Diagnostik Multikollinearität Möglichkeit der Diagnose: Varianz-Inflations-Faktor (VIF): beruht auf dem R² einer Regression der überprüften Variable auf alle anderen unabhängigen Variablen. Ist der VIF einer Variable größer 10, kann von hoher Kollinearität ausgegangen werden. Tol = 1-R 2 VIF = 1/Tol In SPSS kann der VIF leicht angefordert werden: regression (...) /statisitics coeff R Anova Tol (...). Außerdem deutet ein hoher R²-Wert in Verbindung mit nur wenig signifikanten T-Werten auf Multikollinearität hin # 18
19 Diagnostik Multikollinearität Hier nur geringe VIF-Werte Kein Problem erkennbar Manchmal ist die Kollinearität durch eine gewünschte Modellierung bedingt (z.b. Berücksichtigung des Quadrats einer UV) # 19
20 Diagnostik Multikollinearität Abhilfe: Aus betroffenen Variablen einen additiven Index bilden, da sie oft ohnehin ähnliche Konstrukte messen Geeignete Transformationen der Variablen Neue oder zusätzliche Daten beschaffen. Dies ist insbesondere bei Aggregatdaten mit kleinen Fallzahlen, bei denen Multikollinearität häufiger auftritt, oft relativ einfach möglich. # 20
21 Diagnostik Heteroskedastizität Bedeutung der Annahmeverletzung: Die Störterme u i besitzen nicht die selbe Varianz Folgen der Annahmeverletzung: Schätzer sind nach wie vor konsistent und unverzerrt Schätzer sind aber nicht mehr effizient, also nicht mehr die Schätzer mit der kleinsten Varianz Außerdem ist die Formel zur Berechnung der Standardfehler nicht mehr korrekt, wodurch die T-Werte falsch sind # 21
22 Diagnostik Heteroskedastizität Möglichkeit der Diagnose: Am besten eignen sich grafische Verfahren Bei Einfachregression genügt Scatterplot von unabhängiger und abhängiger Variable, um systematisch unterschiedliche Residuen zu erkennen Multiple Regression: Residuen-Plots. Dabei werden die Residuen zunächst gegen die geschätzten Werte der abhängigen Variable geplottet, dann gegen jede unabhängige Variable. Zeigen sich systematische Zusammenhänge, ist Heteroskedastizität nicht auszuschließen. # 22
23 Diagnostik Heteroskedastizität In SPSS lässt man die Residuen und die geschätzten Werte der abhängigen Variable als neue Variablen speichern und erstellt dann Scatterplots: REGRESSION (...) /SAVE PRED RESID. graph /sca PRE_1 WITH RES_1. Abhilfe: Je nachdem, ob Varianzen der Störterme bekannt oder unbekannt sind, gibt es verschiedene Korrekturverfahren zur Berechnung von Schätzern, die robust gegen Heteroskedastizität sind. # 23
24 Diagnostik Heteroskedastizität Robuste Standardfehler: In SPSS nicht für OLS implementiert, aber für Generalisierte Lineare Modelle (hier nicht im Detail): GENLIN f37 WITH alter mann HS MR ang_führung beamte_geh selbstst freiberuf /MODEL alter mann HS MR ang_führung beamte_geh selbstst freiberuf /CRITERIA COVB=ROBUST. # 24
25 Diagnostik Heteroskedastizität Zum Vergleich: herkömmliche p-werte # 25
26 Diagnostik Autokorrelation Bedeutung der Annahmeverletzung: Fehler sind korreliert Betrifft meist Zeitreihendaten oder Daten mit räumlichen Abhängigkeiten Kann bei Querschnittdaten aber auftreten, falls der Einfluss einer Variablen mit der Ausprägung der Variablen steigt, der Zusammenhang aber linear modelliert wird. Folgen der Annahmeverletzung: Schätzer sind nach wie vor konsistent und unverzerrt Schätzer sind aber nicht mehr effizient, also nicht mehr die Schätzer mit der kleinsten Varianz Außerdem ist die Formel zur Berechnung der Standardfehler nicht mehr korrekt, wodurch die T-Werte falsch sind # 26
27 Diagnostik Autokorrelation Möglichkeit der Diagnose: Spezielle Tests. Häufig wird der sogenannte Durbin-Watson-Test angewendet, der auf Autokorrelation 1. Ordnung testet. Faustregel: Werte um 2 deuten auf Abwesenheit von Autokorrelation hin In SPSS kann dieser direkt angefordert werden: REGRESSION(...) /RESIDUALS DURBIN Eignet sich nur für Zeitreihendaten, diese müssen nach der Zeit sortiert vorliegen Abhilfe: Schwierig, weil Struktur der Autokorrelation bekannt sein müsste. Trifft man hierüber bestimmte Annahmen, existieren spezielle Korrekturverfahren. # 27
28 Diagnostik Nicht-normalverteilte Fehler Bedeutung der Annahmeverletzung: Die Störterme u i sind nicht normalverteilt Folgen der Annahmeverletzung: Die Signifikanztests sind streng genommen nicht mehr gültig. Es kann aber gezeigt werden, dass sie asymptotisch, also bei großem Stichprobenumfang, weiter gelten # 28
29 Diagnostik Nicht-normalverteilte Fehler Möglichkeit der Diagnose: Grafische Verfahren sowie der bekannte Kolmogorov-Smirnov-Test auf Normalverteilung. In SPSS lässt man sich die Residuen als neue Variable speichern und prüft dann mit den bereits bekannten Verfahren ihre Verteilung: REGRESSION (...) /SAVE RESID. NPAR TESTS /K-S(NORMAL)=RES_1. fre res_1 /his normal /for nota. # 29
30 Diagnostik Nicht-normalverteilte Fehler Abhilfe: Transformation der Variablen, z.b. Logarithmieren der AV # 30
31 Überblick Annahmeverletzung Überprüfen durch Einflussreiche Fälle DF-Beta (Grenzwert: ±2/ n ) Multikollinearität VIF-Werte (Grenzwert: 10) Heteroskedastizität Residuen gegen vorhergesagte Werte und unabhängige Variablen plotten Autokorrelation Durbin-Watson-Statistik: Werte um 2 sind unauffällig Nicht-Normalverteilung der Fehler Kolmogorov-Smirnov-Test auf Normalverteilung der Residuen 31
32 Übungsaufgabe Replizieren sie die Übungsaufgabe zu den Determinanten der Bewertung der Wohnumgebung der letzten Woche. Berücksichtigen Sie als zusätzliche unabhängige Variable die Bildung (benutzen Sie die metrische Bildungsvariable aus Übungsaufgabe 4). Sind bei dieser Schätzung die Annahmen einer OLS-Regression erfüllt? Prüfen sie im Einzelnen: 1. Liegt Multikollinearität vor? 2. Wird die Schätzung von einflussreichen Datenpunkten beeinflusst? (Berechnen sie DFBETA-Werte und konzentrieren sie sich auf Ausreißer, die durch das Einkommen zustande kommen.) 3. Liegt Heteroskedastizität vor? 4. Sind die Residuen normalverteilt? Ändern sich die Befunde der Analyse jeweils, wenn die Verletzungen beseitigt werden? # 32
Institut für Soziologie Christian Ganser. Methoden 2. Regressionsanalyse II: Lineare multiple Regression
Institut für Soziologie Christian Ganser Methoden 2 Regressionsanalyse II: Lineare multiple Regression Inhalt 1. Anwendungsbereich 2. Vorgehensweise bei multipler linearer Regression 3. Beispiel 4. Modellannahmen
MehrInstitut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion
Institut für Soziologie Methoden 2 Regressionsanalyse IV: Transformation und Interaktion Inhalt 1. Zusammenfassung letzte Sitzung 2. Weitere Annahmen und Diagnostik 3. Transformationen zur besseren Interpretierbarkeit
MehrVorlesung 3: Schätzverfahren
Vorlesung 3: Schätzverfahren 1. Beispiel: General Social Survey 1978 2. Auswahl einer Zufallsstichprobe und Illustration des Stichprobenfehlers 3. Stichprobenverteilung eines Regressionskoeffizienten 4.
MehrTeil: lineare Regression
Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge
MehrVorlesung: Lineare Modelle. Verschiedene Typen von Residuen. Probleme bei der Regression und Diagnose. Prof. Dr. Helmut Küchenhoff.
Vorlesung: Lineare Modelle Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München SoSe 205 5 Metrische Einflußgrößen: Polynomiale Regression, Trigonometrische Polynome, Regressionssplines, Transformationen.
MehrPraxis der Regressionsanalyse
Praxis der Regressionsanalyse Von Samprit Chatterjee New York University und Bertram Price Price Associates, Inc., Washington, D. C. Aus dem Amerikanischen übertragen von Prof. Dr. Gunter Lorenzen Universität
MehrHypothesentests mit SPSS
Beispiel für eine einfache Regressionsanalyse (mit Überprüfung der Voraussetzungen) Daten: bedrohfb_v07.sav Hypothese: Die Skalenwerte auf der ATB-Skala (Skala zur Erfassung der Angst vor terroristischen
MehrSchätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II
Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Wiederholung Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte
MehrStatistik II Übung 4: Skalierung und asymptotische Eigenschaften
Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden
MehrDiagnostik von Regressionsmodellen (1)
Diagnostik von Regressionsmodellen (1) Bei Regressionsanalysen sollte immer geprüft werden, ob das Modell angemessen ist und ob die Voraussetzungen eines Regressionsmodells erfüllt sind. Das Modell einer
MehrSchätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief
Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte : Schätzung Statistik
MehrEGRESSIONSANALYSE AVID BUCHATZ NIVERSITÄT ZU KÖLN
1 EGRESSIONSANALYSE AVID BUCHATZ NIVERSITÄT ZU KÖLN UFBAU 1 Historie 2 Anwendungen / Ziele 3 Lineare Regression/ Beispiel KQ 4 Nichtlineare Regression 5 Eigenschaften der Schätzer istorie früheste Form
MehrDie Regressionsanalyse
Die Regressionsanalyse Zielsetzung: Untersuchung und Quantifizierung funktionaler Abhängigkeiten zwischen metrisch skalierten Variablen eine unabhängige Variable Einfachregression mehr als eine unabhängige
MehrAnalyse von Querschnittsdaten. Spezifikation der unabhängigen Variablen
Analyse von Querschnittsdaten Spezifikation der unabhängigen Variablen Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Annahmen gegeben? kategoriale Variablen Datum 3.0.004 0.0.004
MehrProf. Dr. Marc Gürtler WS 2014/2015. Prof. Dr. Marc Gürtler. Klausur zur 10/12 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft
Prof. Dr. Marc Gürtler WS 04/05 Prof. Dr. Marc Gürtler Klausur zur 0/ SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft Lösungsskizze Prof. Dr. Marc Gürtler WS 04/05 Aufgabe : (37 Punkte) ) Die
MehrÜbung V Lineares Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung
MehrKapitel 10. Multikollinearität. Exakte Multikollinearität Beinahe Multikollinearität
Kapitel 0 Multikollinearität Exakte Multikollinearität Beinahe Multikollinearität Exakte Multikollinearität Unser Modell lautet y = Xb + u, Dimension von X: n x k Annahme : rg(x) = k Wenn sich eine oder
MehrAnnahmen des linearen Modells
Annahmen des linearen Modells Annahmen des linearen Modells zusammengefasst A1: Linearer Zusammenhang: y = 0 + 1x 1 + 2x 2 + + kx k A2: Zufallsstichprobe, keine Korrelation zwischen Beobachtungen A3: Erwartungswert
MehrKapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell
Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften
MehrStatistik II. Regressionsrechnung+ Regressionsanalyse. Statistik II
Statistik II Regressionsrechnung+ Regressionsanalyse Statistik II - 16.06.2006 1 Regressionsrechnung Nichtlineare Ansätze In einigen Situation könnte man einen nichtlinearen Zusammenhang vermuten. Bekannte
MehrEinfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)
3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =
MehrEinfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)
3 Einfache lineare Regression Einfache lineare Modelle mit R 3.6 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula
MehrDynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38
Dynamische Systeme und Zeitreihenanalyse Multivariate Normalverteilung und ML Schätzung Kapitel 11 Statistik und Mathematik WU Wien Michael Hauser Dynamische Systeme und Zeitreihenanalyse // Multivariate
Mehr1. Lösungen zu Kapitel 7
1. Lösungen zu Kapitel 7 Übungsaufgabe 7.1 Um zu testen ob die Störterme ε i eine konstante Varianz haben, sprich die Homogenitätsannahme erfüllt ist, sind der Breusch-Pagan-Test und der White- Test zwei
MehrJohn Komlos Bernd Süssmuth. Empirische Ökonomie. Eine Einführung in Methoden und Anwendungen. 4y Springer
John Komlos Bernd Süssmuth Empirische Ökonomie Eine Einführung in Methoden und Anwendungen 4y Springer 1 Einführung 1 1.1 Ökonometrie 1 2 Vorüberlegungen und Grundbegriffe 7 2.1 Statistik als Grundlage
Mehr1 Einführung Ökonometrie... 1
Inhalt 1 Einführung... 1 1.1 Ökonometrie... 1 2 Vorüberlegungen und Grundbegriffe... 7 2.1 Statistik als Grundlage der Empirischen Ökonomie... 7 2.2 Abgrenzung und Parallelen zu den Naturwissenschaften...
MehrErgänzungsmaterial zur Vorlesung. Statistik 2. Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen
Institut für Stochastik WS 2007/2008 Universität Karlsruhe JProf. Dr. H. Holzmann Dipl.-Math. oec. D. Engel Ergänzungsmaterial zur Vorlesung Statistik 2 Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen
MehrComputerübung 10. Empirische Wirtschaftsforschung. Willi Mutschler. 27. Januar Ökonometrie und Wirtschaftsstatistik Uni Münster
Computerübung 10 Empirische Wirtschaftsforschung Willi Mutschler Ökonometrie und Wirtschaftsstatistik Uni Münster 27. Januar 2011 Willi Mutschler (Uni Münster) Computerübung 10 27. Januar 2011 1 / 12 Inhaltsverzeichnis
MehrKapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen.
Kapitel 3 Schließende lineare Regression 3.1. Einführung induktiv Fragestellungen Modell Statistisch bewerten, der vorher beschriebenen Zusammenhänge auf der Basis vorliegender Daten, ob die ermittelte
Mehr2 Anwendungen und Probleme
Prof. Dr. Werner Smolny Sommersemester 2005 Abteilung Wirtschaftspolitik Helmholtzstr. 20, Raum E 05 Tel. 0731 50 24261 UNIVERSITÄT DOCENDO CURANDO ULM SCIENDO Fakultät für Mathematik und Wirtschaftswissenschaften
MehrAnalyse von Querschnittsdaten. Heteroskedastizität
Analyse von Querschnittsdaten Heteroskedastizität Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Annahmen gegeben? kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004 03.11.2004
Mehr4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers
4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis
MehrZur Erinnerung: Annahmen
Zur Erinnerung: Annahmen Vorlesung 6: Heteroskedastizität. Beispiele mit heteroskedastischen Fehlertermen. Auswirkungen von Heteroskedastizität auf OLS-Schätzungen. Wie erkennt man das Vorliegen von Heteroskedastizität?
MehrVorlesung 4: Spezifikation der unabhängigen Variablen
Vorlesung 4: Spezifikation der unabhängigen Variablen. Fehlspezifikation der unabhängigen Variablen. Auswirkungen einer Fehlspezifikation a. auf die Erwartungstreue der Schätzung b. auf die Effizienz der
Mehr2. Stochastische ökonometrische Modelle. - Modelle der ökonomischen Theorie an der Wirklichkeit überprüfen
.1. Stochastische ökonometrische Modelle.1 Einführung Ziele: - Modelle der ökonomischen Theorie an der Wirklichkeit überprüfen - Numerische Konkretisierung ökonomischer Modelle und deren Analse. . Variierende
MehrStatistik II Übung 1: Einfache lineare Regression
Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der
MehrStatistik II Übung 1: Einfache lineare Regression
Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der
MehrDynamische Modelle: Schätzen und Modellwahl
1 / 23 Dynamische Modelle: Schätzen und Modellwahl Kapitel 18 Angewandte Ökonometrie / Ökonometrie III Michael Hauser 2 / 23 Inhalt Dynamische Modelle und autokorrelierte Fehler Tests auf Autokorrelation
MehrStatistik II. Regressionsanalyse. Statistik II
Statistik II Regressionsanalyse Statistik II - 23.06.2006 1 Einfachregression Annahmen an die Störterme : 1. sind unabhängige Realisationen der Zufallsvariable, d.h. i.i.d. (unabh.-identisch verteilt)
MehrÜbung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010
MehrAnalyse von Querschnittsdaten. Statistische Inferenz
Analyse von Querschnittsdaten Statistische Inferenz Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004 03.11.2004
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur
MehrInterne und externe Modellvalidität
Interne und externe Modellvalidität Interne Modellvalidität ist gegeben, o wenn statistische Inferenz bzgl. der untersuchten Grundgesamtheit zulässig ist o KQ-Schätzer der Modellparameter u. Varianzschätzer
MehrEinführung in die Statistik für Politikwissenschaftler Sommersemester 2011
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen
MehrProxies, Endogenität, Instrumentvariablenschätzung
1 4.2 Multivariate lineare Regression: Fehler in den Variablen, Proxies, Endogenität, Instrumentvariablenschätzung Literatur: Wooldridge, Kapitel 15, Appendix C.3 und Kapitel 9.4 Wahrscheinlichkeitslimes
Mehr2. Generieren Sie deskriptive Statistiken (Mittelwert, Standardabweichung) für earny3 und kidsunder6yr3 und kommentieren Sie diese kurz.
Statistik II Übung : Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (6-24 Jahre alt) und der Anzahl der unter
MehrZiel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X.
Lineare Regression Einfache Regression Beispieldatensatz: trinkgeld.sav Ziel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X. H0: Y lässt sich nicht durch X erklären, das heißt
Mehr10 Statistisches Schätzen
10 Statistisches Schätzen 620 10 Statistisches Schätzen 10.1 Punktschätzung 623 10.1.1 Schätzer und ihre Gütekriterien 623 10.1.2 Erwartungstreue 627 10.1.3 Erwartete quadratische Abweichung (MSE) 634
MehrDatenanalyse mit Excel und Gretl
Dozent: Christoph Hindermann christoph.hindermann@uni-erfurt.de Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 1 Teil 2: Gretl Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 2 Modellannahmen
MehrSchätzung im multiplen linearen Modell VI
Schätzung im multiplen linearen Modell VI Wie im einfachen linearen Regressionsmodell definiert man zu den KQ/OLS-geschätzten Parametern β = ( β 0, β 1,..., β K ) mit ŷ i := β 0 + β 1 x 1i +... β K x Ki,
MehrKapitel 12. Autokorrelation in den Residuen
Kapitel Autokorrelation in den Residuen Der Sachverhalt Modell y = Xb + u, Ordnung von X: n x k Annahme A6: Var{u} = s I Annahme 6 impliziert serielle Unkorreliertheit der Störgrößen: Var{u t, u t+i }
MehrLineare Regression und Varianzanalyse
Lineare Regression und Varianzanalyse Von Prof. Dr. Fritz Pokropp Universität der Bundeswehr Hamburg R. Oldenbourg Verlag München Wien Inhaltsverzeichnis 1 Einleitung 1 1.1 Grundstruktur linearer Modelle
MehrWahrscheinlichkeitsrechnung und schließende Statistik
Karl Mosler Friedrich Schmid Wahrscheinlichkeitsrechnung und schließende Statistik Vierte, verbesserte Auflage Springer Inhaltsverzeichnis 0 Einführung 1 1 Zufalls Vorgänge und Wahrscheinlichkeiten 5 1.1
MehrEmpirische Wirtschaftsforschung in R
Empirische Wirtschaftsforschung in R Schätzung der keynesianischen Geldnachfragefunktion auf Basis von Daten der dänischen Volkswirtschaft Jonas Richter-Dumke Universität Rostock, Institut für Volkswirtschaftslehre
Mehr» S C H R I T T - F Ü R - S C H R I T T - A N L E I T U N G «M U L T I P L E L I N E A R E R E G R E S S I O N M I T S P S S / I B M Daniela Keller
» SCHRITT-FÜR-SCHRITTANLEITUNG«MULTIPLE LINEARE REGRESSION MIT SPSS/IBM Daniela Keller Daniela Keller - MULTIPLE LINEARE REGRESSION MIT SPSS/IBM Impressum 2016 Statistik und Beratung Dipl.-Math. Daniela
MehrBeispiel: Multiples Modell/Omitted Variable Bias I
4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss
Mehrx t2 y t = 160, y = 8, y y = 3400 t=1
Aufgabe 1 (25 Punkte) 1. Eine Online Druckerei möchte die Abhängigkeit des Absatzes gedruckter Fotos vom Preis untersuchen. Dazu verwendet die Firma das folgende lineare Regressionsmodell: wobei y t =
MehrLineare Regression (Ein bisschen) Theorie
Kap. 6: Lineare Regression (Ein bisschen) Theorie Lineare Regression in Matrixform Verteilung des KQ-Schätzers Standardfehler für OLS Der Satz von Gauss-Markov Das allgemeine lineare Regressionsmodell
MehrI.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03
I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03 Vorlesung: 12.11.2002 He uses statistics as a drunken man use lampposts - for support rather than for illumination. Andrew Lang Dr. Wolfgang Langer
Mehr1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...
Inhaltsverzeichnis 1 Grundlagen der Wahrscheinlichkeitsrechnung 1 1.1 Wahrscheinlichkeitsräume Ein erster mathematischer Blick auf Zufallsexperimente.......... 1 1.1.1 Wahrscheinlichkeit, Ergebnisraum,
MehrMehr-Ebenen-Analyse I. Regressionsmodelle für Politikwissenschaftler
Mehr-Ebenen-Analyse I Regressionsmodelle für Politikwissenschaftler Was sind strukturierte Daten? Was ist Struktur? Probleme Bisher sind wir stets von einfachen Zufallsstichproben ausgegangen (Registerstichprobe)
MehrProf. Dr. Marc Gürtler WS 2015/2016. Prof. Dr. Marc Gürtler. Klausur zur 10/12 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft
Prof. Dr. Marc Gürtler WS 015/016 Prof. Dr. Marc Gürtler Klausur zur 10/1 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft Lösungsskizze Prof. Dr. Marc Gürtler WS 015/016 Aufgabe 1: (11+5+1+8=56
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Inferenzstatistik in Regressionsmodellen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS
Sommersemester 2009, Statistik mit SPSS 28. August 2009 28. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 Überblick 1. Korrelation vs. Regression 2. Ziel der Regressionsanalyse 3. Syntax für den
MehrRegressionsanalyse - Einführung in das Thema
Regressionsanalyse - Einführung in das Thema Referent: Dr. Ralf Gutfleisch - AG Methodik Veranstaltung: Frühjahrstagung 2013 in Wolfsburg Datum: 18. März 2013 Strukturen-prüfende Verfahren Regressionsanalyse
MehrSchweizer Statistiktage, Aarau, 18. Nov. 2004
Schweizer Statistiktage, Aarau, 18. Nov. 2004 Qualitative Überprüfung der Modellannahmen in der linearen Regressionsrechnung am Beispiel der Untersuchung der Alterssterblichkeit bei Hitzeperioden in der
MehrDie Funktion f wird als Regressionsfunktion bezeichnet.
Regressionsanalyse Mit Hilfe der Techniken der klassischen Regressionsanalyse kann die Abhängigkeit metrischer (intervallskalierter) Zielgrößen von metrischen (intervallskalierten) Einflussgrößen untersucht
Mehry t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen.
Aufgabe 1 (25 Punkte Zur Schätzung des Werbe-Effekts in einem Getränke-Unternehmen wird das folgende lineare Modell aufgestellt: Dabei ist y t = β 1 + x t2 β 2 + e t. y t : x t2 : Umsatz aus Getränkeverkauf
MehrMethoden der Ökonometrie
Dr. Matthias Opnger Lehrstuhl für Finanzwissenschaft WS 2013/14 Dr. Matthias Opnger Methoden d. Ökonometrie WS 2013/14 1 / 21 Dr. Matthias Opnger Büro: C 504 Sprechzeit: nach Vereinbarung E-Mail: opnger@uni-trier.de
MehrX =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode?
Aufgabe 1 (25 Punkte) Zur Schätzung der Produktionsfunktion des Unternehmens WV wird ein lineares Regressionsmodell der Form angenommen. Dabei ist y t = β 1 + x t2 β 2 + e t, t = 1,..., T (1) y t : x t2
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
MehrDr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp
Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:
MehrLehrstuhl für Statistik und emp. Wirtschaftsforschung, Prof. R. T. Riphahn, Ph.D. Bachelorprüfung, Praxis der empirischen Wirtschaftsforschung
Lehrstuhl für Statistik und emp. Wirtschaftsforschung, Prof. R. T. Riphahn, Ph.D. Bachelorprüfung, Praxis der empirischen Wirtschaftsforschung Aufgabe 1: [14,5 Punkte] Sie interessieren sich für die Determinanten
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrAnalyse von Querschnittsdaten. Signifikanztests I Basics
Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test
MehrBonus-Lektion: Prüfung der Voraussetzungen und Transformationen
Seite 1 von 8 Bonus-Lektion: Prüfung der Voraussetzungen und Transformationen Ziel dieser Lektion: Du weißt, wie Du die einzelnen Voraussetzungen für die Signifikanztests und komplexeren Modelle prüfen
MehrQuantitative Methoden der Agrarmarktanalyse und des Agribusiness
Quantitative Methoden der Agrarmarktanalyse und des Agribusiness Fragen zur Vorlesung Teil 2 SS 2001 Mai 19 Dr. Jens-Peter Loy, Institut für Agrarökonomie (Kommentare bitte per e-mail an jploy@agric-econ.uni-kiel.de)
MehrVorlesung: Multivariate Statistik für Psychologen
Vorlesung: Multivariate Statistik für Psychologen 7. Vorlesung: 05.05.2003 Agenda 2. Multiple Regression i. Grundlagen ii. iii. iv. Statistisches Modell Verallgemeinerung des Stichprobenmodells auf Populationsebene
MehrHeteroskedastie. Test auf Heteroskedastie. Heteroskedastie bedeutet, dass die Varianz der Residuen in der Stichprobe nicht konstant ist.
Heteroskedastie Heteroskedastie bedeutet, dass die Varianz der Residuen in der Stichprobe nicht konstant ist. Beispiele: Bei Zeitreihendaten : Ansteigen der Varianz über die Zeit, Anstieg der Varianz mit
MehrBeispiel: Multiples Modell/Omitted Variable Bias I
4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss
MehrLösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 9A a.
LÖSUNG 9A a. Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Das Regressionsmodell soll nur für Büropersonal angewendet werden Management- und Bewachungspersonal (MIND =0) soll nicht einbezogen
MehrHypothesentests mit SPSS
Beispiel für einen chi²-test Daten: afrikamie.sav Im Rahmen der Evaluation des Afrikamie-Festivals wurden persönliche Interviews durchgeführt. Hypothese: Es gibt einen Zusammenhang zwischen dem Geschlecht
Mehr2. Fehlerhafte Auswahl der exogenen Variablen (Verletzung der A1-Annahme)
2. Fehlerhafte Auswahl der exogenen Variablen (Verletzung der A1-Annahme) Annahme A1: Im multiplen Regressionsmodell fehlen keine relevanten exogenen Variablen und die benutzten exogenen Variablen x 1,
Mehr1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...
Inhaltsverzeichnis 0 Einführung 1 1 Zufallsvorgänge und Wahrscheinlichkeiten 5 1.1 Zufallsvorgänge.......................... 5 1.1.1 Ergebnismengen..................... 6 1.1.2 Ereignisse und ihre Verknüpfung............
MehrEinführung in die Induktive Statistik: Regressionsanalyse
Einführung in die Induktive Statistik: Regressionsanalyse Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Regressionsanalyse Ziel: Analyse
MehrBiometrieübung 10 Lineare Regression. 2. Abhängigkeit der Körpergröße von der Schuhgröße bei Männern
Biometrieübung 10 (lineare Regression) - Aufgabe Biometrieübung 10 Lineare Regression Aufgabe 1. Düngungsversuch In einem Düngeversuch mit k=9 Düngungsstufen x i erhielt man Erträge y i. Im (X, Y)- Koordinatensystem
MehrANOVA und Transformationen. Statistik II
und Statistik II Wiederholung Literatur Statistik II und (1/28) Literatur Zum Nachlesen Agresti ch. 12 (nur bis Seite 381) Agresti ch. 13 (nur bis Seite 428) Statistik II und (2/28) Literatur für nächste
MehrHypothesentests mit SPSS. Beispiel für einen t-test
Beispiel für einen t-test Daten: museum-f-v04.sav Hypothese: Als Gründe, in ein Museum zu gehen, geben mehr Frauen als Männer die Erweiterung der Bildung für Kinder an. Dies hängt mit der Geschlechtsrolle
MehrMehrdimensionale Zufallsvariablen
Mehrdimensionale Zufallsvariablen Im Folgenden Beschränkung auf den diskreten Fall und zweidimensionale Zufallsvariablen. Vorstellung: Auswerten eines mehrdimensionalen Merkmals ( ) X Ỹ also z.b. ω Ω,
MehrAnalyse von Querschnittsdaten. Signifikanztests I Basics
Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Datum Vorlesung 18.10.2006 Einführung 18.10.2006 Beispiele 25.10.2006 Daten 08.11.2006 Variablen Kontinuierliche
Mehr