Multiple Regression. Statistik II
|
|
- Gregor Kästner
- vor 7 Jahren
- Abrufe
Transkript
1 Statistik II
2 Übersicht Wiederholung Literatur Regression Assoziation und Kausalität Statistische Kontrolle Multivariate Beziehungen Inferenz Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit Statistik II (1/33)
3 Literatur Regression Literatur für heute Agresti ch. 10 Zur Nach- und Vorbereitung: Agresti ch. 11 Statistik II (2/33)
4 Literatur Regression Literatur für nächste Woche Mason/Wolfinger: Cohort Analysis. Kish: Weighting: Why, When, and How? Statistik II (3/33)
5 Literatur Regression Daten/Kommandos für heute net get from net describe floridacrime net get floridacrime Statistik II (4/33)
6 Literatur Regression Was ist Regression? Modellierung konditionaler Verteilung (Mittelwert und Streuung) Beschreibung vs. Inferenz Daten vs. Modellannahmen Bekanntestes und einfachstes Modell: lineare (Einfach)- Regression Statistik II (5/33)
7 Literatur Regression Was ist lineare Einfachregression? Der konditionale Mittelwert einer abhängigen Variablen y wird modelliert als lineare Funktion einer unabhängigen Variablen x und einer Konstanten Gemeinsame Verteilung von x und y als Punktewolke (Fehlervarianz) um eine gerade Linie Allgemeines Muster für viele andere statistische Modelle Bestimmung der Parameter durch OLS (Minimale quadrierte Abweichung in y-richtung) Statistik II (6/33)
8 Literatur Regression Wie funktioniert OLS (ohne Mathematik) SAQ = Funktion(Daten, Parameterschätzungen) Daten sind gegeben Welche Parameterschätzungen machen SAQ möglichst klein (guter Fit, gute Schätzung)? Minimum der SAQ-Funktion suchen 1. Ableitung auf null setzen, nach Konstante und Steigung auflösen 1. Formeln aus Formelsammlung 2. Alternativ: kompakte Matrixalgebra Statistik II (7/33)
9 Assoziation und Kausalität Statistische Kontrolle Multivariate Beziehungen Inferenz Was ist Kausalität? X Y Hypothetisch-kontrafaktisches Konzept von Kausalität X und Y an einem Fall messen Realität für diesen Fall mit anderem Wert von X wiederholen Änderung von Y? In der Praxis nicht durchführbar, nur Annäherung an dieses Ideal Statistische Verfahren kein Ersatz für gutes Design Statistik II (8/33)
10 Assoziation und Kausalität Statistische Kontrolle Multivariate Beziehungen Inferenz Was ist Kausalität? X Y Hypothetisch-kontrafaktisches Konzept von Kausalität X und Y an einem Fall messen Realität für diesen Fall mit anderem Wert von X wiederholen Änderung von Y? In der Praxis nicht durchführbar, nur Annäherung an dieses Ideal Experiment: Viele Objekte X von Forscherin variiert, zeitliche Reihenfolge klar Vergleichbar bezüglich anderer Eigenschaften wg. zufälliger Aufteilung auf Experimental-/Kontrollgruppe Statistische Verfahren kein Ersatz für gutes Design Statistik II (8/33)
11 Assoziation und Kausalität Statistische Kontrolle Multivariate Beziehungen Inferenz Was ist Kausalität? X Y Hypothetisch-kontrafaktisches Konzept von Kausalität X und Y an einem Fall messen Realität für diesen Fall mit anderem Wert von X wiederholen Änderung von Y? In der Praxis nicht durchführbar, nur Annäherung an dieses Ideal Beobachtung/Befragung (ex post facto) Viele Objekte Keine Kontrolle über X (zeitliche Reihenfolge), keine zufällige Aufteilung Andere Eigenschaften nur statistisch kontrollierbar Statistische Verfahren kein Ersatz für gutes Design Statistik II (8/33)
12 Assoziation und Kausalität Statistische Kontrolle Multivariate Beziehungen Inferenz Was setzt Kausalität voraus? X Y 1. (Theorie) 2. Statistische Assoziation (Übergang deterministische/probabilistische Aussagen!) 3. Richtige zeitliche Reihenfolge in ex post facto Designs fast nicht zu prüfen 4. Ausschluß von Drittvariablen Statistik II (9/33)
13 Assoziation und Kausalität Statistische Kontrolle Multivariate Beziehungen Inferenz Beispiel: Körpergröße und Mathematik-Leistung Statistik II (10/33)
14 Assoziation und Kausalität Statistische Kontrolle Multivariate Beziehungen Inferenz Beispiel: Pfadfinder und Delingquenz Statistik II (11/33)
15 Assoziation und Kausalität Statistische Kontrolle Multivariate Beziehungen Inferenz Beispiel: Pfadfinder und Delingquenz Statistik II (11/33)
16 Assoziation und Kausalität Statistische Kontrolle Multivariate Beziehungen Inferenz Welche Beziehungen können zwischen drei Variablen bestehen? 1. Scheinkorrelation / scheinbare Non-Korrelation 2. Mediatorvariable 3. Multiple Verursachung 4. Interaktion Statistik II (12/33)
17 Assoziation und Kausalität Statistische Kontrolle Multivariate Beziehungen Inferenz 1. Scheinkorrelation y z x Statistik II (13/33)
18 Assoziation und Kausalität Statistische Kontrolle Multivariate Beziehungen Inferenz Scheinbare Non-Korrelation (Suppression) Kein Zusammenhang zwischen Bildung und Einkommen? Statistik II (14/33)
19 Assoziation und Kausalität Statistische Kontrolle Multivariate Beziehungen Inferenz 2. Mediatorvariable z x y Statistik II (15/33)
20 Assoziation und Kausalität Statistische Kontrolle Multivariate Beziehungen Inferenz 3. Multiple Verursachung x y z Statistik II (16/33)
21 Assoziation und Kausalität Statistische Kontrolle Multivariate Beziehungen Inferenz 4. Interaktion x z y Statistik II (17/33)
22 Assoziation und Kausalität Statistische Kontrolle Multivariate Beziehungen Inferenz Schluß auf die Grundgesamtheit? Kontrolle für multivariate Beziehungen durch multivariate Modelle Inferenzen verfügbar Statistik II (18/33)
23 Modell (zwei unabhängige Variablen) Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit y = β 0 + β 1 x 1 + β 2 x 2 Wert von y von beiden unabhängigen Variablen beeinflußt Effekte linear (proportional) und additiv Effekte unabhängig voneinander β 1 Effekt von x 1 während x 2 konstant gehalten wird (vgl. Pfadfinder-Tabelle) β2 Effekt von x 2 während x 1 konstant gehalten wird D. h. wechselseitige statistische Kontrolle Statistik II (19/33)
24 Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit Graphische Darstellung (zwei unabhängige Variablen) Statistik II (20/33)
25 Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit Beispiel: Bildung und Verbrechen 67 counties in Florida Sind counties mit höherem Niveau von formaler Bildung (% high school Absolventen) krimineller (mehr Verbrechen pro Einwohner)?. reg c hs Source SS df MS Number of obs = 67 F( 1, 65) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = c Coef. Std. Err. t P> t [95% Conf. Interval] hs _cons Statistik II (21/33)
26 Scatterplot + Regression Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit graph twoway (scatter c hs) (lfit c hs) HS C Fitted values Statistik II (22/33)
27 Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit Scheinkorrelation? Verbrechen Urbanisierung Bildung Kontrolle: multiple Regression Verbrechen = α + β 1 Bildung + β 2 Urbanisierung Effekt von Bildung für jedes denkbare Niveau von Urbanisierung Effekt von Urbanisierung für jedes denkbare Niveau von Bildung Statistik II (23/33)
28 Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit Regression in Stata Grundbefehl (reg)ress y x1 x2... Variablennamen können abgekürzt werden Jokerzeichen oder Bereiche für Variablen Ergebnis der letzten Regression reg (Optionen mit Komma abtrennen) Postestimation (z. B. predict) Statistik II (24/33)
29 Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit In Stata.... reg c hs u Source SS df MS Number of obs = 67 F( 2, 64) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = c Coef. Std. Err. t P> t [95% Conf. Interval] hs u _cons Urbanisierung hat eine starken positiven Effekt Bildung hat negativen Effekt Partieller Effekt (vs. bivariater Effekt) Statistik II (25/33)
30 Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit Partielle Effekte Partielle Effekte = Effekt von Bildung Innerhalb einer Gruppe von counties mit identischem (aber beliebigem) Urbanisierungsgrad Schätzung über alle Niveaus von Urbanisierungsgrad Und umgekehrt Analog zur Betrachtung von Subgruppen im Pfadfinder-Beispiel Partielle Koeffizienten Bivariate Koeffizienten wg. Korrelation zwischen unabhängigen Variablen Nicht beim Experiment Statistik II (26/33)
31 Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit Warum ist der partielle Effekt negativ? C Ugrad nicht hoch Ugrad hoch Graphs by Urbanisierungsgrad hoch HS Urbanisierungsgrad wird konstant gehalten Statistik II (27/33)
32 Visualisierung: Matrixplot Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit C U HS Statistik II (28/33)
33 Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit Partielle Regressionsplots Verbrechen Urbanisierung Bildung (Added Variable Plot) Residuum: Differenz zwischen beobachtetem und geschätztem Wert Verbrechen = α 1 + β 1 Urbanisierung Residuum = Verbrechen abzüglich Effekt von Urbanisierung Bildung = α 2 + β 2 Urbanisierung Residuum = Bildung abzüglich Effekt von Urbanisierung Statistik II (29/33)
34 Partielle Regressionsplots Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit Regression von Residuum 1 auf Residuum 2 identisch mit partiellem Regressionskoeffizienten Plot für alle unabhängigen Variablen, Identifikation von Ausreißern avplots Ein plot pro unabhängige Variable Partieller Effekt dieser Variablen auf abhängige Variable Ausreißer Statistik II (29/33)
35 Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit Partielle Regressionsplots e( c X ) e( u X ) coef = , se = , t = 5.54 e( c X ) e( hs X ) coef = , se = , t = Statistik II (29/33)
36 Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit Root Mean Squared Error Verbrechen: 0 128; Residuum = Vorhersagefehler Residuum quadrieren und aufsummieren SAQ SAQ/n= Mittlerer quadrierter Fehler Wurzel RMSE Wie bei Einfachregression. predict abweichung, resid. gen aq=abweichung *abweichung. sum aq Variable Obs Mean Std. Dev. Min Max. displ sqrt(414) aq Statistik II (30/33)
37 Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit R 2 Analog zur Einfachregression R = Korrelation zwischen vorhergesagten/beobachteten Wert bzw. Gesamt SAQ (TSS) = Modell-SAQ (MSS) + Residuale SAQ (RSS) (PRE-Interpretation) R 2 = TSS RSS TSS = MSS TSS = Σ(y ȳ)2 Σ(y ŷ) 2 Σ(y ȳ) 2 Kollinearität zwischen unabhängigen Variablen Adjusted R 2 Statistik II (31/33)
38 Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit R/R 2 von Hand ausrechnen. predict yhat (option xb assumed; fitted values). corr yhat c (obs=67). display.69^ yhat yhat c c Statistik II (32/33)
39 Korrelation Kausalität Keine Kontrolle über unabhängige Variable(n) (vs. Experiment) (Schwacher) Ersatz für Randomisierung (Drittvariablenkontrolle) Partielle vs. bivariate Effekte Fit analog zu Einfachregression Inferenz für Koeffizienten? Nächste Woche: Agresti ch. 11 Statistik II (33/33)
ANOVA und Transformationen
und Statistik II Literatur Statistik II und (1/28) Literatur Zum Nachlesen Agresti ch. 12 (nur bis Seite 381) Agresti ch. 13 (nur bis Seite 428) Statistik II und (2/28) Literatur Literatur für nächste
MehrMultiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse. Statistik II
Multiple Regression II: Signifikanztests,, Multikollinearität und Kohortenanalyse Statistik II Übersicht Wiederholung Literatur Kausalität und Regression Inferenz und standardisierte Koeffizienten Statistik
MehrANOVA und Transformationen. Statistik II
und Statistik II Wiederholung Literatur Statistik II und (1/28) Literatur Zum Nachlesen Agresti ch. 12 (nur bis Seite 381) Agresti ch. 13 (nur bis Seite 428) Statistik II und (2/28) Literatur für nächste
MehrWiederholung Drittvariablen Nicht-lineare Effekte Zusammenfassung. Regression III. Statistik I. Sommersemester 2009. Statistik I Regression III (1/36)
Regression III Statistik I Sommersemester 2009 Statistik I Regression III (1/36) Wiederholung Zuwandererquote FN 2004 10 15 20 25 5 10 15 20 Statistik I Regression III (2/36) Zum Nachlesen Agresti/Finlay
MehrDas Lineare Regressionsmodell
Das Lineare Regressionsmodell Bivariates Regressionsmodell Verbrauch eines Pkw hängt vom Gewicht des Fahrzeugs ab Hypothese / Theorie: Je schwerer ein Auto, desto mehr wird es verbrauchen Annahme eines
MehrRegression III. Statistik I. Sommersemester Wiederholung. Zwei unabhängige Variablen Multivariate Zusammenhänge Interaktion.
Regression III Statistik I Sommersemester 2009 Statistik I Regression III (1/36) FN 2004 25 20 15 10 5 10 15 20 Zuwandererquote Statistik I Regression III (2/36) Zum Nachlesen Agresti/Finlay Kapitel 10.2,
MehrWiederholung/Einführung Lineare Regression Zusammenfassung. Regression I. Statistik I. Sommersemester 2009
Sommersemester 2009 Wiederholung/Einführung Ein Beispiel: Armut und Gewaltverbrechen Rechtswahl 15 10 5 0 5 10 Arbeitslosigkeit Zum Nachlesen Agresti: 9.1-9.4 Gehring/Weins: 8 Schumann: 8.1-8.2 Was ist
MehrRegression I. Statistik I. Sommersemester Lineare Regression Zusammenhang und Modell Ein Beispiel: Armut und Gewaltverbrechen Zusammenfassung
Sommersemester 2009 Ein Beispiel: Armut und Gewaltverbrechen Rechtswahl 15 10 5 0 5 10 Arbeitslosigkeit Zum Nachlesen Agresti: 9.1-9.4 Gehring/Weins: 8 Schumann: 8.1-8.2 Was ist ein Zusammenhang? Gemeinsame
MehrFRAGESTUNDE WS 2016/17 QM 2. Dr. Christian Schwarz 1
FRAGESTUNDE Dr. Christian Schwarz 1 #2 - Allgemein Q: Müssen wir den Standard Error händisch berechnen können? R: Nein. Q: Hat das Monte Carlo Experiment irgendeine Bedeutung für uns im Hinblick auf die
MehrInstitut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Ausblick; Darstellung von Ergebnissen; Wiederholung
Institut für Soziologie Dipl.-Soz. Methoden 2 Ausblick; Darstellung von Ergebnissen; Wiederholung Ein (nicht programmierbarer) Taschenrechner kann in der Klausur hilfreich sein. # 2 Programm Ausblick über
MehrSpezifikationsprobleme Omitted Variable Bias
Spezifikationsprobleme Omitted Variable Bias Spezifikationsprobleme In der Grundgesamtheit gilt der wahre (aber unbekannte) Zusammenhang y = 0 + 1x 1 + : : : kx k dieser Zusammenhang soll anhand einer
MehrMultiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse
Multiple Regression II: Signifikanztests,, Multikollinearität und Kohortenanalyse Statistik II Übersicht Literatur Kausalität und Regression Inferenz und standardisierte Koeffizienten Statistik II Multiple
MehrÜbungsblatt 10: Lineare Regression (Sitzung 11)
1 Übungsblatt 10: Lineare Regression (Sitzung 11) Aufgabe 1 a) Nach welchem Kriterium wird die Regressionsgerade zur Vorhersage von Y-Werten festgelegt? b) Was sind die Gemeinsamkeiten und Unterschiede
MehrInstitut für Soziologie Benjamin Gedon. Methoden 2. Kausalanalyse
Institut für Soziologie Methoden 2 Kausalanalyse Inhalt 1. Kausalanalyse 2. Anwendungsbeispiel 3. Wiederholung 4. Übungsaufgabe # 2 Kausalanalyse Kausalität: Identifizieren von Ursache-Wirkungs-Beziehungen
MehrBivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.154
Bivariate lineare Regression Statistik für SozialwissenschaftlerInnen II p.154 Grundidee und Typen der Regression Die Regressionsanalyse dient zur Quantifizierung des Zusammenhangs und der statistisch
MehrEinführung II. Kontext und Mehr-Ebenen-Datensätze. Wiederholung Statistische Mehr-Ebenen-Modelle Politisches Vertrauen in Europa Fazit/Ausblick
Einführung II Kontext und Mehr-Ebenen-Datensätze Kontext und Mehr-Ebenen-Datensätze Einführung II (1/28) Warum? Wiederholung Moderne Erklärungen = Mehr-Ebenen-Erklärungen Viele Datensätze sind strukturiert
MehrSchätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II
Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Wiederholung Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte
MehrEinfache Modelle für Paneldaten. Statistik II
Einfache Modelle für daten Statistik II Wiederholung Literatur daten Policy-Analyse II: Statistik II daten (1/18) Literatur Zum Nachlesen Einfache Modelle für daten Wooldridge ch. 13.1-13.4 (im Reader)
MehrInstitut für Soziologie Andreas Schneck. Methoden 2. Regressionsanalyse II: Lineare multiple Regression
Institut für Soziologie Methoden 2 Regressionsanalyse II: Lineare multiple Regression Hinweise zur Hausarbeit Abgabe bis 07.08.2017 bis 23 Uhr als PDF-Datei per E-Mail an methoden2@soziologie.uni-muenchen.de
MehrWiederholung Qualitätssicherung Drittvariablen. Regression II. Statistik I. Sommersemester Statistik I Regression II (1/33) Wiederholung
Regression II Statistik I Sommersemester 2009 Statistik I Regression II (1/33) R 2 Root Mean Squared Error Statistik I Regression II (2/33) Zum Nachlesen Agresti: 9.1-9.4 Gehring/Weins: 8 Schumann: 8.1-8.2
MehrSchätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief
Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte : Schätzung Statistik
MehrStatistische Methoden der Lebensverlaufsforschung. Prof. Dr. Johannes Giesecke Humboldt-Universität zu Berlin Institut für Sozialwissenschaften
Statistische Methoden der Lebensverlaufsforschung Prof. Dr. Johannes Giesecke Humboldt-Universität zu Berlin Institut für Sozialwissenschaften Lebensverlauf Deutschland, ca 1870 Johannes Giesecke Statistische
MehrModellspezifikationen Nichtlinearitäten
Modellspezifikationen Nichtlinearitäten Agenda Dummy-Variablen Interaktionseffekte (quadratische Effekte / Polynome) Dummy Interaktion Logarithmierte Variablen Wachstumsraten / Semielastizitäten Elastizitäten
MehrStatistischer Rückschluss und Testen von Hypothesen
Statistischer Rückschluss und Testen von Hypothesen Statistischer Rückschluss Lerne von der Stichprobe über Verhältnisse in der Grundgesamtheit Grundgesamtheit Statistischer Rückschluss lerne aus Analyse
MehrWieviel ist (m)ein Haus wert? - Immobilienbewertung mit Hilfe der Statistik
Wieviel ist (m)ein Haus wert? - Immobilienbewertung mit Hilfe der Statistik Axel Werwatz und Martin Wersing Econ Boot Camp 2010 SFB 649 Ökonomisches Risiko Gute Vorsätze: Herz & Kopf & Hand Lernziel: Immotheorie
MehrWieviel ist (m)ein Haus wert? - Immobilienbewertung mit Hilfe der Statistik. Axel Werwatz Econ Boot Camp 2012 SFB 649 Ökonomisches Risiko
Wieviel ist (m)ein Haus wert? - Immobilienbewertung mit Hilfe der Statistik Axel Werwatz Econ Boot Camp 2012 SFB 649 Ökonomisches Risiko Gute Vorsätze: Herz & Kopf & Hand Lernziel: Immotheorie + Daten
MehrKategoriale abhängige Variablen:
Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell Statistik II
MehrZeitreihen. Statistik II. Literatur. Zeitreihen-Daten Modelle Probleme Trends und Saisonalität Fehlerstruktur. 1 Wiederholung.
Statistik II 1 Literatur 2 -Daten Trends und Saisonalität Fehlerstruktur 3 Statistik II (1/31) Literatur Zum Nachlesen Wooldridge ch 101 & 102 Statistik II (2/31) Literatur Für nächste Woche Einfache für
MehrTEIL 13: DIE EINFACHE LINEARE REGRESSION
TEIL 13: DIE EINFACHE LINEARE REGRESSION Die einfache lineare Regression Grundlagen Die einfache lineare Regression ist ebenfalls den bivariaten Verfahren für metrische Daten zuzuordnen 1 Sie hat einen
MehrMultivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.167
Multivariate lineare Regression Statistik für SozialwissenschaftlerInnen II p.167 Multivariate Regression Verfahren zur Prüfung des gemeinsamen linearen Einflusses mehrerer unabhängiger Variablen auf eine
MehrWieviel ist (m)ein Haus wert? - Immobilienbewertung mit Hilfe der Statistik
Wieviel ist (m)ein Haus wert? - Immobilienbewertung mit Hilfe der Statistik Axel Werwatz und Jens Kolbe Econ Boot Camp 2013 SFB 649 Ökonomisches Risiko Immo ist wichtig 2 Economist, 2002 Krise, 2008 Immo
MehrBiometrische und Ökonometrische Methoden I! Lösungen 6
TECHNISCHE UNIVERSITÄT MÜNCHEN - WEIHENSTEPHAN WS 97/98 MATHEMATIK UND STATISTIK, INFORMATIONS- UND DOKUMENTATIONSZENTRUM Biometrische und Ökonometrische Methoden I! Lösungen 6 1. a) MTB > Read "H:\STUDENT\MINITAB\CNP.DAT"
MehrDie Anwendung des globalen und partiellen F-Tests beim Regressionsmodell
Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS 2002/2003-1 Die Anwendung des globalen und partiellen F-Tests beim Regressionsmodell von XENOPHOB auf V247 und POSTMAT, MATERIAL Für unsere
MehrInstitut für Soziologie Andreas Schneck. Methoden 2. Regressionsanalyse I: Lineare Regression
Institut für Soziologie Methoden 2 Regressionsanalyse I: Lineare Regression Organisatorisches Hausarbeitsgruppen: Aktueller Stand der Gruppenbildung Bitte bis spätestens 03.07.2017 die Gruppenzusammensetzung
MehrAnalysen politikwissenschaftlicher Datensätze mit Stata. Sitzung 5: Lineare Regression
Analysen politikwissenschaftlicher Datensätze mit Stata Sitzung 5: Lineare Regression 1 Vorbereitung Stata durch z:\profile.do starten Datensatz z:\daten\rpstrukt laden Achtung: Ab dieser Sitzung werden
MehrKurs Empirische Wirtschaftsforschung
Kurs Empirische Wirtschaftsforschung 5. Bivariates Regressionsmodell 1 Martin Halla Institut für Volkswirtschaftslehre Johannes Kepler Universität Linz 1 Lehrbuch: Bauer/Fertig/Schmidt (2009), Empirische
Mehr* Beispiel 1: Verkehrsunfaelle
* Beispiel 1: Verkehrsunfaelle. use "C:\hja\lehre\daten\wooldridge\stata\TRAFFIC2.DTA", clear. des Contains data from C:\hja\lehre\daten\wooldridge\stata\TRAFFIC2.DTA obs: 108 vars: 48 17 Aug 1999 23:02
MehrTutorial: Regression Output von R
Tutorial: Regression Output von R Eine Firma erzeugt Autositze. Ihr Chef ist besorgt über die Anzahl und die Kosten von Maschinenausfällen. Das Problem ist, dass die Maschinen schon alt sind und deswegen
MehrBiostatistik 101 Korrelation - Regressionsanalysen
Good Data don't need statistics Biostatistik 101 Korrelation - Regressionsanalysen Carl Herrmann IPMB Uni Heidelberg & DKFZ B080 carl.herrmann@uni-heidelberg.de Korrelation Sind Alter und Blutdruck miteinander
MehrKlausur zu Biometrische und Ökonometrische Methoden und Ökologische Statistik
TECHNISCHE UNIVERSITÄT MÜNCHEN - WEIHENSTEPHAN WS / MATHEMATIK UND STATISTIK, INFORMATIONS- UND DOKUMENTATIONSZENTRUM Klausur zu Biometrische und Ökonometrische Methoden und Ökologische Statistik 4 26..,
MehrGibt es einen Zusammenhang zwischen Merkmalen? Korrelationen
Schäfer A & Schöttker-Königer T, Statistik für (2015) Arbeitsblatt 1 STATA Kapitel 8 Seite 1 Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon
MehrKapitel 10. Multikollinearität. Exakte Multikollinearität Beinahe Multikollinearität
Kapitel 0 Multikollinearität Exakte Multikollinearität Beinahe Multikollinearität Exakte Multikollinearität Unser Modell lautet y = Xb + u, Dimension von X: n x k Annahme : rg(x) = k Wenn sich eine oder
Mehr1 Beispiel zur Methode der kleinsten Quadrate
1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25
MehrMikro-Ökonometrie: Small Sample Inferenz mit OLS
Mikro-Ökonometrie: Small Sample Inferenz mit OLS 1. November 014 Mikro-Ökonometrie: Small Sample Inferenz mit OLS Folie Zusammenfassung wichtiger Ergebnisse des letzten Kapitels (I) Unter den ersten vier
MehrKlausur: Angewandte Ökonometrie. Termin: , 14:00 16:00. Prüfer: Prof. Dr. Hans-Jörg Schmerer. Datum:
Fakultät für Wirtschaftswissenschaft Lehrstuhl für Volkswirtschaftslehre, insb. Internationale Ökonomie Univ.-Prof. Dr. Hans-Jörg Schmerer Name: Vorname: Matrikel-Nr.: Klausur: 42270 Angewandte Ökonometrie
MehrLineare Modelle in R: Zweiweg-Varianzanalyse und Kovarianzanalyse
Lineare Modelle in R: Zweiweg-Varianzanalyse und Kovarianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon im Tutorium LiMo2.pdf laden wir den GSA Datensatz R> load("gsa.rda") und wählen
MehrAnalyse von Querschnittsdaten. Spezifikation der Regressionsfunktion
Analse von Querschnittsdaten Spezifikation der Regressionsfunktion Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Annahmen gegeben? kategoriale Variablen Datum 9..5 6..5..5 9..5 6..5..5..5
MehrKovarianzanalyse. Truthahngewicht. Truthahngewicht. Methoden empirischer Sozialforschung. 1 metrische und mehrere metrische und kategoriale Variablen
Kovarianzanalyse 1 metrische und mehrere metrische und kategoriale Variablen Methoden empirischer Sozialforschung Lineare Modelle (2. Teil) Wie läßt sich die Abhängigkeit einer metrischen Variablen von
MehrBiometrische und Ökonometrische Methoden I! Lösungen 4
TECHNISCHE UNIVERSITÄT MÜNCHEN - WEIHENSTEPHAN WS 97/98 MATHEMATIK UND STATISTIK, INFORMATIONS- UND DOKUMENTATIONSZENTRUM Biometrische und Ökonometrische Methoden I! Lösungen 4 1. a) MTB > name c1 'H2O'
MehrAnalyse von Querschnittsdaten. Signifikanztests I Basics
Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004
MehrBiometrische und Ökonometrische Methoden I Lösungen 4
TECHNISCHE UNIVERSITÄT MÜNCHEN - WEIHENSTEPHAN WS / MATHEMATIK UND STATISTIK, INFORMATIONS- UND DOKUMENTATIONSZENTRUM Biometrische und Ökonometrische Methoden I Lösungen 4. a) MTB > name c 'H2O' c2 'N'
MehrCountdata, Postestimation und Modellvergleich. Statistik II
Countdata, Statistik II Wiederholung/Fortsetzung Literatur Postestimation Modellvergleich Statistik II Countdata (1/29) Literatur Zum Nachlesen Für heute: Scott/Freese ch. 8 Für nächste Woche: Wooldridge
MehrStatistik II Übung 1: Einfache lineare Regression
Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der
MehrBivariate Regressionsanalyse
Universität Bielefeld 15. März 2005 Kovarianz, Korrelation und Regression Kovarianz, Korrelation und Regression Ausgangspunkt ist folgende Datenmatrix: Variablen 1 2... NI 1 x 11 x 12... x 1k 2 x 21 x
MehrZusammenfassung 11. Sara dos Reis.
Zusammenfassung 11 Sara dos Reis sdosreis@student.ethz.ch Diese Zusammenfassungen wollen nicht ein Ersatz des Skriptes oder der Slides sein, sie sind nur eine Sammlung von Hinweise zur Theorie, die benötigt
MehrTEIL 13: DIE LINEARE REGRESSION
TEIL 13: DIE LINEARE REGRESSION Dozent: Dawid Bekalarczyk GLIEDERUNG Dozent: Dawid Bekalarczyk Lineare Regression Grundlagen Prognosen / Schätzungen Verbindung zwischen Prognose und Zusammenhang zwischen
MehrÜbung V Lineares Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung
MehrVersuchsplanung. Teil 2 Varianzanalyse (ANOVA) Dr. Tobias Kiesling
Versuchsplanung Teil 2 Varianzanalyse (ANOVA) Dr. Tobias Kiesling Gliederung Grundlagen der Varianzanalyse Streuungszerlegung und Modellschätzer Modellannahmen und Transformationen
MehrBivariate Zusammenhänge
Bivariate Zusammenhänge 40 60 80 Bivariater Zusammenhang: Zusammenhang zwischen zwei Variablen weight (kg) Gibt es einen Zusammenhang zwischen Größe & Gewicht? (am Beispieldatensatz) Offensichtlich positiver
MehrDas klassische Regressionsmodell: Ein Beispiel
1 / 43 Das klassische Regressionsmodell: Ein Beispiel Kapitel 2 Ökonometrie I Michael Hauser 2 / 43 Inhalt Ein Beispiel für das klassische, bivariate Regressionsmodell: Okun s Gesetz Das bivariate, lineare
MehrVorlesung Wirtschaftsstatistik 2 (FK 040637) Multiple lineare Regression. Dipl.-Ing. Robin Ristl Wintersemester 2012/13
Vorlesung Wirtschaftsstatistik 2 (FK 040637) Multiple lineare Regression Dipl.-Ing. Robin Ristl Wintersemester 2012/13 1 Grundidee: Eine abhängige Variable soll als Linearkombination mehrerer unabhängiger
MehrArbeitsmarktökonomie. Fragestunde. Universität Basel HS 2014 Christoph Sajons, Ph.D.
Arbeitsmarktökonomie Fragestunde Universität Basel HS 2014 Christoph Sajons, Ph.D. 1 Heute A. Ganz kurz: Empirie Migration B. Allgemeines zur Klausur C. Fragen 2 A. Empirie Migration Siehe Do- und Log-file
MehrMultiple Regression III
Multiple Regression III Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Überprüfung der Modellannahmen Residuen-Plot Normal-Q-Q-Plot Cook s Distanz-Plot Maßnahmen bei Abweichungen von Modellannahmen
MehrBivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation
Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation PEΣO 12. November 2001 Von der Tabellenanalyse zur Regression Die bivariate Verteilung zweier metrischer Variablen kann konzeptionell
MehrKategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II
Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Wiederholung Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell
MehrWiederholung. Statistik I. Sommersemester 2009
Statistik I Sommersemester 2009 Statistik I (1/21) Daten/graphische Darstellungen Lage- und Streuungsmaße Zusammenhangsmaße Lineare Regression Wahrscheinlichkeitsrechnung Zentraler Grenzwertsatz Konfidenzintervalle
MehrStatistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 27
Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 27 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)
MehrCountdata, Postestimation und Modellvergleich
Countdata, Statistik II 1 Literatur 2 3 4 Statistik II Countdata (1/29) Literatur Zum Nachlesen Für heute: Scott/Freese ch. 8 Für nächste Woche: Wooldridge Kapitel 10.1 und 10.2 (im Reader) Statistik II
MehrStatistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20
Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 20 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)
MehrKapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell
Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften
MehrVorlesung 7: Zwischenresümee
Vorlesung 7: Zwischenresümee 1. Nachträge zur letzten Sitzung (Heteroskedastizität) 2. Nicht-lineare Funktionen (with a little help from Stata) 3. Darstellung der Ergebnisse einer Regressionsanalyse Tabellen
MehrStatistik II Übung 1: Einfache lineare Regression
Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der
MehrWas ist Regression? Übersicht. Statistik II
Was ist? Statistik II Übersicht Parameterschätzung für die lineare Literatur Was ist? : Standardmodell der linearen : Wahrscheinlichkeitsverteilungen Parameterschätzung für die lineare Statistik II (1/35)
MehrRegression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate
Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für
MehrANalysis Of VAriance (ANOVA) 1/2
ANalysis Of VAriance (ANOVA) 1/2 Markus Kalisch 16.10.2014 1 ANOVA - Idee ANOVA 1: Zwei Medikamente zur Blutdrucksenkung und Placebo (Faktor). Gibt es einen sign. Unterschied in der Wirkung (kontinuierlich)?
MehrBiometrische und Ökonometrische Methoden I Lösungen 9
TECHNISCHE UNIVERSITÄT MÜNCHEN - WEIHENSTEPHAN WS 00/01 MATHEMATIK UND STATISTIK, INFORMATIONS- UND DOKUMENTATIONSZENTRUM Biometrische und Ökonometrische Methoden I Lösungen 9 1. a) MTB > Retrieve "H:\STUDENT\MINITAB\OPELVW.MTW".
Mehr6. Tutoriumsserie Statistik II
6. Tutoriumsserie Statistik II 1. Aufgabe: Eine Unternehmensabteilung ist ausschließlich mit der Herstellung eines einzigen Produktes beschäftigt. Für 10 Perioden wurden folgende Produktmenge y und Gesamtkosten
MehrMikro-Ökonometrie, WS 15/16 Musterlösung Aufgabenblatt 3
Mikro-Ökonometrie, WS 15/16 Musterlösung Aufgabenblatt 3 Aufgabe 3: Die Datei WAGE2.DTA enthält Daten einer Stichprobe von 935 männlichen US-amerikanischen Arbeitnehmern im Alter von 28 bis 38 Jahren.
MehrAnalyse von Querschnittsdaten. Signifikanztests I Basics
Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Datum Vorlesung 18.10.2006 Einführung 18.10.2006 Beispiele 25.10.2006 Daten 08.11.2006 Variablen Kontinuierliche
MehrDrittvariablenkontrolle in der linearen Regression: Trivariate Regression
Drittvariablenkontrolle in der linearen Regression: Trivariate Regression 14. Januar 2002 In der Tabellenanalyse wird bei der Drittvariablenkontrolle für jede Ausprägung der Kontrollvariablen eine Partialtabelle
MehrZeitreihen. Statistik II
Statistik II Wiederholung Literatur -Daten Trends und Saisonalität Fehlerstruktur Statistik II (1/31) Wiederholung Literatur -Daten Trends und Saisonalität Fehlerstruktur Statistik II (1/31) Zum Nachlesen
MehrErgänzung der Aufgabe "Mindestlöhne" zu einer multiplen Regression
Prof. Dr. Peter von der Lippe ( Übungsblatt E) Ergänzung der Aufgabe "Mindestlöhne" zu einer multiplen Regression Das Beispiel "Mindestlöhne" zur einfachen multiplen Regression ergab die folgenden Parameter
MehrPanelregression (und Mehrebenenanwendungen)
Panelregression (und Mehrebenenanwendungen) Henning Lohmann Universität zu Köln Lehrstuhl für Empirische Sozial- und Wirtschaftsforschung SOEP@Campus 2007, Universität Duisburg-Essen, 11. Oktober 2007
MehrStatistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn
Statistikpraktikum Carsten Rezny Institut für angewandte Mathematik Universität Bonn Sommersemester 2014 Mehrdimensionale Datensätze: Multivariate Statistik Multivariate Statistik Mehrdimensionale Datensätze:
MehrBivariate Analyseverfahren
Bivariate Analyseverfahren Bivariate Verfahren beschäftigen sich mit dem Zusammenhang zwischen zwei Variablen Beispiel: Konservatismus/Alter Zusammenhangsmaße beschreiben die Stärke eines Zusammenhangs
MehrAppendix. Kapitel 2. Ökonometrie I Michael Hauser
1 / 24 Appendix Kapitel 2 Ökonometrie I Michael Hauser 2 / 24 Inhalt Geometrie der Korrelation Freiheitsgrade Der OLS Schätzer: Details OLS Schätzer für Okuns s law nachgerechnet Anforderungen an Theorien
MehrBiometrische und Ökonometrische Methoden I! Lösungen 9
TECHNISCHE UNIVERSITÄT MÜNCHEN - WEIHENSTEPHAN WS 98/99 MATHEMATIK UND STATISTIK, INFORMATIONS- UND DOKUMENTATIONSZENTRUM Biometrische und Ökonometrische Methoden I! Lösungen 9 1. a) MTB > name c1 'DM'
MehrEine zweidimensionale Stichprobe
Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,
MehrAbschlussklausur zur Vorlesung Empirische Wirtschaftsforschung
Dr Isabel Schnabel Johannes Gutenberg-Universität Mainz Abschlussklausur zur Vorlesung Empirische Wirtschaftsforschung Sommersemester 2007, 14082007, 16:30 18:30 Uhr Hinweise zur Klausur Die Klausur besteht
MehrSyntax. Ausgabe *Ü12. *1. corr it25 with alter li_re kontakt.
Syntax *Ü2. *. corr it25 with alter li_re kontakt. *2. regression var=it25 alter li_re kontakt/statistics /dependent=it25 /enter. regression var=it25 li_re kontakt/statistics /dependent=it25 /enter. *3.
MehrLineare Regression 2: Gute Vorhersagen
Lineare Regression 2: Gute Vorhersagen Markus Kalisch 23.09.2014 1 Big Picture: Statistisches Lernen Supervised Learning (X,Y) Unsupervised Learning X VL 7, 11, 12 Regression Y kontinuierlich VL 1, 2,
MehrBeispiel: Multiples Modell/Omitted Variable Bias I
4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss
MehrMittelwerte, Zusammenhangsmaße, Hypothesentests in Stata
Mittelwerte,, Hypothesentests in Stata Statistik II Statistik II Mittelwerte,, Hypothesentests (1/30) Wiederholung: Daten & Deskriptive Statistik Zwei nominale Variablen Zwei ordinale Variablen Nominal/intervallskalierte
Mehrsimple lineare Regression kurvilineare Regression Bestimmtheitsmaß und Konfidenzintervall
Regression Korrelation simple lineare Regression kurvilineare Regression Bestimmtheitsmaß und Konfidenzintervall Zusammenhänge zw. Variablen Betrachtet man mehr als eine Variable, so besteht immer auch
MehrTEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN
TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN GLIEDERUNG Bivariate Analyse für metrisch skalierte Variablen Grundlagen Streudiagramme und Visualisierungen von Zusammenhängen Positive lineare
Mehr