Übung Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung BACHELOR FT 2013 (HSU) Übung Emp. WiFo FT 2013 1 / 1
Maßzahlen für den Zusammenhang zwischen Merkmalen Kontingenztabelle: addmargins(table(x)) Pearsons Chi Quadrat-Statistik: quisq.test(table) Spearman s Rangkorrelationskoeffizient: cor(rank(x1),rank(x2),method= spearman ) Pearson s Korrelationskoeffizient: cor(x1,x2,method= pearson ) Kovarianz: cov(x1,x2) (HSU) Übung Emp. WiFo FT 2013 2 / 1
Lineare Regression in R Funktion Beschreibung lm() schätzt/berechnet eine (einfache/mehrfache) lineare Regression plot() zeichnet zu jedem erstellten Modellobjekt entsprechende Grafiken summary() fasst wichtige Ergebnisse der Regression zusammen (HSU) Übung Emp. WiFo FT 2013 3 / 1
Lineare Regression in R Oft werden einzelne Ergebnisse der Modellierung für weitere Berechnungen benötigt: Funktion Beschreibung coef() Koeffizienten eines Modells (später: Schätzung, hier: Berechnung) fitted() Angepasste Werte (In-Sample) des Modells predict() Vorhersage eines neuen Wertes mit Hilfe der Regressionskoeffizienten residuals() Störgrößen der Linearen Regressionsgleichung (= Residuen) rstandard() standardisierte Residuen des Modells (=Residuen geteilt durch den Standardfehler) (HSU) Übung Emp. WiFo FT 2013 4 / 1
Lineare Regression in R Mathematische Operatoren in der Formelnotation Zeichen Beispiel Bedeutung y x Variable y soll durch x erklärt werden: y = c + α x + y x + z Hinzufügen einer weiteren Variablen: y = c + α 1 x + α 2 z. y. Alle Variablen aus dem Datensatz in die Regression einschließen 1 y x 1 Regression ohne Konstante y = α x (HSU) Übung Emp. WiFo FT 2013 5 / 1
Lineare Regression in R Wie schätze ich ein lineares Modell in R? Mit dem Befehl lm() lm() ist im Paket stats eingebunden und wird beim Start automatisch geladen Der Befehl lautet lm(formula, data) formula beschreibt das vorliegende Modell (siehe Tabelle) und data verweist auf die Daten die in das Modell eingehen sollen Beispiel für den Datensatz Data mit der endogenen Variablen y und einer exogenen Variablen x (Spaltennamen): Modell1< lm(y x, data=data) Beispiel für den Datensatz Data mit der endogenen Variablen y und zwei exogenen Variablen x und z (Spaltennamen): Modell1< lm(y x+z, data=data) (HSU) Übung Emp. WiFo FT 2013 6 / 1
Lineare Regression in R Wie stelle ich das Ergebnis der Regression dar (bivariater Fall)? Plotten der beiden untersuchten Größen (exogene und endogene Variable): plot(x,y,type=p) Die Regressionsgerade in einer anderen Farbe hinzufügen: abline(modell1, col= red, type=l) (HSU) Übung Emp. WiFo FT 2013 7 / 1
Übungsaufgabe 4 1 Untersuchen Sie ob es einen linearen Zusammenhang zwischen Jahreseinkommen und Ausbildung gibt. 2 Erstellen Sie eine Kontingenztabelle aus den Kategorien Lebenszufriedenheit und Geschlecht und überprüfen Sie die Unabhängigkeit der Kategoriewahl. 3 Führen Sie eine lineare Mehrfachregression zur Erklärung des Jahreseinkommen durch Ausbildungsjahre, Lebenszufriedenheit und Gesundheitszustand durch. 4 Wie groß ist die Differenz zwischen Bestimmtheitsmaß und adjustiertem Bestimmtheitsmaß. 5 Erstellen Sie ein Grafik mit den Residuen dieser Regression. (HSU) Übung Emp. WiFo FT 2013 8 / 1
Übungsaufgabe 5 1 Lesen Sie den Datensatz temperature (siehe Homepage) in R ein. 2 Untersuchen Sie die Struktur des Datensatzes (Anzahl Beobachtungen, Anzahl Variablen, Datentypen der Variablen). 3 Ändern Sie den Datentyp der Variable gender in einen Faktor um. 4 Lassen Sie sich die ersten drei Zeilen des Datensatzes anzeigen. 5 Im Datensatz wird die Körpertemperatur der Probanden in Fahrenheit sowie in Celsius angegeben. Löschen Sie die Variable F aus dem Datensatz. 6 Sortieren Sie den Datensatz aufsteigend nach der Körpertemperatur der Probanden und speichern Sie die Sortierung ab. Arbeiten Sie mit dem sortierten Datensatz weiter. 7 Wie viele verschiedene Temperaturangaben in Celcius gibt es in den Daten? (HSU) Übung Emp. WiFo FT 2013 9 / 1
Übungsaufgabe 5, Fortsetzung I 8 Welche Personen haben eine Körpertemperatur über 37,5 Grad Celsius? 9 Lassen Sie sich alle Probanden anzeigen, die eine Körpertemperatur zwischen 37,0 und 37,5 (jeweils einschließlich) Grad Celsius haben. 10 Wie viele Personen erfüllen diese Bedingung? 11 Bestimmen Sie die durchschnittliche Körpertemperatur der Frauen und die durchschnittliche Temperatur der Männer (Männer = 1, Frauen = 2). 12 Erstellen Sie einen Boxplot für die Körpertemperatur der Frauen und einen für die Männer. Erstellen Sie ein Histogramm für die Körpertemperatur der Frauen und eines für die Männer. Zeichnen Sie in beide Histogramme die jeweilige Durchschnittstemperatur rot ein. Beschriften Sie die Grafiken angemessen. Alle vier Grafiken sollen auf einem Blatt angezeigt werden. 13 Speichern Sie Ihre Grafiken als pdf ab. (HSU) Übung Emp. WiFo FT 2013 10 / 1
Übungsaufgabe 5, Fortsetzung II 14 Betrachten Sie im Folgenden nur noch die ersten zehn Beobachtungen. Fügen Sie die Variable age mit folgenden Merkmalsausprägungen c(24, 30, 49, 35, 54, 56, 63, 71, 82, 39) zum Datensatz hinzu. 15 Führen Sie eine lineare Einfachregression durch, mit der Sie testen, ob das Alter einen Einfluss auf die Körpertemperatur hat. Interpretieren Sie das Ergebnis. 16 Plotten Sie Alter gegen Körpertemperatur und zeichnen Sie die Regressionsgerade in blau ein. Beschriften Sie die Grafik angemessen und speichern Sie sie als pdf ab. (HSU) Übung Emp. WiFo FT 2013 11 / 1