Übung Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung BACHELOR FT 2013 (HSU) Übung Emp. WiFo FT 2013 1 / 15
Datensätze Statistische Auswertungen gehen in den meisten Fällen von einer Datentabelle aus. Name Geschlecht Beruf Alter Peter m Arzt 45 Lydia w Arbeitslos 28 Elfriede w Rentner 68 Auszug Datensatz 1 (HSU) Übung Emp. WiFo FT 2013 2 / 15
Daten einlesen Daten können aus einer Text- oder aus einer csv-datei in R importiert werden. Folgende Fragen müssen beim Datenimport beantwortet werden: Stehen in der ersten Zeile des Datensatzes die Spaltenüberschriften? header=true oder FALSE Durch welches Zeichen werden die Spalten getrennt? sep= oder ; oder Welches Dezimalzeichen wird verwendet? dec=, oder. Beispiel für den Import einer Textdatei: Daten < read.table( Dateiname.txt, header=true, sep=, dec=, ) Beispiel für den Import einer csv-datei: Daten < read.csv( Dateiname.csv, header = TRUE, sep = ;, dec=. ) (HSU) Übung Emp. WiFo FT 2013 3 / 15
Datensatz 1 importieren 1 Laden Sie den Datensatz 1 von der Lehrstuhl-Homepage herunter und speichern Sie ihn im Ordner ÜbungEmpWiFo ab. 2 Öffnen Sie die Textdatei und beantworten Sie die Fragen zur Struktur des Datensatzes. 3 Importiern und speichern Sie die Datei in R unter data (HSU) Übung Emp. WiFo FT 2013 4 / 15
Datenstruktur Dimension des Datensatzes: dim(data) Auf bestimmte Daten zugreifen Die erste Spalte: data[,1] alternativ data$name Die erste Zeile: data[1,] Die ersten zehn Werte in Spalte 2: data[1:10,2] alternativ data$geschlecht[1:10] (HSU) Übung Emp. WiFo FT 2013 5 / 15
Datenaufbereitung Ausgewählte Spalten sortieren: aufsteigend: sort(x) Datensatz sortieren nach einer Spalte sortieren: data[order(data$alter),] Anzeigen doppelter Werte: duplicated(x) Welche Werte kommen vor?: unique(x) Auswahl Daten, die bestimmte Bedingung(en) erfüllen: which(x==3) subset(data,x==3) (HSU) Übung Emp. WiFo FT 2013 6 / 15
Lage-, Streu- und Zusammenhangsmaße Mittelwert: mean(x) Spannweite: range(x) Standardabweichung: sd(x) Median: median(x) Varianz: var(x) Zusammenfassung: summary(x) Absolute Häufigkeiten: table(x) bzw. table(x,y) (HSU) Übung Emp. WiFo FT 2013 7 / 15
Datensatz erweitern (cbind(data,x),rbind(data,x)) Neue Variablen können als Spalte zum Datensatz hinzugefügt werden. Neue Beobachtung können als Zeile zum Datensatz hinzugefügt werden. Neuen Datensatz erstellen: dataneu< data.frame(x,y) (HSU) Übung Emp. WiFo FT 2013 8 / 15
Übungsaufgabe 2 1 Lassen Sie sich die ersten sechs Zeilen des Datensatzes data anzeigen. 2 Wie hoch ist das Jahreseinkommen von Beobachtung Nr. 16? 3 Sortieren Sie den Datensatz aufsteigend nach dem Jahreseinkommen. 4 Welche Jahreseinkommen kommen im Datensatz vor? 5 Wie viele unterschiedliche Jahreseinkommen gibt es im Datensatz? 6 Welche Personen sind 28 Jahre alt und haben weniger als 50 000 Euro Jahreseinkommen? 7 Bestimmen Sie das durchschnittliche Jahreseinkommen der Männer. 8 Erstellen Sie eine Häufigkeitstabelle für die Variable Beruf mit absoluten Häufigkeiten und eine mit relativen Häufigkeiten. (HSU) Übung Emp. WiFo FT 2013 9 / 15
Grafische Darstellung R bietet eine große Auswahl an Grafiktypen. Grafiktypen: Allgemeine Scatterplots: plot() Balkendiagramm: barplot() Kuchendiagramm: pie() Histogramm: hist() (HSU) Übung Emp. WiFo FT 2013 10 / 15
Grafiken: Zusätzliche Argumente Titel: main= Titel Untertitel: sub= Untertitel Größe Untertitel: cex.sub=... Achsenbeschriftung: xlab= Titel x-achse, ylab= Titel y-achse Größe Achsenbeschriftung: cex.names=... Achsenformatierung: xlim=c(min,max), ylim=c(min,max) Axen ausblenden: axes=false Linie oder Punkte: type= l oder type= p (HSU) Übung Emp. WiFo FT 2013 11 / 15
Grafiken: Zusätzliche Argumente Punkt hinzufügen mit den Koordination (x, y): points(x,y) Linie hinzufügen: lines(data$spaltenname,data$spaltenname) Gerade mit Achsenabschnitt a und Steigung b: abline(a,b) Horizontale Linie: abline(h=...) Beispiel: plot(data$spaltenname, data$spaltenname, type= l,xlab= Monat,colour= red,ylim=c(-5,5), main= Titel ) (HSU) Übung Emp. WiFo FT 2013 12 / 15
Plots: Weitere Funktionen (Parameter) Während Sie diese Einstellungen direkt als Argument in die Funktion plot() eingeben, gibt es weitere Einstellungen, die vor der Grafikerstellung mit dem Befehl par() gesetzt werden, z.b. Mehrere Grafiken neben/-untereinander: par(mfrow=c(2,2)) Hintergrundfarbe: par(bg= blue, red... ) Achsenskalierung logarithmisch: par(xlog,ylog) (HSU) Übung Emp. WiFo FT 2013 13 / 15
Plots: Grafiken als pdf drucken Sie können erstellte Grafiken ganz bequem als pdf von R drucken lassen Setzen Sie pdf( Grafikname.pdf ) vor der Grafikerstellung Dann Grafikerstellung schließen um pdf drucken zu lassen: graphics.off() Auch möglich: jpeg(), png() (HSU) Übung Emp. WiFo FT 2013 14 / 15
Übungsaufgabe 3 1 Erstellen Sie eine Grafik zum Jahreseinkommen der älteren Hälfte der Bevölkerung (s. Median).Die Punkte sollen blau sein und die Stärke 3 haben. Beschriften Sie die Grafik (Diagrammtitel und Achsenbeschriftung. 2 Zeichnen Sie in die Grafik das Durchschnittsjahreseinkommen der Gesamtbevölkerung mittels einer gestrichelten farbigen Gerade ein 3 Erstellen Sie ein sortiertes Balkendiagramm der ersten zehn Jahreseinkommen und hinterlegen Sie die Grafik grün. 4 Erstellen Sie untereinander ein Histogramm der absoluten Häufigkeiten und ein Boxplot Diagramm der Jahreseinkommen. 5 Speichern Sie beide Grafiken als pdf in Ihren Ordner. (HSU) Übung Emp. WiFo FT 2013 15 / 15