Literatur. Statistische Software (R-Vertiefung) Grafikausgabe. Übersicht von Grafikpaketen (nicht vollständig)

Ähnliche Dokumente
Allgemeines zu Grafiken. Statistische Software (R) Literatur. Übersicht von Grafikpaketen (nicht vollständig)

Statistische Software (R)

Statistische Software (R)

Grafiken mit R. Mike Kühne 1 R-Kurs

Datenaufbereitung, Grafische Datenanalyse

Kapitel 4. Grafiken in R. Vorlesung Programmieren in statistischer Software: R Sommersemester 2009

Univariate explorative Datenanalyse in R

Grundlagen der Bioinformatik Übung 5 Einführung in R. Ulf Leser, Yvonne Mayer

Grafiken. Session 4. > plot(x,y, xlab=, ylab= sin(x), main= Steps, Type 2, type= S )

Vorbereitungsseminar für Abschlussarbeiten

Grundlagen der Bioinformatik Assignment 4: Introduction to R. Yvonne Lichtblau SS 2017

Univariate explorative Datenanalyse in R

Eine Einführung in R: Deskriptive Statistiken und Graphiken

Bivariate explorative Datenanalyse in R

Datentypen und -strukturen. Statistische Software. Datenstrukturen in R. Datentypen in R. Micha Schneider

Eine Einführung in R: Deskriptive Statistiken und Graphiken

Statistik für Informatiker, SS 2017 Organisatorisches, ein Startbeispiel und eine sehr knappe R-Einführung

Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung

Grafische Darstellung bivariater Daten: Handwerkszeug der deskriptiven Statistik

Aufgaben. Frage: (Aufgabe 3) Warum findet R den Befehl approx.r nicht?

# Erforderlich da Leerstellen in einigen Elementen vorhanden sind kj = read.delim(file.path(pfad, "kj.txt"))

Einführung in die Angewandte Bioinformatik: Datenanalyse mit R

Statistische Software (R)

L A TEX-Tipps & knitr

Computergrundlagen Visualisierung II: Gnuplot und Engauge

Übungsaufgabe Parameter und Verteilungsschätzung

Einführung in die Grundlagen von Matlab. Ralph Neubecker

Computergrundlagen Visualisierung II: Gnuplot und Engauge

Softwarepraktikum. zu Elemente der Mathematik. Carsten Rezny Institut für angewandte Mathematik Universität Bonn

Syntax Variablen. mtrx <- matrix (c(1,2,3,4,5,6),ncol=2,nrow=3) Anzeigen des Types: class(var) Umwandeln mit: as.vector(mtrx)

Statistische Datenanalyse mit R, R-Studio. Dr. Andrea Denecke Leibniz Universität IT-Services

Texteingabe und -ausgabe in Kommandozeile

Klaus Schliep. 16. Februar 2004

L A T E X-Kurs. Teil 4 - Datenanalyse - Qti Plot. Fachschaft Physik Uni Konstanz WS 2015/16

Ferienkurse Mathematik Sommersemester 2009

7 Grafik in der Ebene (2D-Graphik)

Frage: Was kann man tun damit im stripchart bei vielen Punkten diese nicht übereinander gezeichnet werden?

Bivariate explorative Datenanalyse in R

Einführung in MATLAB

Daniel S. Steingrube Institut für Quantenoptik Leibniz Universität Hannover.

3.4 Bivariate Datenanalyse in R

Umfrage <- read.csv(" sep = ";", dec = ",")

Softwarepraktikum. zu Elemente der Mathematik. Carsten Rezny Institut für angewandte Mathematik Universität Bonn

Erstellen von graphischen Ausgaben

Erste Schritte mit R. 2.1 Herunterladen der freien Software R

Programmieren mit statistischer Software

Einführung in das Textsatzsystem L A TEX

Tutorial 002 Erstellen von Diagrammen nach den Vorgaben des CD

Programmieren in R - Lösungen zum Kapitel Data Analysis Christoph Rust Oktober 2018

Erwin Grüner

Projektarbeit UE Angewandte Statistik I MBIOB 17 Sommersemester 2015

Sozialwissenschaftliche Datenanalyse mit R

Workshop Statistik mit R

1. Aufgabenstellung. 2. Methode der Auswertung. 2.1 Die Theorie: 2.2 Der SAS-Quellcode:

Lösungen der Aufgaben zum Kapitel Data Analysis *

k-means Clustern in R

Einstieg in SPSS. Man kann auch für jede Ausprägung einer Variablen ein Wertelabel vergeben.

Kreisdiagramm, Tortendiagramm

Thomas Rahlf. Datendesign mit. 100 Visualisierungsbeispiele. 1. Auflage. Open Source Press

Einführung in GrapheR

Praktikum Beobachtungsnetze. Matlab in Versuch Hydrologie Hilfestellungen

EINFÜHRUNG IN DIE WISSENSCHAFTLICHE DATENANALYSE

Erstellen von Grafiken in Excel

R, Sweave und TikZdevice

Kennen, können, beherrschen lernen was gebraucht wird

Grafiken in R mit ggplot2

Beschriftungssoftware für Legrand Reiheneinbaugeräte

R starten (Arbeitsverzeichnis wählen, Workspace abspeichern, History abspeichern)

SIZ 422 Tabellenkalkulation. mit Excel Peter Wies. 1. Ausgabe, Mai 2016

Einführung in Excel. Zur Verwendung im Experimentalphysik-Praktikum. für Studierende im Sem. P3

Was ist R? Grundfunktionen in R Beispiele Zusammenfassung Literatur. Einführung in R. Michael Zwinkel

Bedienungsanleitung. DicksonWare (Deutsch) by MGS Europe GmbH all rights reserved

Einführung in R. 1 Literatur und Software 1

Kurzanleitung zur Erstellung eines Reports von ClassiX aus

0 Einführung: Was ist Statistik

Übungen zur Vorlesung. Statistik 2

R-Wörterbuch Ein Anfang... ein Klick auf einen Begriff führt, sofern vorhanden, zu dessen Erklärung.

Einführung in die Ökonometrie

Vorlesung Statistik SS 2006

SAS-Benutzertreff: Neuerungen SAS/GRAPH V8. Carina Ortseifen 1. Neuerungen im Modul SAS/GRAPH der Version 8. Inhalt. 1.

Einführung in das rechnergestützte Arbeiten

Ronny Timm, (s ) Marcel Piater, (s ) Mathematik Aufgabe zur tranzsendenten Funktion: y=2*sin(x)- exp(- x)

Basis-Kurs Statistik und SPSS für Mediziner Lösungen. SPSS-Übung Deskriptive Statistik

5 Exkurs: Deskriptive Statistik

Verallgemeinerung von Sin, Cos, Tan mit GeoGebra

Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung

ClassPad II. Einführung und Aufgaben

Auflistung der Objekte im Workspace object wird aus dem Workspace entfernt

Empirische Softwaretechnik

Kapitel 1: Deskriptive Statistik

27. Parametrisierungen In der letzten Serie haben wir den durch die Gleichung > Teq:=(3+z^2)^2+(x^2+y^2)^2+2*(x^2+y^2)*(z^2-5)=0;

Statistische Datenanalyse mit R. Dr. Andrea Denecke Leibniz Universität IT-Services

2015/03/12 18:36 1/12 Stil

Box-Plots. Werkzeuge der empirischen Forschung. W. Kössler. Einleitung. Datenbehandlung. Wkt.rechnung. Beschreibende Statistik 174 / 258

TFT Display Konfigurationsprogramm 99pkd B 99pkd Seite 1 von 5

gnuplot Tool zum 2- und 3-dimensionalen Plotten von Daten: Funktionen und Datenfiles. Einfache Fits von Funktionen Viele Ausgabeformate:

Numerik-Programm, mittlerweile mit vielen Erweiterungen (Toolboxen) Matlab = Matrix Laboratory Sehr gute Doku (doc, help, lookfor)

Transkript:

Literatur Statistische Software (R-Vertiefung) Paul Fink, M.Sc. Institut für Statistik Ludwig-Maximilians-Universität München R Graphics Second Edition by Paul Murrel Link zu den im Buch dargestellten Grafiken und dem zugehörigem R code: http://www.stat.auckland.ac.nz/~paul/rg2e/ Grafik Fink: Statistische Software (R) SoSe 2013 1 Übersicht von Grafikpaketen (nicht vollständig) Grafikausgabe Die Grafikausgabe von R erfolgt in ein sogenanntes Gerät (Device) Ein Gerät ist zum Beispiel ein Fenster auf dem Bildschirm oder eine Datei Es stehen dabei zum Beispiel folgende Geräte zur Verfügung: bitmap(), jpeg(), pdf(), pictex(), png(), postscript(), xfig(), x11() bzw. X11(). Das Zusatzpaket tikzdevice stellt zusätzlich die Funktion tikzdevice() zur Verfügung, um Grafikcode direkt in TikZ- Code umzuwandeln zum Weiterverwenden mit LAT E X. Ist auf CRAN nicht mehr verfügbar, jedoch weiterhin unter R-Forge. Fink: Statistische Software (R) SoSe 2013 2 Fink: Statistische Software (R) SoSe 2013 3

Grafikausgabe Unter Windows(TM) gibt es auch noch bmp() und win.metafile(). Beispiel: x11() öffnet ein Grafikfenster auf dem Bildschirm und dev.off() schließt das Fenster wieder. Beispiel: Zeichnen der Dichte der Standard-Normalverteilung auf dem Bildschirm mit der Grafikfunktion curve(). x11() curve(from = -3, to = 3, dnorm(x), ylab = "Dichte der N(0,1)-Verteilung") Grafikausgabe Statt auf dem Bildschirm, lassen wir uns die Grafik direkt in ein gewünschtes Dateiformat ausgeben, zum Beispiel PDF oder Postscript. pdf(file="dichten01.pdf") curve(from=-3, to=3, dnorm(x), ylab="dichte der N(0,1)-Verteilung") dev.off() Die Datei "dichten01.pdf" wird dabei im aktuellen Arbeitsverzeichnis angelegt. Sie können das Ergebnis z.b. mit dem Acrobat Reader betrachten. Die Postscript-Version geht ganz analog: postscript(file="dichten01.ps") curve(from = -3, to = 3, dnorm(x), ylab = "Dichte der N(0,1)-Verteilung") dev.off() Fink: Statistische Software (R) SoSe 2013 4 Fink: Statistische Software (R) SoSe 2013 5 Grafikausgabe Traditionelle Grafiken (graphics Paket) Dichte der N(0,1) Verteilung 0.0 0.1 0.2 0.3 0.4 3 2 1 0 1 2 3 x Bei der Ausgabe in eine Datei muss dass Gerät immer geschlossen werden mit dev.off()! Erst beim Schließen wird die Grafik in die Datei gespeichert. Zunächst lassen sich die traditionellen Grafik Funktionen in zwei Klassen unterteilen high-level Grafik-Funktionen erstellen vollständige Grafiken, z.b. Streudiagramme, Boxplots, Histogramme, etc. low-level Grafik-Funktionen bieten zum einen eine feinere Kontrolle von Details und zum anderen die Möglichkeit zusätzliche Elemente, z.b. beschreibende Etiketten, zusätzliche Linien, etc., zu einer bestehenden Grafik hinzuzufügen. Grafiken selber zusammen stellen nach dem Baukasten- Prinzip. Fink: Statistische Software (R) SoSe 2013 6 Fink: Statistische Software (R) SoSe 2013 7

Die plot() Funktion Die plot() Funktion ist generisch Die plot() Funktion ist die wichtigste high-level Funktion im traditionellen Grafik System. In vielen Fällen ist es die einfachste Variante um vollständige Grafiken zu erstellen. Die folgenden drei Befehle erstellen identische Streudiagramme. > plot(pressure) > plot(pressure$temperature, pressure$pressure) > plot(pressure ~ temperature, data = pressure) In der ersten Variante werden alle darzustellenden Datenpunkte in einem Objekt der Klasse data.frame mit zwei Variablen übergeben. In der zweiten Variante werden die x- und y-werte einzeln an die Argumente übergeben. Die dritte Variante verwendet eine Formel der Form y ~ x und zusätzlich die Daten in denen die Variablen enthalten sind. Die plot() Funktion kann mit denselben Daten auf unterschiedliche Weise aufgerufen werden und liefert ein identisches Ergebnis. Abhängig vom Typ der Daten werden von plot() unterschiedliche Grafiken erzeugt, wird z.b. für ein Objekt der Klasse "factor" an das Argument x übergeben, so wird direkt ein Balkendiagramm erstellt (siehe?plot.factor). Fink: Statistische Software (R) SoSe 2013 8 Fink: Statistische Software (R) SoSe 2013 9 Diagramme für eine Variable Diagramme für zwei Variablen Funktion Daten Beschreibung Funktion Daten Beschreibung plot() numeric Scatterplot plot() factor Barplot plot() 1-D table Barplot barplot() numeric (Höhe der Balken) Barplot pie() numeric Pie chart dotchart() numeric Dotplot boxplot() numeric Boxplot hist() numeric Histogramm stripchart() numeric 1-D scatterplot stem() numeric Stem-and-leaf plot plot() numeric, numeric Scatterplot plot() numeric, factor Stripcharts plot() factor, numeric Boxplots plot() factor, factor Spineplot plot() 2-D table Mosaic plot sunflowerplot() numeric, numeric Sunflower Scatterplot smoothscatter() numeric, numeric Smoothed scatterplot boxplot() list of numeric Boxplots barplot() matrix Stacked/side-by-side Barplot dotchart() matrix Dotplot stripchart() list of numeric Stripcharts spineplot() numeric, factor Spinogram cdplot() numeric, factor Conditional density plot fourfoldplot() 2x2 table Fourfold display assocplot() 2-D table Association plot mosaicplot() 2-D table Mosaic plot Fink: Statistische Software (R) SoSe 2013 10 Fink: Statistische Software (R) SoSe 2013 11

Diagramme für viele Variablen Spezielle Plots Funktion Daten Beschreibung plot() data frame Scatterplot Matrix pairs() matrix Scatterplot Matrix matplot() matrix Scatterplot stars() matrix Star plots image() numeric, numeric, matrix Image plot contour() numeric, numeric, matrix Contour plot filled.contour() numeric, numeric, matrix Filled contour persp() numeric, numeric, matrix 3-D surface symbols() numeric, numeric, numeric Symbol scatterplot coplot() formula Conditioning plot Das traditionelle Grafik System und Pakete, die darauf aufbauen, beinhalten eine Vielzahl an Funktionen um spezielle Grafiken zu erzeugen. Die meisten dieser Funktionen sind Variationen des einfachen Streudiagramms mit Punkten/Linien in kartesischen Koordinaten. Z.B. qqplot und qqnorm werden verwendet um beobachtete Werte gegen Werte einer theoretischen Verteilung abzutragen. mosaicplot() N-D table Mosaic plot Fink: Statistische Software (R) SoSe 2013 12 Fink: Statistische Software (R) SoSe 2013 13 Argumente für Grafikfunktionen Oft möchte man nur kleine Anpassugen an den Grafiken vornehmen, wie zum Besipiel den Titel oder die Achsenbeschriftung änderen oder die Plot-Region. Argument main xlab, ylab xlim, ylim cex cex.main, cex.axis, cex.lab col axes xaxt="n", yaxt="n" lty, lwd type Beschreibung Haupttitel der Grafik Titel der X-Achse bzw Y-Achse Vektor mit Minimum/Maximum für Werte in der Plot-Region in X bzw. Y Richtung Generelle Vergrößerung Vergrößerung von Titel, Achsenbeschriftung und -titeln relativ zu cex Farbe der Objekte in der Plot-Region Kann auch wie cex auf Titel und Achsen angewendet werden Bei FALSE werden keine Achsen eingezeichnet Kein Einzeichnen von X bzw. Y-Achse Linientyp, Linienbreite "p": Punkte, "l": Linien, "b": Punkte und Linien, "h": Stäbe, "n": Nichts einzeichen Das type Argument > y <- rnorm(20) > plot(y, type = "p") > plot(y, type = "l") > plot(y, type = "b") > plot(y, type = "h") In Abhängigkeit vom type Argument werden die x- und y-werte unterschiedlich interpretiert, für type = "p" wird ein Streudiagramm dargestellt, x- und y-werte repräsentieren die Koordinaten der Punkte, type = "l" oder type = "o" wird ein Liniendiagramm dargestellt, x- und y-werte werden durch eine Linie verbunden, type = "h" wird ein Stabdiagramm dargestellt, wobei die x- Werte die Position der Stäbe und die y-werte die Höhe der Stäbe liefern. Fink: Statistische Software (R) SoSe 2013 14 Fink: Statistische Software (R) SoSe 2013 15

Weitere Elemente hinzufügen: low-level Globale Konfiguration Funktion Beschreibung points() Punkte an Stellen (x, y) lines() Linien zwischen den Stellen (x, y) segments() Liniensegmente, ausgehend von (x0, y0) zu allen Punkten in (x, y) arrows() ähnlich wie segements, nur mit Pfeilspitzen an dem/n Ende/n xspline() Geglättete Kurve durch die Punkte (x, y) rect() Rechteck, mit linker unterer Ecke (xl, yb) und recher oberer Ecke (xr, yt) polygon() Polygonzug mit Knoten in (x, y) text() Text hinzufügen an Position (x, y) title() Beschriftung zur Grafik hinzufügen (Titel und/oder Achsen) axis() Achsen hinzufügen; X-Achse: side="1", Y-Achse: side="2" abline() Eine oder mehrere Geraden grid() Gitternetz Das Grafiklayout kann man durch setzten von Grafikparametern in der Funktion par ändern. Dazu muss par(grafikparameter1 = Wert1, usw.) vor der ersten Grafikfunktion aufgerufen werden Hier nur ein Überblick über die wichtigsten Parameter Parameter ask cex las mfrow, mfcol new xaxp, xaxs, xaxt, xlog yaxp, yaxs, yaxt, ylog Beschreibung Wenn TRUE, Zeichnen eines neuen Plots durch die Drücken der Eingabetaste Vergrößerung (siehe Tabelle davor) Ausrichtung der Achsenbeschriftung Mehrere Grafiken in einem Display, Vektor der Form c(nr, nc), Einzeichen zeilen- bzw. spaltenweise Wenn TRUE, dann wird Grafikdisplay nicht geleert Konfiguration der x-achse Konfiguration der y-achse Fink: Statistische Software (R) SoSe 2013 16 Fink: Statistische Software (R) SoSe 2013 17 Mathematische Ausdrücke in Grafiken Legenden Beispiel: Beispiel aus?plotmath: > x <- seq(-4, 4, len = 101) > y <- cbind(sin(x), cos(x)) > matplot(x, y, type = "l", xaxt = "n", + main = expression(paste(plain(sin) * phi, " and ", + plain(cos) * phi)), + ylab = expression("sin" * phi, "cos" * phi), # only 1st is taken + xlab = expression(paste("phase Angle ", phi)), + col.main = "blue") > axis(1, at = c(-pi, -pi/2, 0, pi/2, pi), + labels = expression(-pi, -pi/2, 0, pi/2, pi)) > with(iris, + plot(sepal.length, Sepal.Width, + pch = as.numeric(species), cex = 1.2)) > legend(6.1, 4.4, c("setosa", "versicolor", "virginica"), + cex = 1.5, pch = 1:3) Achtung: Es nicht sichergestellt, dass die Legende zur Grafik passt. Stimmen die Symbole? Stimmen die Bezeichnungen? Dies liegt in der Verantwortung des Anwenders. Die Zusatzpakete lattice und ggplot2 bieten mehr Unterstützung. Online Dokumentation: http://had.co.nz/ggplot2/ by Hadley Wickham Fink: Statistische Software (R) SoSe 2013 18 Fink: Statistische Software (R) SoSe 2013 19

Umgang mit Farben Interaktive Grafiken Farben sind sehr hilfreich in Grafiken, jedoch sollte man aufpassen, welche man verwendet. Übersicht über die built-in Farben in R: colors() Zum Umgang mit Farben: Präsentation von Achim Zeileis (2010) Präsentation von Paul Murrel (2002) Online Colorbrewer: http://colorbrewer2.org/ Die Wahl hängt aber auch immer von dem Gerät ab für das die Grafik verwendet wird, i.e. Beamer, Ausdruck in verschiedenen Qualitäten In R werden hauptsächlich statische Grafiken erstellt. Interaktivität kann erreicht werden, wenn man vor Erstellung mehrerer Plots par(ask=true) setzt: Eine neue Grafik wird dann nur nach Betätigung der Eingabetaste (Return) erstellt. Interaktive Bestimmung von Punkten innerhalb einer bereits erstellten Grafik geht über die Funktionen identify und locator. Achtung: Beide Funktionen sind fehlerbehaftet und sollten vermieden werden! Das Paket iplots bietet interaktive Grafiken: http://www.rosuda.org/iplots/ Fink: Statistische Software (R) SoSe 2013 20 Fink: Statistische Software (R) SoSe 2013 21 Exkurs: Aufbau von Grafiken Eine traditionelle R-Grafik hat den folgenden Aufbau: Exkurs: Aufbau von Grafiken Für mehrere Grafiken sieht es dann so aus: Outer margin 3 Outer margin 3 Figure Region Figure 1 Figure 2 Current Figure Region Outer margin 2 Plot Region Outer margin 4 Outer margin 2 Current Plot Region Figure 4 Outer margin 4 Figure 5 Figure 6 Outer margin 1 Outer margin 1 Fink: Statistische Software (R) SoSe 2013 22 Fink: Statistische Software (R) SoSe 2013 23

Exkurs: Aufbau von Grafiken Die Darstellung innerhalb einer Figure hat den Aufbau: Max y value y i The location (x i, y i) Min y value Min x value x i Max x value Fink: Statistische Software (R) SoSe 2013 24