Download Aufruf Hilfe Objekte in R Datenimport Rechnen Grafik Verteilungen. R Grundlagen

Ähnliche Dokumente
Der Download von R erfolgt über die homepage

Softwarepraktikum. zu Elemente der Mathematik. Carsten Rezny Institut für angewandte Mathematik Universität Bonn

Statistik für Informatiker, SS 2017 Organisatorisches, ein Startbeispiel und eine sehr knappe R-Einführung

Klaus Schliep. 16. Februar 2004

Softwarepraktikum. zu Elemente der Mathematik. Carsten Rezny Institut für angewandte Mathematik Universität Bonn

IDE Grundlagen Vektoren Matrizen Faktoren Dataframes Visualisierung Tips. Quick & dirty

Demographie III Übung

Lineare Algebra mit dem Statistikprogramm R

R Befehle SS min(x) Bestimmt das Minimum von x Bestimmt die Anzahl der sum(x<=4) Werte von x, die kleiner oder max(x) Bestimmt das Maximum von x

Eine Einführung in R: Dichten und Verteilungsfunktionen

Eine Einführung in R: Dichten und Verteilungsfunktionen

Einführung in die formale Demographie Übung

Statistische Software (R)

Einführung in die Angewandte Bioinformatik: Datenanalyse mit R

Mit R können Rechenoperationen durch direkte Eingabe durchgeführt werden. Beispiel >(3*(5+7)^4)/3 [1] 20736

Einführung in R. 17. April Emacs mit Erweiterung ESS (

Eine Einführung in R: Grundlagen I

Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung

Lösungen zur Hausaufgabe Statistik für Hydrologen 2016

Eine Einführung in R: Grundlagen I

Eine Einführung in R: Dichten und Verteilungsfunktionen

Erwin Grüner

Einführung in die Programmierumgebung R Michael Wenk

Statistische Software (R)

Präsenzübung (Einführung in R) Übung zur Vorlesung Statistik I für Biowissenschaften WS 2016/2017

W-Rechnung und Statistik für Ingenieure Übung 2

Material zur Vorlesung Räumliche Statistik

Syntax Variablen. mtrx <- matrix (c(1,2,3,4,5,6),ncol=2,nrow=3) Anzeigen des Types: class(var) Umwandeln mit: as.vector(mtrx)

Ferienkurse Mathematik Sommersemester 2009

W-Rechnung und Statistik für Ingenieure Übung 8

Musterlösung der Aufgaben vom 14.3.

Einheit 1. Einführung in R. IFAS JKU Linz c 2018 Programmieren mit Statistischer Software 1 0 / 11

Bivariate explorative Datenanalyse in R

Grafiken. Session 4. > plot(x,y, xlab=, ylab= sin(x), main= Steps, Type 2, type= S )

Einführung in die Ökonometrie

Aufgaben zur Vorlesung Statistische Analyse von Systemen

Mathematische Methoden Physik I, WS06/07 Kompaktkurs Mathematica,

Wichtige Befehle in R zur Datenanalyse Ergänzende Unterlagen zur Vorlesung Prof. Dr. Oliver Gansser

Running R. Windows Aus Menü. Lese R Code ein führt den Code auch gleich aus, eventuell muss vorher das Verzeichnis gewechselt werden.

Einführung in R. Marius Hofert. Ulm University

Statistische Software (R)

Statistische Software (R)

Empirische Softwaretechnik

Theorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte

R Einstieg. Manuel Eugster, Armin Monecke, Faban Scheipl. Institut für Statistik Ludwig-Maximilians-Universität München.

Einführung. Statistische Software. Was ist R? Wie installiere ich R? Micha Schneider. Institut für Statistik Ludwig-Maximilians-Universität München

Musterlösung zur Übungsklausur Statistik

Workshop Statistik mit R

Programmieren mit statistischer Software

Lösungen der Aufgaben zum Kapitel Data Analysis *

Datenaufbereitung, Grafische Datenanalyse

3.4 Bivariate Datenanalyse in R

Übersicht deskriptiver Maße & anderer. Nützliche Funktionen. Statistische Software (R-Vertiefung) artihmetische Mittel median() mean()

Univariate explorative Datenanalyse in R

R starten (Arbeitsverzeichnis wählen, Workspace abspeichern, History abspeichern)

Datenformat zum Import von CSV-Dateien

Datenanalyse und Programmierung in R eine Einführung 1

Univariate explorative Datenanalyse in R

Übersicht deskriptiver Maße & anderer. Nützliche Funktionen. Statistische Software (R-Vertiefung) artihmetische Mittel median() mean()

Einführung in R. Universität Konstanz SS 2010

Programmieren in R - Lösungen zum Kapitel Data Analysis Christoph Rust Oktober 2018

Einführung in. Pierre Bayerl

Demographie III Übung

R-Tutorial. R bietet zahlreiche Hilfe-Funktionen an. Informiere Dich über die Funktion log():

Programmieren mit statistischer Software

Vorbereitungsseminar für Abschlussarbeiten

Einführung in MATLAB

ClassPad- Workshop Wahrscheinlichkeit. Merkblatt zu Wahrscheinlichkeiten mit dem ClassPad

Angewandte Statistik mit R

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn

Statistik & Graphiken in R Forschungsorientierte Vertiefung Methodenlehre

Programmieren mit statistischer Software

1. Was ist eine Wahrscheinlichkeit P(A)?

$Strasse [1] "Autobahn" "Landstr" "Nebenstr" "Autobahn" "Landstr" "Nebenstr" [7] "Autobahn" "Landstr" "Nebenstr" "Autobahn" "Landstr" "Nebenstr"

Datenformat zum Import von CSV-Dateien

Aufbau des Minitab-Bildschirms. TQU-Schulungsunterlagen. TQU-Akademie 1. Einführung Minitab

1. Übungsblatt zu Wahrscheinlichkeitsrechnung und Statistik in den Ingenieurswissenschaften

Zugriff auf die swhv-mitgliederverwaltung

Einführung in die Ökonometrie - Übung

Erste Schritte mit R. 2.1 Herunterladen der freien Software R

Statistische Datenanalyse mit R. Dr. Andrea Denecke Leibniz Universität IT-Services

Inhaltsverzeichnis. Vorwort. Abbildungsverzeichnis. Tabellenverzeichnis. 1 Einleitung Gegenstand Aufbau 4

Einführung in R. 1 Download und Installation. 2 Starten und Beenden. Stephan Petsch. 2.1 Im Rechnerpool. 2.2 In Windows

Lösungen zu Übungsblatt 9 Höhere Mathematik2/Stochastik 2 Master KI/PI

Erwin Grüner

ETSApp DALI Daten Import

Inhaltsverzeichnis. Bibliografische Informationen digitalisiert durch

Modul G d) Gibt es einen Größen- bzw. Altersunterschied zwischen den anwesenden Männern und Frauen?

Mathematische Computer-Software

MATLAB-Tutorium WS18 Nathalie Marion Frieß

R-Wörterbuch Ein Anfang... ein Klick auf einen Begriff führt, sofern vorhanden, zu dessen Erklärung.

Angewandte Statistik mit R. Eine Einführung für Ökonomen und

Programmiervorkurs für die Numerik Teil 2/4

FUNKTIONEN UND FORMELN IN

Übersicht deskriptiver Maße & anderer. Nützliche Funktionen. Statistische Software (R) artihmetische Mittel median() mean()

FORMELN IN. Referent: Daniel Laskow Betreuer: Eugen Betke Programmierung in R Arbeitsbereich Wissenschaftliches Rechnen Universität Hamburg

Transkript:

R Grundlagen A. Gebhardt 6. Juni 2013/ R Institut für Statistik Universität Klagenfurt Universitätsstr. 65-67, A 9020 Klagenfurt albrecht.gebhardt@uni-klu.ac.at 1 / 27

Inhalt 1 Bezugsquelle 2 Aufruf 3 Hilfe 4 Objekte in R Vektoren Matrizen Datensätze Elementzugriff 5 Datenimport 6 Rechnen 7 Grafik 8 Verteilungen 2 / 27

Bezugsquelle R - Download R ist Free Software und steht unter GPL Programm, Quelltext, Dokumentation, Zusatzpakete usw. findet man unter http://cran.r-project.org CRAN = Comprehensive R Archive Network Zusatzpakete kann man später direkt aus R heraus mit install.packages(...); update.packages(...) installieren und updaten. 3 / 27

Aufruf Start von R R ist eine kommandozeilenorientierte Anwendung! Windows:... im Menü Unix: R MacOS:... Eingaben erfolgen danach am R Prompt: > Mittel ESS 1 läuft R auch im GNU Emacs: Alt-X R 1 http//ess.r-project.org/ 4 / 27

Hilfe Hilfe Hilfe zu Kommandos und Begriffen bekommt man mittels help.start() Anzeige im Browser?cmdname oder help(cmdname) zum Kommando cmdname als Textfile im R (oder nach help.start() im schon laufenden Browserfenster) apropos(muster) Suche nach Hilfeseiten über deren Namen help.search(stichwort) Suche in den Hilfeseiten 5 / 27

Objekte in R Vektoren Übersicht 1 Bezugsquelle 2 Aufruf 3 Hilfe 4 Objekte in R Vektoren Matrizen Datensätze Elementzugriff 5 Datenimport 6 Rechnen 7 Grafik 8 Verteilungen 6 / 27

Objekte in R Vektoren Vektoren werden durch Zusammenfügen (concatenate) von Einzelwerten gleichen Typs erzeugt: > x <- c(1,2,3,4,5) Einzelwerte können u.a. numerisch (ganzzahlig, reell, komplex) Text ("... text") logisch (TRUE, FALSE) sein Zuweisungsoperator (allgemein) ist <- (oder ->, oder in neueren R Versionen auch = ) Anzeige einer Variablen (allgemein) Eingabe des Namens > x [1] 1 2 3 4 5 7 / 27

Objekte in R Matrizen Übersicht 1 Bezugsquelle 2 Aufruf 3 Hilfe 4 Objekte in R Vektoren Matrizen Datensätze Elementzugriff 5 Datenimport 6 Rechnen 7 Grafik 8 Verteilungen 8 / 27

Objekte in R Matrizen enstehen durch Matrizen zeilen/spaltenweises Einsortieren von Vektoren: > M <- matrix(c(1,2,3,4,5,6), nrow=2, ncol=3) > M [,1] [,2] [,3] [1,] 1 3 5 [2,] 2 4 6 zeilen/spaltenweises Zusammenkleben von Vektoren: > M1 <- cbind(c(1,2,2), c(2,2,3)) > M1 [,1] [,2] [1,] 1 2 [2,] 2 2 [3,] 2 3 > M2 <- rbind(c(1,0,1), c(0,1,0)) > M2 [,1] [,2] [,3] [1,] 1 0 1 [2,] 0 1 0 9 / 27

Objekte in R Datensätze Übersicht 1 Bezugsquelle 2 Aufruf 3 Hilfe 4 Objekte in R Vektoren Matrizen Datensätze Elementzugriff 5 Datenimport 6 Rechnen 7 Grafik 8 Verteilungen 10 / 27

Objekte in R Datensätze data frames gebräuchlichster Datentyp: data.frame Tabelle mit mehreren Spalten unterschiedlichen(!) Typs erzeugbar mittels data.frame(spname1=vektor1, SpName2=Vektor2,...), z.b. > daten <- data.frame(var1=c(1,2,3),var2=c("a","b","c")) entstehen beim Importieren von Datenfiles 11 / 27

Objekte in R Elementzugriff Übersicht 1 Bezugsquelle 2 Aufruf 3 Hilfe 4 Objekte in R Vektoren Matrizen Datensätze Elementzugriff 5 Datenimport 6 Rechnen 7 Grafik 8 Verteilungen 12 / 27

Objekte in R Elementzugriff Zugriff auf Elemente Vektorelement: x i : x[i] Matrixelement: M i,j : M[i,j] Bereiche: x[2:4], M[2:3,3:5], Spalten 3 bis 5 M[,3:5], Zeilen 1 und 2 M[c(1,2),] mittels logischer Verknüpfungen, z.b. > x[ x>2 ] # alle Werte von x mit x>2 [1] 3 4 5 > x[ x>2 ] <- 2 * x[x>2] # verdopple alle Werte von x mit x>2 > x [1] 1 2 6 8 10 13 / 27

Objekte in R Elementzugriff Zugriff auf Elemente eines data.frame wie bei Matrizen oder: auf Spalten über Spaltennamen: > daten$var1 # ganze Spalte "Var1" [1] 1 2 3 > daten$var2[3] # drittes Element von Spalte "Var2" [1] c Levels: a b c ohne den Namen der data.frame Variablen nach attach(): attach(daten) Var1 detach(daten) str() liefert Informationen über Variablen: > str(daten) 'data.frame': 3 obs. of 2 variables: $ Var1: num 1 2 3 $ Var2: Factor w/ 3 levels "a","b","c": 1 2 3 14 / 27

Datenimport Datenimport Bevorzugte Datenformate simples Textfile mit Tabelle (Spalten per whitespace getrennt), optional mit Spaltennamen in Zeile 1, optional mit as.is=t (ohne Typwandlung) > daten <- read.table("data.txt", header=true, as.is=true) CSV (comma separated values), Tabellenkalkulationen exportieren bevorzugt in dieses Format: > daten <- read.csv("data.csv", sep=";", dec=",") für deutschsprachiges Excel oder OpenCalc: Trennzeichen ;, Dezimalpunkt,, Spaltenüberschr.: ebenfalls optional, wie oben 15 / 27

Datenimport Bsp: Daten erfassen mit Tabellenkalkulation (in der LV Gruppe): Alter, Größe, Geschlecht, Wegzeit zur Uni, Wegstrecke zur Uni, Verkehrsmittel als CSV exportieren in R einlesen, anzeigen, usw. 16 / 27

Datenimport Bsp: z.b. folgenden Datensatz verwenden: Kodierung der Verkehrsmittel Spalte: Fussgänger F, Fahrrad FR, Auto A, ÖPNV Ö, Strecke d in km, Zeit t in min 17 / 27

Rechnen Rechnen in R elementweise Operationen (für Vektoren und Matrizen): +,-,*,/,^,&, weitere Operationen mit Vektoren: sum(), prod(), cumsum(), mean(),... Matrixoperationen Multiplikation %*% (bei passender Dimension) > M3 <- M2 %*% M1 > M3 [,1] [,2] [1,] 3 5 [2,] 2 2 Invertieren: solve() (falls quadratisch und nicht singulär) > Inv <- solve(m3) > Inv [,1] [,2] [1,] -0.5 1.25 [2,] 0.5-0.75 18 / 27

Rechnen Bsp: Berechnen Sie: Gesamtstrecke zurückgelegter km aller Studierenden für Datensatz Durchschnittsgröße, mittlere Strecke, mittlere Zeit Vektor der Durchschnittsgeschwindigkeiten 19 / 27

Optionen: type="l" (Linien), col="red" (farbig), usw. 20 / 27 Grafik Grafik Punkte (x i, y i ) zeichnen > plot(daten$dist,daten$time) daten$time 10 20 30 40 50 60 0 10 20 30 40 daten$dist Abbildung: x-y-plot

Abbildung: Funktionsplot 21 / 27 Grafik Funktionsdarstellungen Funktionen plotten: curve() > opar <- par(mfrow=c(1,2)) > curve(sin(x), -pi, pi) > curve(dnorm(x,0,1), -3, 3) > par(opar) sin(x) 1.0 0.5 0.0 0.5 1.0 dnorm(x, 0, 1) 0.0 0.1 0.2 0.3 0.4 3 2 1 0 1 2 3 x 3 2 1 0 1 2 3 x

Grafik Plots modifizieren points(x1,y1) # zusätzliche Punkte lines(x2,y2) # zusätzliche Linien, plot(..., add=true) # anderen Plot drüberzeichnen xlab("text") # Achsenbeschriftung title("titel") # Ueberschrift x11() # neues Plotfenster (Unix) windows() # -"- par(mfrow=c(zeilen, spalten)) # Plotbereich aufteilen spezielle Plots: Histogramm hist() 22 / 27

Grafik Bsp: Erstellen Sie zum Datensatz einen Plot der Strecke und Zeit gegenüberstellt. 23 / 27

Verteilungen Zugriff auf Verteilungsfunktionen Namensschema: d vertlg (x, parameter) # Dichte f(x) p vertlg (x, parameter) # Vertlg F(x) q vertlg (prozent, parameter) # Quantil r vertlg (anzahl, parameter) # Zuf.-Zahlen Binomialverteilung: [dpqr]binom(., n, p) hyperg. Verteilung: [dpqr]hyper(., M, N-M, n) Normalvertlg: [dpqr]norm(., my, sigma) χ 2 Vtlg: [dpqr]chisq(., freiheitsgrade) Poissonvertlg: [dpqr]pois(., lambda) Exp.Vertlg: [dpqr]exp(., lambda) usw., Details zu den Parametern in den Hilfeseiten 24 / 27

Verteilungen Bsp: Wenn X N(0, 1) dann X 2 χ 2 1. Überprüfen mit Zufallszahlen: > x <-rnorm(100,0,1) > xsqrd <- x^2 > # Histogramm, mit relativen Haeufigkeiten: > hist(xsqrd, freq=f) > # ChiQuadrat Dichte drueberzeichnen: > curve(dchisq(x,1),add=t,col="red") Abspeichern des Bildes: dev.copy2eps("bild1.eps") 25 / 27

Verteilungen Abbildung: Histogram of xsqrd Density 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0 2 4 6 8 10 xsqrd Abbildung: Histogramm und Dichte χ 2 -Verteilung 26 / 27

Verteilungen Bsp: Zeichnen Sie Dichte- und Verteilungsfunktionen für die obengenannten Verteilungen mit Parametern Ihrer Wahl. Berechnen Sie die Wahrscheinlichkeiten für P(0 X 1) für Normalverteilung, χ 2 -Verteilung und Exponentialverteilung für Parameter Ihrer Wahl. 27 / 27