Einführung in R SS2007

Ähnliche Dokumente
PD Dr. Matthias Fischer. Version 2.0

Der Download von R erfolgt über die homepage

Übersicht Statistik-Funktionen. Statistische Software (R) Nützliche Funktionen. Nützliche Funktionen

Erwin Grüner

Einführung in die Ökonometrie

Übersicht deskriptiver Maße & anderer. Nützliche Funktionen. Statistische Software (R) artihmetische Mittel median() mean()

Übersicht deskriptiver Maße & anderer. Nützliche Funktionen. Statistische Software (R-Vertiefung) artihmetische Mittel median() mean()

Übersicht deskriptiver Maße & anderer. Nützliche Funktionen. Statistische Software (R-Vertiefung) artihmetische Mittel median() mean()

Statistik für Informatiker, SS 2017 Organisatorisches, ein Startbeispiel und eine sehr knappe R-Einführung

Erwin Grüner

Auflistung der Objekte im Workspace object wird aus dem Workspace entfernt

Mit R können Rechenoperationen durch direkte Eingabe durchgeführt werden. Beispiel >(3*(5+7)^4)/3 [1] 20736


Zusammenstellung der Befehle in R

Download Aufruf Hilfe Objekte in R Datenimport Rechnen Grafik Verteilungen. R Grundlagen

Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung

Klaus Schliep. 16. Februar 2004

Statistische Software (R)

Vorbereitungsseminar für Abschlussarbeiten

Statistische Software (R)

Material zur Vorlesung Räumliche Statistik

Einführung in die Angewandte Bioinformatik: Datenanalyse mit R

Kurze Einführung in Octave

Datenaufbereitung, Grafische Datenanalyse

Syntax Variablen. mtrx <- matrix (c(1,2,3,4,5,6),ncol=2,nrow=3) Anzeigen des Types: class(var) Umwandeln mit: as.vector(mtrx)

Statistische Software (R)

Eine Einführung in R: Grundlagen II

Dipl.-Volksw. Markus Pullen Wintersemester 2012/13

Einführung in die Programmierumgebung R Michael Wenk

Einführung in R. Marius Hofert. Ulm University

R-Wörterbuch Ein Anfang... ein Klick auf einen Begriff führt, sofern vorhanden, zu dessen Erklärung.

Lineare Algebra mit dem Statistikprogramm R

Elementare Befehle. Operatoren

Kurze Einführung in R

Vorlesung Statistik SS 2006

R starten (Arbeitsverzeichnis wählen, Workspace abspeichern, History abspeichern)

Aufgaben zur Vorlesung Statistische Analyse von Systemen

Mathematische Computer-Software

Tipps und Tricks in MATLAB

R Befehle SS min(x) Bestimmt das Minimum von x Bestimmt die Anzahl der sum(x<=4) Werte von x, die kleiner oder max(x) Bestimmt das Maximum von x

Elementare Befehle. Operatoren

Einführung in die formale Demographie Übung

Theorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte

Übungsaufgaben. zahlen bis auf das 3. und 7. Element enthält. (e) Erstellen Sie einen Vektor. zahlen3, der ein Klon von

Kompaktwissen zu R. 1. Hilfe. Allgemein. Beispiele hilfreicher Internetseiten (mit weiteren Verweisen zu Einführungen und Tutorien)

Einführung in Matlab Was ist MATLAB? Hilfe Variablen

Matrizen. a12 a1. a11. a1n a 21. a 2 j. a 22. a 2n. A = (a i j ) (m, n) = i te Zeile. a i 1. a i 2. a i n. a i j. a m1 a m 2 a m j a m n] j te Spalte

MATLAB Sommersemester 2018 Dr. Ulf Mäder

Grundlagen der Bioinformatik Assignment 4: Introduction to R. Yvonne Lichtblau SS 2017

Erwin Grüner

Stichworte zu Octave

Softwarepraktikum. zu Elemente der Mathematik. Carsten Rezny Institut für angewandte Mathematik Universität Bonn

Python Einführung. Monica Selva Soto. 24 März Mathematisches Institut

Univariate explorative Datenanalyse in R

Dipl.-Volksw. Markus Pullen Wintersemester 2012/13

Softwarepraktikum. zu Elemente der Mathematik. Carsten Rezny Institut für angewandte Mathematik Universität Bonn

durch angewandte Statistik 2., aktualisierte Aulage Reinhold Hatzinger Kurt Hornik Herbert Nagel Marco J. Maier

Einführung in die Ökonometrie - Übung

Programmiervorkurs für die Numerik Teil 2/4

Statistische Software (R)

Musterlösung der Klausur vom 29. Juli 2003

Operatoren und Ausdrücke

Eine Einführung in R: Grundlagen I

Eine Einführung in R: Grundlagen I

Zyklen: break und continue

IV. Matrizenrechnung. Gliederung. I. Motivation. Lesen mathematischer Symbole. III. Wissenschaftliche Argumentation. i. Rechenoperationen mit Matrizen

Zahl ist der im Gradmaß angegebene Winkel, dessen Sinus Sie berechnen möchten.

Ulrich Stein

3.4 Bivariate Datenanalyse in R

Markus Grasmair. 8. März 2010

Grundlagen der Bioinformatik Übung 5 Einführung in R. Ulf Leser, Yvonne Mayer

Hilfsblätter Lineare Algebra

Institut für Programmierung und Reaktive Systeme. Java 2. Markus Reschke

Univariate explorative Datenanalyse in R

Eine Einführung in R: Dichten und Verteilungsfunktionen

Statistische Software (R)

Aufgaben. Frage: (Aufgabe 3) Warum findet R den Befehl approx.r nicht?

R-Tutorial. R bietet zahlreiche Hilfe-Funktionen an. Informiere Dich über die Funktion log():

Demographie III Übung

Eine Einführung in R: Dichten und Verteilungsfunktionen

ECDL - Core. Modul 4 Tabellenkalkulation. Arbeitsblätter für Schüler mit praktischen Übungen zu allen Lernzielen des Syllabus 5

Allgemeines zu Grafiken. Statistische Software (R) Literatur. Übersicht von Grafikpaketen (nicht vollständig)

1. Übungsblatt zu Wahrscheinlichkeitsrechnung und Statistik in den Ingenieurswissenschaften

Grafiken. Session 4. > plot(x,y, xlab=, ylab= sin(x), main= Steps, Type 2, type= S )

Einführung in das rechnergestützte Arbeiten

Projekt 3 Variablen und Operatoren

Einführung in R. Christoph Dalitz. August Hochschule Niederhein Fachbereich Elektrotechnik & Informatik

Vorkurs Informatik WiSe 16/17

Programmieren mit statistischer Software

R-Fehlermeldungsleitfaden

Bivariate explorative Datenanalyse in R

Running R. Windows Aus Menü. Lese R Code ein führt den Code auch gleich aus, eventuell muss vorher das Verzeichnis gewechselt werden.

1 Univariate Statistiken

Grundlagen der Programmierung

C-Programmierung: Ausdrücke und Operatoren#Division.2F

Modul Entscheidungsunterstützung in der Logistik. Einführung in die Programmierung mit C++ Übung 2

Übungen zur Vorlesung Wissenschaftliches Rechnen I

Transkript:

Einführung in R SS2007 PD Dr. Matthias Fischer und Danny Stadelmayer 25. April 2007 SS2007 () R Einführung 19. April 2007 1 / 36

Gliederung 1 Allgemeines 2 Installation 3 Daten ein- und auslesen 4 Rechnen mit R 5 Grafiken und Verteilungen SS2007 () R Einführung 19. April 2007 2 / 36

Allgemeines R ist: Statistik Software: S-Plus, SPSS, STATA... und R Ständig wachsendes Programm...nicht nur als Taschenrechner verwendbar...wird auch für eigene Programmierungen genützt Homepage: http://cran.r-project.org/...für downloads, Dokumentationen usw. Große Anzahl an Büchern und Informationen im Internet vorhanden Jeder kann sein individuelles R-Packet schreiben und einbinden SS2007 () R Einführung 19. April 2007 3 / 36

Installation Download/Installation R 1 http://cran.r-project.org/ 2 Betriebssystem wählen 3 base wählen 4 R-2.4.1-win32.exe wählen und lokal speichern 5 Ausführen der Datei R-2.4.1-win32.exe SS2007 () R Einführung 19. April 2007 4 / 36

Installation SS2007 () R Einführung 19. April 2007 5 / 36

Installation SS2007 () R Einführung 19. April 2007 6 / 36

Installation SS2007 () R Einführung 19. April 2007 7 / 36

Installation SS2007 () R Einführung 19. April 2007 8 / 36

Installation Starten des Programms... SS2007 () R Einführung 19. April 2007 9 / 36

Installation Wichtig ist: R unterscheidet Groß- und Kleinschreibung. die Variablennamen c und t sind bereits durch Funktionen belegt. Dezimalpunkte müssen verwendet werden. R ist bereit wenn > erscheint. die Eingabe ist unvollständig wenn + erscheint. R speichert nicht automatisch. Abruf bereits verwendeter Befehle durch und SS2007 () R Einführung 19. April 2007 10 / 36

Installation Menü Pakete Installiere Pakete...(aus dem Internet) SS2007 () R Einführung 19. April 2007 11 / 36

Installation Menü Pakete Installiere Pakete aus lokalen ZIP-Dateien...(von Datenträger) SS2007 () R Einführung 19. April 2007 12 / 36

Installation Packages Allgemeine Funktionen sind direkt nach dem Start verfügbar Spezielle Funktionen können durch sog. packages eingebunden werden Anzeigen bereits eingebundener packages durch search() Potenzielle aber noch nicht eingebundene packages können durch library() eingesehen werden Weitere Zusatzpackages müssen erst installiert werden um sie danach über den library(packagename) einzubinden Informationen über das package erhält man durch library(help=packagename) SS2007 () R Einführung 19. April 2007 13 / 36

Installation Die Hilfe in R Mit dem Befehl help.start() bzw. mittels Hilfe/HTML Hilfe aus der Menüleiste wird die Hilfefunktion gestartet. Der Aufruf help(such.begriff) bzw.?such.begriff liefert Hilfe/Dokumentation zu dem (exakten!) Begriff such.begriff. Mit dem Befehl apropos(such.begriff) werden alle Objekte gelistet, die auf den Begriff bzw. auf die Funktion such.begriff zurückgreifen. SS2007 () R Einführung 19. April 2007 14 / 36

Daten ein- und auslesen Dateneingabe über Tastatur Geringe Datenmengen können über Tastatur mittels scan eingegeben werden, z.b. datenneu=scan(). Ein Leerzeichen oder das Betätigen der Return-Taste markieren einen neuen Datenpunkt. Der Eingabemodus wird durch zweimaliges Betätigen der Return-Taste verlassen. Ist ein Datensatz bzw. sind mehrere Datensätze bereits definiert, so können diese bequem mittels data.entry modifiziert bzw. erweitert werden. > x=1:10 > y=2:11 > data.entry(x,y) SS2007 () R Einführung 19. April 2007 15 / 36

Daten ein- und auslesen Einlesen von Daten aus externen Dateien Datenimport mittels read.table (für unterschiedliche Datentypen!) read.table(file, header = FALSE, sep =, dec =. ) Es können u.a. folgende Spezifikation festgelegt werden: Pfad inkl. Dateinamen (file), Trennzeichen zwischen den Datenpunkten (sep), Trennzeichen für Dezimalstellen (dec) und das Vorhandensein einer überschrift (header). Weitere Optionen: Spaltenüberschriften (col.names) bzw. Zeilenüberschriften (row.names). erzeugt einen Data.frame in R. Beispiel: kdat=read.table( d:/rkurs/kontodaten.dat,true). SS2007 () R Einführung 19. April 2007 16 / 36

Daten ein- und auslesen Auslesen von Daten in externen Dateien mittels write.table mittels cat mittels write mittels sink mittels save SS2007 () R Einführung 19. April 2007 17 / 36

Rechnen mit R Mathematische Operatoren Operator Operation Beispiel + Addition 1+3 - Subtraktion 1-3 * Multiplikation 1*3 Potenzierung 1 3 / Division 4/3 %% Divisionsrest 4%%3 %/% Ganzzahlige Division (ohne Rest) 4%/%3 SS2007 () R Einführung 19. April 2007 18 / 36

Rechnen mit R Vergleichsoperatoren Operator Operation Beispiel (a=2,b=1) > größer als 3>5 FALSE < kleiner als 4<4 FALSE == genau gleich a==4 FALSE!= ungleich b!=5 TRUE >= größer gleich a>=b TRUE <= größer gleich a<=3 TRUE SS2007 () R Einführung 19. April 2007 19 / 36

Rechnen mit R Logische bzw. Boolsche Operatoren Operator Operation Beispiel (a=2,b=0)! nicht!b TRUE & und a&b FALSE oder a b TRUE xor oder (ausschließlich) xor(a,b) TRUE istrue Prüfung auf WAHR istrue(a) FALSE SS2007 () R Einführung 19. April 2007 20 / 36

Rechnen mit R Elementare mathematische Funktionen Funktion Beschreibung sqrt(x) Wurzelfunktion f(x) = x abs(x) Betragsfunktion f(x) = x exp(x) Exponentialfunktion f(x) = e x log(x,base = exp(1)) Logarithmus log10(x)/log2(x) Logarithmus sin(x)/cos(x)/tan(x) Sinus/Kosinus/Tangens (SKT) asin(x)/acos(x)/atan(x) Arcus SKT sinh(x)/cosh(x)/tanh(x) SKT Hyperbolicus asinh(x)/acosh(x)/atanh(x) Arcus SKT Hyperbolicus gamma(x)/lgamma(x) (logarithmierte) Gamma-Funktion psigamma(x,deriv=0) Psigamma-Funktion digamma(x) Digamma-Funktion beta(a,b)/lbeta(a,b) (logarithmierte) Beta-Funktion besseli(x,nu)/besselj(x,nu) Modifizierte Bessel-Funktion besselk(x,nu)/bessely(x,nu) Modifizierte Bessel-Funktion SS2007 () R Einführung 19. April 2007 21 / 36

Rechnen mit R Elementare Funktionen R-Funktion Beschreibung choose(n, k) Binomialkoeffizient ( ) n k lchoose(n, k) log ( ) n k factorial(x) Fakultät n! lfactorial(x) log n! R-Funktion round(x,digits=0) signif(x,digits=0) zapsmall(x) ceiling(x) floor(x) trunc(x) Beschreibung Mathematische Rundung Mathematische Rundung Mathematische Rundung Nächstgrößere ganze Zahl Nächstkleinere ganze Zahl Abschneiden der Nachkommastellen SS2007 () R Einführung 19. April 2007 22 / 36

Rechnen mit R Erzeugung von Vektoren Mittels des Combine-Befehls c: x=c(1,4,3,5) oder x=c(1,2,3,4) Mittels des :-Operators: x=1:4 oder x=10:1 Mittels des sequence-befehls: seq(-2,4,2) oder seq(-2,4 2) Mittels des rep-befehls: rep(1,10) oder rep(c(1,3),c(2,4)) Durch Kombination der obigen Befehle: c(1:10,rep(2,3),seq(0,1 200)) SS2007 () R Einführung 19. April 2007 23 / 36

Rechnen mit R Selektion von Elementen eines Vektors R-Befehl Beschreibung x[3] Element 3 x[c(1,3)] Element 1 und 3 x[3:5] drittes bis fünftes Element x[-3] Vektor ohne drittes Element x[-c(1,3)] Vektor ohne erste und drittes Element x[x>3] Alle Elemente größer als 3 x[x<1 x>3] Alle Elemente größer als 3 oder kleiner als 1 x[x<1&x>3] Alle Elemente größer als 3 und kleiner als 1 R-Funktion Beschreibung any(x>0) TRUE, falls ein Element positiv, sonst FALSE all(x>0) TRUE, falls alle Element positiv, sonst FALSE which(x>0) Indizes der Elemente, die größer als 0 sind append(x,values,after) Verketten von Vektoren SS2007 () R Einführung 19. April 2007 24 / 36

Rechnen mit R Funktionen für Vektoren R-Funktion Beschreibung length(x) Länge des Vektors sum(x) Summe der Elemente mean(x)/median(x) Mittelwert/Median der Elemente var(x) Varianz der Elemente mit 1/(n 1) cumsum(x) Laufende Summe prod(x) Produkt der Elemente cumprod(x) Laufendes Produkt max(x) Größtes Element cummax(x) Laufendes Maximum min(x)/cummin(x) Minimum/Laufendes Minimum range(x) Minimum und Maximum sort(x,decreasing = FALSE) Sortierung der Elemente rank(x) Rangbildung rev(x) Vektor in umgekehrter Reihenfolge unique(x) Vektor ohne Ties SS2007 () R Einführung 19. April 2007 25 / 36

Rechnen mit R Funktionen für Vektoren R-Funktion Beschreibung diff(x) Vektor der ersten Differenzen sgn(x) Vektor der Vorzeichen which.max(x) Index des Maximums which.min(x) Index des Minimums is.vector(x) TRUE falls Objekt x ein Vektor na.omit(x) Vektor ohne NA s na.fail(x) Fehlermeldung falls NA in Vektor SS2007 () R Einführung 19. April 2007 26 / 36

Rechnen mit R Erzeugung von Matrizen Erzeugung einer Matrix mit dem R-Befehl matrix elemente=c(1,1,1,2,3,4,6,7,3) # Eingabe als Vektor! matrix(elemente,ncol=3,nrow=3,byrow=false) Spaltenweise Anordnung der Elemente in drei Spalten und drei Zeilen. Diagonal-Matrizen: diag(a) bzw. diag(c(1,2,3)) SS2007 () R Einführung 19. April 2007 27 / 36

Rechnen mit R Operatoren für Matrizen Operator Operation +,- Elementweise Addition/Subtraktion *,/ Elementweise Multiplikation/Division %*% Matrix-Multiplikation %x% Kroneckerprodukt, vgl. auch kronecker %o% äußeres Produkt, vgl. auch outer t(x) Transponierung solve(x) Invertierung SS2007 () R Einführung 19. April 2007 28 / 36

Rechnen mit R Selektion von Elementen einer Matrix R-Befehl Beschreibung A[1,3] Element in Zeile 1 und Spalte 3 A[1,] erste Zeile A[,2] zweite Spalte A[c(1,4),] erste und vierte Zeile A[-c(1,4),] Matrix ohne erste und vierte Zeile R-Funktion Beschreibung crossprod(a,b) Berechne A A bzw. A B colsums(a) Spaltensumme der Matrix A rowsums(a) Zeilensumme der Matrix A colnames(a) Spaltennamen übergeben rownames(a) Zeilennamen übergeben rbind(a,b)/cbind(a,b) Verbinde Matrizen zeilenweise bzw. spaltenweise lower.tri/upper.tri(a) TRUE/FALSE falls im unteren/oberen Bereich apply(a,1,mean) Mittelwert über alle Zeilen apply(a,2,mean) Mittelwert über alle Spalten SS2007 () R Einführung 19. April 2007 29 / 36

Rechnen mit R Funktionen für Matrizen R-Funktion Beschreibung ncol(x) Anzahl der Spalten nrow(x) Anzahl der Zeilen length(x) Anzahl der Elemente dim(x) Dimension diag(x) Hauptdiagonale diag(a) Einheitsmatrix (a N) solve(x) Inverse Matrix chol2inv(x) Inverse Matrix (mittels Cholesky) det(x) Determinante der Matrix eigen(x) Eigenwerte/vektoren der Matrix t(x) transponierte Matrix qr(x) QR-Zerlegung svd(x) Singulärwert-Zerlegung chol(x) Cholesky-Zerlegung SS2007 () R Einführung 19. April 2007 30 / 36

Rechnen mit R Funktionen für Zeichenketten (Strings) Funktion Beschreibung cat Ausgabe von Objekten paste Fusion von Zeichenketten nchar Anzahl der Zeichen charmatch Matchen von Zeichenketten substr(x, start, stop) Teile einer Zeichenkette SS2007 () R Einführung 19. April 2007 31 / 36

Grafiken und Verteilungen Der Plot-Befehl R stellt umfangreiche Grafikmöglichkeiten zur Verfügung, starte z.b. demo(graphics). Der wichtigste Befehl zur Erzeugung von Grafiken ist plot. > x=seq(-4,4,,200) > y=x^2 > plot(x,y) Grafiken werden gemäß fest definierter Grafikparameter erzeugt. Diese können mittels par verändert werden. SS2007 () R Einführung 19. April 2007 32 / 36

Grafiken und Verteilungen Der Plot-Befehl Ausgewählte Optionen des Plot-Befehls: plot(x,y,option). option Beschreibung Beispiel add überlagerung der letzten Plots add=true axes Anzeigen der Achsen axes=false col Farbe col=2 type Art des Plots col= l / p / b / o / h lwd Linienstärke lwd=2 main überschrift main= Histogramm sub Unterschrift sub= Werte xlab Titel für x-achse xlab= x ylab Titel für y-achse ylab= f(x) xlim Ober-/Untergrenze für x-achse xlim=c(0,2) ylim Ober-/Untergrenze für y-achse ylim=range(x) pch Symbol für Punktgröße pch=1.2 cex Symbolgröße cex=1.2 SS2007 () R Einführung 19. April 2007 33 / 36

Grafiken und Verteilungen Grafikfunktionen Zur Darstellung eindimensionaler Daten. R-Befehl plot curve boxplot barplot dotchart hist pie qqnorm qqplot stripchart stem Beschreibung Indexplot, Stabdiagramm, empirische CDF Erzeugung mathematischer Kurven Boxplot Säulendiagramm Cleveland-Dot-Chart Histogramm Kreisdiagramm Quantil-Plot für Normalverteilung Quantil-Quantil-Plot Eindimensionales Streudiagramm Stem&Leaf-Diagramm SS2007 () R Einführung 19. April 2007 34 / 36

Grafiken und Verteilungen Verteilungen R bieten Funktionen für Dichten ( density function), Verteilungsfunktionen ( probability function) und der Quantile ( quantile function) von diversen Verteilungen sowie zur Erzeugung von Zufallszahlen ( random number) aus diversen Verteilungen. Jede Funktion hat zwei Bestandteile Funktionskürzel (d,p,q,r) + Verteilungskürzel (norm,t,f,...) Beispiele: Funktion Beschreibung dnorm(1,0,2) Normaldichte (µ = 0, σ = 2) an der Stelle x = 0 rnorm(10) 10 Zufallszahlen aus Standard-Normalverteilung pt(0.5,1) t(1)-verteilungsfunktion an Stelle x = 0.5 qbinom(0.9,10,0.5) 90%-Quantile (Binomialvert.) mit n = 10, p = 0.5 SS2007 () R Einführung 19. April 2007 35 / 36

Grafiken und Verteilungen Verteilungen Kürzel Verteilung Paket exp Exponential-Verteilung norm Normalverteilung t Student-t-Verteilung f F-Verteilung chisq χ 2 -Verteilung logis Logistische Verteilung binom Binomialverteilung pois Poissonverteilung lnorm Lognormalverteilung symstb Symmetrische Stabile Verteilung fbasics stable Schiefe Stabile Verteilung fbasics gh Verallg. hyperbolische Verteilungen fbasics hyp Hyperbolische Verteilung fbasics nig Normal inverse Gauss Verteilung fbasics SS2007 () R Einführung 19. April 2007 36 / 36