Kompaktwissen zu R. 1. Hilfe. Allgemein. Beispiele hilfreicher Internetseiten (mit weiteren Verweisen zu Einführungen und Tutorien)

Ähnliche Dokumente
Datenaufbereitung, Grafische Datenanalyse

Erwin Grüner

Klaus Schliep. 16. Februar 2004

3.4 Bivariate Datenanalyse in R

Einführung in die Programmierumgebung R Michael Wenk

Eine Einführung in R: Grundlagen I

Eine Einführung in R: Grundlagen I

Syntax Variablen. mtrx <- matrix (c(1,2,3,4,5,6),ncol=2,nrow=3) Anzeigen des Types: class(var) Umwandeln mit: as.vector(mtrx)

Wahrscheinlichkeitsrechnung und Mathematische Statistik für Informatiker Software Folien von JProf. Uwe Ligges. Jörg Rahnenführer WS 2013/2014

Eine Einführung in R: Grundlagen II

Vorbereitungsseminar für Abschlussarbeiten

R-Wörterbuch Ein Anfang... ein Klick auf einen Begriff führt, sofern vorhanden, zu dessen Erklärung.

Statistische Software (R)

Statistische Software (R)

Statistisches Programmieren

Einführung in R. 17. April Emacs mit Erweiterung ESS (

Univariate explorative Datenanalyse in R

Lineare Algebra mit dem Statistikprogramm R

MATLAB-Tutorium WS18 Nathalie Marion Frieß

Einführung in die Programmierung (MA8003)

Einführung in die Programmierung (MA8003)

R Einstieg. Manuel Eugster, Armin Monecke, Faban Scheipl. Institut für Statistik Ludwig-Maximilians-Universität München.

Einführung in die Angewandte Bioinformatik: Datenanalyse mit R

Einführung in die Ökonometrie

Univariate explorative Datenanalyse in R

Kapitel 1. R als Taschenrechner. Vorlesung Programmieren in statistischer Software: R Sommersemester Einleitung, Grundlagen

Sozialwissenschaftliche Datenanalyse mit R

Statistik für Informatiker, SS 2017 Organisatorisches, ein Startbeispiel und eine sehr knappe R-Einführung

Modul G d) Gibt es einen Größen- bzw. Altersunterschied zwischen den anwesenden Männern und Frauen?

Dipl.-Volksw. Markus Pullen Wintersemester 2012/13

Statistische Software (R)

R- Grundlagen. TU Ilmenau. Stefan Heyder. 07. März 2019

R starten (Arbeitsverzeichnis wählen, Workspace abspeichern, History abspeichern)

Programmieren mit statistischer Software

Übersicht Statistik-Funktionen. Statistische Software (R) Nützliche Funktionen. Nützliche Funktionen

Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung

Übersicht deskriptiver Maße & anderer. Nützliche Funktionen. Statistische Software (R) artihmetische Mittel median() mean()

Programmieren mit statistischer Software

IDE Grundlagen Vektoren Matrizen Faktoren Dataframes Visualisierung Tips. Quick & dirty

Erwin Grüner

Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung

Umgang mit R unter Windows. Stand:

Einführung in R. 1 Literatur und Software 1

1 Literatur und Software 2

Statistische Software (R)

R Reader Arbeiten mit dem Statistikprogramm R. von Jörg Groß & Benjamin Peters

Leseanleitung für QIDB-Rechenregeln. IQTIG-spezifische Variablen, Operatoren und Funktionen in R

Algorithmen und Datenstrukturen 03

2 R die Basics. Inhalt. 2.1 Ziel. 2.2 R als Taschenrechner. Markus Burkhardt

Statistik PS R-Ergänzungen

Datentypen und -strukturen. Statistische Software. Datenstrukturen in R. Datentypen in R. Micha Schneider

> patienten<-data.frame( c(28,61,79,54,na,48), c(2,2,3,2,1,1), c("pillen","pillen","massage","gymnastik","massage","gymnastik"),

Übersicht deskriptiver Maße & anderer. Nützliche Funktionen. Statistische Software (R-Vertiefung) artihmetische Mittel median() mean()

R-Tutorial. R bietet zahlreiche Hilfe-Funktionen an. Informiere Dich über die Funktion log():

Präsenzübung (Einführung in R) Übung zur Vorlesung Statistik I für Biowissenschaften WS 2016/2017

Algorithmen und Datenstrukturen 02

Matlab: Grundlagen und Hilfen

Download Aufruf Hilfe Objekte in R Datenimport Rechnen Grafik Verteilungen. R Grundlagen

Python Einführung. Monica Selva Soto. 24 März Mathematisches Institut

Programmieren mit statistischer Software

Einführung in die statistische Sprache R

Übersicht deskriptiver Maße & anderer. Nützliche Funktionen. Statistische Software (R-Vertiefung) artihmetische Mittel median() mean()

Softwarepraktikum. zu Elemente der Mathematik. Carsten Rezny Institut für angewandte Mathematik Universität Bonn

Mit R können Rechenoperationen durch direkte Eingabe durchgeführt werden. Beispiel >(3*(5+7)^4)/3 [1] 20736

Softwarepraktikum. zu Elemente der Mathematik. Carsten Rezny Institut für angewandte Mathematik Universität Bonn

R-Fehlermeldungsleitfaden

Zusammenstellung der Befehle in R

Statistische Datenanalyse mit SPSS für Windows

Theorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte

Inhaltsübersicht.

Dipl.-Volksw. Markus Pullen Wintersemester 2012/13

Zahl ist der im Gradmaß angegebene Winkel, dessen Sinus Sie berechnen möchten.

Mathematische Computer-Software

Datenmanagement in R: Eine Einführung

Programmiervorkurs für die Numerik Teil 2/4

Statistische Software (R-Vertiefung) Kontrollstrukturen: Bedingte Anweisungen. Logische Operatoren & Verknüpfungen. Syntax. Paul Fink, M.Sc.

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Statistische Datenanalyse mit R. Dr. Andrea Denecke Leibniz Universität IT-Services

Vorwort zur vierten Auflage Einleitung 13

Programmieren in R - Lösungen zum Kapitel Data Analysis Christoph Rust Oktober 2018

7. Einführung in C++ Programmieren / Algorithmen und Datenstrukturen 1 Prof. Dr. Bernhard Humm FB Informatik, Hochschule Darmstadt

Ulrich Kohler, Frauke Kreuterr. Datenanalyse mit. Stata. Allgemeine Konzepte der Datenanalyse und ihre praktische Anwendung. 5. aktualisierte Auflage

Statistische Software Übungsblatt 1 P. Fink SoSe 2013

11./ 12. April Andrea Ossig Prof. Dr. Helmut Küchenhoff

Einführung in R. Universität Konstanz SS 2010

Einführung in MATLAB

# Erforderlich da Leerstellen in einigen Elementen vorhanden sind kj = read.delim(file.path(pfad, "kj.txt"))

TU Bergakademie Freiberg Datenanalyse/Statistik Wintersemester 2016/ Übungsblatt. Homepage zur Übung unter:

Was ist R? Grundfunktionen in R Beispiele Zusammenfassung Literatur. Einführung in R. Michael Zwinkel

Beispiele elementarer Datentypen Ganze Zahlen (integer) Unterbereiche Gleitkommazahlen Festkommazahlen

Wie bekomme ich einen schnellen Überblick über die bereits eingegebenen Daten?

Statistische Datenanalyse mit R, R-Studio. Dr. Andrea Denecke Leibniz Universität IT-Services

Lineare Regression in R, Teil 1

Arbeiten mit Daten. Session 3

17. Oktober Ubucon 2010, Universität Göttingen. Eine Einführung in Tcl. Dominik Wagenführ. Einleitung. Grundlagen. Strings.

Bivariate explorative Datenanalyse in R

Statistik & Graphiken in R Forschungsorientierte Vertiefung Methodenlehre

Transkript:

Kompaktwissen zu R 1. Hilfe Allgemein Manuale und Archive von Mailinglisten Beispiele hilfreicher Internetseiten (mit weiteren Verweisen zu Einführungen und Tutorien) Bücher In R Starten des Hilfesystems im Browser Hilfe zu einer Funktion nach Schlagwort suchen ähnliche Funktionen suchen R-Homepage: www.r-project.org http://de.wikibooks.org/wiki/gnu_r http://www.statmethods.net/index.html z.b. Ligges (2005): Programmieren mit R help.start()?funktionsname help(funktionsname) help.search( Schlagwort") apropos( Funktionsname")

2. Grammatik Satzbau Zuweisung <- = (funktioniert, ist aber nicht zu empfehlen) Objekt Alles ist ein Objekt (Daten, Funktionen, Ergebnisse, ) Objekt definieren Objektname sollte mit Buchstaben beginnen, darf aber auch Zahlen und Punkte/Unterstriche enthalten Groß- und Kleinschreibung wird unterschieden Funktion Funktionsname mit Argumenten in runden Klammern, zb: table( Variable1, Variable2) Kommentar # R-Konsole Pfadangaben Befehle dürfen sich über mehrere Zeilen erstrecken, Zeilenbeginn ist dann mit + statt > markiert. statt üblichem / muss // oder \ verwendet werden Datenstrukturen Je nach Datenstruktur können bestimmte Funktionen angewendet werden. Bei unpassender Datenstruktur gibt es Fehlermeldungen oder falsche Ergebnisse. Häufigster Fehlergrund: factor statt numeric. Teilweise können Daten direkt in andere Datenstruktur überführt werden (zb as.numeric). Vektor vector logical numeric [integer] numeric [double] complex character Matrix Array Dataframe Liste Abfragen der Klasse TRUE oder FALSE Ganzzahlen reele Zahlen in doppelter Maschinengenauigkeit Komplexe Zahlen Zeichenketten (strings) matrix (mehrere Spalten bzw Zeilen von Vektoren) array ( dreidimensinale Matrix ) data.frame (Matrix, bei der jede Spalte anderes Format haben darf) list (jeder Eintrag ist eigenes Objekt beliebigen Formates) class()

3. Vokabeln Logik Vergleiche ==,!=, <, >, <=, >= Konstanten Operatoren TRUE, FALSE! (Negation) &, bzw. &&, (und, oder) any() (ist irgendein Element TRUE?) all() (sind alle Elemente TRUE?) xor() (ausschließendes oder) Vektoren Erzeugen eines Vektors Zusammenfügen von Elementen Folgen Wiederholungen Indizieren von Vektoren n-tes Element aufrufen Vektor (vec) mehrerer Elemente aufrufen Element(e) entfernen Benanntes Element aufrufen Elemente über TRUE/FALSE-Vektor (muss dieselbe Länge wie der Vektor haben) aufrufen c() seq(anfang, Ende, by=abstand) seq(along = Objekt) Anfang:Ende rep(objekt, Anzahl) rep(objekt, each = Anzahl) x[n] x[vec] x[-vec] x[ Name ] x[logikvektor] Grundlegendes Rechnen Grundlegende Operatoren Extremwerte, Betrag Summe, Produkt Runden Wurzel Logarithmen Exponentialfunktion trigonometrische Funktionen +, -, *, /, ^ min(), max(), abs() sum(), prod() round(), floor(), ceiling() sqrt() log(), log10(), log2() exp() sin(), cos(), tan()

Unendlichkeit nicht definiert fehlende Werte leere Menge Inf, -Inf NaN (not a number) NA (not available) NULL Nützliche Funktionen Welche Elemente erfüllen eine gegebene Bedingung? Länge eines Vektors transponieren Sortieren Ränge bilden (ohne/ mit Entfernen von Bindungen) Überprüfen von exakter Gleichheit zweier Objekte Überprüfen von Gleichheit auf Maschinen- Rechengenauigkeit Entfernen mehrfach vorkommender Elemente aus einem Vektor Sind Werte mehrfach vorhanden? Untermenge abfragen (zb Alter a in 18 bis 65) kumulative Summe/ Produkt Kontinuierliche Variable kategorisieren which() length() t() sort() rank(), order() identical() all.equal() unique() duplicated() a %in% b cumsum(), cumprod() library(car) findinterval() Matrizen Erzeugen einer Matrix Indizierung der n-ten Zeile der m-ten Spalte eines Elementes Benannte Spalte aufrufen matrix(data = Datenvektor, nrow = Zeilenanzahl, ncol = Spaltenanzahl, byrow = FALSE) ( byrow = TRUE baut die Matrix zeilenweise statt spaltenweise auf) M[n, ] M[,m] M[n,m] M$Name Matrixmultiplikation %*% Abfragen und Setzen der Hauptdiagonalen Zeilen-, Spaltennamen Anzahl Zeilen, Spalten Invertieren einer Matrix diag() dimnames(), rownames(), colnames() nrow(), ncol() solve()

Listen Erzeugen einer Liste Erzeugen einer benannten Liste Aufrufen des n-ten Elementes Aufrufen eines benannten Elementes list(element1, Element2, ) list(e1 = Element1, E2 = Element2, ) L[[n]] L$Name, L[[ Name ]] Data Frames Erzeugen eines Data Frames Indizierung Untermengen extrahieren Datensätze aufteilen und zusammenfügen data.frame(name1 =Vektor1, Name2 =Vektor2, ) wie bei Matrix subset(dataframe, Bedingung) split(), merge() Daten einlesen Textdatei (.txt) read.table() Excel-Datei Einfachster Weg: Excel-Datei als.csv speichern, dann read.csv(), read.csv2() SPSS-Datei library(foreign) read.spss() STATA-Datei library(foreign) read.dta() SAS-Datei (auf Rechner ohne SAS:) SAS System Viewer (kostenloser Download) zum Öffnen des SAS Datensatzes und Speichern als.csv, dann read.csv(), read.csv2() Auch Datenbanken (OBDC, MySQL, ) sind möglich. Daten speichern Textdatei (.txt) Excel-Datei RData write.table() write.csv(), write.csv2() save(data, file= Name.RData") Datumsangaben SPSS-Datum nach R umkodieren library(date); library(chron) SPSS_Datum <- as.date( as.chron(isodate(1582, 10, 14) + SPSS_Datum) )

Pakete Paket installieren Paket aufrufen install.packages( Name ) oder: http://www.cran.r-project.org/ Packages Windows Binary (.zip) in library-order des R- Programmes entpacken library(paketname) Statistische Maßzahlen Lagemaße Arithmetisches Mittel Median Häufigkeitstabelle Streuungsmaße Varianz Standardabweichung Spannweite (d.h. Minimum, Maximum) Zusammenhangsmaße Korrelation Kovarianz Zusammenfassung mean() median() table() prop.table(kreuztabelle) var() sd() range(), min(), max() cor() cov() summary() Bei fehlenden Werten ist das Ergebnis NA. Zum Ausschluss dieser Werte das Argument na.rm=true angeben. Regressionsmodelle und Tests Lineare Regression lm( Outcome ~ Prädiktor ) Verallgemeinerte lineare Modelle (logistische, Poisson, ) Zusammenfassung Diagnoseplots glm(, family=binomial) glm(, family=poisson) summary() plot() t-test Chi-Quadrat-Test t.test() chisq.test()

Grafiken Allgemeine Plot-Funktion Boxplot Histogramm Säulendiagramm, Stabdiagramm Quantile-Quantile-Plot Einige Argumente für eine neue Grafik: Bereich für x- und y-achse Punkt-Symbol (plotting character), Farbe, Linientyp labels der x- und y-achse Überschrift, Unterschrift Hinzufügen von einer Geraden Punkten einer Legende Text plot() boxplot() hist() barplot() qqnorm() xlim, ylim pch, col, lty xlab, ylab main, sub lines() abline() points() legend() mtext()