Empirische Softwaretechnik

Größe: px
Ab Seite anzeigen:

Download "Empirische Softwaretechnik"

Transkript

1 Empirische Softwaretechnik Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester

2 Einführung in das Statistikpaket 2

3 R?! nicht vergleichbar mit den üblichen Statistikprogrammen wie SAS oder SPSS interactive computing with data de-facto Standard an den Unis kostet nichts! 3

4 Entwickler von R Ross Ihaka & Robert Gentleman (University of Auckland, New Zealand) R: A Language for Data Analysis and Graphics Journal of Computational and Graphical Statistics 5 (1996) R Development Core Team (ab 1997) 4

5 Eigenschaften von R interaktiv programmierbar (basiert auf Version 3 der Sprache S) erweiterbar (Schnittstelle zu Programmiersprachen wie C, C++, Fortran, Java, Perl) umfangreiche Graphikfunktionen 5

6 Wo gibt s R? R-Webseite CRAN = Comprehensive R Archive Network Binärdateien für Windows, Linux, Mac Quellen Bibliotheken ( packages ) Dokumentation (Handbücher, FAQ s) 6

7 So sieht s dann aus... 7

8 Bücher über R Dalgaard: Introductory Statistics with R (Springer, 2002) Venables & Smith: An Introduction to R (Network Theory Ltd., 2002) letzteres gibt s auch als PDF im Internet: 8

9 Sprache S entwickelt von John Chambers & Richard Becker ACM Software System Award 1998 für Chambers for the S system, which has forever altered how people analyze, visualize, and manipulate data 9

10 Bücher über S Becker & Chambers (1984): S. An Interactive Environment for Data Analysis and Graphics ( the brown book ) Version 1 von S Becker & Chambers & Wilks (1988): The New S Language ( the blue book ) Version 2 von S 10

11 Bücher über S (Forts.) Chambers & Hastie (1992): Statistical Models in S ( ) Version 3 von S Chambers (1998): Programming with Data. A Guide to the S Language ( the green book ) Version 4 von S 11

12 Statistik mit R Verteilungsfunktionen Testen von Hypothesen parametrisch: t-test, Pearson,... nicht-parametrisch: Wilcoxon, Spearman,... Lineare Regression...und noch mehr! 12

13 Explorative Datenanalyse mit R Punktwolken ( scatter plots ) Balkendiagramme ( bar plots ) Boxplots Regressionskurven 13

14 Datentypen Zahlen und Zeichen Boolesche Werte (TRUE, FALSE, NA) kategorielle Daten ( factors ) Vektoren (auch Zeichenketten) Matrizen (und mehrdimensionale Felder) (inhomogene) Listen Datensätze/-tabellen ( data frames ) 14

15 Wertzuweisungen x <- 12 x [1] 12 y <- c(13,2,11,3,7,5) y [1] y <- seq(0,0.9,0.2) y [1]

16 Zeichnen der Standard- Normalverteilung x <- seq(-4,4,0.05) v <- dnorm(x,mean=0,sd=1) plot(x,v,type="l") 16

17 Rechengenauigkeit pi [1] options("digits") $digits [1] 7 options(digits=4) pi [1]

18 Binomialverteilung für MVP Parameter n = und p = 0, Beobachtung b = 1255 options(digits=20) y <- pbinom(1254,size= , prob= ) 1 y [1] 0 einfach zu unwahrscheinlich! 18

19 Hypothesen-Test zu MVP options(digits=20) prop.test(1255, , ) 1-sample proportions test with continuity correction data: 1255 out of 1e+06, null probability X-squared = , df = 1, p-value = < 2.2e

20 Schleifen?! Schleifen sind langsam also vermeiden! Befehle in R sind stattdessen vektor- und matrixorientiert Beispiel: x <- seq(0,0.8,0.2) x + 1 [1] wird recycled! 20

21 Korrelationstest nach Pearson vt <- c(0,3,5,0,3,5) wa <- c(116,132,135,152,154,181) cor.test(vt,wa) Pearson's product-moment correlation data: vt and wa t = 1.052, df = 4, p-value = cor

22 Zeichnen von Punktwolken plot(vt,wa,xlab="vererbungstiefe", ylab="wartungsaufwand") 22

23 Lineare Regression vt <- c(0,3,5,0,3,5) wa <- c(116,132,135,152,154,181) lm(wa~vt) Sprechweise: wa depends on vt Call: lm(formula = wa ~ vt) Coefficients: (Intercept) vt

24 Zeichnen der Regressionsgerade plot(vt,wa,xlab="vererbungstiefe", ylab="wartungsaufwand") abline(lm(wa~vt)) Sprechweise: a and b line 24

25 Postscript-Ausgabe postscript(file="vt-wa-plot.ps") plot(vt,wa) dev.off() 25

26 Einlesen von Tabellen "inheritdata.txt" enthält die Experimentdaten: vt mz wa scan(file="inheritdata.txt",skip=2) [1]

27 Einlesen von Tabellen (Forts.) temp <- scan(file="inheritdata.txt",skip=2) Read 42 items tempmat <- matrix(temp,ncol=3,byrow=true) tempmat [,1] [,2] [,3] [1,] [2,] [3,]

28 Einlesen von Tabellen (Forts.) vt <- tempmat[,1] mz <- tempmat[,2] wa <- tempmat[,3] mz [1]

29 Abspeichern von Tabellen write(t(tempmat),file="mat.txt",ncolumns=3) muß erst transponiert werden es werden 3 Spalten 29

30 selbst ausprobieren! 30

31 ENDE 31

Empirische Softwaretechnik. Einführung in das Statistikpaket R?! Entwickler von R. nicht vergleichbar mit den üblichen Statistikprogrammen

Empirische Softwaretechnik. Einführung in das Statistikpaket R?! Entwickler von R. nicht vergleichbar mit den üblichen Statistikprogrammen Empirische Softwaretechnik Einführung in das Statistikpaket Prof. Dr. Walter F. Tichy Dr. Frank Padberg Sommersemester 2007 1 2 R?! nicht vergleichbar mit den üblichen Statistikprogrammen wie SAS oder

Mehr

Was ist R? Warum R? Literatur Eine Beispielsitzung mit R. Einführung in R. Dr. Mike Kühne. Technische Universität Dresden Institut für Soziologie

Was ist R? Warum R? Literatur Eine Beispielsitzung mit R. Einführung in R. Dr. Mike Kühne. Technische Universität Dresden Institut für Soziologie Technische Universität Dresden Institut für Soziologie Übersicht 1 Was ist R? 2 3 4 Die Sprache R Geschichte Übersicht 1 Was ist R? Die Sprache R Geschichte 2 3 4 Die Sprache R Geschichte Was ist R? Flexible

Mehr

Einheit 1. Einführung in R. IFAS JKU Linz c 2018 Programmieren mit Statistischer Software 1 0 / 11

Einheit 1. Einführung in R. IFAS JKU Linz c 2018 Programmieren mit Statistischer Software 1 0 / 11 Einheit 1 Einführung in R IFAS JKU Linz c 2018 Programmieren mit Statistischer Software 1 0 / 11 Einführung R ist ein Software-Paket für Statistisches Rechnen und Graphik. Es ist die Open Source Implementierung

Mehr

Erste Schritte mit R. 2.1 Herunterladen der freien Software R

Erste Schritte mit R. 2.1 Herunterladen der freien Software R Erste Schritte mit R 2 BevorwirunsmitdeninKap.1 eingeführten Fragestellungen beschäftigen, brauchen wir noch ein Werkzeug, um die Datensätze später wirklich auswerten zu können. Sicher lässt sich das in

Mehr

Einführung in die Ökonometrie

Einführung in die Ökonometrie Einführung in die Ökonometrie Das Programmpaket R Installierung und Pakete R als Taschenrechner Laden von Datensätzen und Einlesen von Daten Hilfe und Dokumentation Einfaches Datenmanagement Univariate

Mehr

R, Sweave und TikZdevice

R, Sweave und TikZdevice R, Sweave und TikZdevice Uwe Ziegenhagen 4. März 2010 Was ist R oder: Am Anfang war S S Sprache, entwickelt durch Becker & Chambers von den Bell Labs kommerzialisiert als S-Plus R: GNU Implementation von

Mehr

Einführung in die Ökonometrie - Übung

Einführung in die Ökonometrie - Übung Einführung in die Ökonometrie Übung Einführung in die angewandte Regressionsanalyse mit R Allgemeine Einführung in R Deskriptive und explorative Datenanalyse mit R Regressionsanalyse mit R Programmieren

Mehr

Statistische Datenanalyse mit R, Korrelation und Regression. Dr. Andrea Denecke Leibniz Universität IT-Services

Statistische Datenanalyse mit R, Korrelation und Regression. Dr. Andrea Denecke Leibniz Universität IT-Services Statistische Datenanalyse mit R, Korrelation und Regression Dr. Andrea Denecke Leibniz Universität IT-Services Korrelationsanalyse Eine Korrelationsanalyse soll herausfinden Ob ein linearer Zusammenhang

Mehr

If something has a 50% chance of happening, then 9 times out of 10 it will. Yogi Berra

If something has a 50% chance of happening, then 9 times out of 10 it will. Yogi Berra If something has a 50% chance of happening, then 9 times out of 10 it will. Yogi Berra If you torture your data long enough, they will tell you whatever you want to hear. James L. Mills Warum Biostatistik?

Mehr

Fortgeschrittenes Programmieren mit R. Christoph Beck. Di, 14:00-15:30 (3065)

Fortgeschrittenes Programmieren mit R. Christoph Beck. Di, 14:00-15:30 (3065) Christoph Beck Di, 14:00-15:30 (3065) Packages / Pakete in R Pakete in R Erweiterungen der (Basis)-Funktionalitäten in R Basis-Pakete Zusätzliche Pakete Base packages base Base R functions (and datasets

Mehr

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn Statistikpraktikum Carsten Rezny Institut für angewandte Mathematik Universität Bonn Sommersemester 2014 Mehrdimensionale Datensätze: Multivariate Statistik Multivariate Statistik Mehrdimensionale Datensätze:

Mehr

R Einstieg. Manuel Eugster, Armin Monecke, Faban Scheipl. Institut für Statistik Ludwig-Maximilians-Universität München.

R Einstieg. Manuel Eugster, Armin Monecke, Faban Scheipl. Institut für Statistik Ludwig-Maximilians-Universität München. R Einstieg Manuel Eugster, Armin Monecke, Faban Scheipl Institut für Statistik Ludwig-Maximilians-Universität München Einführung in R Was ist S? S ist eine Sprache für Datenanalyse und Graphik, entwickelt

Mehr

Mehrere metrische Merkmale

Mehrere metrische Merkmale Kapitel 5 Mehrere metrische Merkmale 5.1 Wie kann man zwei metrische Merkmale grafisch beschreiben? Ein Streudiagram von zwei metrischen Merkmalen erzeugt man mit der Funktion plot mit den Beobachtungen

Mehr

Was ist R? Grundfunktionen in R Beispiele Zusammenfassung Literatur. Einführung in R. Michael Zwinkel

Was ist R? Grundfunktionen in R Beispiele Zusammenfassung Literatur. Einführung in R. Michael Zwinkel Einführung in R Michael Zwinkel Arbeitsbereich Wissenschaftliches Rechnen Fachbereich Informatik Fakultät für Mathematik, Informatik und Naturwissenschaften Universität Hamburg Betreuer: Julian Kunkel

Mehr

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 Empirische Softwaretechnik Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 1 Experiment zur Vererbungstiefe Softwaretechnik: die Vererbungstiefe ist kein guter Schätzer für den Wartungsaufwand

Mehr

7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien

7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Statistik 7.1 Korrelationsanalyse Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 7 Regressions- und Korrelationsanalyse Kovarianz Pearson-Korrelation Der (lineare)

Mehr

Biostatistik 101 Korrelation - Regressionsanalysen

Biostatistik 101 Korrelation - Regressionsanalysen Good Data don't need statistics Biostatistik 101 Korrelation - Regressionsanalysen Carl Herrmann IPMB Uni Heidelberg & DKFZ B080 [email protected] Korrelation Sind Alter und Blutdruck miteinander

Mehr

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik Sommersemester 2016 Prof. Dr. Stefan Etschberger Hochschule Augsburg Einstichproben-t-Test und approximativer Gaußtest

Mehr

5. Übung Datenanalyse und Statistik WS07/08 (Boogaart, Jansen)

5. Übung Datenanalyse und Statistik WS07/08 (Boogaart, Jansen) 5. Übung Datenanalyse und Statistik WS07/08 (Boogaart, Jansen) Bringen Sie alles mit, was Ihnen helfen kann die letzte Aufgabe zu lösen: Taschenrechner, Laptop, Tafelwerke, oder.... Installieren Sie z.b.

Mehr

Metrische und kategoriale Merkmale

Metrische und kategoriale Merkmale Kapitel 6 Metrische und kategoriale Merkmale 6.1 Wie kann man metrische und kategoriale Merkmale numerisch beschreiben? Typischerweise will man geeignete Maßzahlen (beispielsweise Lage- oder Streuungsmaße)

Mehr

Grundlagen der Bioinformatik Übung 5 Einführung in R. Ulf Leser, Yvonne Mayer

Grundlagen der Bioinformatik Übung 5 Einführung in R. Ulf Leser, Yvonne Mayer Grundlagen der Bioinformatik Übung 5 Einführung in R Ulf Leser, Yvonne Mayer Introduction to R Ulf Leser: Grundlagen der Bioinformatik, Sommer Semester 2016 2 Einführung in R Voraussetzung: funktionsfähige

Mehr

Statistische Software (R)

Statistische Software (R) Statistische Software (R) Paul Fink, M.Sc., Eva Endres, M.Sc. Institut für Statistik Ludwig-Maximilians-Universität München Einführung Statistik und Computer Nach Efron (2003): Statistik im 20. Jahrhundert

Mehr

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) 3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =

Mehr

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) 3 Einfache lineare Regression Einfache lineare Modelle mit R 3.6 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula

Mehr

Teil XI. Hypothesentests für zwei Stichproben. Woche 9: Hypothesentests für zwei Stichproben. Lernziele. Beispiel: Monoaminooxidase und Schizophrenie

Teil XI. Hypothesentests für zwei Stichproben. Woche 9: Hypothesentests für zwei Stichproben. Lernziele. Beispiel: Monoaminooxidase und Schizophrenie Woche 9: Hypothesentests für zwei Stichproben Patric Müller Teil XI Hypothesentests für zwei Stichproben ETHZ WBL 17/19, 26.06.2017 Wahrscheinlichkeit und Statistik Patric

Mehr

Verallgemeinerte lineare Modelle. Promotion. Promotion. Methoden empirischer Sozialforschung. 1 binäre und mehrere metrische und kategoriale Variablen

Verallgemeinerte lineare Modelle. Promotion. Promotion. Methoden empirischer Sozialforschung. 1 binäre und mehrere metrische und kategoriale Variablen Verallgemeinerte lineare Modelle 1 binäre und mehrere metrische und kategoriale Variablen Methoden empirischer Sozialforschung Verallgemeinerte lineare Modelle () Wie läßt sich die Abhängigkeit der Erfolgswahrscheinlichkeit

Mehr

Teil VIII Hypothesentests für zwei Stichproben

Teil VIII Hypothesentests für zwei Stichproben Woche 9: Hypothesentests für zwei Stichproben Teil VIII Hypothesentests für zwei Stichproben WBL 15/17, 22.06.2015 Alain Hauser Berner Fachhochschule, Technik und Informatik Berner

Mehr

Werkzeuge der empirischen Forschung

Werkzeuge der empirischen Forschung Werkzeuge der empirischen Forschung I. Daten und Beschreibende Statistik 1. Einführung 2. Dateneingabe, Datentransformation, Datenbehandlung 3. Beschreibende Statistik II. Schließende Statistik 1 III.

Mehr

Wichtige Befehle in R zur Datenanalyse Ergänzende Unterlagen zur Vorlesung Prof. Dr. Oliver Gansser

Wichtige Befehle in R zur Datenanalyse Ergänzende Unterlagen zur Vorlesung Prof. Dr. Oliver Gansser Wichtige Befehle in R zur Datenanalyse Ergänzende Unterlagen zur Vorlesung Prof. Dr. Oliver Gansser Inhaltsverzeichnis Datenmanagement........................................... 2 Grafische Verfahren..........................................

Mehr

Lineare Regression in R, Teil 1

Lineare Regression in R, Teil 1 Lineare Regression in R, Teil 1 Christian Kleiber Abt. Quantitative Methoden, WWZ, Universität Basel October 6, 2009 1 Vorbereitungen Zur Illustration betrachten wir wieder den Datensatz CASchools aus

Mehr

Statistik und Computer. Statistische Software (R) Was ist Statistiksoftware? Formeln und Code. Applications. Theory. Methodology

Statistik und Computer. Statistische Software (R) Was ist Statistiksoftware? Formeln und Code. Applications. Theory. Methodology Statistik und Computer Efron (2001): Statistik im 20. Jahrhundert Applications Statistische Software (R) Paul Fink, M.Sc. Institut für Statistik Ludwig-Maximilians-Universität München Einführung Theory

Mehr

Statistik mit R, Sitzung am

Statistik mit R, Sitzung am Statistik mit R, Sitzung am 19.06.07 Mike Kühne 1 R-Kurs INHALTSVERZEICHNIS Inhaltsverzeichnis 1 Bivariate Statistik 3 1.1 Tabellen.............................. 3 1.2 Zusammenhangsmaße für nominal skalierte

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst mit dem R Commander A Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist

Mehr

FORMELN IN. Referent: Daniel Laskow Betreuer: Eugen Betke Programmierung in R Arbeitsbereich Wissenschaftliches Rechnen Universität Hamburg

FORMELN IN. Referent: Daniel Laskow Betreuer: Eugen Betke Programmierung in R Arbeitsbereich Wissenschaftliches Rechnen Universität Hamburg FORMELN IN Referent: Daniel Laskow Betreuer: Eugen Betke Programmierung in R Arbeitsbereich Wissenschaftliches Rechnen Universität Hamburg 01.06.2016 Gliederung Arithmetische Operatoren Funktionen aus

Mehr

Statistische Messdatenauswertung

Statistische Messdatenauswertung Roland Looser Statistische Messdatenauswertung Praktische Einführung in die Auswertung von Messdaten mit Excel und spezifischer Statistik-Software für naturwissenschaftlich und technisch orientierte Anwender

Mehr

Lineare Regressionen mit R (Ökonometrie SS 2014 an der UdS)

Lineare Regressionen mit R (Ökonometrie SS 2014 an der UdS) Lineare Regressionen mit R (Ökonometrie SS 2014 an der UdS) Es soll untersucht werden, ob und wie sich Rauchen während der Schwangerschaft auf den Gesundheitszustand des Neugeborenen auswirkt. Hierzu werden

Mehr

Xojo für FileMaker Entwickler

Xojo für FileMaker Entwickler Ein Blick über den Tellerrand Was ist Xojo? Xojo ist eine Objektorientiertes Entwicklungswerkzeug zum Bau von Crossplattform Lösungen Objektorientierte Programmiersprache Kompiler für native Anwendungen

Mehr

Angewandte Statistik mit R. Eine Einführung für Ökonomen und

Angewandte Statistik mit R. Eine Einführung für Ökonomen und Reiner Hellbrück Angewandte Statistik mit R Eine Einführung für Ökonomen und Sozialwissenschaftler 3. Auflage Springer Gabler Inhaltsverzeichnis Vorwort zur dritten Auflage Vorwort zur ersten Auflage Vorwort

Mehr

angewandte Statistik

angewandte Statistik R Einführung Reinhold Hatzinger Kurt Hornik Herbert Nagel durch angewandte Statistik ein Imprint von Pearson Education München Boston San Francisco Harlow, England Don Mills, Ontario Sydney Mexico City

Mehr

Computerwerkstatt: Umgang mit Daten in R (- Studio)

Computerwerkstatt: Umgang mit Daten in R (- Studio) Computerwerkstatt: Umgang mit Daten in R (- Studio) Dipl.-Psych. Jörg-Henrik Heine 14.11.2012 1 Allgemeines und Vorbereitung Angedacht ist zunächst eine knappe Einführung in das graphical user Interface

Mehr

11. Übungsblatt zur Vorlesung Ökonometrie SS 2014

11. Übungsblatt zur Vorlesung Ökonometrie SS 2014 Universität des Saarlandes Lehrstab Statistik Dr. Martin Becker Dipl.-Kfm. Andreas Recktenwald 11. Übungsblatt zur Vorlesung Ökonometrie SS 2014 Aufgabe 45 Die in Aufgabe 43 getroffene Annahme heteroskedastischer

Mehr

Grundlagen der Bioinformatik Übung 5: Microarray Analysis. Yvonne Lichtblau

Grundlagen der Bioinformatik Übung 5: Microarray Analysis. Yvonne Lichtblau Grundlagen der Bioinformatik Übung 5: Microarray Analysis Yvonne Lichtblau Vorstellung Lösungen Übung 4 Yvonne Lichtblau: Grundlagen der Bioinformatik, Sommer Semester 2017 2 Lösungen vorstellen - Übung

Mehr

Arbeitsbuch zur deskriptiven und induktiven Statistik

Arbeitsbuch zur deskriptiven und induktiven Statistik Helge Toutenburg Michael Schomaker Malte Wißmann Christian Heumann Arbeitsbuch zur deskriptiven und induktiven Statistik Zweite, aktualisierte und erweiterte Auflage 4ü Springer Inhaltsverzeichnis 1. Grundlagen

Mehr

Kurzüberblick: R. Markus Kalisch, Seminar für Statistik, ETHZ

Kurzüberblick: R. Markus Kalisch, Seminar für Statistik, ETHZ Kurzüberblick: R Markus Kalisch, Seminar für Statistik, ETHZ Ursprung von R ~1970, Bell-Labs intern: An Interactive Environment for Data Analysis and Graphics Interne Software mit Namen S, geschrieben

Mehr

Angewandte Statistik mit R

Angewandte Statistik mit R Reiner Hellbrück Angewandte Statistik mit R Eine Einführung für Ökonomen und Sozialwissenschaftler 2., überarbeitete Auflage B 374545 GABLER Inhaltsverzeichnis Vorwort zur zweiten Auflage Tabellenverzeichnis

Mehr

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß Fachgruppe Statistik, Risikoanalyse & Computing STAT672 Data Mining Sommersemester 2007 Prof. Dr. R. D. Reiß Überblick Data Mining Begrifflichkeit Unter Data Mining versteht man die Computergestützte Suche

Mehr

Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung

Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung Übung Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung BACHELOR FT 2013 (HSU) Übung Emp. WiFo FT 2013 1 / 1 Maßzahlen für den Zusammenhang zwischen Merkmalen Kontingenztabelle:

Mehr

Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung

Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung Übung Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung BACHELOR FT 2013 (HSU) Übung Emp. WiFo FT 2013 1 / 17 Organisatorisches (HSU) Übung Emp. WiFo FT 2013 2 / 17 Organisatorisches

Mehr

CIM2004 Übung 7: Permutationstest, Bootstrap & Jackknife

CIM2004 Übung 7: Permutationstest, Bootstrap & Jackknife CIM2004 Übung 7: Permutationstest, Bootstrap & Jackknife Michael Höhle [email protected] Lösung 24. Juni 2004 1 Permutationstest Bilirubin ist ein Zerlegungsprodukt von Haemoglobin. Falls die

Mehr

Prognoseintervalle für y 0 gegeben x 0

Prognoseintervalle für y 0 gegeben x 0 10 Lineare Regression Punkt- und Intervallprognosen 10.5 Prognoseintervalle für y 0 gegeben x 0 Intervallprognosen für y 0 zur Vertrauenswahrscheinlichkeit 1 α erhält man also analog zu den Intervallprognosen

Mehr

Beispiel: Multiples Modell/Omitted Variable Bias I

Beispiel: Multiples Modell/Omitted Variable Bias I 4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss

Mehr

> r.lm < lm(log10(ersch) log10(dist), > summary(r.lm) > r.lms < summary(r.lm) R-Funktionen zur linearen Regression. data = d.

> r.lm < lm(log10(ersch) log10(dist), > summary(r.lm) > r.lms < summary(r.lm) R-Funktionen zur linearen Regression. data = d. 3.4 S-Funktionen 75 R-Funktionen zur linearen Regression a Im package stat (immer vorhanden): lm > r.lm < lm(log10(ersch) log10(dist), data = d.spreng) b Funktion summary produziert Resultate, die man

Mehr

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Schäfer A & Schöttker-Königer T, Statistik für (2015) Arbeitsblatt 1 STATA Kapitel 8 Seite 1 Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon

Mehr

Einführungskus MATLAB

Einführungskus MATLAB Start Inhalt 1(12) Einführungskus MATLAB Wintersemester 2016/17 Sommersemester 2017 www.math.tu-freiberg.de/ queck/lehre/math/matlab/kurs16/ TU Bergakademie Freiberg W. Queck Start Inhalt Einleitung 2(12)

Mehr

Eine Einführung in R: Grundlagen II

Eine Einführung in R: Grundlagen II Eine Einführung in R: Grundlagen II Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws11/r-kurs/

Mehr

Statistik, Datenanalyse und Simulation

Statistik, Datenanalyse und Simulation Dr. Michael O. Distler [email protected] Mainz, 13. Juli 2011 Ziel der Vorlesung Vermittlung von Grundkenntnissen der Statistik, Simulationstechnik und numerischen Methoden (Algorithmen) Aufgabe:

Mehr

JMP 10 Student Edition Quick Guide

JMP 10 Student Edition Quick Guide JMP 10 Student Edition Quick Guide Voraussetzung für die Befehle sind eine geöffnete Datentabelle, Standard Voreinstellungen und nutzerdefinierte Variablen mit geeigneter Typisierung. RMC = Rechter Mausklick

Mehr

durch angewandte Statistik 2., aktualisierte Aulage Reinhold Hatzinger Kurt Hornik Herbert Nagel Marco J. Maier

durch angewandte Statistik 2., aktualisierte Aulage Reinhold Hatzinger Kurt Hornik Herbert Nagel Marco J. Maier REinführung durch angewandte Statistik 2., aktualisierte Aulage Reinhold Hatzinger Kurt Hornik Herbert Nagel Marco J. Maier R - PDF Inhaltsverzeichnis R - Einführung durch angewandte Statistik Vorwort

Mehr

Graphische Verfahren in der Statistik: Q-Q- und P-P-Plots

Graphische Verfahren in der Statistik: Q-Q- und P-P-Plots Prof. Dr. Dietmar Pfeifer Institut für Mathemati Graphische Verfahren in der Statisti: Q-Q- und P-P-Plots Bei den üblichen parametrischen Testverfahren in der Statisti wird in der Regel eine Annahme über

Mehr

Einführung. Statistische Software. Was ist R? Wie installiere ich R? Micha Schneider. Institut für Statistik Ludwig-Maximilians-Universität München

Einführung. Statistische Software. Was ist R? Wie installiere ich R? Micha Schneider. Institut für Statistik Ludwig-Maximilians-Universität München Einführung Statistische Software Micha Schneider Institut für Statistik Ludwig-Maximilians-Universität München WS 2016/17, R Teil 1 Was ist R? Wie installiere ich R? R ist eine kostenlose Software-Umgebung

Mehr