Programmieren in R - Lösungen zum Kapitel Data Analysis Christoph Rust Oktober 2018

Größe: px
Ab Seite anzeigen:

Download "Programmieren in R - Lösungen zum Kapitel Data Analysis Christoph Rust Oktober 2018"

Transkript

1 Programmieren in R - Lösungen zum Kapitel Data Analysis Christoph Rust Oktober 2018 Vorbemerkungen: Diese Datei wurde mit R Markdown (www) erstellt. Die Quelldatei lässt sich unter (www) herunterladen. Öffnet man diese in RStudio und und klickt auf knit bzw. drückt Strg + Shift + k, so wird dieses Dokument in das jeweilige Format (Word-Datei, PDF und HTML u.a.) kompiliert. Die zugehörige R-Script-Datei ist unter (www) zu finden. Aufgabe D1 Verwenden Sie den Datensatz CPS1985 aus dem AER Paket: a) Erstellen Sie nun ein Histogram der logarithmierten Löhne. library(aer) Loading required package: car Loading required package: cardata Loading required package: lmtest Loading required package: zoo Attaching package: 'zoo' The following objects are masked from 'package:base': as.date, as.date.numeric Loading required package: sandwich Loading required package: survival data(cps1985) attach(cps1985) <- log(wage) hist(, freq=false) 1

2 Histogram of b) Erweitern Sie dieses um die Dichtefunktion einer normalverteilten Zufallsvariable, welche Mittelwert und Varianz der logarithmierten Löhne aufweist. erweitere die ylims, damit die NV-Dichte oben nicht abgeschnitten wird hist(, freq = FALSE, ylim = c(0,0.8)) Möglichkeit 1: x- und y-werte berechnen und dann lines() anwenden xx <- seq(range()[1], range()[2], length.out = 100) yy <- dnorm(xx, mean= mean(), sd = sd() ) lines(x = xx, y = yy, col = "red", lty = 2, lwd = 8) Möglichkeit 2: eigene Funktion definieren und curve(, add=true) anwenden adjnorm <- function(x) dnorm(x, mean = mean(), sd = sd()) curve(adjnorm, lwd = 2, add=true, col="blue" ) 2

3 Histogram of c) Zeichnen Sie den Mittelwert als gestrichelte Linie ein. hist(, freq = FALSE,ylim = c(0,0.8)) xx <- seq(range()[1], range()[2], length.out = 100) yy <- dnorm(xx, mean= mean(), sd = sd() ) lines(x = xx, y = yy, col = "red") abline(v=mean(), col = "blue", lwd=3, lty = 2) 3

4 Histogram of d) Zeichnen Sie mit einem Polygon die 25% Quantile ein. hist(, freq = FALSE,ylim = c(0,0.8)) xx <- seq(range()[1], range()[2], length.out = 100) yy <- dnorm(xx, mean= mean(), sd = sd() ) lines(x = xx, y = yy, col = "red") q25 <- qnorm(p=0.25, mean(), sd = sd()) xx <- c(seq(min(), q25, by=0.1)) yy <- dnorm(xx, mean= mean(), sd = sd() ) polygon(x = c(xx,q25), y = c(yy,0), col = "grey" ) 4

5 Histogram of Aufgabe D2 Überfliegen Sie den Aufsatz Incentives Work: Getting Teachers to Come to School von Duflo et al. a) Beschreiben Sie kurz das Experiment, das hier durchgeführt wurde. Antwort: In der Studie wird mit einem Experiment überprüft, ob Überwachung und finanzielle Anreize die Abwesenheitszeiten von Lehrern und damit den Lernerfolg beeinflussen. b) Schauen Sie sich dann die Daten an -> Incentives Work Data\ Die folgenden Datensätze sind ausreichend: TreatmentSchools, Posttest Laden Sie die Daten in R und schauen Sie sie an. Versuchen Sie hierbei den Stata Datensatz (Endung.dta) mit Hilfe der read_dta Funktion aus dem haven Package zu laden. if (!require(haven)) install.packages("haven") ; library(haven) Loading required package: haven TreatmentSchools <- read_dta(" Posttest <- read_dta(" str(posttest) Classes 'tbl_df', 'tbl' and 'data.frame': 2896 obs. of 9 variables: $ schid : num attr(*, "label")= chr "School ID" $ childno : num attr(*, "label")= chr "Child Number" $ post_math_v : num attr(*, "label")= chr "Verbal Posttest Math Score" 5

6 $ post_lang_v : num attr(*, "label")= chr "Verbal Posttest Language Score" $ post_total_v: num attr(*, "label")= chr "Verbal Posttest Total Score" $ post_math_w : num NA NA NA NA attr(*, "label")= chr "Written Posttest Math Score" $ post_lang_w : num 2.45 NA NA NA NA attr(*, "label")= chr "Written Posttest Language Score" $ post_total_w: num 3.34 NA NA NA NA attr(*, "label")= chr "Written Posttest Total Score" $ post_writ : num attr(*, "label")= chr "Did student take written test or verbal test? Written=1, Verbal=0" str(treatmentschools) Classes 'tbl_df', 'tbl' and 'data.frame': 60 obs. of 1 variable: $ schid: num attr(*, "label")= chr "School ID in Treatment "..- attr(*, "format.stata")= chr "%8.0g" c) Erstellen Sie im Datensatz Posttest eine Variable treat, die den Wert TRUE annimmt für Schüler, deren School-ID (Variable schid) im Datensatz TreatmentSchools auftaucht. Verwenden Sie den Operator %in% Beispiel: a <- 1:10 a[1:10 %in% c(2,3)] Posttest$treat <- Posttest$schid %in% TreatmentSchools$schid d) Erzeugen Sie eine Teilstichprobe des Datensatzes, der die Schüler mit schriftlichem Test enthält (post_writ==1) subsample <- subset(posttest, post_writ ==1) e) Vergleichen Sie die mittleren Testergebnisse (Variable post_total_w) von Treatment- und Nicht- Treatment-Schülern. tapply(posttest$post_total_w, Posttest$treat, mean, na.rm = TRUE) FALSE TRUE f) Führen Sie einen t-test der folgenden Nullhypothese durch: Treatment- und Nicht-Treatment-Schüler sind im Mittel gleich gut with( Posttest, t.test(post_total_w ~ treat), alternative = "two-sided") Welch Two Sample t-test data: post_total_w by treat t = , df = , p-value = 9.633e-06 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval:

7 sample estimates: mean in group FALSE mean in group TRUE Es zeigt sich eindeutig eine bessere Leistung bei den Treatment-Schülern! Kurze Anmerkung zu der Funktion with(): wenn man einen Datensatz nicht attachen will, aber dennoch in einer Anwendung nicht jedes Mal explizit die Variable im Datensatz indizieren möchte, lassen sich die Variablen innerhalb der Funktion with() kurzzeitig sichtbar machen. 7

Lösungen der Aufgaben zum Kapitel Data Analysis *

Lösungen der Aufgaben zum Kapitel Data Analysis * Lösungen der Aufgaben zum Kapitel Data Analysis * Christoph Rust October 11, 2017 * Dieses Dokument wurde mit Sweave unter R-Studio erstellt. Das zur Erstellung benutzte Skript kann unter http:// www.uni-regensburg.de/wirtschaftswissenschaften/vwl-tschernig/medien/programmieren-mit-r/sol_data_analysis.zip.

Mehr

W-Rechnung und Statistik für Ingenieure Übung 13

W-Rechnung und Statistik für Ingenieure Übung 13 W-Rechnung und Statistik für Ingenieure Übung 13 Nächste Woche: Probeklausur Bringen Sie sich ein leeres Exemplar der Probeklausur mit, um sich eine Musterlösung zu erstellen. Aufgabe 1 : Testproblem Testproblem:

Mehr

Teil VIII Hypothesentests für zwei Stichproben

Teil VIII Hypothesentests für zwei Stichproben Woche 9: Hypothesentests für zwei Stichproben Teil VIII Hypothesentests für zwei Stichproben WBL 15/17, 22.06.2015 Alain Hauser Berner Fachhochschule, Technik und Informatik Berner

Mehr

Teil XI. Hypothesentests für zwei Stichproben. Woche 9: Hypothesentests für zwei Stichproben. Lernziele. Beispiel: Monoaminooxidase und Schizophrenie

Teil XI. Hypothesentests für zwei Stichproben. Woche 9: Hypothesentests für zwei Stichproben. Lernziele. Beispiel: Monoaminooxidase und Schizophrenie Woche 9: Hypothesentests für zwei Stichproben Patric Müller Teil XI Hypothesentests für zwei Stichproben ETHZ WBL 17/19, 26.06.2017 Wahrscheinlichkeit und Statistik Patric

Mehr

Lösungen zur Hausaufgabe Statistik für Hydrologen 2016

Lösungen zur Hausaufgabe Statistik für Hydrologen 2016 Dr. Wiltrud Kuhlisch SOS 2016 TU Dresden, Institut für Mathematische Stochastik Lösungen zur Hausaufgabe Statistik für Hydrologen 2016 Aufgabe 1: Das Merkmal Groesse hat metrisches Skalenniveau. Darstellung

Mehr

> read.table("d:\\reifen.txt",header=t) > Reifen

> read.table(d:\\reifen.txt,header=t) > Reifen 1. Aufgabe: Auf einer Reifenrollentestanlage werden Versuche durchgeführt um die Langlaufeigenschaften zu untersuchen. Insbesondere wird die Untersuchung des Abriebs über simulierte Anfahr- Brems- und

Mehr

Hypothesentests mit R Ashkan Taassob Andreas Reisch 21.04.09 1

Hypothesentests mit R Ashkan Taassob Andreas Reisch 21.04.09 1 Hypothesentests mit R Ashkan Taassob Andreas Reisch 21.04.09 1 Inhalt Programmiersprache R Syntax Umgang mit Dateien Tests t Test F Test Wilcoxon Test 2 Test Zusammenfassung 2 Programmiersprache R Programmiersprache

Mehr

Analytische Statistik: Varianzanpassungstest, Varianzhomogenitätstest. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09

Analytische Statistik: Varianzanpassungstest, Varianzhomogenitätstest. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Analytische Statistik: Varianzanpassungstest, Varianzhomogenitätstest Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Varianzanpassungstest Untersuchung der Streuung einer bzw.

Mehr

Kovarianzanalyse. Truthahngewicht. Truthahngewicht. Methoden empirischer Sozialforschung. 1 metrische und mehrere metrische und kategoriale Variablen

Kovarianzanalyse. Truthahngewicht. Truthahngewicht. Methoden empirischer Sozialforschung. 1 metrische und mehrere metrische und kategoriale Variablen Kovarianzanalyse 1 metrische und mehrere metrische und kategoriale Variablen Methoden empirischer Sozialforschung Lineare Modelle (2. Teil) Wie läßt sich die Abhängigkeit einer metrischen Variablen von

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Universität Duisburg-Essen, Fak. 4, FG Instrumentelle Analytik 7. Juni 2007 Statistisches Testen Inhaltsverzeichnis Schätzverfahren und Testverfahren sind Anwendungen der Stichprobentheorie.

Mehr

# Befehl für den Lilliefors-Test

# Befehl für den Lilliefors-Test 1/5 Matthias Rudolf & Diana Vogel R-Kurs Graduiertenakademie September 2017 Loesungsskript: Tests 1a library(nortest) 1b lillie.test Befehl für den Lilliefors-Test 2a, Datensatz "Schachbeispiel einlesen"

Mehr

Biostatistik, WS 2017/18 Der zwei-stichproben-t-test

Biostatistik, WS 2017/18 Der zwei-stichproben-t-test 1/28 Biostatistik, WS 2017/18 Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1718/ 15.12.2017 und 22.12.2017 2/28 Inhalt

Mehr

Biostatistik, WS 2013/2014 Wilcoxons Rangsummen-Test

Biostatistik, WS 2013/2014 Wilcoxons Rangsummen-Test 1/22 Biostatistik, WS 2013/2014 Wilcoxons Rangsummen-Test Matthias Birkner http://www.mathematik.uni-mainz.de/~birkner/biostatistik1314/ 20.12.2013 Motivation 4/22 Bei (ungefähr) glockenförmigen und symmetrisch

Mehr

Metrische und kategoriale Merkmale

Metrische und kategoriale Merkmale Kapitel 6 Metrische und kategoriale Merkmale 6.1 Wie kann man metrische und kategoriale Merkmale numerisch beschreiben? Typischerweise will man geeignete Maßzahlen (beispielsweise Lage- oder Streuungsmaße)

Mehr

Statistik für Ingenieure Vorlesung 12

Statistik für Ingenieure Vorlesung 12 Statistik für Ingenieure Vorlesung 12 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 23. Januar 2017 5.1.1. Tests für eine Stichprobe mit stetiger Skala a) Shapiro-Wilk-Test

Mehr

Übung zur Vorlesung Statistik I WS Übungsblatt 9

Übung zur Vorlesung Statistik I WS Übungsblatt 9 Übung zur Vorlesung Statistik I WS 2012-2013 Übungsblatt 9 17. Dezember 2012 Aufgabe 26 (4 Punkte): In einer Studie mit n = 10 Patienten soll die Wirksamkeit eines Medikaments gegen Bluthochdruck geprüft

Mehr

Kurze Einführung in R

Kurze Einführung in R Dr. Katharina Best Sommersemester 2011 Kurze Einführung in R WiMa-Praktikum Erste Schritte R wird durch Eintippen von R in der Konsole gestartet. Beendet wird es durch q() oder quit(). Es existieren auch

Mehr

Wichtige Befehle in R zur Datenanalyse Ergänzende Unterlagen zur Vorlesung Prof. Dr. Oliver Gansser

Wichtige Befehle in R zur Datenanalyse Ergänzende Unterlagen zur Vorlesung Prof. Dr. Oliver Gansser Wichtige Befehle in R zur Datenanalyse Ergänzende Unterlagen zur Vorlesung Prof. Dr. Oliver Gansser Inhaltsverzeichnis Datenmanagement........................................... 2 Grafische Verfahren..........................................

Mehr

Ein metrisches Merkmal

Ein metrisches Merkmal Kapitel 4 Ein metrisches Merkmal 4.1 Wie kann man ein metrisches Merkmal numerisch beschreiben? Häufigkeitstabellen erzeugt man mit table. Das arithmetische Mittel und den Median berechnet man mit mean

Mehr

Einführung in die Ökonometrie

Einführung in die Ökonometrie Einführung in die Ökonometrie Das Programmpaket R Installierung und Pakete R als Taschenrechner Laden von Datensätzen und Einlesen von Daten Hilfe und Dokumentation Einfaches Datenmanagement Univariate

Mehr

Aufgabe 35 mit R (Ökonometrie SS 2014 an der UdS)

Aufgabe 35 mit R (Ökonometrie SS 2014 an der UdS) Vorbereitungen Aufgabe 35 mit R (Ökonometrie SS 2014 an der UdS) Falls das R - Paket car noch nicht installiert wurde, kann dies mit der Funktion install.packages() erledigt werden. install.packages("car")

Mehr

Univariate explorative Datenanalyse in R

Univariate explorative Datenanalyse in R Univariate explorative Datenanalyse in R Achim Zeileis, Regina Tüchler 2006-10-03 1 Ein metrisches Merkmal Wir laden den Datensatz: R> load("statlab.rda") und machen die Variablen direkt verfügbar: R>

Mehr

14.3 Das Einstichprobenproblem in R

14.3 Das Einstichprobenproblem in R 14.3. DAS EINSTICHPROBENPROBLEM IN R 343 0.553 0.570 0.576 0.601 0.606 0.606 0.609 0.611 0.615 0.628 0.654 0.662 0.668 0.670 0.672 0.690 0.693 0.749 0.844 0.933 die absoluten Häufikeiten n i der Klassen.

Mehr

Datenaufbereitung, Grafische Datenanalyse

Datenaufbereitung, Grafische Datenanalyse Datenaufbereitung, Grafische Datenanalyse R-Übung 2 Statistik III für Nebenfachstudierende LMU WS 2013/14 David Rügamer 6. & 13. November 2013 Nach einer Vorlage von Toni Hilger (WS 11/12) und Arne Kaldhusdal

Mehr

Statistik mit R, Sitzung am

Statistik mit R, Sitzung am Statistik mit R, Sitzung am 19.06.07 Mike Kühne 1 R-Kurs INHALTSVERZEICHNIS Inhaltsverzeichnis 1 Bivariate Statistik 3 1.1 Tabellen.............................. 3 1.2 Zusammenhangsmaße für nominal skalierte

Mehr

Statistik und Wahrscheinlichkeitstheorie UE EDV Übung mit GNU R

Statistik und Wahrscheinlichkeitstheorie UE EDV Übung mit GNU R Statistik und Wahrscheinlichkeitstheorie UE EDV Übung mit GNU R Mathias Stephan Panzenböck e0427417 12. Juni 2006 Beispiel 1 library(e1071) library(car) load('0427417.rdata') a) min(bsp1$x) # = 2.435354

Mehr

Grundlagen der Bioinformatik Assignment 4: Introduction to R. Yvonne Lichtblau SS 2017

Grundlagen der Bioinformatik Assignment 4: Introduction to R. Yvonne Lichtblau SS 2017 Grundlagen der Bioinformatik Assignment 4: Introduction to R Yvonne Lichtblau SS 2017 Presentations Assignment 3 Yvonne Lichtblau: Grundlagen der Bioinformatik, Sommer Semester 2017 2 Overview Assignment

Mehr

Statistics, Data Analysis, and Simulation SS 2015

Statistics, Data Analysis, and Simulation SS 2015 Mainz, June 11, 2015 Statistics, Data Analysis, and Simulation SS 2015 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Dr. Michael O. Distler

Mehr

Dipl.-Volksw. Markus Pullen Wintersemester 2012/13

Dipl.-Volksw. Markus Pullen Wintersemester 2012/13 Statistische Auswertungen mit R Universität Kassel, FB 07 Wirtschaftswissenschaften Dipl.-Volksw. Markus Pullen Wintersemester 2012/13 Beispiele 8. Sitzung Konfidenzintervalle, Hypothesentests > # Anwendungsbeispiel

Mehr

Vergleich von Gruppen I

Vergleich von Gruppen I Vergleich von Gruppen I t-test und einfache Varianzanalyse (One Way ANOVA) Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Der unverbundene t-test mit homogener Varianz Beispiel Modell Teststatistik

Mehr

Univariate explorative Datenanalyse in R

Univariate explorative Datenanalyse in R Univariate explorative Datenanalyse in R Achim Zeileis 2009-02-20 1 Grundlegende Befehle Zunächst laden wir den Datensatz (siehe auch Daten.pdf ) BBBClub R> load("bbbclub.rda") das den "data.frame" BBBClub

Mehr

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test 1/29 Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1516/ 11.12.2015 2/29 Inhalt 1 t-test

Mehr

t-tests Lösung: b) und c)

t-tests Lösung: b) und c) t-tests 2015 Assessmentmodul 1 - Frage B10: Ein Team von Gesundheitspsychologinnen hat ein Programm entwickelt, das die Studierenden der Universität Zürich dazu anregen soll, mehr Sport zu treiben. In

Mehr

Eine Einführung in R: Dichten und Verteilungsfunktionen

Eine Einführung in R: Dichten und Verteilungsfunktionen Eine Einführung in R: Dichten und Verteilungsfunktionen Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 25. November 2009 Bernd

Mehr

Jonathan Harrington. Die t-verteilung

Jonathan Harrington. Die t-verteilung Jonathan Harrington Die t-verteilung Standard error of the mean (SE) ist die Standardabweichung von Mittelwerten Ich werfe 5 Würfel und berechne den Mittelwert der Zahlen µ = 3.5 der wahrscheinlichste

Mehr

Fragestellungen. Ist das Gewicht von Männern und Frauen signifikant unterschiedlich? (2-sample test)

Fragestellungen. Ist das Gewicht von Männern und Frauen signifikant unterschiedlich? (2-sample test) Hypothesen Tests Fragestellungen stab.glu 82 97 92 93 90 94 92 75 87 89 hdl 56 24 37 12 28 69 41 44 49 40 ratio 3.60 6.90 6.20 6.50 8.90 3.60 4.80 5.20 3.60 6.60 glyhb 4.31 4.44 4.64 4.63 7.72 4.81 4.84

Mehr

Grundlagen der Bioinformatik Übung 5 Einführung in R. Ulf Leser, Yvonne Mayer

Grundlagen der Bioinformatik Übung 5 Einführung in R. Ulf Leser, Yvonne Mayer Grundlagen der Bioinformatik Übung 5 Einführung in R Ulf Leser, Yvonne Mayer Introduction to R Ulf Leser: Grundlagen der Bioinformatik, Sommer Semester 2016 2 Einführung in R Voraussetzung: funktionsfähige

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) und der Wilcoxon-Test Martin Hutzenthaler & Dirk Metzler 20. Mai 2010 Inhaltsverzeichnis

Mehr

Eine Einführung in R: Dichten und Verteilungsfunktionen

Eine Einführung in R: Dichten und Verteilungsfunktionen Eine Einführung in R: Dichten und Verteilungsfunktionen Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/

Mehr

FRAGESTUNDE WS 2016/17 QM 2. Dr. Christian Schwarz 1

FRAGESTUNDE WS 2016/17 QM 2. Dr. Christian Schwarz 1 FRAGESTUNDE Dr. Christian Schwarz 1 #2 - Allgemein Q: Müssen wir den Standard Error händisch berechnen können? R: Nein. Q: Hat das Monte Carlo Experiment irgendeine Bedeutung für uns im Hinblick auf die

Mehr

Programmieren mit statistischer Software

Programmieren mit statistischer Software Programmieren mit statistischer Software Eva Endres, M.Sc. Institut für Statistik Ludwig-Maximilians-Universität München Datenaufbereitung The Forbes 2000 Ranking of the World s Biggest Companies I Paket

Mehr

Übung zur Vorlesung Statistik I WS Übungsblatt 10

Übung zur Vorlesung Statistik I WS Übungsblatt 10 Übung zur Vorlesung Statistik I WS 2012-2013 Übungsblatt 10 7. Januar 2013 Aufgabe 29 (4 Punkte): Der Datensatz Blutdruckstudie.txt enthält das Ergebnis einer Studie, die die Wirksamkeit eine Medikaments

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) und der Wilcoxon-Test Martin Hutzenthaler & Dirk Metzler http://www.zi.biologie.uni-muenchen.de/evol/statgen.html

Mehr

das Kleingedruckte...

das Kleingedruckte... Gepaarte t-tests das Kleingedruckte... Datenverteilung ~ Normalverteilung QQ-plot statistischer Test (Shapiro-Wilk, Kolmogorov-Smirnov) wenn nicht : nicht-parametrische Tests gleiche Varianz (2-Proben

Mehr

Versuchsplanung SoSe 2015 R - Lösung zu Übung 1 am 24.04.2015 Autor: Ludwig Bothmann

Versuchsplanung SoSe 2015 R - Lösung zu Übung 1 am 24.04.2015 Autor: Ludwig Bothmann Versuchsplanung SoSe 2015 R - Lösung zu Übung 1 am 24.04.2015 Autor: Ludwig Bothmann Contents Aufgabe 1 1 b) Schätzer................................................. 3 c) Residuenquadratsummen........................................

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2

Mehr

R-WORKSHOP II. Inferenzstatistik. Johannes Pfeffer

R-WORKSHOP II. Inferenzstatistik. Johannes Pfeffer R-WORKSHOP II Inferenzstatistik Johannes Pfeffer Dresden, 25.1.2011 01 Outline Lösung der Übungsaufgabe Selbstdefinierte Funktionen Inferenzstatistik t-test Kruskal-Wallis Test Übungsaufgabe TU Dresden,

Mehr

Wiederholungsklausur Wirtschaftsmathematik Lösungshinweise

Wiederholungsklausur Wirtschaftsmathematik Lösungshinweise Wiederholungsklausur Wirtschaftsmathematik Lösungshinweise Prüfungsdatum: 9. September 205 Prüfer: Etschberger Studiengang: Wirtschaftsingenieurwesen Aufgabe 5 Punkte Karl möchte heute, am..205, ein Auto

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 9. Dezember 2009 Bernd Klaus, Verena Zuber

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R Eine Einführung in R: Statistische Tests

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) und der Wilcoxon-Test Dirk Metzler 24. Mai 2017 Inhaltsverzeichnis 1 Wiederholung:

Mehr

Verallgemeinerte lineare Modelle. Promotion. Promotion. Methoden empirischer Sozialforschung. 1 binäre und mehrere metrische und kategoriale Variablen

Verallgemeinerte lineare Modelle. Promotion. Promotion. Methoden empirischer Sozialforschung. 1 binäre und mehrere metrische und kategoriale Variablen Verallgemeinerte lineare Modelle 1 binäre und mehrere metrische und kategoriale Variablen Methoden empirischer Sozialforschung Verallgemeinerte lineare Modelle () Wie läßt sich die Abhängigkeit der Erfolgswahrscheinlichkeit

Mehr

Statistische Datenanalyse mit R, Korrelation und Regression. Dr. Andrea Denecke Leibniz Universität IT-Services

Statistische Datenanalyse mit R, Korrelation und Regression. Dr. Andrea Denecke Leibniz Universität IT-Services Statistische Datenanalyse mit R, Korrelation und Regression Dr. Andrea Denecke Leibniz Universität IT-Services Korrelationsanalyse Eine Korrelationsanalyse soll herausfinden Ob ein linearer Zusammenhang

Mehr

Stochastik Praktikum Testtheorie

Stochastik Praktikum Testtheorie Stochastik Praktikum Testtheorie Thorsten Dickhaus Humboldt-Universität zu Berlin 11.10.2010 Definition X: Zufallsgröße mit Werten in Ω, (Ω, F, (P ϑ ) ϑ Θ ) statistisches Modell Problem: Teste H 0 : ϑ

Mehr

Prüfungstermin aus Angewandter Statistik (WS 2012/13) Name:

Prüfungstermin aus Angewandter Statistik (WS 2012/13) Name: 1. In einem als Paarvergleich geplanten Experiment wurden an 7 Probanden zeitlich hintereinander eine Testformulierung (A) und (nach einer ausreichend langen Wash-out-Periode) eine Kontrolle (K) verabreicht.

Mehr

Verteilungen. Session 5

Verteilungen. Session 5 Verteilungen Session 5 1 Verteilungen in R Das R System kennt viele Verteilungen, darunter praktisch alle Standardverteilungen, denen man üblicherweise in Einführungskursen in die Statistik begegnet. Die

Mehr

Programmieren mit statistischer Software

Programmieren mit statistischer Software Programmieren mit statistischer Software Eva Endres, M.Sc. Institut für Statistik Ludwig-Maximilians-Universität München Vektorwertiges Programmieren Programmieren ohne explizite Schleife I Vektorisierung

Mehr

Statistische Auswertung der Daten von Blatt 13

Statistische Auswertung der Daten von Blatt 13 Statistische Auswertung der Daten von Blatt 13 Problemstellung 1 Graphische Darstellung der Daten 1 Diskussion der Normalverteilung 3 Mittelwerte und deren Konfidenzbereiche 3 Signifikanz der Behandlung

Mehr

Eine Einführung in R: Dichten und Verteilungsfunktionen

Eine Einführung in R: Dichten und Verteilungsfunktionen Eine Einführung in R: Dichten und Verteilungsfunktionen Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/

Mehr

Güteanalyse. Nochmal zur Erinnerung: Hypothesentest. Binominalverteilung für n=20 und p=0,5. Münzwurf-Beispiel genauer

Güteanalyse. Nochmal zur Erinnerung: Hypothesentest. Binominalverteilung für n=20 und p=0,5. Münzwurf-Beispiel genauer Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 Güteanalyse Prof. Walter F. Tichy Fakultät für Informatik 1 Fakultät für Informatik 2 Nochmal zur Erinnerung: Hypothesentest Am Beispiel

Mehr

Gesamtcholesterin Region A Region B <170 (optimal) 80 >=170 (Risiko)

Gesamtcholesterin Region A Region B <170 (optimal) 80 >=170 (Risiko) AUFGABEN 1. In einer Studie wurde ein Blutparameter am Beginn und am Ende einer Therapie bestimmt. Es ergab sich, dass bei 35 Probanden eine Veränderung des Parameters eintrat, und zwar lag der Wert bei

Mehr

1. Wie groß ist die Wahrscheinlichkeit, dass beide nicht gewinnen? Hinweis: Die Vierfeldertafel könnte hilfreich sein.

1. Wie groß ist die Wahrscheinlichkeit, dass beide nicht gewinnen? Hinweis: Die Vierfeldertafel könnte hilfreich sein. Aufgabe 1 Die Zwillinge Daida und Iballa M. kämpfen um den Weltmeistertitel im Windsurfen. Vor einem Wettkampf in Torbole macht der berühmte Moderator Roberto H. einen Vorbericht. In seiner Analyse beziffert

Mehr

Nicht-parametrische statistische Verfahren

Nicht-parametrische statistische Verfahren Nicht-parametrische statistische Verfahren von Peter Pfaffelhuber Version: 7. Dezember 015 Die statistischen Verfahren, die wir bisher kennengelernt haben, basieren auf statistischen Modellen, die immer

Mehr

Biostatistik, Sommer 2017

Biostatistik, Sommer 2017 1/57 Biostatistik, Sommer 2017 : Gepaarter, Ungepaarter t-test, Welch Test Prof. Dr. Achim Klenke http://www.aklenke.de 12. Vorlesung: 07.07.2017 2/57 Inhalt 1 Gepaarter t-test Ungepaarter t-test Ungepaarter

Mehr

PROC NPAR1WAY. zum Durchführen des U-Tests für zwei unverbundene Stichproben (für quantitative nicht-normalverteilte Merkmale)

PROC NPAR1WAY. zum Durchführen des U-Tests für zwei unverbundene Stichproben (für quantitative nicht-normalverteilte Merkmale) PROC NPAR1WAY zum Durchführen des U-Tests für zwei unverbundene Stichproben (für quantitative nicht-normalverteilte Merkmale) Allgemeine Form: PROC NPAR1WAY DATA=name Optionen ; VAR variablenliste ; CLASS

Mehr

e) Beim klassischen Signifikanztest muß die Verteilung der Prüfgröße unter der Nullhypothese

e) Beim klassischen Signifikanztest muß die Verteilung der Prüfgröße unter der Nullhypothese 9 Hypothesentests 1 Kapitel 9: Hypothesentests A: Übungsaufgaben: [ 1 ] Bei Entscheidungen über das Ablehnen oder Nichtablehnen von Hypothesen kann es zu Irrtümern kommen. Mit α bezeichnet man dabei die

Mehr

Gesamtcholesterin Region A Region B <170 (optimal) 80 >=170 (Risiko)

Gesamtcholesterin Region A Region B <170 (optimal) 80 >=170 (Risiko) GRUNDAUFGABEN ZU DEN 1-STICHPROBENVERGLEICHEN 1. In einer Studie wurde ein Blutparameter am Beginn und am Ende einer Therapie bestimmt. Es ergab sich, dass bei 35 Probanden eine Veränderung des Parameters

Mehr

Statistische Software (R)

Statistische Software (R) Statistische Software (R) Paul Fink, M.Sc., Eva Endres, M.Sc. Institut für Statistik Ludwig-Maximilians-Universität München Grafiken Leitmotiv bei Erstellung von Grafiken Sinnvolle, leicht zu verstehende

Mehr

1. Nennen Sie den für das Merkmal X geeigneten Skalentyp und begründen Sie Ihre Antwort.

1. Nennen Sie den für das Merkmal X geeigneten Skalentyp und begründen Sie Ihre Antwort. Aufgabe 1 150 Personen gaben bei einer Befragung an, wie viel Geld sie in diesem Jahr für Weihnachtsgeschenke ausgegeben haben. Die Ergebnisse der Befragung sind in nachfolgender Tabelle zusammengefasst,

Mehr

1. Erklären Sie den Unterschied zwischen einem einseitigen und zweiseitigen Hypothesentest.

1. Erklären Sie den Unterschied zwischen einem einseitigen und zweiseitigen Hypothesentest. Statistik II Übung 3: Hypothesentests Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier Stichproben). Verwenden

Mehr

> library(nlme) > fit <- lme(y ~ 1, random = ~1 id, data = sim.y.long) > summary(fit)

> library(nlme) > fit <- lme(y ~ 1, random = ~1 id, data = sim.y.long) > summary(fit) Übungsblatt Analyse longitudinaler Daten und Zeitreihen SoSe 007 Donna Pauler Ankerst, Ulrich Mansmann, Volkmar Henschel, Michael Höhle Übung: Montag 0..007 Aufgabe 1 (Mixed Model Simulation) In dieser

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 4. Der t-test

Wahrscheinlichkeitsrechnung und Statistik für Biologen 4. Der t-test Wahrscheinlichkeitsrechnung und Statistik für Biologen 4. Der t-test Matthias Birkner & Dirk Metzler 12. Mai 2009 Inhaltsverzeichnis 1 t-test für gepaarte Stichproben 1 1.1 Beispiel: Orientierung bei Trauerschnäppern..........................

Mehr

Statistisches Data Mining (StDM) Woche 9

Statistisches Data Mining (StDM) Woche 9 Statistisches Data Mining (StDM) HS 2016 Woche 9 Aufgabe 1 Churn bei einem Telephonanbieter In dieser Aufgabe wird das Churn-Verhalten (Wechseln zu einem anderen Anbieter) von Telekommunikationskunden

Mehr

Teil X. Hypothesentests für eine Stichprobe. Woche 8: Hypothesentests für eine Stichprobe. Lernziele. Statistische Hypothesentests

Teil X. Hypothesentests für eine Stichprobe. Woche 8: Hypothesentests für eine Stichprobe. Lernziele. Statistische Hypothesentests Woche 8: Hypothesentests für eine Stichprobe Teil X Patric Müller Hypothesentests für eine Stichprobe ETHZ WBL 17/19, 19.06.2017 Wahrscheinlichkeit und Statistik Patric

Mehr

Grundlagen der Bioinformatik Übung 5: Microarray Analysis. Yvonne Lichtblau

Grundlagen der Bioinformatik Übung 5: Microarray Analysis. Yvonne Lichtblau Grundlagen der Bioinformatik Übung 5: Microarray Analysis Yvonne Lichtblau Vorstellung Lösungen Übung 4 Yvonne Lichtblau: Grundlagen der Bioinformatik, Sommer Semester 2017 2 Lösungen vorstellen - Übung

Mehr

Varianzanalyse mit Messwiederholungen. (Repeated-measures (M)ANOVA)

Varianzanalyse mit Messwiederholungen. (Repeated-measures (M)ANOVA) Varianzanalyse mit Messwiederholungen (Repeated-measures (M)ANOVA) Jonathan Harrington Befehle: anova2.txt pfad = "Verzeichnis wo Sie anovaobjekte gespeichert haben" attach(paste(pfad, "anovaobjekte",

Mehr

Teil VII Hypothesentests für eine Stichprobe

Teil VII Hypothesentests für eine Stichprobe Woche 7: Hypothesentests für eine Stichprobe Teil VII Hypothesentests für eine Stichprobe WBL 15/17, 15.06.2015 Alain Hauser Berner Fachhochschule, Technik und Informatik Berner Fachhochschule

Mehr

Wiederholung und ein mehrfaktorielles Verfahren. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09

Wiederholung und ein mehrfaktorielles Verfahren. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Wiederholung und ein mehrfaktorielles Verfahren Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Einstieg und Wiederholung Daten unterscheiden sich in ihrem mathematischen Informationsgehalt!

Mehr

Biostatistik. Lösung

Biostatistik. Lösung Prof. Dr. Achim Klenke Fridolin Kielisch 13. Übung zur Vorlesung Biostatistik im Sommersemester 2015 Lösung Aufgabe 1: a) Ich führe einen zweiseitigen Welch-Test durch, weil ich annehme, dass die Daten

Mehr

Klausur Stochastik und Statistik (WS 2008/09)

Klausur Stochastik und Statistik (WS 2008/09) Klausur Stochastik und Statistik (WS 2008/09) Aufgabe: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Pkt. mgl. 2 1 1 1 8 4 4 2 7 2 2 2 2 2 2 1 3 2 2 50 Pkt erreicht: Name, Vorname: Matrikelnummer: Fachrichtung:

Mehr

Lösung zu Kapitel 11: Beispiel 1

Lösung zu Kapitel 11: Beispiel 1 Lösung zu Kapitel 11: Beispiel 1 Eine Untersuchung bei 253 Personen zur Kundenzufriedenheit mit einer Einzelhandelskette im Südosten der USA enthält Variablen mit sozialstatistischen Daten der befragten

Mehr

Vergleich zweier Stichproben

Vergleich zweier Stichproben zurück zum Inhaltsverzeichnis Die Werte sind verbunden, abhängig oder korreliert. Beispiel: Eine Probe wird mit zwei Messgeräten bestimmt. Es gibt eine paarweise Zuordnung. Die Werte sind unabhängig also

Mehr

1 Ausgangssituation und Versuchsziel

1 Ausgangssituation und Versuchsziel 1 Ertragsunterschiede in Abhängigkeit von Pflanztiefe und Pflanztermin bei Knoblauch mit Wintergerste als Untersaat LFS Obersiebenbrunn 2015 1 Ausgangssituation und Versuchsziel... 1 2 Methode und Sorten...

Mehr

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management für Betriebswirtschaft und internationales Management Sommersemester 2015 Prof. Dr. Stefan Etschberger Hochschule Augsburg Testverteilungen Chi-Quadrat-Verteilung Sind X 1,..., X n iid N(0; 1)-verteilte

Mehr

Dipl.-Volksw. Markus Pullen Wintersemester 2012/13

Dipl.-Volksw. Markus Pullen Wintersemester 2012/13 Statistische Auswertungen mit R Universität Kassel, FB 7 Wirtschaftswissenschaften Dipl.-Volksw. Markus Pullen Wintersemester 212/13 Abschlussübung 1. Sitzung: Laden Sie die Datei BIP S_Kreise_29.csv aus

Mehr

Lineare Regression in R, Teil 2

Lineare Regression in R, Teil 2 Lineare Regression in R, Teil 2 Christian Kleiber Abt. Quantitative Methoden, WWZ, Universität Basel 28. Oktober 2009 1 Vorbereitungen Zur Illustration betrachten wir wieder den Datensatz CASchools. Laden

Mehr

Empirische Wirtschaftsforschung in R

Empirische Wirtschaftsforschung in R Empirische Wirtschaftsforschung in R Schätzung der keynesianischen Geldnachfragefunktion auf Basis von Daten der dänischen Volkswirtschaft Jonas Richter-Dumke Universität Rostock, Institut für Volkswirtschaftslehre

Mehr

Fragestellungen. Ist das Gewicht von Männern und Frauen signifiant unterschiedlich? (2-sample test)

Fragestellungen. Ist das Gewicht von Männern und Frauen signifiant unterschiedlich? (2-sample test) Hypothesen Tests Fragestellungen stab.glu hdl ratio glyhb location age gender height weight frame 82 56 3.60 4.31 Buckingham 46 female 62 121 medium 97 24 6.90 4.44 Buckingham 29 female 64 218 large 92

Mehr

Musterlösung zu Serie 8

Musterlösung zu Serie 8 Prof. Dr. W. Stahel, Dr. J. Ernest Regression HS 2017 Musterlösung zu Serie 8 1. Im Data Frame http://stat.ethz.ch/teaching/datasets/wbl/umwelt.dat sind die Ergebnisse einer Umfrage zum Umweltschutz gegeben.

Mehr

2016SS_Statistik_Vorlesung_0622.R ste Sun Jun 26 11:08:

2016SS_Statistik_Vorlesung_0622.R ste Sun Jun 26 11:08: 2016SS_Statistik_Vorlesung_0622.R ste Sun Jun 26 11:08:43 2016 # Statistik 22.6.2016 # Lade Daten D

Mehr

Sie wissen noch, dass 18.99% der Surfer, die kein Smartphone haben, pro Monat weniger als 20 Stunden das Internet nutzen, d.h. f(y 1 X 2 ) =

Sie wissen noch, dass 18.99% der Surfer, die kein Smartphone haben, pro Monat weniger als 20 Stunden das Internet nutzen, d.h. f(y 1 X 2 ) = Aufgabe 1 In einer Umfrage wird der Besitz eines Smartphones (Merkmal X) und die Nutzungsdauer des Internets pro Monat (Merkmal Y ) untersucht. Merkmal X hat zwei Ausprägungen: X 1 : Besitz und X 2 : Nichtbesitz.

Mehr

Biostatistik 101 Korrelation - Regressionsanalysen

Biostatistik 101 Korrelation - Regressionsanalysen Good Data don't need statistics Biostatistik 101 Korrelation - Regressionsanalysen Carl Herrmann IPMB Uni Heidelberg & DKFZ B080 carl.herrmann@uni-heidelberg.de Korrelation Sind Alter und Blutdruck miteinander

Mehr

ANGEWANDTE STATISTIK II Prüfungstermin Name:

ANGEWANDTE STATISTIK II Prüfungstermin Name: Die Beantwortung der Rechenaufgaben hat zusätzlich zu den numerischen Ergebnissen zu beinhalten: - Feststellung des Problemtyps, Angabe der Lösungsmethode; - bei den Testverfahren: Hypothesen, P-Wert,

Mehr

Statistik für Ingenieure Vorlesung 11

Statistik für Ingenieure Vorlesung 11 Statistik für Ingenieure Vorlesung 11 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 23. Januar 2018 5. Schließende Statistik 5.1. Statistische Tests (Signifikanztests)

Mehr

Computerwerkstatt: Umgang mit Daten in R (- Studio)

Computerwerkstatt: Umgang mit Daten in R (- Studio) Computerwerkstatt: Umgang mit Daten in R (- Studio) Dipl.-Psych. Jörg-Henrik Heine 14.11.2012 1 Allgemeines und Vorbereitung Angedacht ist zunächst eine knappe Einführung in das graphical user Interface

Mehr

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Warum überhaupt Gedanken machen? Was fehlt, ist doch weg, oder? Allgegenwärtiges Problem in psychologischer Forschung Bringt Fehlerquellen

Mehr

Beurteilung von Analysenwerten im Hinblick auf eine Grenzwertüberschreitung

Beurteilung von Analysenwerten im Hinblick auf eine Grenzwertüberschreitung Beurteilung von Analysenwerten im Hinblick auf eine Grenzwertüberschreitung K. Molt Universität Duisburg-Essen, Fak. 4, FG Instrumentelle Analytik 3. Juni 2007 K. Molt (Fachgeb. IAC) 3. Juni 2007 1 / 41

Mehr

Einführung in die Angewandte Bioinformatik: Datenanalyse mit R

Einführung in die Angewandte Bioinformatik: Datenanalyse mit R Einführung in die Angewandte Bioinformatik: Datenanalyse mit R 20.05.2010 Prof. Dr. Sven Rahmann 1 Funktionsaufruf mit benannten Parametern Es ist Konvention, einer Funktion erst die nötigen Daten zu übergeben;

Mehr