W-Rechnung und Statistik für Ingenieure Übung 13

Ähnliche Dokumente
Teil XI. Hypothesentests für zwei Stichproben. Woche 9: Hypothesentests für zwei Stichproben. Lernziele. Beispiel: Monoaminooxidase und Schizophrenie

Statistik für Ingenieure Vorlesung 12

Teil VIII Hypothesentests für zwei Stichproben

> read.table("d:\\reifen.txt",header=t) > Reifen

Statistik für Ingenieure Vorlesung 13

Hypothesentests mit R Ashkan Taassob Andreas Reisch

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Fragestellungen. Ist das Gewicht von Männern und Frauen signifikant unterschiedlich? (2-sample test)

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Statistik für Ingenieure Vorlesung 11

Analytische Statistik: Varianzanpassungstest, Varianzhomogenitätstest. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09

14.3 Das Einstichprobenproblem in R

Eine Einführung in R: Statistische Tests

Stochastik Praktikum Testtheorie

das Kleingedruckte...

Eine Einführung in R: Statistische Tests

Übung zur Vorlesung Statistik I WS Übungsblatt 9

Biostatistik, WS 2017/18 Der zwei-stichproben-t-test

Vergleich von Gruppen I

Eine Einführung in R: Statistische Tests

Blockpraktikum zur Statistik mit R

Biostatistik, Sommer 2017

Biostatistik, Sommer Nichtparametrische Statistik: Mediantest, Rangsummentest, χ 2 -Test. Prof. Dr. Achim Klenke.

7. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Fragestellungen. Ist das Gewicht von Männern und Frauen signifiant unterschiedlich? (2-sample test)

Biostatistik, WS 2013/2014 Wilcoxons Rangsummen-Test

Aufgabe Σ erreichbare Punkte

Klausur Stochastik und Statistik (WS 2008/09)

Teil X. Hypothesentests für eine Stichprobe. Woche 8: Hypothesentests für eine Stichprobe. Lernziele. Statistische Hypothesentests

Dipl.-Volksw. Markus Pullen Wintersemester 2012/13

Vergleich zweier Stichproben

Teil VII Hypothesentests für eine Stichprobe

Vorlesung: Statistik II für Wirtschaftswissenschaft

Metrische und kategoriale Merkmale

Biostatistik. Lösung

Jonathan Harrington. Die t-verteilung

Statistik und Wahrscheinlichkeitstheorie UE EDV Übung mit GNU R

# Befehl für den Lilliefors-Test

Statistik Vorlesung 6 (Tests II)

Einfaktorielle Varianzanalyse

Biostatistik 101 Korrelation - Regressionsanalysen

Statistisches Testen

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Mehrere metrische Merkmale

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg

1. Nennen Sie den für das Merkmal X geeigneten Skalentyp und begründen Sie Ihre Antwort.

Statistik II. IV. Hypothesentests. Martin Huber

Statistik mit R, Sitzung am

Mathematik 2 für Naturwissenschaften

Proportions Tests. Proportions Test können in zwei Fällen benutzt werden. Vergleich von beobachteten vs. erwarteten Proportionen

1 (2π) m/2 det (Σ) exp 1 ]

Lösungen zur Hausaufgabe Statistik für Hydrologen 2016

1 Ausgangssituation und Versuchsziel

Werkzeuge der empirischen Forschung

Tests für Erwartungswert & Median

Klausur zur Vorlesung

Biostatistik, WS 2017/18 Der t-test

Kapitel 10 Mittelwert-Tests Einstichproben-Mittelwert-Tests 10.2 Zweistichproben Mittelwert-Tests

Musterlösung zu Serie 8

Statistik Vorlesung 6 (Tests II)

Mathematik 2 für Naturwissenschaften

Statistik Vorlesung 6 (Tests II)

1. Übungsblatt zu Wahrscheinlichkeitsrechnung und Statistik in den Ingenieurswissenschaften

Statistisches Testen

Statistische Auswertung der Daten von Blatt 13

Multivariate Verfahren

4.1. Nullhypothese, Gegenhypothese und Entscheidung

W-Rechnung und Statistik für Ingenieure Übung 5

Programmieren in Anwendungen

Metrische Merkmale in R. Metrische Merkmale in R. Beispiel: Nitratbelastung. Beispiel: Nitratbelastung

3. Geben Sie Modus, Erwartungswert und Varianz der Zufallsvariablen X an.

Nicht-parametrische statistische Verfahren

ANGEWANDTE STATISTIK II Prüfungstermin Name:

7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien

Biostatistik 101 Korrelation - Regressionsanalysen

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

Arbeitsbuch zur deskriptiven und induktiven Statistik

Methodenlehre II, SoSe 2015

Mathematische und statistische Methoden II

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen

Ausgangssituation und Versuchsziel

Einführung in die Statistik

Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

Ein metrisches Merkmal

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

1. Erklären Sie den Unterschied zwischen einem einseitigen und zweiseitigen Hypothesentest.

Statistische Datenanalyse mit R, Korrelation und Regression. Dr. Andrea Denecke Leibniz Universität IT-Services

Blockpraktikum zur Statistik mit R

Transkript:

W-Rechnung und Statistik für Ingenieure Übung 13

Nächste Woche: Probeklausur Bringen Sie sich ein leeres Exemplar der Probeklausur mit, um sich eine Musterlösung zu erstellen.

Aufgabe 1 : Testproblem Testproblem: Betrachten wieder den Datensatz BLECH.DAT: > BLECH [1] 346 363 360 318 346 268 299 287 310 349 333 365 281 265 344 Frage: Wird im Mittel ein Wert kleiner als 310 angenommen?

Aufgabe 1 : Teststatistik Entscheide mich gegen H 0 : µ 310, falls 310 x groß, genauer: Teststatistik: wobei N=15, µ 0 = 310. P-Wert: P H0 ( 15 310 X s(x) ) > T(x) = P H0 ( 15 (310 X) s(x) ( 15 X 310 = P H0 s(x) = F t14 ( T(x)) ) < T(x) ) < T(x) F t14 ( T(x)) Verteilungsfunktion in T(x) der t 14 -Verteilung.

Aufgabe 1 : Berechnung des P-Werts Bestimme den P-Wert für BLECH.DAT: > N<-length(BLECH) > mu0<-310 > TS<-sqrt(N)*(mu0-mean(BLECH))/sd(BLECH) > TS [1] -1.354669 > pt(-ts,df=n-1) [1] 0.9015088 oder > t.test(blech,alternative="less",mu=mu0)$p.value [1] 0.9015088 Entscheidung:

Aufgabe 1 : Alternative Entscheidungsregel Alternative zu P-Wert: Entscheide gegen H 0, falls > alpha<-0.05 > #kritischer Wert > qt(1-alpha,df=n-1) [1] 1.76131 > #lehne H0 ab, falls TS>kritischer Wert > TS>qt(1-alpha,df=N-1) [1] FALSE Entscheidung:

Aufgabe 1 : Darstellung der Gütefunktion Gütefunktion: γ(µ) = P µ (Entscheidung für H 1 ) = F t14 ( N µ µ 0 σ )( t N 1,1 α) > mus<-seq(200,400,0.5) #Ausgewertete mu s > plot(mus,pt(-qt(1-alpha,df=n-1),df=n-1, + ncp=sqrt(n)*(mus-mu0)),type="l", + main="g"utefunktion",ylab="",lwd=3,ylim=c(0,1)) > abline(h=alpha,lwd=2,lty=2) #Linie bei Niveau zeichnen

Aufgabe 1 : Plot der Gütefunktion Gütefunktion 0.0 0.2 0.4 0.6 0.8 1.0 200 250 300 350 400 mu

Aufgabe 2(a) : Testproblem Nun wollen wir Aussagen zur Streuung testen. Wir nehmen weiterhin an, dass Daten normalverteilt sind Testproblem: Entscheidungsregel: Genauer: T(x) = (N 1) s(x) σ 0 = (15 1) s(x) 30, Lehne H 0 ab, falls T(x) > χ 2 N 1;1 α oder T(x) < χ 2 N 1; α, 2 2 wobei χ 2 N 1, α das α 2 2 Quantil einer χ2 -Verteilung mit N-1 Freiheitsgraden bezeichnet.

Aufgabe 2(a) : Berechnung in R > N<-length(BLECH) > alpha<-0.05 > s0<-30 > TS_var<-(N-1)*sd(BLECH)/s0 > k1<-qchisq(1-alpha/2,df=n-1) > k2<-qchisq(alpha/2,df=n-1) > TS_var>k1 [1] FALSE > TS_var<k2 [1] FALSE Entscheidung:

Aufgabe 2(b) : Testproblem Testproblem: Lehne H 0 ab, falls s(x) 30 klein. Genauer: T(x) = (N 1) s(x) = (15 1) s(x) σ 0 30, Entscheidungsregel: Lehne H 0 ab, falls T(x) < χ 2 N 1;α (α-quantil der χ 2 N 1 -Verteilung) Der Test heißt Ein-Stichproben χ 2 (Chi-Quadrat)-Test

Aufgabe 2(b) : Berechnung in R > TS_var<-(N-1)*sd(BLECH)/s0 > k<-qchisq(alpha,df=n-1) > TS_var<k [1] FALSE Entscheidung:

Aufgabe 3 : Vergleich von Blechproben Haben zuzätzlich zu BLECH Daten einer zweiten Produktionslinie: 364, 339, 289, 304, 362, 324, 314, 330, 301, 274, 319, 314, 326, 328, 310 Fragen: Unterscheiden sich die Blechdicken der beiden Produktionslinien im Mittel (Erwartungswert)? Unterscheiden sie sich in der Streuung (Varianz)?

Aufgabe 3 : Tests für Mittelwert Testproblem: H 0 : µ BLECH1 = µ BLECH2 gegen H 1 : µ BLECH1 µ BLECH2 Mögliche Tests: Zweiseitiger t-test Voraussetzungen: Welch-Zweiseitiger t-test Voraussetzung: Wilcoxon-Test

Aufgabe 3 : Annahme einer Normalverteilung Verwenden ein graphisches und ein statistisches Verfahren: graphisch : qqnorm(xdata) statistisch:

Aufgabe 3 : Q-Q-Normal-Plot > qqnorm(blech,pch=16) #Anfertigen des Plots > qqline(blech,lwd=3) #Linienbreite ändern > qqnorm(blech2,pch=16) #Anfertigen des Plots > qqline(blech2,lwd=2) #Linienbreite ändern Normal Q Q Plot Normal Q Q Plot Sample Quantiles 280 300 320 340 360 Sample Quantiles 280 300 320 340 360 1 0 1 Theoretical Quantiles 1 0 1 Theoretical Quantiles Ergebnis:

Aufgabe 3 : Shapiro-Wilk-Test Nullhypothese des Tests: Normalverteilung liegt vor > shapiro.test(blech) Shapiro-Wilk normality test data: BLECH W = 0.9063, p-value = 0.1189 > shapiro.test(blech2) Shapiro-Wilk normality test data: BLECH2 W = 0.9679, p-value = 0.8254 Ergebnis:

Aufgabe 3 : Varianzen Testproblem: 2 Produktionslinien, daher 2 ungepaarte Stichproben Zweiseitiger Varianztest (F-Test) braucht normalverteilte Daten Teststatistik: Entscheidungsregel: Lehne H 0 : σ BLECH1 = σ BLECH2 ab, falls s(x)2 s(y) 2 > F N1 1;N 2 1; 1 α 2 oder s(x)2 s(y) 2 < F N1 1;N 2 1; α 2.

Aufgabe 3 : Test der Varianzen in R > var.test(blech,blech2) F test to compare two variances data: BLECH and BLECH2 F = 2.1144, num df = 14, denom df = 14, p-value = 0.1736 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.7098594 6.2978609 sample estimates: ratio of variances 2.114378 Entscheidung:

Aufgabe 3 : Mittelwerte Testproblem: Varianzen können als gleich angenommen werden (Vgl. F-Test) Normalverteilung wird angenommen (Vgl. Q-Q-Normal-Plot und Shapiro-Wilk-Test) Zwei-seitiger t-test für zwei Stichproben Teststatistik: T(x, y) = N1 N 2 N 1 + N 2 x ȳ s 12 (x, y) Entscheidungsregel: Lehne H 0 ab, falls N1 N 2 x ȳ N 1 +N 2 s 12 (x,y) > t N 1 +N 2 2;1 α 2

Aufgabe 3 : Test der Mittelwerte in R > t.test(blech,blech2,var.equal=t) Two Sample t-test data: BLECH and BLECH2 t = 0.2184, df = 28, p-value = 0.8287 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -20.11148 24.91148 sample estimates: mean of x mean of y 322.2667 319.8667 Entscheidung:

Aufgabe 3 : Welch-Zweiseitiger t-test > t.test(blech,blech2,alternative= two.sided +,var.equal=f)$p.value [1] 0.8289144 > t.test(blech,blech2,alternative= two.sided +,var.equal=f)$statistic t 0.2183853 Entscheidung:

Aufgabe 3 : Wilcoxon-Test Alternativer Test für die Mittelwerte, der keine Normalverteilung braucht: > wilcox.test(blech,blech2,alternative= two.sided ) Wilcoxon rank sum test with continuity correction data: BLECH and BLECH2 W = 121.5, p-value = 0.7243 alternative hypothesis: true location shift is not equal to 0 Entscheidung:

Aufgabe 4 : Streudiagramm der Daten Stellen Druckfestigkeit und Festbetonrohdichte dar: Festbetonrohdichte 2.45 2.50 2.55 110 120 130 140 150 160 170 180 Druck

Aufgabe 4 : Tests auf Zusammenhang Testproblem: H 0 : ρ = 0 gegen H 1 : ρ 0 Zweiseitiger Korrelations-Test basierend auf Korrelationskoeffizienten von Pearson Voraussetzungen: Zweiseitiger Korrelations-Test basierend auf Spearmanschen Rangkorrelationskoeffizienten χ 2 -Test, vor allem auch für nominale Merkmale

Aufgabe 4 : Prüfen einer Normalverteilung der Daten (1) > shapiro.test(beton$druck)$p.value [1] 0.01221 > shapiro.test(beton$festbetonrohdichte)$p.value [1] 0.003074 Entscheidung:

Aufgabe 4 : Prüfen einer Normalverteilung der Daten (2) > qqnorm(beton$druck,pch=16) > qqline(beton$druck,lwd=3) > qqnorm(beton$festbetonrohdichte,pch=16) > qqline(beton$festbetonrohdichte,lwd=3) Normal Q Q Plot Normal Q Q Plot Sample Quantiles 110 130 150 170 Sample Quantiles 2.45 2.50 2.55 2 1 0 1 2 Theoretical Quantiles 2 1 0 1 2 Theoretical Quantiles

Aufgabe 4 : Test auf Zusammenhang Benutze aufgrund der Datenanalyse den Korrelations-Test basierend auf Rangkorrelationskoeffizienten! > cor.test(festbetonrohdichte,druck,method="spearman") Spearman s rank correlation rho data: beton$festbetonrohdichte and beton$druck S = 211725.2, p-value = 6.456e-05 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.3495386 Ergebnis:

Aufgabe 4 : Ergebnis des ungeeigneten t-tests Was passiert, wenn wir den Test anwenden, für welchen die Voraussetzungen nicht erfüllt waren? > cor.test(festbetonrohdichte,druck,method="pearson") Pearson s product-moment correlation data: beton$festbetonrohdichte and beton$druck t = 3.5794, df = 123, p-value = 0.0004938 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: 0.1390387 0.4580485 sample estimates: cor 0.3071468 Ergebnis:

Aufgabe 4 : Ergebnis des χ 2 -Test Was ergibt der bei stetigen Daten ungenaue χ 2 -Test? > chisq.test(table(beton$festbetonrohdichte,beton$druck)) Pearson s Chi-squared test data: table(beton$festbetonrohdichte, beton$druck) X-squared = 7022.9, df = 6804, p-value = 0.03127 Warnmeldung: In chisq.test(table(beton$festbetonrohdichte, beton$druck)) Chi-Quadrat-Approximation kann inkorrekt sein Ergebnis:

Zusammenfassung : Univariate Stichproben Test für den Erwartungswert (mittleren Wert) Voraussetzung t-test (t.test) Normalverteilung H 0 : µ = µ 0 t.test(..,alternative= two.sided,..) H 0 : µ µ 0 t.test(..,alternative= less,..) H 0 : µ µ 0 t.test(..,alternative= greater,..) Wilcoxon-Test (wilcox.test) - Test für die Varianz Ein-Stichproben χ 2 -(Chi-Quadrat)-Test Voraussetzung Normalverteilung

Zusammenfassung : Bivariate Stichproben Tests auf Zusammenhang Voraussetzung Pearson-Korrelationstest Normalverteilung H 0 : ρ = 0 kein Zusammenhang cor.test(x,y,method= pearson ) Spearmanscher-Rang-Korrelationstest - H 0 : ρ = 0 kein Zusammenhang cor.test(x,y,method= spearman ) χ 2 (Chi-Quadrat)-Test (wenige verschiedene Werte) auf Unabhängigkeit H 0 : kein Zusammenhang chisq.test(table(x,y))

Zusammenfassung : Univariate, gepaarte Stichproben Test für den Vergleich der Varianzen F-Test oder Varianz-test für 2 Stichproben var.test(x,y,..) Test für den Vergleich der Mittelwerte 2-Stichproben-t-Test t.test(x,y,var.equal=true) Voraussetzung Normalverteilung Voraussetzung NVt., gleiche Varianz 2-Stichproben-t-Test NVt. t.test(x,y,var.equal=false) Wilcoxon-Test - wilcox.test(x,y)