W-Rechnung und Statistik für Ingenieure Übung 13
Nächste Woche: Probeklausur Bringen Sie sich ein leeres Exemplar der Probeklausur mit, um sich eine Musterlösung zu erstellen.
Aufgabe 1 : Testproblem Testproblem: Betrachten wieder den Datensatz BLECH.DAT: > BLECH [1] 346 363 360 318 346 268 299 287 310 349 333 365 281 265 344 Frage: Wird im Mittel ein Wert kleiner als 310 angenommen?
Aufgabe 1 : Teststatistik Entscheide mich gegen H 0 : µ 310, falls 310 x groß, genauer: Teststatistik: wobei N=15, µ 0 = 310. P-Wert: P H0 ( 15 310 X s(x) ) > T(x) = P H0 ( 15 (310 X) s(x) ( 15 X 310 = P H0 s(x) = F t14 ( T(x)) ) < T(x) ) < T(x) F t14 ( T(x)) Verteilungsfunktion in T(x) der t 14 -Verteilung.
Aufgabe 1 : Berechnung des P-Werts Bestimme den P-Wert für BLECH.DAT: > N<-length(BLECH) > mu0<-310 > TS<-sqrt(N)*(mu0-mean(BLECH))/sd(BLECH) > TS [1] -1.354669 > pt(-ts,df=n-1) [1] 0.9015088 oder > t.test(blech,alternative="less",mu=mu0)$p.value [1] 0.9015088 Entscheidung:
Aufgabe 1 : Alternative Entscheidungsregel Alternative zu P-Wert: Entscheide gegen H 0, falls > alpha<-0.05 > #kritischer Wert > qt(1-alpha,df=n-1) [1] 1.76131 > #lehne H0 ab, falls TS>kritischer Wert > TS>qt(1-alpha,df=N-1) [1] FALSE Entscheidung:
Aufgabe 1 : Darstellung der Gütefunktion Gütefunktion: γ(µ) = P µ (Entscheidung für H 1 ) = F t14 ( N µ µ 0 σ )( t N 1,1 α) > mus<-seq(200,400,0.5) #Ausgewertete mu s > plot(mus,pt(-qt(1-alpha,df=n-1),df=n-1, + ncp=sqrt(n)*(mus-mu0)),type="l", + main="g"utefunktion",ylab="",lwd=3,ylim=c(0,1)) > abline(h=alpha,lwd=2,lty=2) #Linie bei Niveau zeichnen
Aufgabe 1 : Plot der Gütefunktion Gütefunktion 0.0 0.2 0.4 0.6 0.8 1.0 200 250 300 350 400 mu
Aufgabe 2(a) : Testproblem Nun wollen wir Aussagen zur Streuung testen. Wir nehmen weiterhin an, dass Daten normalverteilt sind Testproblem: Entscheidungsregel: Genauer: T(x) = (N 1) s(x) σ 0 = (15 1) s(x) 30, Lehne H 0 ab, falls T(x) > χ 2 N 1;1 α oder T(x) < χ 2 N 1; α, 2 2 wobei χ 2 N 1, α das α 2 2 Quantil einer χ2 -Verteilung mit N-1 Freiheitsgraden bezeichnet.
Aufgabe 2(a) : Berechnung in R > N<-length(BLECH) > alpha<-0.05 > s0<-30 > TS_var<-(N-1)*sd(BLECH)/s0 > k1<-qchisq(1-alpha/2,df=n-1) > k2<-qchisq(alpha/2,df=n-1) > TS_var>k1 [1] FALSE > TS_var<k2 [1] FALSE Entscheidung:
Aufgabe 2(b) : Testproblem Testproblem: Lehne H 0 ab, falls s(x) 30 klein. Genauer: T(x) = (N 1) s(x) = (15 1) s(x) σ 0 30, Entscheidungsregel: Lehne H 0 ab, falls T(x) < χ 2 N 1;α (α-quantil der χ 2 N 1 -Verteilung) Der Test heißt Ein-Stichproben χ 2 (Chi-Quadrat)-Test
Aufgabe 2(b) : Berechnung in R > TS_var<-(N-1)*sd(BLECH)/s0 > k<-qchisq(alpha,df=n-1) > TS_var<k [1] FALSE Entscheidung:
Aufgabe 3 : Vergleich von Blechproben Haben zuzätzlich zu BLECH Daten einer zweiten Produktionslinie: 364, 339, 289, 304, 362, 324, 314, 330, 301, 274, 319, 314, 326, 328, 310 Fragen: Unterscheiden sich die Blechdicken der beiden Produktionslinien im Mittel (Erwartungswert)? Unterscheiden sie sich in der Streuung (Varianz)?
Aufgabe 3 : Tests für Mittelwert Testproblem: H 0 : µ BLECH1 = µ BLECH2 gegen H 1 : µ BLECH1 µ BLECH2 Mögliche Tests: Zweiseitiger t-test Voraussetzungen: Welch-Zweiseitiger t-test Voraussetzung: Wilcoxon-Test
Aufgabe 3 : Annahme einer Normalverteilung Verwenden ein graphisches und ein statistisches Verfahren: graphisch : qqnorm(xdata) statistisch:
Aufgabe 3 : Q-Q-Normal-Plot > qqnorm(blech,pch=16) #Anfertigen des Plots > qqline(blech,lwd=3) #Linienbreite ändern > qqnorm(blech2,pch=16) #Anfertigen des Plots > qqline(blech2,lwd=2) #Linienbreite ändern Normal Q Q Plot Normal Q Q Plot Sample Quantiles 280 300 320 340 360 Sample Quantiles 280 300 320 340 360 1 0 1 Theoretical Quantiles 1 0 1 Theoretical Quantiles Ergebnis:
Aufgabe 3 : Shapiro-Wilk-Test Nullhypothese des Tests: Normalverteilung liegt vor > shapiro.test(blech) Shapiro-Wilk normality test data: BLECH W = 0.9063, p-value = 0.1189 > shapiro.test(blech2) Shapiro-Wilk normality test data: BLECH2 W = 0.9679, p-value = 0.8254 Ergebnis:
Aufgabe 3 : Varianzen Testproblem: 2 Produktionslinien, daher 2 ungepaarte Stichproben Zweiseitiger Varianztest (F-Test) braucht normalverteilte Daten Teststatistik: Entscheidungsregel: Lehne H 0 : σ BLECH1 = σ BLECH2 ab, falls s(x)2 s(y) 2 > F N1 1;N 2 1; 1 α 2 oder s(x)2 s(y) 2 < F N1 1;N 2 1; α 2.
Aufgabe 3 : Test der Varianzen in R > var.test(blech,blech2) F test to compare two variances data: BLECH and BLECH2 F = 2.1144, num df = 14, denom df = 14, p-value = 0.1736 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.7098594 6.2978609 sample estimates: ratio of variances 2.114378 Entscheidung:
Aufgabe 3 : Mittelwerte Testproblem: Varianzen können als gleich angenommen werden (Vgl. F-Test) Normalverteilung wird angenommen (Vgl. Q-Q-Normal-Plot und Shapiro-Wilk-Test) Zwei-seitiger t-test für zwei Stichproben Teststatistik: T(x, y) = N1 N 2 N 1 + N 2 x ȳ s 12 (x, y) Entscheidungsregel: Lehne H 0 ab, falls N1 N 2 x ȳ N 1 +N 2 s 12 (x,y) > t N 1 +N 2 2;1 α 2
Aufgabe 3 : Test der Mittelwerte in R > t.test(blech,blech2,var.equal=t) Two Sample t-test data: BLECH and BLECH2 t = 0.2184, df = 28, p-value = 0.8287 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -20.11148 24.91148 sample estimates: mean of x mean of y 322.2667 319.8667 Entscheidung:
Aufgabe 3 : Welch-Zweiseitiger t-test > t.test(blech,blech2,alternative= two.sided +,var.equal=f)$p.value [1] 0.8289144 > t.test(blech,blech2,alternative= two.sided +,var.equal=f)$statistic t 0.2183853 Entscheidung:
Aufgabe 3 : Wilcoxon-Test Alternativer Test für die Mittelwerte, der keine Normalverteilung braucht: > wilcox.test(blech,blech2,alternative= two.sided ) Wilcoxon rank sum test with continuity correction data: BLECH and BLECH2 W = 121.5, p-value = 0.7243 alternative hypothesis: true location shift is not equal to 0 Entscheidung:
Aufgabe 4 : Streudiagramm der Daten Stellen Druckfestigkeit und Festbetonrohdichte dar: Festbetonrohdichte 2.45 2.50 2.55 110 120 130 140 150 160 170 180 Druck
Aufgabe 4 : Tests auf Zusammenhang Testproblem: H 0 : ρ = 0 gegen H 1 : ρ 0 Zweiseitiger Korrelations-Test basierend auf Korrelationskoeffizienten von Pearson Voraussetzungen: Zweiseitiger Korrelations-Test basierend auf Spearmanschen Rangkorrelationskoeffizienten χ 2 -Test, vor allem auch für nominale Merkmale
Aufgabe 4 : Prüfen einer Normalverteilung der Daten (1) > shapiro.test(beton$druck)$p.value [1] 0.01221 > shapiro.test(beton$festbetonrohdichte)$p.value [1] 0.003074 Entscheidung:
Aufgabe 4 : Prüfen einer Normalverteilung der Daten (2) > qqnorm(beton$druck,pch=16) > qqline(beton$druck,lwd=3) > qqnorm(beton$festbetonrohdichte,pch=16) > qqline(beton$festbetonrohdichte,lwd=3) Normal Q Q Plot Normal Q Q Plot Sample Quantiles 110 130 150 170 Sample Quantiles 2.45 2.50 2.55 2 1 0 1 2 Theoretical Quantiles 2 1 0 1 2 Theoretical Quantiles
Aufgabe 4 : Test auf Zusammenhang Benutze aufgrund der Datenanalyse den Korrelations-Test basierend auf Rangkorrelationskoeffizienten! > cor.test(festbetonrohdichte,druck,method="spearman") Spearman s rank correlation rho data: beton$festbetonrohdichte and beton$druck S = 211725.2, p-value = 6.456e-05 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.3495386 Ergebnis:
Aufgabe 4 : Ergebnis des ungeeigneten t-tests Was passiert, wenn wir den Test anwenden, für welchen die Voraussetzungen nicht erfüllt waren? > cor.test(festbetonrohdichte,druck,method="pearson") Pearson s product-moment correlation data: beton$festbetonrohdichte and beton$druck t = 3.5794, df = 123, p-value = 0.0004938 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: 0.1390387 0.4580485 sample estimates: cor 0.3071468 Ergebnis:
Aufgabe 4 : Ergebnis des χ 2 -Test Was ergibt der bei stetigen Daten ungenaue χ 2 -Test? > chisq.test(table(beton$festbetonrohdichte,beton$druck)) Pearson s Chi-squared test data: table(beton$festbetonrohdichte, beton$druck) X-squared = 7022.9, df = 6804, p-value = 0.03127 Warnmeldung: In chisq.test(table(beton$festbetonrohdichte, beton$druck)) Chi-Quadrat-Approximation kann inkorrekt sein Ergebnis:
Zusammenfassung : Univariate Stichproben Test für den Erwartungswert (mittleren Wert) Voraussetzung t-test (t.test) Normalverteilung H 0 : µ = µ 0 t.test(..,alternative= two.sided,..) H 0 : µ µ 0 t.test(..,alternative= less,..) H 0 : µ µ 0 t.test(..,alternative= greater,..) Wilcoxon-Test (wilcox.test) - Test für die Varianz Ein-Stichproben χ 2 -(Chi-Quadrat)-Test Voraussetzung Normalverteilung
Zusammenfassung : Bivariate Stichproben Tests auf Zusammenhang Voraussetzung Pearson-Korrelationstest Normalverteilung H 0 : ρ = 0 kein Zusammenhang cor.test(x,y,method= pearson ) Spearmanscher-Rang-Korrelationstest - H 0 : ρ = 0 kein Zusammenhang cor.test(x,y,method= spearman ) χ 2 (Chi-Quadrat)-Test (wenige verschiedene Werte) auf Unabhängigkeit H 0 : kein Zusammenhang chisq.test(table(x,y))
Zusammenfassung : Univariate, gepaarte Stichproben Test für den Vergleich der Varianzen F-Test oder Varianz-test für 2 Stichproben var.test(x,y,..) Test für den Vergleich der Mittelwerte 2-Stichproben-t-Test t.test(x,y,var.equal=true) Voraussetzung Normalverteilung Voraussetzung NVt., gleiche Varianz 2-Stichproben-t-Test NVt. t.test(x,y,var.equal=false) Wilcoxon-Test - wilcox.test(x,y)