TECHNISCHE UNIVERSITÄT MÜNCHEN - WEIHENSTEPHAN SS 01 MATHEMATIK UND STATISTIK, INFORMATIONS- UND DOKUMENTATIONSZENTRUM Biometrische und Ökonometrische Methoden II Lösungen 1 1. a) MTB > name c1 '100 mm' c2 '150 mm' c3 '200 mm' MTB > read c1-c3 DATA> 13.5 10.9 27.0 DATA> 23.1 23.4 14.4 DATA> 12.3 21.3 17.2 DATA> 5.8 19.5 29.1 DATA> 10.9 10.2 25.6 DATA> 16.2 14.5 21.6 DATA> end 6 rows read. MTB > Save 'I:WIRSING.MTW'; SUBC> Replace. Saving worksheet in file: I:WIRSING.MTW b) MTB > AOVOneway '100 mm'-'200 mm'. One-Way Analysis of Variance Analysis of Variance Factor 2 243.1 121.5 3.73 0.049 Error 15 489.4 32.6 Total 17 732.4 Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ------+---------+---------+---------+ 100 mm 6 13.633 5.776 (--------*-------) 150 mm 6 16.633 5.560 (--------*-------) 200 mm 6 22.483 5.795 (-------*--------) ------+---------+---------+---------+ Pooled StDev = 5.712 12.0 18.0 24.0 30.0 Der globale F-Test prüft die Nullhypothese, daß alle Mittelwerte gleich sind, gegen die Alternative, daß mindestens ein Mittelwertsunterschied besteht, d.h. daß der Prüffaktor einen Einfluß auf das Prüfmerkmal hat. Mathematisch formuliert: H : µ = µ ~ i,j H : } i g j, µ g µ 0 i j 1 i j Der p-wert ist 0.049 = 4.9%. Also kann ein Mittelwertsunterschied bzw. ein Einfluß der Bewässerung auf den Ertrag auf 5% Signifikanzniveau statistisch gesichert werden, jedoch nicht auf 1%.
Biometrische und Ökonometrische Methoden II Lösungen zu Aufgabenblatt 1 Seite 2 c) MTB > name c4 'Ertrag' c5 'Stufe' MTB > Stack '100 mm'-'200 mm' 'Ertrag'; SUBC> Subscripts 'Stufe'. Es existiert nun eine Spalte Ertrag mit den Erträgen und eine Spalte Stufe mit den Bewässerungsstufen 1 für 100 mm, 2 für 150 mm und 3 für 200 mm. MTB > Print 'Ertrag' 'Stufe'. Data Display Row Ertrag Stufe 1 13.5 1 2 23.1 1 3 12.3 1 4 5.8 1 5 10.9 1 6 16.2 1 7 10.9 2 8 23.4 2 9 21.3 2 10 19.5 2 11 10.2 2 12 14.5 2 13 27.0 3 14 14.4 3 15 17.2 3 16 29.1 3 17 25.6 3 18 21.6 3 d) MTB > Oneway 'Ertrag' 'Stufe'. One-Way Analysis of Variance Analysis of Variance for Ertrag Stufe 2 243.1 121.5 3.73 0.049 Error 15 489.4 32.6 Total 17 732.4 Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ------+---------+---------+---------+ 1 6 13.633 5.776 (--------*-------) 2 6 16.633 5.560 (--------*-------) 3 6 22.483 5.795 (-------*--------) ------+---------+---------+---------+ Pooled StDev = 5.712 12.0 18.0 24.0 30.0
Biometrische und Ökonometrische Methoden II Lösungen zu Aufgabenblatt 1 Seite 3 e) Das ANOVA-Kommando dient zur Durchführung von ein- mehrfaktoriellen Varianzanalysen für balanzierte Designs, d.h. alle Faktorstufen kommen mit gleicher Wiederholungszahl vor. Es muß das übliche Modell einer Varianzanalyse mit den verschiedenen Effekten in verkürzter Form angegeben werden: Allgemeines einfaktorielles Modell: Verkürztes Modell in MINITAB: y = µ + + e ij i ij 'Ertrag' = 'Stufe' MTB > ANOVA 'Ertrag' = 'Stufe'. Analysis of Variance (Balanced Designs) Factor Type Levels Values Stufe fixed 3 1 2 3 Analysis of Variance for Ertrag Stufe 2 243.09 121.55 3.73 0.049 Error 15 489.36 32.62 Total 17 732.45 Das Kommando GLM (General Linear Model = Verallgemeinertes Lineares Modell) dient zur Durchführung von balanzierten und unbalanzierten Varianzanalysen, Kovarianzanalysen und Regressionen. Das Modell entspricht dem des Befehls ANOVA. MTB > GLM 'Ertrag' = 'Stufe'. General Linear Model Factor Levels Values Stufe 3 1 2 3 Analysis of Variance for Ertrag Source DF Seq SS Adj SS Adj MS F P Stufe 2 243.09 243.09 121.55 3.73 0.049 Error 15 489.35 489.35 32.62 Total 17 732.45 f) Die Dummyvariablen kann man unter dem Menüpunkt Calc Make Indicator Variables... automatisch erzeugen, indem man im Dialogfenster unter Indicator variables for: die Spalte mit den Bewässerungsstufen und unter Store results in: die Spalten für die Dummyvariablen einträgt. Als Referenzstufe dient hier die Stufe 1, also 100 mm.
Biometrische und Ökonometrische Methoden II Lösungen zu Aufgabenblatt 1 Seite 4 MTB > name c6 'Stufe 1' c7 'Stufe 2' c8 'Stufe 3' MTB > Indicator 'Stufe' 'Stufe 1'-'Stufe 3'. MTB > Print 'Ertrag' 'Stufe 1'-'Stufe 3'. Data Display Row Ertrag Stufe 1 Stufe 2 Stufe 3 1 13.5 1 0 0 2 23.1 1 0 0 3 12.3 1 0 0 4 5.8 1 0 0 5 10.9 1 0 0 6 16.2 1 0 0 7 10.9 0 1 0 8 23.4 0 1 0 9 21.3 0 1 0 10 19.5 0 1 0 11 10.2 0 1 0 12 14.5 0 1 0 13 27.0 0 0 1 14 14.4 0 0 1 15 17.2 0 0 1 16 29.1 0 0 1 17 25.6 0 0 1 18 21.6 0 0 1 MTB > Regress 'Ertrag' 2 'Stufe 2' 'Stufe 3'; SUBC> Constant. Regression Analysis The regression equation is Ertrag = 13.6 + 3.00 Stufe 2 + 8.85 Stufe 3 Predictor Coef StDev T P Constant 13.633 2.332 5.85 0.000 Stufe 2 3.000 3.298 0.91 0.377 Stufe 3 8.850 3.298 2.68 0.017 S = 5.712 R-Sq = 33.2% R-Sq(adj) = 24.3% Analysis of Variance Regression 2 243.09 121.55 3.73 0.049 Error 15 489.35 32.62 Total 17 732.45 Source DF Seq SS Stufe 2 1 8.12 Stufe 3 1 234.97 Die Tafel der Varianzanalyse ist identisch mit den bisherigen Ausgaben. Man kann also auch durch eine Regressionanalyse mit Dummyvariablen einen Datensatz varianzanalytisch auswerten.
Biometrische und Ökonometrische Methoden II Lösungen zu Aufgabenblatt 1 Seite 5 2. a) MTB > name c1 'Zunahme' c2 'Futter' MTB > set 'Zunahme' DATA> 9 9 11 12 13 14 DATA> 8 14 15 16 16 17 DATA> 15 15 16 16 19 22 DATA> 10 11 13 13 15 17 DATA> 13 16 16 17 17 22 DATA> end MTB > Set 'Futter' DATA> 1( 1 : 5 / 1 )6 DATA> End. MTB > Print 'Zunahme' 'Futter'. Data Display Row Zunahme Futter 1 9 1 2 9 1 3 11 1 4 12 1 5 13 1 6 14 1 7 8 2 8 14 2 9 15 2 10 16 2 11 16 2 12 17 2 13 15 3 14 15 3 15 16 3 16 16 3 17 19 3 18 22 3 19 10 4 20 11 4 21 13 4 22 13 4 23 15 4 24 17 4 25 13 5 26 16 5 27 16 5 28 17 5 29 17 5 30 22 5 MTB > Save 'I:\Futter.MTW'; SUBC> Replace. Saving worksheet in file: I:\Futter.MTW
Biometrische und Ökonometrische Methoden II Lösungen zu Aufgabenblatt 1 Seite 6 b) MTB > ANOVA 'Zunahme' = Futter; SUBC> Means Futter. Analysis of Variance (Balanced Designs) Factor Type Levels Values Futter fixed 5 1 2 3 4 5 Analysis of Variance for Zunahme Futter 4 146.200 36.550 4.83 0.005 Error 25 189.167 7.567 Total 29 335.367 Means Futter N Zunahme 1 6 11.333 2 6 14.333 3 6 17.167 4 6 13.167 5 6 16.833 c) Globaler F-Test mit Testgröße F = 4.83 aus dem Output in b): 0 MTB > InvCDF 0.95; SUBC> F 4 25. Inverse Cumulative Distribution Function F distribution with 4 DF in numerator and 25 DF in denominator P( X <= x) x 0.9500 2.7587 F 0 = 4.83 > 2.76 = F 4,25;0.95, also Nullhpothese der Mittelwertsgleichheit auf 5% Signifikanzniveau ablehnen, d.h. mindestens ein Mittelwert unterscheidet sich von den anderen. Die Entscheidung, ob ein signifikanter Einfluß des Prüffaktors vorliegt erfolgt einfacher durch Vergleich des p-werts mit dem Signifikanzniveau. Der p-wert ist die sog. Überschreitungswahrscheinlichkeit, d.h. die Wahrscheinlichkeit, daß die Testgröße den angegebenen oder einen höheren Wert annimmt. Praktisch ist es die Irrtumswahrscheinlichkeit bei Ablehnung des vorliegenden Tests. Ist dieser p-wert größer als die vorgegebene Irrtumswahrscheinlichkeit (bzw. kleiner als der p-wert), dann ist der zu gehörige Fraktilwert größer als die Testgröße und man kann die Nullhypothese nicht ablehnen. Ist der p-wert jedoch kleiner als die gegebene Irrtumswahrscheinlichkeit (bzw. größer als der p-wert), dann ist der zu gehörige Fraktilwert kleiner als die Testgröße und die Nullhypothese kann abgelehnt werden. Der Fraktilwert bei der Wahrscheinlichkeit von 1 p ist gleich der Testgröße. p = 0.005 < 0.050 =, also H ablehnen. 0
Biometrische und Ökonometrische Methoden II Lösungen zu Aufgabenblatt 1 Seite 7 d) MTB > InvCDF 0.975; SUBC> T 25. Inverse Cumulative Distribution Function Student's t distribution with 25 DF P( X <= x) x 0.9750 2.0595 ȳ i. ±t na;1/2 # MQ R r ȳ i. ±t 25;0.975 # 1 7.567 13.167±2.313 0.95 10.854,15.480 0.95 6 0.95