Ausgewählte Kapitel der Statistik: Regressions- u. varianzanalytische e Lösung von Grundaufgaben mit SPSS (ab V..0) Text: akmv_v.doc Daten: akmv??.sav Lehrbuch: W. Timischl, Biostatistik. Wien - New York: Springer 000 Problem.: Abhängigkeitsanalysen - mehrfach lineare Regression Die folgenden Daten sind einer Studie entnommen, in der u.a. das cholesterin Y (in mg/dl), das Gewicht X (in kg) und das Alter X (in a) bestimmt wurden. Es sollen (mit den von Probanden stammenden Daten) im Rahmen eines zweifach-linearen s folgende Fragen untersucht werden: i) Hängt Y global von X und X ab? (globale Abhängigkeitsprüfung, α = 5%). Wenn ja, wie lautet das Regressionsmodell? ii) Ist eine Reduktion auf ein lineares mit nur einem Regressor möglich? (partielle Abhängigkeitsprüfung, α = 5%) Daten: akmv.sav i) Daten, einfache Statistiken Analysieren - Berichte - Fälle zusammenfassen... 4 5 6 7 8 9 0 Insgesamt Zusammenfassung von Fällen a N Mittelwert Standardabweichung Varianz a. Begrenzt auf die ersten 00 Fälle. chol./ Gewicht/kg Alter/a mg p.dl 8 48 50 60 5 95 8 55 440 58 0 90 80 58 400 0 5 0 65 45 50 5 0 70 50 0 54 40 90 68 0 55 6 8 0 6,00 4,5 0,00 7,008,49 70,4 89,7 0,86 4959,09 i) Schätzung der parameter, globale Abhängigkeitsprüfung Analysieren - Regression - linear... zusammenfassung b Korrigiertes Standardfehler R R-Quadrat R-Quadrat des Schätzers,888 a,789,74 5,76 a. Einflußvariablen : (Konstante), Alter/a, Gewicht/kg b. Abhängige Variable: chol./mg p.dl
Regression Residuen ANOVA b Quadratsumme df Quadrate F Signifikanz 409,04 59,507 6,85,00 a 50,986 9 78,998 54550,000 a. Einflußvariablen : (Konstante), Alter/a, Gewicht/kg b. Abhängige Variable: chol./mg p.dl (Konstante) Gewicht/kg Alter/a Nicht standardisierte Koeffizienten a. Abhängige Variable: chol./mg p.dl Koeffizienten a Standardisierte Koeffizienten 95%-Konfidenzintervall für B Standard Signifi Untergren Obergren B fehler Beta T kanz ze ze 7,94 4,874,67,9-5,855 7,644,686,870,407,99,084 -,8,65,445,95,559,660,06,55 6,74 Regressionsfunktion: Y(erwartet) = 7,94 +,686 X +,445 X Anpassungsgüte: Es empfiehlt sich, die adäquatheit an Hand eines mit den erwarteten und beobachteten Y-Werten gezeichneten Streudiagramms zu überprüfen. Ein Kennwert für die Anpassungsgüte ist das multiple Bestimmtheitsmaß (=Quadrat der Produktmomentkorrelation zwischen den erwarteten und beobachteten Y-Werten; im Beispiel ist R =78,9%).,0,0 Standard. geschätzter Wert (Y) 0,0 -,0 -,0 R-Qu. = 0.7890 00 00 400 500 chol./mg p.dl (Y)
ii) partielle Abhängigeitsprüfung: Ist X (Gewicht) redundant? (reduziertes : einfache lineare Regression von Y auf X) Statistik - Regression - linear... zusammenfassung Korrigiertes Standardfehler R R-Quadrat R-Quadrat des Schätzers,87 a,70,67 40,96 a. Einflußvariablen : (Konstante), Alter/a Regression Residuen ANOVA b Quadrats umme df Quadrate F Signifikanz 8,846 8,846,49,00 a 68,54 0 6,85 54550,000 a. Einflußvariablen : (Konstante), Alter/a b. Abhängige Variable: chol./mg p.dl Partieller F-Test: TGs(X X) = [SQRes(X) - SQRes(X,X)]/MQRes(X,X) = (68,54 50,986)/78,998 =,759; Testgröße ist F-verteilt mit dem Zählerfreiheitsgrad und dem Nennerfreiheitsgrad 9 P(TG >,759) = 8,45% α =5% Verkleinerung von SQRes ist nicht signifikant! (dass X redundant ist, sieht man auch aus der Tabelle "Koeffizienten" unter i) ii) partielle Abhängigkeitsprüfung: Ist X redundant? nein! (siehe Tabelle "Koeffizienten" unter i) Problem.: Abhängigkeitsanalysen - polynomiale Regression Mit Hilfe angegebenen Daten soll die Photosynthese Y (in mmol CO pro m und s) einer Pflanze als Funktion der Temperatur X (in oc) bei konstant gehaltener (hoher) Lichintensität dargestellt werden. Man prüfe die Abhängigkeit der Variablen Y von X im Rahmen eines quadratischen s (α = 5%). Für welche Temperatur ist der Y maximal? Daten: akmv.sav i) Grafische Untersuchung des typs (Art der Regressionsfunktion) Grafiken - Streudiagramm... 5 9 Photosynth. 6 4 7 0 6 9 Temp. (C) Streudiagramm quadratische Regressionsfunktion: Y(erwartet) = b0 + b*x + b*x mit X = X, X = X*X ii) Daten, einfache Statistiken
4 Zusammenfassung von Fällen a Temp. (C) Photosynth. X 5 7,9 5 5 8,0 5 0 4,5 400 4 0 4,4 400 5 5,77 65 6 5,7 65 7 0 9,09 900 8 0 0,57 900 Insgesamt N 8 8 8 Mittelwert,50,65 57,50 Standardabweichung 5,976,606 70,5 Varianz 5,74 6,866 705,74 a. Begrenzt auf die ersten 00 Fälle. iii) Schätzung der parameter, Abhängigkeitsprüfungen (global, partiell) Analysieren - Regression - linear... zusammenfassung Korrigiertes Standardfehler R R-Quadrat R-Quadrat des Schätzers,906 a,80,748,48 a. Einflußvariablen : (Konstante), X, Temp. (C) Regression Residuen ANOVA b Quadrat summe df Quadrate F Signifikanz 9,40 9,70,40,04 a 8,644 5,79 48,064 7 a. Einflußvariablen : (Konstante), X, Temp. (C) b. Abhängige Variable: Photosynth. Globaler F-Test: Signifikanz < α =5% Y hängt (im Rahmen des s) signifikant von X (und X*X) ab. (Konstante) Temp. (C) X Nicht standard. Koeffizienten a. Abhängige Variable: Photosynth. Koeffizienten a Standard. Koeffizienten 95%-Konfidenzint. für B B SE Beta T Signifikanz UG OG -,875 9,040 -,40,060-45,,64 4,00,84 9,46 4,769,005,849 6,7 -,088,09-9,055-4,7,005 -,6 -,040 Partieller F-Test: Wegen Sign. < α ist weder X (TEMP) noch X=X*X im redundant.
5,5,0,5 Standard. geschätzter Wert (Y) 0,0 -,5 -,0 -,5 R-Qu. = 0.80 6 9 5 Photosynth. Regressionsmodell: Y(erwartet) = -,875 + 4,00 X 0,088 X*X Optimale Temperatur: dy/dx = 4,00 - x 0,088 X = 0 X(opt.) =,8 Problem.: Vergleich von Regressionsgeraden In einem Placebo-kontrollierten Parallelversuch wurde eine Größe vor Gabe des Präparates (Variable X) und danach (Variable X) gemessen. Die Präparatwirkung Y wird durch die Differenz X - X ausgedrückt. Jeweils zehn Versuchspersonen erhielten das Testpräparat, andere zehn das Kontrollpräparat (Placebo). i) Man zeige auf der Grundlage von linearen Regressionsmodellen, dass in jeder Präparatgruppe die Wirkung Y vom Anfangswert X abhängt (Prüfung auf Abhängigkeit). ii) Man zeige, dass sich die Anstiege der Regressionsgeraden nicht signifikant unterscheiden (Prüfung auf Abweichung von der Parallelität). iii) Man zeige, dass die Regressionsgeraden nicht zusammenfallen (Prüfung auf Koinzidenz). Als Testniveau sei für jede Einzelprüfung 5% angenommen; Daten: siehe "Daten, einfache Statistiken". i) Daten, einfache Statistiken Analysieren - Berichte - Fälle zusammenfassen... Tabelle: siehe nächste Seite i) Grafische Überprüfung der adäquatheit (lineares ) Grafiken - Streudiagramm - Einfach... 00 80 60 40 0 Präparat 0-0 Placebo R-Qu. = 0,7805 A Y -40 40 60 80 00 0 40 60 80 R-Qu. = 0,6980 X
6 Zusammenfassung von Fällen a Präparat A Placebo Insgesamt 4 5 6 7 8 9 0 Insgesamt N Mittelwert Standardfehler des Mittelwertes Standardabweichung Varianz 4 5 6 7 8 9 0 Insgesamt N Mittelwert Standardfehler des Mittelwertes Standardabweichung Varianz N Mittelwert Standardfehler des Mittelwertes X X Y 6 0 84 6 49 8 56 49 7 0 8 8 9 9 6 6 7 54 44 5-8 56 76 94 67 7 0 0 0 84,80 4,70 4,0 9,99 5,65 9,66,59 7,85 0,56 997,7 8,678 9,656 57 8-6 46 79 67 6 9 7 58 6 68 68 0 76 6 77 68 9 6 98 8 74 56 8 0 99 0 0 0 0,0 84,0 6,00,49 6,07 9,4 9,5 9,9 9,8 560,767 68, 889,778 0 0 0 97,45 6,90,55 8, 6,4 6,80 Standardabweichung Varianz a. Begrenzt auf die ersten 00 Fälle. 7,5 7,48 0,9 80,66 754,97 9,74 i) Lineare Regression von Y auf X (getrennt nach Präparatgruppen) Aufteilung der Datei nach Gruppen: Daten Datei aufteilen... Regressionsprozedur: Analysieren - Regression - Linear.. Präparat = A zusammenfassung b R R-Quadrat Korrigiertes R-Quadrat Standardfehler des Schätzers,85 a,698,660 7,8 a. Einflußvariablen : (Konstante), Untersuchungsm..US b. Präparat = A
7 ANOVA b,c Quadrat summe df Quadrate F Signifikanz Regression 5865,78 5865,78 8,490,00 a Residuen 57,7 8 7,5 840,900 9 a. Einflußvariablen : (Konstante), Untersuchungsm..US b. c. Präparat = A Koeffizienten a,b (Konstante) Untersuchungsm..US a. b. Präparat = A Nicht standardisierte Koeffizienten Standard. Koeffizienten B SE Beta T Signifikanz -7,44 6,904 -,6,4,808,880,85 4,00,00 Präparat = Placebo zusammenfassung b R R-Quadrat Korrigiertes R-Quadrat Standardfehler des Schätzers,88 a,78,75 4,8 a. Einflußvariablen : (Konstante), Untersuchungsm..US b. Präparat = Placebo Regression Residuen ANOVA b,c Quadrat summe df Quadrate F Signifikanz 650,69 650,69 8,447,00 a 757,7 8 9,76 8008,000 9 a. Einflußvariablen : (Konstante), Untersuchungsm..US b. c. Präparat = Placebo Koeffizienten a,b (Konstante) Untersuchungsm..US a. b. Präparat = Placebo Nicht standardisierte Koeffizienten Standard. Koeffizienten B SE Beta T Signifikanz -47,44 4,5458 -,6,0,667,5,88 5,4,00 Ergebnisse: Regressionsmodell (Präparat A): Y = b X + b0 + Fehler mit b = 0.808 (sign. <> Null, P =0.00), b0 = -7.44; Regressionsmodell (Placebo): Y = b X + b0 + Fehler mit b = 0.667 (sign. <> Null, P = 0.00), b0 = -47.44. ii) Gibt es zwischen den Geradenanstiegen b und b einen signifikanten Unterschied (α=5%)?
8 ii) Vergleich von b und b mit dem t-test Voraussetzungen: b (Stichprobenfunktion, Anstieg - Präparat A) ist normalverteilt, Schätzwerte: Mittelwert = 0.808, Standardabweichung = 0.880 (Freiheitsgrad = n-=8) b (Stichprobenfunktion, Anstieg - Placebo) ist normalverteilt, Schätzwerte: Mittelwert = 0.667, Standardabweichung = 0.5, (Freiheitsgrad = n-=8) Manuelle Durchführung des t-tests: F-Test: Varianzverhältnis (0.880/0.5)^ =.58 <= F(8, 8, 0.975) = 4.4 spricht nicht gegen die Gleichheit der Varianzen. -Stichproben-t-Test (unabhängige Stichproben): mittlere (gepoolte) Varianz = (0.880^ + 0.5^)/ = 0.047 Testgröße = (0.808-0.667)/0.047^(/)* (64/6)^(/) =.58 <= t(6, 0.975) =.0 Unterschied der Anstiegswerte ist auf dem Testniveau 5% nicht signifikant. ii) Vergleich der Anstiege im Rahmen eines mehrfach-linearen Regressionsmodells mit einer Indikatorvariablen ("dummy variable") Prinzip: Die zwei einfach-linearen Regressionsmodelle werden mit Hilfe der Indikatorvariablen z in ein mehrfach-lineares Regressionsmodell zusammengefasst. Der Hilfsvariablen z wird für alle Beobachtungen der Präparatgruppe A der Wert Null und für alle Beobachtungen der Placebo-Gruppe der Wert eins zugewiesen. Setzt man die abhängige Variabe Y als multiples lineares mit den Regressorvariablen u=x, u=z und u=x*z in der Gestalt (*) Y = b0 + b*u + b*u + b*u + Fehler an, so geht diese gleichung für z=0 (Gruppe A) über in (**) Y = b0 + b*x + Fehler und für z= (Placebo-Gruppe) über in (***) Y = (b0+b) + (b+b)*x + Fehler. Die Anstiege in den einfach-linearen Regressionsmodellen (**) und (***) sind genau dann verschieden, wenn im dreifach-linearen Regressionsmodells (*) der Koeffizient b ungleich Null ist, d.h. die Zielvariable von u abhängt. Die Abhängigkeitsprüfung von u erfolgt mit dem partiellen F-Test. Datenorganisation: Datenmatrix durch z-spalte (=u) und z*x-spalte (=u) ergänzen. Zusammenfassung von Fällen a Präparat X (=u) X Y U (=z) U (=z*x) A 6 0 0 0 A 84 6 0 0 A 49 8 0 0 4 A 56 49 7 0 0 5 A 0 8 8 0 0 6 A 9 9 6 0 0 7 A 6 7 54 0 0 8 A 44 5-8 0 0 9 A 56 76 0 0 0 A 94 67 7 0 0 Placebo 57 8-6 57 Placebo 46 79 67 46 Placebo 6 9 7 6 4 Placebo 58 6 58 5 Placebo 68 68 0 68 6 Placebo 76 6 7 Placebo 77 68 9 77 8 Placebo 6 98 8 6 9 Placebo 74 56 8 74 0 Placebo 0 99 0 Insgesamt N 0 0 0 0 0 0 a. Begrenzt auf die ersten 00 Fälle. Hypothesen:
9 H0: Koeffizient von u in (*) ist Null (Nullmodell), H: Koeffizient von u in (*) ist ungleich Null (Alternativmodell). Durchführung des partiellen F-Tests: Schritt : Fehlerquadratsumme SQRes(H)=495.45 und Freiheitsgrade FG(H)= 6 aus dem Alternativmodell bestimmen (Statistik - Regression - Linear... ; abhängige Variable = Y, unabhängige Variable = u, u, u). Regression Residuen ANOVA b Quadrat summe df Quadrate F Signifikanz 55,5 448,499 6,458,000 a 495,45 6 68,466 755,0 9 a. Einflußvariablen : (Konstante), U, Untersuchungsm..US, U b. Schritt : Fehlerquadratsumme SQRes(H0)=4404.569 und Freiheitsgrade FG(H0)= 7 aus dem Alternativmodell bestimmen (Statistik - Regression - Linear... ; abhängige Variable = Y, unabhängige Variable = u, u). ANOVA b Quadrat summe df Quadrate F Signifikanz Regression 46,4 657,90 5,70,000 a Residuen 4404,569 7 59,09 755,0 9 a. Einflußvariablen : (Konstante), U, Untersuchungsm..US b. Schritt : Testentscheidung Mittlere Reduktion der Fehlerquadratsumme bei Übergang vom Nullmodell zum Alternativmodell = MQRes(H H0) = [SQRes(H0) - SQRes(H)]/[FG(H0)-FG(H)] = (4404.569-495.45)/(7-6) = 09.6. Schätzung der Fehlervarianz aus dem Alternativmodell durch MQRes(H) = 68.466 mit FG(H) = 6. Testgröße = MQRes(H H0)/MQRes(H) = 0.406 <= F(,6,0.95) = 4.49 Unterschied zwischen den Anstiegen nicht signifikant. iii) Sind die Regressionsgeraden überhaupt verschieden? (hinsichtlich Anstiege und y-achsenabschnitte) Prüfung im Rahmen des mehrfach-linearen Regressionsmodells (*) mit den Regressorvariablen u (=X), u (=z) und u (=z*x) durch Übergang vom Vollmodell (Alternativmodell) zum Nullmodell (Koeffizienten von u und u sind Null). Hypothesen: H0: Y hängt nicht von u und u ab (Nullmodell), H: Y hängt von u, u und u ab (Alternativmodell). Durchführung des partiellen F-Tests: Schritt : SQRes(H) = 495.45, FG(H) = 6, MQRes(H) = 68.466. Schritt : SQRes(H0) = 99.59, FG(H0) = 8. Regression Residuen ANOVA b Quadrat summe df Quadrate F Signifikanz 858,59 858,59 5,997,00 a 99,59 8 56,55 7550,950 9 a. Einflußvariablen : (Konstante), Untersuchungsm..US b. Schritt :
0 MQRes(H H0) = (99.59-495.45)/(8-6)=498.569. Testgröße = MQRes(H H0)/MQE(H) = 9.07 > F(,6,0.95) =.6 Regressionsgeraden fallen nicht zusammen! Problem.4: Abhängigkeitsanalysen - Versuche mit einem Haupt- und einem Blockfaktor Die folgende Datentabelle zeigt die an einer Messstelle der Donau erhaltenen monatlichen Messwerte des phosphors (gesp_) für die Jahre 986 bis 988. Man vergleiche die Jahresmittelwerte und verwende dabei den Monat als Blockfaktor. Das Testniveau ist mit 5% vorgegeben. Monat 986 987 988 0.8 0.65 0.79 0.08 0.0 0.89 0.8 0.9 0.4 4 0.8 0.70 0.60 5 0.99 0. 0.50 6 0. 0.085 0.0 7 0.7 0.74 0.70 8 0.54 0.8 0.5 9 0.4 0.86 0. 0 0.5 0.66 0.09 0.6 0.8 0. 0.7 0.09 0.5 i) Problemlösung mit der Prozedur Allgemeines lineares : Messwert = Basiswert + Faktor(=Jahres)-Effekt + Block (=Monats)-Effekt + Versuchsfehler Datenorganisation: monat jahr gesp_ 86 0.8 86 0.08...... 88 0.5 i) Globaltest (H0: kein Jahres-Effekt), Power Analysieren - Allgemeines lineares Univariat... Abhängige Variable: -P in mg/l /Wolfsthal) Quelle Korrigiertes Konstanter Term MONAT JAHR Fehler Korrigierte variation Quadratsumme vom Typ III df Tests der Zwischensubjekteffekte 8,5E-0 b 6,50E-0,7,046 9,078,84,697,697 607,49,000 607,49,000 5,50E-0 5,00E-0,790,8 9,69,677,6E-0,E-0 4,69,00 9,85,77 6,47E-0,794E-0,840 6,4 5 a. Unter Verwendung von Alpha =,05 berechnet b. R-Quadrat =,569 (korrigiertes R-Quadrat =,5) Quadrate F Sign. Nichtzentralitäts- Parameter Beobachtete Schärfe a Geschätzte Randmittel. mittelwert Abhängige Variable: -P in mg/l /Wolfsthal) 95% Konfidenzintervall Mittelwert Standardfehler Untergrenze Obergrenze,7,009,99,5
. MONAT Abhängige Variable: -P in mg/l /Wolfsthal) MONAT 4 5 6 7 8 9 0 95% Konfidenzintervall Mittelwert Standardfehler Untergrenze Obergrenze,75,0,,9,,0,70,96,7,0,08,5,04,0,4,67,5,0 9,004E-0,7,4,0 7,87E-0,05,94,0,0,57,9,0,66,9,4,0,50,77,09,0,46,7,7,0,74,00,44,0,80,07. JAHR Abhängige Variable: -P in mg/l /Wolfsthal) JAHR 86 87 88 95% Konfidenzintervall Mittelwert Standardfehler Untergrenze Obergrenze,55,05,4,87,97,05,65,8,99,05,68, i) Multiple Vergleiche (nach Scheffe und Dunnett) Abhängige Variable: -P in mg/l /Wolfsthal) Mehrfachvergleiche Scheffé Dunnett-T (-seitig) a (I) JAHR 86 87 88 87 88 (J) JAHR 87 88 86 88 86 87 86 86 Mittlere Differenz 95% Konfidenzintervall (I-J) SE Sign. Untergr. Obergr. 5,8500E-0*,0,04,870E-0,5 5,597E-0,0,05-7,07E-04,55-5,85000E-0*,0,04 -,5 -,870E-0 -,58E-0,0,99-5,9E-0 5,4046E-0-5,5967E-0,0,05 -,55 7,07E-04,58E-0,0,99-5,4046E-0 5,9E-0-5,85000E-0*,0,04 -,0949-7,54E-0-5,5967E-0*,0,0 -,0690-4,9E-0 Basiert auf beobachteten Mittelwerten. *. Die mittlere Differenz ist auf der Stufe,05 signifikant. a. In Dunnett-T-Tests wird eine Gruppe als Kontrollgruppe behandelt, mit der alle anderen Gruppen verglichen werden. ii) Rangvarianzanalyse für verbundene Stichproben (Friedman-Test) Analysieren - Nichtparametrische Tests - K verbundene Stichproben... Datenorganisation: monat gesp86 gesp87 gesp88 0.8 0.65 0.79 0.08 0.0 0.89 usw.
Ränge GESP86 GESP87 GESP88 Mittlerer Rang,67,50,8 Statistik für Test a N Chi-Quadrat df Asymptotische Signifikanz a. Friedman-Test 8,667,0 Problem.5: Abhängigkeitsanalysen - Einfaktorielle Versuche mit Messwiederholungen Um die Wirkung einer Behandlung auf eine Zielvariable Y zu untersuchen, wurden 0 Probanden der Behandlung unterzogen und die Zielvariable am Beginn und am Ende der Behandlung (Zeitpunkte bzw. ) sowie nach einem längeren zeitlichen Intervall (Zeitpunkt ) gemessen. Die Messwerte sind in der folgenden Tabelle protokolliert. Es soll auf dem 5%-Niveau geprüft werden, ob sich die Zielvariable im Mittel verändert hat. Pers. Zeitp. Zeitp. Zeitp. 568 78 7 668 849 80 44 440 465 4 466 68 40 5 5 6 6 6 696 779 555 7 76 754 640 8 605 87 696 9 504 756 97 0 469 586 50 i) Datenorganisation: wie in der Tabelle. ii) Problemlösung mit GLM - Messwiederholungen: Analysieren - Allgemeines lineares - Messwiederholung... Innersubjektfaktoren Maß: MESSWERT Abhängige ZEIT Variable X_ X_ X_ Deskriptive Statistiken Untersuchungsm..US Untersuchungsm..US Untersuchungsm..US Mittelwert Standardabweichung N 569,90 09,4 0 70,0 5, 0 565,70 65,46 0 ii) Lösung im Rahmen einer multivariaten Varianzanalyse
Multivariate Tests c Effekt Wert F Hypothese df Fehler df Sign. NZP Beobachtete Schärfe a ZEIT Pillai-Spur,70 9,465 b,000 8,000,008 8,99,899 Wilks-Lambda,97 9,465 b,000 8,000,008 8,99,899 Hotelling-Spur,66 9,465 b,000 8,000,008 8,99,899 Größte charakteristische Wurzel nach Roy,66 9,465 b,000 8,000,008 8,99,899 a. Unter Verwendung von Alpha =,05 berechnet b. Exakte Statistik c. Design: Intercept Innersubjekt-Design: ZEIT ii) Lösung im Rahmen einer Blockvarianzanalyse mit Korrektur der Fehlerfreiheitsgrade Maß: MESSWERT Mauchly-Test auf Sphärizität b Inner subjekt effekt ZEIT Prüft die Nullhypothese, daß sich die Fehlerkovarianz-Matrix der orthonormalisierten transformierten abhängigen Variablen proportional zur Einheitsmatrix verhält. a. Kann zum Korrigieren der Freiheitsgrade für die gemittelten Signifikanztests verwendet werden. In der Tabelle mit den Tests der Effekte innerhalb der Subjekte werden korrigierte Tests angezeigt. b. Design: Intercept Innersubjekt-Design: ZEIT Maß: MESSWERT Quelle ZEIT Fehler(ZEIT) Epsilon a Unter Approximiertes Greenhouse- Huynh- grenz Mauchly-W Chi-Quadrat df Sign. Geisser Feldt e,670,08,0,75,869,500 Sphärizität angenommen Greenhouse- Geisser Huynh-Feldt Untergrenze Sphärizität angenommen Greenhouse- Geisser Huynh-Feldt Untergrenze Quadratsumme vom Typ III Tests der Innersubjekteffekte df 8,800 6064,400 7,80,005 4,60,885 8,800,50 84,49 7,80,0 0,795,80 8,800,79 704,594 7,80,008,484,847 8,800,000 8,800 7,80,05 7,80,666 508,867 8 8504,659 508,867,5,8 508,867 5,648 978,99 508,867 9,000 7009,9 a. Unter Verwendung von Alpha =,05 berechnet Quadrate F Sign. NZP Beob. Schärfe a
4 Tests der Innersubjektkontraste Maß: MESSWERT Quelle ZEIT Quadratsumme vom Typ III df Quadrate F Sign. NZP Beob. Schärfe a ZEIT Linear 88,00 88,00,00,9,00,05 Quadratisch 040,600 040,600 4,70,004 4,70,95 Fehler Linear 7878,800 9 8708,756 (ZEIT) Quadratisch 74705,067 9 800,56 a. Unter Verwendung von Alpha =,05 berechnet Problem.6: Abhängigkeitsanalysen - Einfaktorielle Versuche mit einer Kovariablen In einem Placebo-kontrollierten Parallelversuch wurde eine Größe vor Gabe des Präparates (Variable X) und danach (Variable X') gemessen. Jeweils zehn Versuchspersonen erhielten das Testpräparat, andere zehn das Kontrollpräparat (Placebo). Die Messergebnisse sind in der folgenden Tabelle zusammengestellt. Es ist das Ziel des Versuches, das Testpräparat mit dem Kontrollpräparat hinsichtlich der Wirksamkeit zu vergleichen. Dabei ist die Wirksamkeit durch die Differenz Y=X-X' erfasst und eine allfällige Abhängigkeit vom Anfangswert zu berücksichtigen. Als Testniveau sei α = 5% vereinbart. Behandlungsfaktor (Präparat) Stufe (Test) Stufe (Placebo) X X' X X' Wieder- 6 57 8 holungen 84 46 79 49 6 9 56 49 58 0 8 68 68 9 9 76 6 7 77 68 44 5 6 98 56 74 56 94 67 0 99 i) Datenorganisation Y-Spalte mit "Transformieren - Berechnen..." erzeugen: Präparat X X' Y(=X-X') 6 0... 94 67 7 57 8-6... 0 99 ii) Vergleich der Präparateffekte ohne Berücksichtigung des Anfangswertes Analysieren - Allgemeines lineares Univariat... (ohne Anfangswert als Kovariable) Präparat A Placebo Deskriptive Statistiken Mittelwert Standardabweichung N 4,0 0,56 0 6,00 9,8 0,55 0,9 0 Levene-Test auf Gleichheit der Fehlervarianzen a F df df Signifikanz,67 8,687 Prüft die Nullhypothese, daß die Fehlervarianz der abhängigen Variablen über Gruppen hinweg gleich ist. a. Design: Intercept+PRAEP
5 Quelle Korrigiertes Intercept PRAEP Fehler Korrigierte variation Quadratsumme vom Typ III Tests der Zwischensubjekteffekte df 40,050 b 40,050,50,78,50,85 5,050 5,050 4,7,000 4,69,997 40,050 40,050,50,78,50,85 640,900 8 9,77 4006,000 0 7550,950 9 a. Unter Verwendung von Alpha =,05 berechnet b. R-Quadrat =,065 (korrigiertes R-Quadrat =,0) Quadrate F Sign. NZP Beob. Schärfe a Ergebnis: Präparateffekt ns (Power nur 8,5%), höhere Power kann erreicht werden durch größere Stichproben oder Verkleinerung des Versuchsfehlers (Kovarianzanalyse). iii) Kovarianzanalyse - Test auf signifikante Präparateffekte Analysieren - Allgemeines lineares Univariat... (mit Anfangswert als Kovariable) Levene-Test auf Gleichheit der Fehlervarianzen a F df df Signifikanz,47 8,56 Prüft die Nullhypothese, daß die Fehlervarianz der abhängigen Variablen über Gruppen hinweg gleich ist. a. Design: Intercept+PRAEP+X Quelle Korrigiertes Konstanter Term PRAEP X Fehler Korrigierte variation Quadratsumme vom Typ III Tests der Zwischensubjekteffekte df 46,8 b 657,90 5,70,000 50,740,000 9,46 9,46,4,004,4,887 4888,0 4888,0 8,866,000 8,866,98 006, 006, 46,40,000 46,40,000 4404,569 7 59,09 4006,000 0 7550,950 9 a. Unter Verwendung von Alpha =,05 berechnet b. R-Quadrat =,749 (korrigiertes R-Quadrat =,70) Quadrate F Sign. NZP Beob. Schärfe a Parameterschätzer Parameter Konstanter Term [PRAEP=] [PRAEP=] 95% Konfidenzintervall Beob. B SE T Sign. Untergr. Obergr. NZP Schärfe a -5,50,740-4,00,00-80,8-6,6 4,00,977,69 7,68 4,4,000 7,60 49,578 4,4,98 0 b,,,,,,, X,7,06 6,807,000,498,946 6,807,000 a. Unter Verwendung von Alpha =,05 berechnet b. Dieser Parameter wird auf Null gesetzt, weil er redundant ist.
6 iv) iv) Kovarianzanalyse - Überprüfung der Voraussetzungen (Linerarität, Parallelität) Grafisch an Hand des Streudiagramms Grafiken - Streudiagramm... (mit eingezeichneten Regressionsgraden) 00 80 60 40 0 0 Präparat -0 Placebo Y -40 40 60 80 00 0 40 60 80 A X iv) Überprüfung der Parallelität im Rahmen von Allgemeines lineares Univariat... (Prüfung auf signifikante Wechselwirkung Faktor*Kovariable) Levene-Test auf Gleichheit der Fehlervarianzen a F df df Signifikanz,774 8,9 Prüft die Nullhypothese, daß die Fehlervarianz der abhängigen Variablen über Gruppen hinweg gleich ist. a. Design: Intercept+PRAEP+X+PRAEP * X Quelle Korrigiertes Konstanter Term PRAEP X PRAEP * X Fehler Korrigierte variation Quadratsumme vom Typ III Tests der Zwischensubjekteffekte df 55,497 b 448,499 6,458,000 49,75,000 008,8 008,8,05,004,05,88 4,789 4,789,800,84,800,4 9,586 9,586 44,406,000 44,406,000 09,6 09,6,406,5,406,09 495,45 6 68,466 4006,000 0 7550,950 9 a. Unter Verwendung von Alpha =,05 berechnet b. R-Quadrat =,755 (korrigiertes R-Quadrat =,709) Quadrate F Sign. NZP Beoh. Schärfe a Ergebnis: Wechselwirkung Faktor*Kovariable ns (vgl. auch Problem.) Problem.7: Abhängigkeitsanalysen - Zweifaktorielle Versuche Im Zusammenhang mit einer Untersuchung des Wasserhaushaltes einer Pflanze wurde unter verschiedenen Nährstoff- und Lichtbedingungen die mittlere Spaltöffnungsfläche (Zielvariable Y) auf bestimmten Blättern gemessen. Die Nährstoffgaben bestanden in einer als Kontrolle verwendeten "Volllösung" sowie zwei weiteren Lösungen mit einem Mangel bzw. Überschuss an Kalium (im Vergleich zur Kontrolle). Die unterschiedlichen Lichtbedingungen simulierten eine "Langtag-Situation" (6 Stunden Helligkeit und 8 Stunden Dunkelheit) und eine "Kurztag-Situation" (8 Stunden Helligkeit und 6 Stunden Dunkelheit). Das in der folgenden Tabelle zusammengestellte Datenmaterial stellt eine Kreuzklassifikation der "durchschnittlichen Spaltöffnungsfläche" nach den betrachteten Faktoren dar. Zu jeder Kombination einer Nährstoff- und Licht-Faktorstufe sind fünf Messwerte des Untersuchungsmerkmals angeschrieben, die von fünf verschiedenen, unter der jeweiligen Bedingung kultivierten Pflanzen stammen. Es soll untersucht werden, ob die Haupteffekte (Licht, Nährstoff) signifikant sind und ob es eine signifikante Faktorwechselwirkung gibt (Testniveau = 5%).
7 Faktor A (Nährstoff) Faktor B (Licht) /Kontrolle /K-Mangel /K-Übersch. (Langtag).8 57.7 9.9 5. 4. 0.8 7.4 6.8 6.7 7.7 9. 4.8 9.8.9 7. (Kurztag) 7.7 4.8 4.0 9.5 49.5.. 46.7 5.7 4. 0.8. 7.6 8.6 9.6 i) Datenorganisation nährstoff licht y.8... 9.8 7.7... 7.6 57.7 usw. ii) Test auf signifikante Haupt- und Wechselwirkungseffekte Analysieren - Allgemeines lineares Univariat... Deskriptive Statistiken A_NAEHR B_LICHT Mittelwert Standardabweichung N,8000 0,85 5,8600 8,57 5 7,00 0,684 0 5,9400 4,054 5 9,4800 9,759 5 7,700,406 0 7,9000 7,770 5 5,400 8,40 5 6,500 7,4 0 8,8800,5575 5,600 0,090 5 0,500 0,7897 0 Levene-Test auf Gleichheit der Fehlervarianzen a F df df Signifikanz,9 5 4,489 Prüft die Nullhypothese, daß die Fehlervarianz der abhängigen Variablen über Gruppen hinweg gleich ist. a. Design: Intercept+A_NAEHR+B_LICHT+A_NAEHR * B_LICHT
8 Quelle Korrigiertes Konstanter Term A_NAEHR B_LICHT A_NAEHR * B_LICHT Fehler Korrigierte variation Quadratsumm e vom Typ III Tests der Zwischensubjekteffekte df 04,04 b 5 06,86,0,098 0,600,594 7944, 7944, 86,8,000 86,8,000 778,7 89,6,990,0 7,98,658 80,688 80,688,87,7,87,4 74,894 87,447,896,4,79,86 4,84 4 97,576 0,40 0 76,8 9 a. Unter Verwendung von Alpha =,05 berechnet b. R-Quadrat =,06 (korrigiertes R-Quadrat =,6) Quadrate F Sign. NZP Beob. Schärfe a Mehrfachvergleiche Scheffé Dunnett-T (-seitig) a (I) A_NAEHR (J) A_NAEHR Mittlere Differenz 95% Konfidenzintervall (I-J) SE Sign. Untergr. Obergr. -0,800 4,48,08 -,9045,445,800 4,48,98-0,745,45 0,800 4,48,08 -,445,9045,900 4,48,058 -,45,745 -,800 4,48,98 -,45 0,745 -,900 4,48,058 -,745,45 0,800* 4,48,050,6E-0 0,7589 -,800 4,48,976 -,889 9,5689 Basiert auf beobachteten Mittelwerten. *. Die mittlere Differenz ist auf der Stufe,05 signifikant. a. In Dunnett-T-Tests wird eine Gruppe als Kontrollgruppe behandelt, mit der alle anderen Gruppen verglichen werden. 50 Profildiagramm 40 Geschätztes Randmittel 0 0 B_LICHT A_NAEHR Ergebnis: Nährstofffaktor sign.; Lichtfaktor, Faktorwechselwirkung ns.