Ausgewählte Kapitel der Statistik: Regressions- u. varianzanalytische Modelle Lösung von Grundaufgaben mit SPSS (ab V. 11.0)



Ähnliche Dokumente
Ausgewählte Kapitel der Statistik: Regressions- u. varianzanalytische Modelle Lösung von Grundaufgaben mit SPSS Statistics 20.0

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse

Etwas positive Tendenz ist beim Wechsel der Temperatur von 120 auf 170 zu erkennen.

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50, ,5 51,7 48,8

Korrelation - Regression. Berghold, IMI

SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben

Standardab er des. Testwert = % Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere

Varianzanalyse (ANOVA: analysis of variance)

Einfache Varianzanalyse für abhängige

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Anhang A: Fragebögen und sonstige Unterlagen

Willkommen zur Vorlesung Statistik

Hypothesentests mit SPSS

Einfache statistische Auswertungen mit dem Programm SPSS

Kapitel 7: Varianzanalyse mit Messwiederholung

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift:

Überblick über die Verfahren für Ordinaldaten

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Webergänzung zu Kapitel 10

Leseprobe. Wilhelm Kleppmann. Versuchsplanung. Produkte und Prozesse optimieren ISBN: Weitere Informationen oder Bestellungen unter

Messung von Veränderungen. Dr. Julia Kneer Universität des Saarlandes

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Gemischte Modelle. Fabian Scheipl, Sonja Greven. SoSe Institut für Statistik Ludwig-Maximilians-Universität München

9. Schätzen und Testen bei unbekannter Varianz

Nichtparametrische statistische Verfahren

Varianzanalytische Methoden Zweifaktorielle Versuchspläne 4/13. Durchführung in SPSS (File Trait Angst.sav)

Tutorial: Homogenitätstest

V A R I A N Z A N A L Y S E

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

In konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert.

Fortgeschrittene Statistik Logistische Regression

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Varianzanalyse ANOVA

Statistik II für Betriebswirte Vorlesung 2

Business Value Launch 2006

Stichprobenauslegung. für stetige und binäre Datentypen

FAKTORIELLE VERSUCHSPLÄNE. Andreas Handl

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

B 2. " Zeigen Sie, dass die Wahrscheinlichkeit, dass eine Leiterplatte akzeptiert wird, 0,93 beträgt. (genauerer Wert: 0,933).!:!!

Plotten von Linien ( nach Jack Bresenham, 1962 )

Versuchsplanung. Inhalt. Grundlagen. Faktor-Effekt. Allgemeine faktorielle Versuchspläne. Zweiwertige faktorielle Versuchspläne

Statistik für Studenten der Sportwissenschaften SS 2008

Auswertung mit dem Statistikprogramm SPSS:

Musterlösung zu Serie 14

Statistische Auswertung:

1.3 Die Beurteilung von Testleistungen

Tabelle 136: Unterschiede zwischen den Clustern in der Bearbeitungszeit des Wissenstests (LT-ZEIT)

Grundlagen der Inferenzstatistik

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR)

Quantitative Methoden der Bildungsforschung

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Kommentierter SPSS-Ausdruck zur logistischen Regression

A.1 Fragebogen der Untersuchung von Burisch (2002)

4. Erstellen von Klassen

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Im Modell der Varianzanalyse (mit festen Effekten) ist das. aus dem Durchschnittsmesswert für y plus dem Effekt des.

Zeichen bei Zahlen entschlüsseln

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Repetitionsaufgaben: Lineare Gleichungen

Willkommen zur Vorlesung Statistik (Master)

Professionelle Seminare im Bereich MS-Office

Kapitel 3: Interpretationen

Lineare Gleichungssysteme

Statistik II Übung 3: Hypothesentests

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen

Taschenbuch Versuchsplanung Produkte und Prozesse optimieren

Planen mit mathematischen Modellen 00844: Computergestützte Optimierung. Autor: Dr. Heinz Peter Reidmacher

W-Rechnung und Statistik für Ingenieure Übung 11

Quadratische Gleichungen

2. Korrelation, lineare Regression und multiple Regression

QM: Prüfen -1- KN

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse Lösung 10 Punkte

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen

Formelsammlung zur Kreisgleichung

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester Juli 2005

Das Mathematik-Abitur im Saarland

V 2 B, C, D Drinks. Möglicher Lösungsweg a) Gleichungssystem: 300x y = x + 500y = 597,5 2x3 Matrix: Energydrink 0,7 Mineralwasser 0,775,

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

Statistik im Versicherungs- und Finanzwesen

Bevor lineare Gleichungen gelöst werden, ein paar wichtige Begriffe, die im Zusammenhang von linearen Gleichungen oft auftauchen.

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Einführung in statistische Analysen

Klausur zur Vorlesung Multivariate Verfahren, SS Kreditpunkte, 90 min

Vorkurs Mathematik Übungen zu Polynomgleichungen

Lineare Funktionen. 1 Proportionale Funktionen Definition Eigenschaften Steigungsdreieck 3

i x k k=1 i u i x i v i 1 0, ,08 2 0, ,18 3 0, ,36 4 0, ,60 5 1, ,00 2,22 G = n 2 n i=1

Transkript:

Ausgewählte Kapitel der Statistik: Regressions- u. varianzanalytische e Lösung von Grundaufgaben mit SPSS (ab V..0) Text: akmv_v.doc Daten: akmv??.sav Lehrbuch: W. Timischl, Biostatistik. Wien - New York: Springer 000 Problem.: Abhängigkeitsanalysen - mehrfach lineare Regression Die folgenden Daten sind einer Studie entnommen, in der u.a. das cholesterin Y (in mg/dl), das Gewicht X (in kg) und das Alter X (in a) bestimmt wurden. Es sollen (mit den von Probanden stammenden Daten) im Rahmen eines zweifach-linearen s folgende Fragen untersucht werden: i) Hängt Y global von X und X ab? (globale Abhängigkeitsprüfung, α = 5%). Wenn ja, wie lautet das Regressionsmodell? ii) Ist eine Reduktion auf ein lineares mit nur einem Regressor möglich? (partielle Abhängigkeitsprüfung, α = 5%) Daten: akmv.sav i) Daten, einfache Statistiken Analysieren - Berichte - Fälle zusammenfassen... 4 5 6 7 8 9 0 Insgesamt Zusammenfassung von Fällen a N Mittelwert Standardabweichung Varianz a. Begrenzt auf die ersten 00 Fälle. chol./ Gewicht/kg Alter/a mg p.dl 8 48 50 60 5 95 8 55 440 58 0 90 80 58 400 0 5 0 65 45 50 5 0 70 50 0 54 40 90 68 0 55 6 8 0 6,00 4,5 0,00 7,008,49 70,4 89,7 0,86 4959,09 i) Schätzung der parameter, globale Abhängigkeitsprüfung Analysieren - Regression - linear... zusammenfassung b Korrigiertes Standardfehler R R-Quadrat R-Quadrat des Schätzers,888 a,789,74 5,76 a. Einflußvariablen : (Konstante), Alter/a, Gewicht/kg b. Abhängige Variable: chol./mg p.dl

Regression Residuen ANOVA b Quadratsumme df Quadrate F Signifikanz 409,04 59,507 6,85,00 a 50,986 9 78,998 54550,000 a. Einflußvariablen : (Konstante), Alter/a, Gewicht/kg b. Abhängige Variable: chol./mg p.dl (Konstante) Gewicht/kg Alter/a Nicht standardisierte Koeffizienten a. Abhängige Variable: chol./mg p.dl Koeffizienten a Standardisierte Koeffizienten 95%-Konfidenzintervall für B Standard Signifi Untergren Obergren B fehler Beta T kanz ze ze 7,94 4,874,67,9-5,855 7,644,686,870,407,99,084 -,8,65,445,95,559,660,06,55 6,74 Regressionsfunktion: Y(erwartet) = 7,94 +,686 X +,445 X Anpassungsgüte: Es empfiehlt sich, die adäquatheit an Hand eines mit den erwarteten und beobachteten Y-Werten gezeichneten Streudiagramms zu überprüfen. Ein Kennwert für die Anpassungsgüte ist das multiple Bestimmtheitsmaß (=Quadrat der Produktmomentkorrelation zwischen den erwarteten und beobachteten Y-Werten; im Beispiel ist R =78,9%).,0,0 Standard. geschätzter Wert (Y) 0,0 -,0 -,0 R-Qu. = 0.7890 00 00 400 500 chol./mg p.dl (Y)

ii) partielle Abhängigeitsprüfung: Ist X (Gewicht) redundant? (reduziertes : einfache lineare Regression von Y auf X) Statistik - Regression - linear... zusammenfassung Korrigiertes Standardfehler R R-Quadrat R-Quadrat des Schätzers,87 a,70,67 40,96 a. Einflußvariablen : (Konstante), Alter/a Regression Residuen ANOVA b Quadrats umme df Quadrate F Signifikanz 8,846 8,846,49,00 a 68,54 0 6,85 54550,000 a. Einflußvariablen : (Konstante), Alter/a b. Abhängige Variable: chol./mg p.dl Partieller F-Test: TGs(X X) = [SQRes(X) - SQRes(X,X)]/MQRes(X,X) = (68,54 50,986)/78,998 =,759; Testgröße ist F-verteilt mit dem Zählerfreiheitsgrad und dem Nennerfreiheitsgrad 9 P(TG >,759) = 8,45% α =5% Verkleinerung von SQRes ist nicht signifikant! (dass X redundant ist, sieht man auch aus der Tabelle "Koeffizienten" unter i) ii) partielle Abhängigkeitsprüfung: Ist X redundant? nein! (siehe Tabelle "Koeffizienten" unter i) Problem.: Abhängigkeitsanalysen - polynomiale Regression Mit Hilfe angegebenen Daten soll die Photosynthese Y (in mmol CO pro m und s) einer Pflanze als Funktion der Temperatur X (in oc) bei konstant gehaltener (hoher) Lichintensität dargestellt werden. Man prüfe die Abhängigkeit der Variablen Y von X im Rahmen eines quadratischen s (α = 5%). Für welche Temperatur ist der Y maximal? Daten: akmv.sav i) Grafische Untersuchung des typs (Art der Regressionsfunktion) Grafiken - Streudiagramm... 5 9 Photosynth. 6 4 7 0 6 9 Temp. (C) Streudiagramm quadratische Regressionsfunktion: Y(erwartet) = b0 + b*x + b*x mit X = X, X = X*X ii) Daten, einfache Statistiken

4 Zusammenfassung von Fällen a Temp. (C) Photosynth. X 5 7,9 5 5 8,0 5 0 4,5 400 4 0 4,4 400 5 5,77 65 6 5,7 65 7 0 9,09 900 8 0 0,57 900 Insgesamt N 8 8 8 Mittelwert,50,65 57,50 Standardabweichung 5,976,606 70,5 Varianz 5,74 6,866 705,74 a. Begrenzt auf die ersten 00 Fälle. iii) Schätzung der parameter, Abhängigkeitsprüfungen (global, partiell) Analysieren - Regression - linear... zusammenfassung Korrigiertes Standardfehler R R-Quadrat R-Quadrat des Schätzers,906 a,80,748,48 a. Einflußvariablen : (Konstante), X, Temp. (C) Regression Residuen ANOVA b Quadrat summe df Quadrate F Signifikanz 9,40 9,70,40,04 a 8,644 5,79 48,064 7 a. Einflußvariablen : (Konstante), X, Temp. (C) b. Abhängige Variable: Photosynth. Globaler F-Test: Signifikanz < α =5% Y hängt (im Rahmen des s) signifikant von X (und X*X) ab. (Konstante) Temp. (C) X Nicht standard. Koeffizienten a. Abhängige Variable: Photosynth. Koeffizienten a Standard. Koeffizienten 95%-Konfidenzint. für B B SE Beta T Signifikanz UG OG -,875 9,040 -,40,060-45,,64 4,00,84 9,46 4,769,005,849 6,7 -,088,09-9,055-4,7,005 -,6 -,040 Partieller F-Test: Wegen Sign. < α ist weder X (TEMP) noch X=X*X im redundant.

5,5,0,5 Standard. geschätzter Wert (Y) 0,0 -,5 -,0 -,5 R-Qu. = 0.80 6 9 5 Photosynth. Regressionsmodell: Y(erwartet) = -,875 + 4,00 X 0,088 X*X Optimale Temperatur: dy/dx = 4,00 - x 0,088 X = 0 X(opt.) =,8 Problem.: Vergleich von Regressionsgeraden In einem Placebo-kontrollierten Parallelversuch wurde eine Größe vor Gabe des Präparates (Variable X) und danach (Variable X) gemessen. Die Präparatwirkung Y wird durch die Differenz X - X ausgedrückt. Jeweils zehn Versuchspersonen erhielten das Testpräparat, andere zehn das Kontrollpräparat (Placebo). i) Man zeige auf der Grundlage von linearen Regressionsmodellen, dass in jeder Präparatgruppe die Wirkung Y vom Anfangswert X abhängt (Prüfung auf Abhängigkeit). ii) Man zeige, dass sich die Anstiege der Regressionsgeraden nicht signifikant unterscheiden (Prüfung auf Abweichung von der Parallelität). iii) Man zeige, dass die Regressionsgeraden nicht zusammenfallen (Prüfung auf Koinzidenz). Als Testniveau sei für jede Einzelprüfung 5% angenommen; Daten: siehe "Daten, einfache Statistiken". i) Daten, einfache Statistiken Analysieren - Berichte - Fälle zusammenfassen... Tabelle: siehe nächste Seite i) Grafische Überprüfung der adäquatheit (lineares ) Grafiken - Streudiagramm - Einfach... 00 80 60 40 0 Präparat 0-0 Placebo R-Qu. = 0,7805 A Y -40 40 60 80 00 0 40 60 80 R-Qu. = 0,6980 X

6 Zusammenfassung von Fällen a Präparat A Placebo Insgesamt 4 5 6 7 8 9 0 Insgesamt N Mittelwert Standardfehler des Mittelwertes Standardabweichung Varianz 4 5 6 7 8 9 0 Insgesamt N Mittelwert Standardfehler des Mittelwertes Standardabweichung Varianz N Mittelwert Standardfehler des Mittelwertes X X Y 6 0 84 6 49 8 56 49 7 0 8 8 9 9 6 6 7 54 44 5-8 56 76 94 67 7 0 0 0 84,80 4,70 4,0 9,99 5,65 9,66,59 7,85 0,56 997,7 8,678 9,656 57 8-6 46 79 67 6 9 7 58 6 68 68 0 76 6 77 68 9 6 98 8 74 56 8 0 99 0 0 0 0,0 84,0 6,00,49 6,07 9,4 9,5 9,9 9,8 560,767 68, 889,778 0 0 0 97,45 6,90,55 8, 6,4 6,80 Standardabweichung Varianz a. Begrenzt auf die ersten 00 Fälle. 7,5 7,48 0,9 80,66 754,97 9,74 i) Lineare Regression von Y auf X (getrennt nach Präparatgruppen) Aufteilung der Datei nach Gruppen: Daten Datei aufteilen... Regressionsprozedur: Analysieren - Regression - Linear.. Präparat = A zusammenfassung b R R-Quadrat Korrigiertes R-Quadrat Standardfehler des Schätzers,85 a,698,660 7,8 a. Einflußvariablen : (Konstante), Untersuchungsm..US b. Präparat = A

7 ANOVA b,c Quadrat summe df Quadrate F Signifikanz Regression 5865,78 5865,78 8,490,00 a Residuen 57,7 8 7,5 840,900 9 a. Einflußvariablen : (Konstante), Untersuchungsm..US b. c. Präparat = A Koeffizienten a,b (Konstante) Untersuchungsm..US a. b. Präparat = A Nicht standardisierte Koeffizienten Standard. Koeffizienten B SE Beta T Signifikanz -7,44 6,904 -,6,4,808,880,85 4,00,00 Präparat = Placebo zusammenfassung b R R-Quadrat Korrigiertes R-Quadrat Standardfehler des Schätzers,88 a,78,75 4,8 a. Einflußvariablen : (Konstante), Untersuchungsm..US b. Präparat = Placebo Regression Residuen ANOVA b,c Quadrat summe df Quadrate F Signifikanz 650,69 650,69 8,447,00 a 757,7 8 9,76 8008,000 9 a. Einflußvariablen : (Konstante), Untersuchungsm..US b. c. Präparat = Placebo Koeffizienten a,b (Konstante) Untersuchungsm..US a. b. Präparat = Placebo Nicht standardisierte Koeffizienten Standard. Koeffizienten B SE Beta T Signifikanz -47,44 4,5458 -,6,0,667,5,88 5,4,00 Ergebnisse: Regressionsmodell (Präparat A): Y = b X + b0 + Fehler mit b = 0.808 (sign. <> Null, P =0.00), b0 = -7.44; Regressionsmodell (Placebo): Y = b X + b0 + Fehler mit b = 0.667 (sign. <> Null, P = 0.00), b0 = -47.44. ii) Gibt es zwischen den Geradenanstiegen b und b einen signifikanten Unterschied (α=5%)?

8 ii) Vergleich von b und b mit dem t-test Voraussetzungen: b (Stichprobenfunktion, Anstieg - Präparat A) ist normalverteilt, Schätzwerte: Mittelwert = 0.808, Standardabweichung = 0.880 (Freiheitsgrad = n-=8) b (Stichprobenfunktion, Anstieg - Placebo) ist normalverteilt, Schätzwerte: Mittelwert = 0.667, Standardabweichung = 0.5, (Freiheitsgrad = n-=8) Manuelle Durchführung des t-tests: F-Test: Varianzverhältnis (0.880/0.5)^ =.58 <= F(8, 8, 0.975) = 4.4 spricht nicht gegen die Gleichheit der Varianzen. -Stichproben-t-Test (unabhängige Stichproben): mittlere (gepoolte) Varianz = (0.880^ + 0.5^)/ = 0.047 Testgröße = (0.808-0.667)/0.047^(/)* (64/6)^(/) =.58 <= t(6, 0.975) =.0 Unterschied der Anstiegswerte ist auf dem Testniveau 5% nicht signifikant. ii) Vergleich der Anstiege im Rahmen eines mehrfach-linearen Regressionsmodells mit einer Indikatorvariablen ("dummy variable") Prinzip: Die zwei einfach-linearen Regressionsmodelle werden mit Hilfe der Indikatorvariablen z in ein mehrfach-lineares Regressionsmodell zusammengefasst. Der Hilfsvariablen z wird für alle Beobachtungen der Präparatgruppe A der Wert Null und für alle Beobachtungen der Placebo-Gruppe der Wert eins zugewiesen. Setzt man die abhängige Variabe Y als multiples lineares mit den Regressorvariablen u=x, u=z und u=x*z in der Gestalt (*) Y = b0 + b*u + b*u + b*u + Fehler an, so geht diese gleichung für z=0 (Gruppe A) über in (**) Y = b0 + b*x + Fehler und für z= (Placebo-Gruppe) über in (***) Y = (b0+b) + (b+b)*x + Fehler. Die Anstiege in den einfach-linearen Regressionsmodellen (**) und (***) sind genau dann verschieden, wenn im dreifach-linearen Regressionsmodells (*) der Koeffizient b ungleich Null ist, d.h. die Zielvariable von u abhängt. Die Abhängigkeitsprüfung von u erfolgt mit dem partiellen F-Test. Datenorganisation: Datenmatrix durch z-spalte (=u) und z*x-spalte (=u) ergänzen. Zusammenfassung von Fällen a Präparat X (=u) X Y U (=z) U (=z*x) A 6 0 0 0 A 84 6 0 0 A 49 8 0 0 4 A 56 49 7 0 0 5 A 0 8 8 0 0 6 A 9 9 6 0 0 7 A 6 7 54 0 0 8 A 44 5-8 0 0 9 A 56 76 0 0 0 A 94 67 7 0 0 Placebo 57 8-6 57 Placebo 46 79 67 46 Placebo 6 9 7 6 4 Placebo 58 6 58 5 Placebo 68 68 0 68 6 Placebo 76 6 7 Placebo 77 68 9 77 8 Placebo 6 98 8 6 9 Placebo 74 56 8 74 0 Placebo 0 99 0 Insgesamt N 0 0 0 0 0 0 a. Begrenzt auf die ersten 00 Fälle. Hypothesen:

9 H0: Koeffizient von u in (*) ist Null (Nullmodell), H: Koeffizient von u in (*) ist ungleich Null (Alternativmodell). Durchführung des partiellen F-Tests: Schritt : Fehlerquadratsumme SQRes(H)=495.45 und Freiheitsgrade FG(H)= 6 aus dem Alternativmodell bestimmen (Statistik - Regression - Linear... ; abhängige Variable = Y, unabhängige Variable = u, u, u). Regression Residuen ANOVA b Quadrat summe df Quadrate F Signifikanz 55,5 448,499 6,458,000 a 495,45 6 68,466 755,0 9 a. Einflußvariablen : (Konstante), U, Untersuchungsm..US, U b. Schritt : Fehlerquadratsumme SQRes(H0)=4404.569 und Freiheitsgrade FG(H0)= 7 aus dem Alternativmodell bestimmen (Statistik - Regression - Linear... ; abhängige Variable = Y, unabhängige Variable = u, u). ANOVA b Quadrat summe df Quadrate F Signifikanz Regression 46,4 657,90 5,70,000 a Residuen 4404,569 7 59,09 755,0 9 a. Einflußvariablen : (Konstante), U, Untersuchungsm..US b. Schritt : Testentscheidung Mittlere Reduktion der Fehlerquadratsumme bei Übergang vom Nullmodell zum Alternativmodell = MQRes(H H0) = [SQRes(H0) - SQRes(H)]/[FG(H0)-FG(H)] = (4404.569-495.45)/(7-6) = 09.6. Schätzung der Fehlervarianz aus dem Alternativmodell durch MQRes(H) = 68.466 mit FG(H) = 6. Testgröße = MQRes(H H0)/MQRes(H) = 0.406 <= F(,6,0.95) = 4.49 Unterschied zwischen den Anstiegen nicht signifikant. iii) Sind die Regressionsgeraden überhaupt verschieden? (hinsichtlich Anstiege und y-achsenabschnitte) Prüfung im Rahmen des mehrfach-linearen Regressionsmodells (*) mit den Regressorvariablen u (=X), u (=z) und u (=z*x) durch Übergang vom Vollmodell (Alternativmodell) zum Nullmodell (Koeffizienten von u und u sind Null). Hypothesen: H0: Y hängt nicht von u und u ab (Nullmodell), H: Y hängt von u, u und u ab (Alternativmodell). Durchführung des partiellen F-Tests: Schritt : SQRes(H) = 495.45, FG(H) = 6, MQRes(H) = 68.466. Schritt : SQRes(H0) = 99.59, FG(H0) = 8. Regression Residuen ANOVA b Quadrat summe df Quadrate F Signifikanz 858,59 858,59 5,997,00 a 99,59 8 56,55 7550,950 9 a. Einflußvariablen : (Konstante), Untersuchungsm..US b. Schritt :

0 MQRes(H H0) = (99.59-495.45)/(8-6)=498.569. Testgröße = MQRes(H H0)/MQE(H) = 9.07 > F(,6,0.95) =.6 Regressionsgeraden fallen nicht zusammen! Problem.4: Abhängigkeitsanalysen - Versuche mit einem Haupt- und einem Blockfaktor Die folgende Datentabelle zeigt die an einer Messstelle der Donau erhaltenen monatlichen Messwerte des phosphors (gesp_) für die Jahre 986 bis 988. Man vergleiche die Jahresmittelwerte und verwende dabei den Monat als Blockfaktor. Das Testniveau ist mit 5% vorgegeben. Monat 986 987 988 0.8 0.65 0.79 0.08 0.0 0.89 0.8 0.9 0.4 4 0.8 0.70 0.60 5 0.99 0. 0.50 6 0. 0.085 0.0 7 0.7 0.74 0.70 8 0.54 0.8 0.5 9 0.4 0.86 0. 0 0.5 0.66 0.09 0.6 0.8 0. 0.7 0.09 0.5 i) Problemlösung mit der Prozedur Allgemeines lineares : Messwert = Basiswert + Faktor(=Jahres)-Effekt + Block (=Monats)-Effekt + Versuchsfehler Datenorganisation: monat jahr gesp_ 86 0.8 86 0.08...... 88 0.5 i) Globaltest (H0: kein Jahres-Effekt), Power Analysieren - Allgemeines lineares Univariat... Abhängige Variable: -P in mg/l /Wolfsthal) Quelle Korrigiertes Konstanter Term MONAT JAHR Fehler Korrigierte variation Quadratsumme vom Typ III df Tests der Zwischensubjekteffekte 8,5E-0 b 6,50E-0,7,046 9,078,84,697,697 607,49,000 607,49,000 5,50E-0 5,00E-0,790,8 9,69,677,6E-0,E-0 4,69,00 9,85,77 6,47E-0,794E-0,840 6,4 5 a. Unter Verwendung von Alpha =,05 berechnet b. R-Quadrat =,569 (korrigiertes R-Quadrat =,5) Quadrate F Sign. Nichtzentralitäts- Parameter Beobachtete Schärfe a Geschätzte Randmittel. mittelwert Abhängige Variable: -P in mg/l /Wolfsthal) 95% Konfidenzintervall Mittelwert Standardfehler Untergrenze Obergrenze,7,009,99,5

. MONAT Abhängige Variable: -P in mg/l /Wolfsthal) MONAT 4 5 6 7 8 9 0 95% Konfidenzintervall Mittelwert Standardfehler Untergrenze Obergrenze,75,0,,9,,0,70,96,7,0,08,5,04,0,4,67,5,0 9,004E-0,7,4,0 7,87E-0,05,94,0,0,57,9,0,66,9,4,0,50,77,09,0,46,7,7,0,74,00,44,0,80,07. JAHR Abhängige Variable: -P in mg/l /Wolfsthal) JAHR 86 87 88 95% Konfidenzintervall Mittelwert Standardfehler Untergrenze Obergrenze,55,05,4,87,97,05,65,8,99,05,68, i) Multiple Vergleiche (nach Scheffe und Dunnett) Abhängige Variable: -P in mg/l /Wolfsthal) Mehrfachvergleiche Scheffé Dunnett-T (-seitig) a (I) JAHR 86 87 88 87 88 (J) JAHR 87 88 86 88 86 87 86 86 Mittlere Differenz 95% Konfidenzintervall (I-J) SE Sign. Untergr. Obergr. 5,8500E-0*,0,04,870E-0,5 5,597E-0,0,05-7,07E-04,55-5,85000E-0*,0,04 -,5 -,870E-0 -,58E-0,0,99-5,9E-0 5,4046E-0-5,5967E-0,0,05 -,55 7,07E-04,58E-0,0,99-5,4046E-0 5,9E-0-5,85000E-0*,0,04 -,0949-7,54E-0-5,5967E-0*,0,0 -,0690-4,9E-0 Basiert auf beobachteten Mittelwerten. *. Die mittlere Differenz ist auf der Stufe,05 signifikant. a. In Dunnett-T-Tests wird eine Gruppe als Kontrollgruppe behandelt, mit der alle anderen Gruppen verglichen werden. ii) Rangvarianzanalyse für verbundene Stichproben (Friedman-Test) Analysieren - Nichtparametrische Tests - K verbundene Stichproben... Datenorganisation: monat gesp86 gesp87 gesp88 0.8 0.65 0.79 0.08 0.0 0.89 usw.

Ränge GESP86 GESP87 GESP88 Mittlerer Rang,67,50,8 Statistik für Test a N Chi-Quadrat df Asymptotische Signifikanz a. Friedman-Test 8,667,0 Problem.5: Abhängigkeitsanalysen - Einfaktorielle Versuche mit Messwiederholungen Um die Wirkung einer Behandlung auf eine Zielvariable Y zu untersuchen, wurden 0 Probanden der Behandlung unterzogen und die Zielvariable am Beginn und am Ende der Behandlung (Zeitpunkte bzw. ) sowie nach einem längeren zeitlichen Intervall (Zeitpunkt ) gemessen. Die Messwerte sind in der folgenden Tabelle protokolliert. Es soll auf dem 5%-Niveau geprüft werden, ob sich die Zielvariable im Mittel verändert hat. Pers. Zeitp. Zeitp. Zeitp. 568 78 7 668 849 80 44 440 465 4 466 68 40 5 5 6 6 6 696 779 555 7 76 754 640 8 605 87 696 9 504 756 97 0 469 586 50 i) Datenorganisation: wie in der Tabelle. ii) Problemlösung mit GLM - Messwiederholungen: Analysieren - Allgemeines lineares - Messwiederholung... Innersubjektfaktoren Maß: MESSWERT Abhängige ZEIT Variable X_ X_ X_ Deskriptive Statistiken Untersuchungsm..US Untersuchungsm..US Untersuchungsm..US Mittelwert Standardabweichung N 569,90 09,4 0 70,0 5, 0 565,70 65,46 0 ii) Lösung im Rahmen einer multivariaten Varianzanalyse

Multivariate Tests c Effekt Wert F Hypothese df Fehler df Sign. NZP Beobachtete Schärfe a ZEIT Pillai-Spur,70 9,465 b,000 8,000,008 8,99,899 Wilks-Lambda,97 9,465 b,000 8,000,008 8,99,899 Hotelling-Spur,66 9,465 b,000 8,000,008 8,99,899 Größte charakteristische Wurzel nach Roy,66 9,465 b,000 8,000,008 8,99,899 a. Unter Verwendung von Alpha =,05 berechnet b. Exakte Statistik c. Design: Intercept Innersubjekt-Design: ZEIT ii) Lösung im Rahmen einer Blockvarianzanalyse mit Korrektur der Fehlerfreiheitsgrade Maß: MESSWERT Mauchly-Test auf Sphärizität b Inner subjekt effekt ZEIT Prüft die Nullhypothese, daß sich die Fehlerkovarianz-Matrix der orthonormalisierten transformierten abhängigen Variablen proportional zur Einheitsmatrix verhält. a. Kann zum Korrigieren der Freiheitsgrade für die gemittelten Signifikanztests verwendet werden. In der Tabelle mit den Tests der Effekte innerhalb der Subjekte werden korrigierte Tests angezeigt. b. Design: Intercept Innersubjekt-Design: ZEIT Maß: MESSWERT Quelle ZEIT Fehler(ZEIT) Epsilon a Unter Approximiertes Greenhouse- Huynh- grenz Mauchly-W Chi-Quadrat df Sign. Geisser Feldt e,670,08,0,75,869,500 Sphärizität angenommen Greenhouse- Geisser Huynh-Feldt Untergrenze Sphärizität angenommen Greenhouse- Geisser Huynh-Feldt Untergrenze Quadratsumme vom Typ III Tests der Innersubjekteffekte df 8,800 6064,400 7,80,005 4,60,885 8,800,50 84,49 7,80,0 0,795,80 8,800,79 704,594 7,80,008,484,847 8,800,000 8,800 7,80,05 7,80,666 508,867 8 8504,659 508,867,5,8 508,867 5,648 978,99 508,867 9,000 7009,9 a. Unter Verwendung von Alpha =,05 berechnet Quadrate F Sign. NZP Beob. Schärfe a

4 Tests der Innersubjektkontraste Maß: MESSWERT Quelle ZEIT Quadratsumme vom Typ III df Quadrate F Sign. NZP Beob. Schärfe a ZEIT Linear 88,00 88,00,00,9,00,05 Quadratisch 040,600 040,600 4,70,004 4,70,95 Fehler Linear 7878,800 9 8708,756 (ZEIT) Quadratisch 74705,067 9 800,56 a. Unter Verwendung von Alpha =,05 berechnet Problem.6: Abhängigkeitsanalysen - Einfaktorielle Versuche mit einer Kovariablen In einem Placebo-kontrollierten Parallelversuch wurde eine Größe vor Gabe des Präparates (Variable X) und danach (Variable X') gemessen. Jeweils zehn Versuchspersonen erhielten das Testpräparat, andere zehn das Kontrollpräparat (Placebo). Die Messergebnisse sind in der folgenden Tabelle zusammengestellt. Es ist das Ziel des Versuches, das Testpräparat mit dem Kontrollpräparat hinsichtlich der Wirksamkeit zu vergleichen. Dabei ist die Wirksamkeit durch die Differenz Y=X-X' erfasst und eine allfällige Abhängigkeit vom Anfangswert zu berücksichtigen. Als Testniveau sei α = 5% vereinbart. Behandlungsfaktor (Präparat) Stufe (Test) Stufe (Placebo) X X' X X' Wieder- 6 57 8 holungen 84 46 79 49 6 9 56 49 58 0 8 68 68 9 9 76 6 7 77 68 44 5 6 98 56 74 56 94 67 0 99 i) Datenorganisation Y-Spalte mit "Transformieren - Berechnen..." erzeugen: Präparat X X' Y(=X-X') 6 0... 94 67 7 57 8-6... 0 99 ii) Vergleich der Präparateffekte ohne Berücksichtigung des Anfangswertes Analysieren - Allgemeines lineares Univariat... (ohne Anfangswert als Kovariable) Präparat A Placebo Deskriptive Statistiken Mittelwert Standardabweichung N 4,0 0,56 0 6,00 9,8 0,55 0,9 0 Levene-Test auf Gleichheit der Fehlervarianzen a F df df Signifikanz,67 8,687 Prüft die Nullhypothese, daß die Fehlervarianz der abhängigen Variablen über Gruppen hinweg gleich ist. a. Design: Intercept+PRAEP

5 Quelle Korrigiertes Intercept PRAEP Fehler Korrigierte variation Quadratsumme vom Typ III Tests der Zwischensubjekteffekte df 40,050 b 40,050,50,78,50,85 5,050 5,050 4,7,000 4,69,997 40,050 40,050,50,78,50,85 640,900 8 9,77 4006,000 0 7550,950 9 a. Unter Verwendung von Alpha =,05 berechnet b. R-Quadrat =,065 (korrigiertes R-Quadrat =,0) Quadrate F Sign. NZP Beob. Schärfe a Ergebnis: Präparateffekt ns (Power nur 8,5%), höhere Power kann erreicht werden durch größere Stichproben oder Verkleinerung des Versuchsfehlers (Kovarianzanalyse). iii) Kovarianzanalyse - Test auf signifikante Präparateffekte Analysieren - Allgemeines lineares Univariat... (mit Anfangswert als Kovariable) Levene-Test auf Gleichheit der Fehlervarianzen a F df df Signifikanz,47 8,56 Prüft die Nullhypothese, daß die Fehlervarianz der abhängigen Variablen über Gruppen hinweg gleich ist. a. Design: Intercept+PRAEP+X Quelle Korrigiertes Konstanter Term PRAEP X Fehler Korrigierte variation Quadratsumme vom Typ III Tests der Zwischensubjekteffekte df 46,8 b 657,90 5,70,000 50,740,000 9,46 9,46,4,004,4,887 4888,0 4888,0 8,866,000 8,866,98 006, 006, 46,40,000 46,40,000 4404,569 7 59,09 4006,000 0 7550,950 9 a. Unter Verwendung von Alpha =,05 berechnet b. R-Quadrat =,749 (korrigiertes R-Quadrat =,70) Quadrate F Sign. NZP Beob. Schärfe a Parameterschätzer Parameter Konstanter Term [PRAEP=] [PRAEP=] 95% Konfidenzintervall Beob. B SE T Sign. Untergr. Obergr. NZP Schärfe a -5,50,740-4,00,00-80,8-6,6 4,00,977,69 7,68 4,4,000 7,60 49,578 4,4,98 0 b,,,,,,, X,7,06 6,807,000,498,946 6,807,000 a. Unter Verwendung von Alpha =,05 berechnet b. Dieser Parameter wird auf Null gesetzt, weil er redundant ist.

6 iv) iv) Kovarianzanalyse - Überprüfung der Voraussetzungen (Linerarität, Parallelität) Grafisch an Hand des Streudiagramms Grafiken - Streudiagramm... (mit eingezeichneten Regressionsgraden) 00 80 60 40 0 0 Präparat -0 Placebo Y -40 40 60 80 00 0 40 60 80 A X iv) Überprüfung der Parallelität im Rahmen von Allgemeines lineares Univariat... (Prüfung auf signifikante Wechselwirkung Faktor*Kovariable) Levene-Test auf Gleichheit der Fehlervarianzen a F df df Signifikanz,774 8,9 Prüft die Nullhypothese, daß die Fehlervarianz der abhängigen Variablen über Gruppen hinweg gleich ist. a. Design: Intercept+PRAEP+X+PRAEP * X Quelle Korrigiertes Konstanter Term PRAEP X PRAEP * X Fehler Korrigierte variation Quadratsumme vom Typ III Tests der Zwischensubjekteffekte df 55,497 b 448,499 6,458,000 49,75,000 008,8 008,8,05,004,05,88 4,789 4,789,800,84,800,4 9,586 9,586 44,406,000 44,406,000 09,6 09,6,406,5,406,09 495,45 6 68,466 4006,000 0 7550,950 9 a. Unter Verwendung von Alpha =,05 berechnet b. R-Quadrat =,755 (korrigiertes R-Quadrat =,709) Quadrate F Sign. NZP Beoh. Schärfe a Ergebnis: Wechselwirkung Faktor*Kovariable ns (vgl. auch Problem.) Problem.7: Abhängigkeitsanalysen - Zweifaktorielle Versuche Im Zusammenhang mit einer Untersuchung des Wasserhaushaltes einer Pflanze wurde unter verschiedenen Nährstoff- und Lichtbedingungen die mittlere Spaltöffnungsfläche (Zielvariable Y) auf bestimmten Blättern gemessen. Die Nährstoffgaben bestanden in einer als Kontrolle verwendeten "Volllösung" sowie zwei weiteren Lösungen mit einem Mangel bzw. Überschuss an Kalium (im Vergleich zur Kontrolle). Die unterschiedlichen Lichtbedingungen simulierten eine "Langtag-Situation" (6 Stunden Helligkeit und 8 Stunden Dunkelheit) und eine "Kurztag-Situation" (8 Stunden Helligkeit und 6 Stunden Dunkelheit). Das in der folgenden Tabelle zusammengestellte Datenmaterial stellt eine Kreuzklassifikation der "durchschnittlichen Spaltöffnungsfläche" nach den betrachteten Faktoren dar. Zu jeder Kombination einer Nährstoff- und Licht-Faktorstufe sind fünf Messwerte des Untersuchungsmerkmals angeschrieben, die von fünf verschiedenen, unter der jeweiligen Bedingung kultivierten Pflanzen stammen. Es soll untersucht werden, ob die Haupteffekte (Licht, Nährstoff) signifikant sind und ob es eine signifikante Faktorwechselwirkung gibt (Testniveau = 5%).

7 Faktor A (Nährstoff) Faktor B (Licht) /Kontrolle /K-Mangel /K-Übersch. (Langtag).8 57.7 9.9 5. 4. 0.8 7.4 6.8 6.7 7.7 9. 4.8 9.8.9 7. (Kurztag) 7.7 4.8 4.0 9.5 49.5.. 46.7 5.7 4. 0.8. 7.6 8.6 9.6 i) Datenorganisation nährstoff licht y.8... 9.8 7.7... 7.6 57.7 usw. ii) Test auf signifikante Haupt- und Wechselwirkungseffekte Analysieren - Allgemeines lineares Univariat... Deskriptive Statistiken A_NAEHR B_LICHT Mittelwert Standardabweichung N,8000 0,85 5,8600 8,57 5 7,00 0,684 0 5,9400 4,054 5 9,4800 9,759 5 7,700,406 0 7,9000 7,770 5 5,400 8,40 5 6,500 7,4 0 8,8800,5575 5,600 0,090 5 0,500 0,7897 0 Levene-Test auf Gleichheit der Fehlervarianzen a F df df Signifikanz,9 5 4,489 Prüft die Nullhypothese, daß die Fehlervarianz der abhängigen Variablen über Gruppen hinweg gleich ist. a. Design: Intercept+A_NAEHR+B_LICHT+A_NAEHR * B_LICHT

8 Quelle Korrigiertes Konstanter Term A_NAEHR B_LICHT A_NAEHR * B_LICHT Fehler Korrigierte variation Quadratsumm e vom Typ III Tests der Zwischensubjekteffekte df 04,04 b 5 06,86,0,098 0,600,594 7944, 7944, 86,8,000 86,8,000 778,7 89,6,990,0 7,98,658 80,688 80,688,87,7,87,4 74,894 87,447,896,4,79,86 4,84 4 97,576 0,40 0 76,8 9 a. Unter Verwendung von Alpha =,05 berechnet b. R-Quadrat =,06 (korrigiertes R-Quadrat =,6) Quadrate F Sign. NZP Beob. Schärfe a Mehrfachvergleiche Scheffé Dunnett-T (-seitig) a (I) A_NAEHR (J) A_NAEHR Mittlere Differenz 95% Konfidenzintervall (I-J) SE Sign. Untergr. Obergr. -0,800 4,48,08 -,9045,445,800 4,48,98-0,745,45 0,800 4,48,08 -,445,9045,900 4,48,058 -,45,745 -,800 4,48,98 -,45 0,745 -,900 4,48,058 -,745,45 0,800* 4,48,050,6E-0 0,7589 -,800 4,48,976 -,889 9,5689 Basiert auf beobachteten Mittelwerten. *. Die mittlere Differenz ist auf der Stufe,05 signifikant. a. In Dunnett-T-Tests wird eine Gruppe als Kontrollgruppe behandelt, mit der alle anderen Gruppen verglichen werden. 50 Profildiagramm 40 Geschätztes Randmittel 0 0 B_LICHT A_NAEHR Ergebnis: Nährstofffaktor sign.; Lichtfaktor, Faktorwechselwirkung ns.