25. Januar Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. 4. Multivariate Mittelwertvergleiche

Größe: px
Ab Seite anzeigen:

Download "25. Januar 2010. Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. 4. Multivariate Mittelwertvergleiche"

Transkript

1 Ruhr-Universität Bochum 25. Januar / 75

2 2 / 75

3 4.1 Beispiel: Vergleich von verschiedenen Unterrichtsmethoden Zwei Zufallsstichproben (A und B) mit je 10 Schülern und 8 Schülern Gruppe A wird nach Unterrichtsmethode A unterrichtet und Gruppe B nach Unterrichtsmethode B Für jeden Schüler werden zwei Variable gemessen Leistung (x1) Zufriedenheit (x2) Frage: besteht zwischen den beiden Unterrichtsmethoden ein Unterschied? 3 / 75

4 Daten zu Beispiel 4.1 Methode A x 1 x Methode B x 1 x Beachte: Im Prinzip könnte man beide Variablen getrennt untersuchen. (z.b. Hypothesen bzgl. der Variablen x 1 mit t-test für zwei unabhängige Stichproben). Die Anwendung von mutliplen Tests führt aber zu Schierigkeiten bei der Wahl des Niveaus (vgl. Methodenlehre II, 1.16). 4 / 75

5 4.2 Mathematisches Modell g Gruppen von Probanden in jeder Gruppe gibt es n j Probanden, für die Daten erhoben werden (j) x 1,..., x n (j) j (j = 1,..., g) jedes Datum (d.h. Messung an einem Probanden) hat p Variablen/Merkmale. x (j) m = (x (j) m1,..., x (j) mp) (m = 1,..., n j ) bezeichnet die Messwerte für Proband m in Gruppe j (man beachte, dass der obere Index j die Gruppe bezeichnet). alle Daten sind Realisierungen einer normalverteilten Zufallsvariable. die Daten entstammen aus unabhängigen Gruppen Ziel: Vergleich der Erwartungswertvektoren (d.h. den Vektoren aus den komponentenweise gebildeten Erwartungswerten). 5 / 75

6 4.3 Hypothesentest für den Erwartungswert (Vektor) der Population (g = 1) Frage: ist der Erwartungswertvektor µ der Grundgesamtheit gleich einem gegebenen Vektor µ 0 Idee: lehne die Nullhypothese H 0 : µ = µ 0 ab, falls der Vektor x (1) µ 0 groß ist. Dabei bezeichnet x (1) = 1 n 1 n 1 m=1 den Mittelwertvektor der beobachteten Daten. Beachte: Der Mittelwertvektor ist x (1) ist der Vektor gebildet aus den Mittelwerten für die einzelnen Variablen x m (1). x (1) m 6 / 75

7 4.4 Beispiel (Fortsetzung von 4.2) Ein Wissenschaftler behauptet, dass der Erwartungswertvektor der Population derjenigen Schüler, die nach Methode A unterrichtet werden, durch den Vektor µ 0 = ( 10 5 ) gegeben ist. In diesem Fall ist p = 2, n 1 = 10. Man berechnet den Mittelwertvektor x (1) = 1 n1 {( n 1 m=1 x(1) m = 1 11 ) ( ) ( ) } = ( ) und erhält x (1) µ 0 = ( ) Beachte: Wenn die Nullhypothese gilt, sollten die beiden Komponenten in diesem Vektor ungefähr gleich 0 sein, andernfalls sollte mindestens eine der Komponenten weit von 0 entfernt sein. 7 / 75

8 4.5 Hotellings T 2 -Test für eine Stichprobe Modellannahmen: die beobachteten Daten sind Realisationen von unabhängigen multivariat normalverteilten Zufallsvariablen. Testgröße wobei T 2 1 = n 1 (x (1) µ 0 ) D 1 1 (x (1) µ 0 ) D 1 = 1 n 1 1 n 1 (x (1) m=1 m x (1) )(x (1) ) T m x (1) eine Schätzung für die Kovarianzmatrix der Population ist. Diese Matrix dient hier der Standardisierung, da nicht davon ausgegangen werden kann, dass verschiedene Variablen dieselbe Größenordnug haben. Die Nullhypothese H 0 : µ = µ 0 wird verworfen, falls n 1 p (n 1 1)p T 2 1 > F p,n1 p,1 α ist. Dabei ist F p,n1 p,1 α das (1 α)-quantil der F -Verteilung mit (p, n 1 p) Freiheitsgraden. 8 / 75

9 Beispiel (Berechnung der Kovarianzmatrix) Beachte: In Beispiel 4.1 erhält man für Gruppe A als Kovarianzmatrix D 1 = 1 [ {( ) ( )} {( ) ( )} T { (9 ) ( ) } T {(9 ) ( )} ] = 1 [( ) ( ) ] (0.2, 0.6) + ( 1.8, 1.4) = 1 [ ( ) ( ) ] ( ) = / 75

10 Beachte: Berechnet man für das erste und das zweite Merkmal der Daten für Unterrichtsmethode A die Varianz, so ergibt sich s 2 x 1 = 1 9 {( )2 + (9 10.8) 2 + ( ) } = 3.29 s 2 x 2 = 1 9 {(5 4.4)2 + (3 4.4) 2 + (4 4.4) } = 1.82 D.h. in der Diagonalen der Kovarianzmatrix stehen die (empirischen) Varianzen der Merkmale. Berechnet man für das erste und zweite Merkmal die Kovarianz, so ergibt sich sx 2 1x 2 = 1 {( )(5 4.4) + (9 10.8)(3 4.4) +... } 9 = 0.36 D.h. in den Einträgen neben der Diagonalen stehen die (empirischen) Kovarianzen zwischen den Merkmalen. 10 / 75

11 Eine Bemerkung zur Kovarianzmatrix Beispiel: 500 simulierte Daten (zweidimensional) X1 X2 Beachte: Die Kovarianzmatrix D 1 wird zur Standardisierung verwendet. Ziel ist es, die Daten so zu transfomieren, dass Die einzelnen Komponenten dieselbe Größenordnung haben. Die beiden Komponenten unkorreliert sind. 11 / 75

12 Beispiel: Bei den 500 Daten, wurde jede Komponente getrennt z-standadisiert X1 X2 Beachte: Die einzelnen Komponenten haben dieselbe Größenordnung. Die beiden Komponenten sind aber nicht unkorreliert. 12 / 75

13 Beispiel: die 500 simulierten Daten werden wie folgt transformiert. Es gibt eine Matrix A mit A A = D 1. Transformiere die Daten durch z i = A 1 (x (1) i x (1) ) X1 X2 Beachte: Die einzelnen Komponenten haben dieselbe Größenordnung. Die beiden Komponenten sind unkorreliert. 13 / 75

14 Beispiel: Hotellings T 2 -Test für Beispiel 4.1 Für die Daten aus Gruppe A im Beispiel 4.1 ergibt sich für die Statistik T 1 der Wert ( ) 1 ( ) T = 10 (0.8, 0.6) ( ) ( ) = 10 (0.8, 0.6) ( ) 0.21 = 10 (0.8, 0.6) = Da F 2,8,0.95 = 4.46 und T 2 1 H 0 : µ = = 1.52, kann die Nullhypothese ( ) 10 5 zum Niveau 5% nicht verworfen werden (p-wert: 0.275) 14 / 75

15 Anschauliche Interpretation von Hotellings T 2 -Test für die Daten aus Beispiel 4.1 X Y X1 Links: Original Daten Rechts: Daten nach der Transformation z = A 1 (x µ 0 ) Beachte: Die Nullhypothese wird abgelehnt, falls der durchschnittliche Abstand der transformierten Daten zum Nullpunkt des Koordinatensystems zu groß ist. Y1 15 / 75

16 SPSS Output für die Daten aus Beispiel 4.1 Multivariate Tests b Effekt Konstanter Term a. Exakte Statistik Pillai-Spur Wilks-Lambda Hotelling-Spur Größte charakteristische Wurzel nach Roy Wert,276,724,380,380 F 1,522 a 1,522 a 1,522 a 1,522 a Hypothese df 2,000 2,000 2,000 2,000 Fehler df 8,000 8,000 8,000 8,000 Sig.,275,275,275,275 b. Design: Konstanter Term Beachte: Mit SPSS wurde die Nullhypothese H : µ = 0 mit den um den Vektor µ 0 = (10, 5) T verschobenen Daten überprüft. Der Wert von Hotellings T 2 berechnet sich indem man den Wert der Hotelling-Spur mit (n 1) multipliziert : T 2 1 = (10 1) = 3.42 SPSS liefert noch die Ergbnisse für drei weitere Tests für die Nullhypothese H : µ = 0 (Pillai-Spur, Wilk s-lambda, Roy s größter Eigenwert), die am Ende des Kapitels erklärt werden. 16 / 75

17 4.6 Wichtigste Anwendung des Einstichproben T 2 -Tests: Vergleich von zwei abhängigen Stichproben Beispiel: 5 Probanden machen ein Konzentrationstraining. Vor und nach dem Training wird ein Konzentrationstest gemacht, in dem 2 Variablen gemessen werden. Das ergibt die Daten: vorher x 1 x nachher x 1 x nachher - vorher x 1 x Frage: Bewirkt das Training einen Unterschied in der Konzentrationsfähigkeit? Idee: Falls kein Unterschied zwischen den Ergebnissen vor und nach dem Test besteht sollten die Differenzen (nachher-vorher) klein seien. 17 / 75

18 T 2 -Tests: für zwei abhängige Stichproben Idee: Man wendet Hotelling s Einstichproben T 2 -Test auf die komponentenweise gebildeten Differenzen der Daten an, um die Hypothese H 0 : µ = 0 zu testen. Im Beispiel ergibt sich (n = 5, p = 2): Mittelwertvektor der Differenzen: ( ) T1 2 = 5 F = = 1.87 Das 95%-Quantil der F -Verteilung mit (2, 3) Freiheitsgraden ist F 2,3,0.95 = Damit kann die Nullhypothese ( vor und nach dem Training besteht kein Unterschied ) nicht zum Niveau 5% verworfen werden. 18 / 75

19 Anschauliche Interpretation von Hotellings T 2 -Test für die Daten aus Beispiel 4.6 X Y X Y1 Links: Original Daten (Differenzen vorher - nachher) Rechts: Daten nach der Transformation z = A 1 (x µ 0 ) (in diesem Fall ist µ 0 = 0) Beachte: Die Nullhypothese wird abgelehnt, falls der durchschnittliche Abstand der transformierten Daten zum Nullpunkt des Koordinatensystems zu groß ist. 19 / 75

20 4.7 Vergleich von zwei unabhängigen Stichproben Frage: sind die Erwartungswertvektoren µ 1 und µ 2 der beiden Populationen (vgl. Beispiel 4.1) gleich H 0 : µ 1 = µ 2 Idee: die Nullhypothese wird abgelehnt falls der Vektor der Differenzen x (1) x (2) groß ist (d.h. sich mindestens eine der Komponenten deutlich von 0 unterscheidet). Dabei bezeichnet x (j) = 1 n j n j m=1 x (j) m j = 1, 2 den Mittelwert (Vektor) der Gruppe j (j = 1: Lernmethode A, j = 2 Lernmethode B) 20 / 75

21 4.8 Beispiel (Fortsetzung von 4.1) Ein Wissenschaftler behauptet, dass zwischen den Unterrichtsmethoden ein Unterschied bestht. mathematische Formulierung der Nullhypothese H 0 : µ 1 µ 2 = 0 H 0 : µ 1 = µ 2 µ j bezeichnet den Erwartungswert (Vektor) der Population j Als Schätzung für die Mittelwertdifferenz berechnet man zunächst den Mittelwertvektor der beiden Populationen (x (1) wurde bereits in Beispiel 4.4 berechnet) x (2) = 1 n 2 = n 2 m=1 ( Damit erhält man x (1) x (2) = x (j) m = 1 8 ) ( ) {( ) ( ) = 4.5 ( ) ( ) } ( ) / 75

22 4.9 Hotelling s T 2 -Test für den Vergleich von zwei Stichproben aus unabhängigen Populationen Modellannahmen: Zwei unabhängige Stichproben {x m (1) = (x (1) m1,..., x mp) (1) m = 1,..., n 1 } {x (2) m = (x (2) m1,..., x mp) (2) m = 1,..., n 2 } Die beobachteten Daten sind Realisationen von normalverteilten Zufallsvariablen. (x (1) 1,..., x(1) n 1 ) und (x (2) 1,..., x(2) n 2 ) sind Realisationen unabhängiger Zufallsvariablen (d.h. es liegen unabhängige Stichproben vor). Varianzhomogenität und Kovarianzhomogenität 22 / 75

23 4.9 Hotelling s T 2 -Test für den Vergleich von zwei Stichproben aus unabhängigen Populationen Testgröße T 2 2 = n 1n 2 (n 1 + n 2 2) n 1 + n 2 (x (1) x (2) ) T W 1 (x (1) x (2) ), wobei die Matrix W = n 2 j j=1 m=1 (x (j) m x (j) )(x (j) m x (j) ) T die (gewichteten) Summen der Varianzen und Kovarianzen innerhalb der beiden Gruppen enthält. Die Nullhypothese H 0 : µ 1 = µ 2 wird zum Niveau α verworfen, falls n 1 + n 2 p 1 (n 1 + n 2 2)p T 2 2 > F p,n1+n 2 p 1,1 α gilt. Dabei bezeichnet F p,n1+n 2 p 1,1 α das (1 α)-quantil der F -Verteilung mit (p, n 1 + n 2 p 1) Freiheitsgraden. 23 / 75

24 Bemerkung zu der Matrix W Kovarianzmatrix für Gruppe 1 D 1 = 1 n 1 1 n 1 (x (1) m=1 m x (1) )(x (1) ) T m x (1) Kovarianzmatrix für Gruppe 2 D 2 = 1 n 2 1 n 2 (x (1) m=1 m x (1) )(x (1) ) T m x (1) Die Matrix ergibt sich als gewichtete Summe von D 1 und D 2 : Im Beispiel 4.1 ist W = 9 W = (n 1 1) D 1 + (n 2 1) D 2 ( ) ( ) = ( ) / 75

25 Beispiel (Fortsetzung von 4.1) Für die Matrix W erhält man im Beispiel 4.1 ( ) ( ) W = W 1 = Das ergibt ( ) ( ) T = (0.925, 0.1) ( ) = (0.925, 0.1) = Wegen ( ) 2 T 2 3 = 0.54 und F 2,15,0.95 = 3.68 kann die Nullhypothese H 0 : µ 1 = µ 2 ( zwischen den Unterrichtsmethoden besteht kein Unterschied ) zum Niveau 5% nicht verworfen werden (p-wert: 0.593). 25 / 75

26 SPSS Output: Vergleich von zwei unabhängigen Stichproben Effekt Konstanter Term GRUPPE Pillai-Spur Wilks-Lambda Hotelling-Spur Größte charakteristische Wurzel nach Roy Pillai-Spur Wilks-Lambda Hotelling-Spur Größte charakteristische Wurzel nach Roy a. Exakte Statistik b. Design: Konstanter Term + GRUPPE Multivariate Tests b Wert,981,019 50,785 50,785,068,932,073,073 F 380,886 a 380,886 a 380,886 a 380,886 a,547 a,547 a,547 a,547 a Hypothese df 2,000 2,000 2,000 2,000 2,000 2,000 2,000 2,000 Fehler df 15,000 15,000 15,000 15,000 15,000 15,000 15,000 15,000 Sig.,000,000,000,000,590,590,590,590 Der Wert von Hotellings T 2 berechnet sich durch Multiplikation des Werts der Hotelling-Spur mit (n 1 + n 2 2): T 2 2 = ( ) = SPSS liefert noch die Ergbnisse für drei weitere Tests für die Nullhypothese H : µ 1 = µ 2 (Pillai-Spur, Wilk s-lambda, Roy s größter Eigenwert), die am Ende des Kapitels erklärt werden. 26 / 75

27 4.10 Einfaktorielle multivariate Varianzanalyse (MANOVA) Modellannahmen: g 2 unabhängige Stichproben. {x (1) m = (x (1) m1,..., x (1) mp) m = 1,..., n 1 }. {x (g) m = (x (g) m1,..., x (g) mp ) m = 1,..., n g } die beobachteten Daten sind Realisationen von normalverteilten Zufallsvariablen. (x (1) 1,..., x(1) n 1 ),..., (x (g) 1,..., x(g) n 2 ) sind Realisationen unabhängiger Zufallsvariablen (d.h. es liegen g unabhängige Stichproben vor). Varianzhomogenität und Kovarianzhomogenität. 27 / 75

28 4.10 MANOVA Es bezeichne µ j den Erwartungswert (-vektor) der j-ten Population (j = 1,..., g). Nullhypothese: H 0 : µ 1 = = µ g Die Nullhypothese wird zu Gunsten der Alternative für H 1 : µ i µ j für mindestens ein Paar i, j (i j) verworfen falls für Wilk s gilt: Λ = W (W + B) 1 Λ p,n g,n 1,α Dabei bezeichnet Λp,n g,n 1,α das (1 α)-quantil der Wilk s-λ-verteilung mit (p, n g, n 1) Freiheitsgraden n = g j=1 n j die Anzahl aller Beobachtungen Die Matrix B = g j=1 n j (x (j) x ( ) )(x (j) x ( ) ) T dient als Maß für die Unterschiede zwischen den Gruppen (Streuung zwischen den Gruppen). D.h. man vergleicht jeden Gruppenmittelwertvektor mit dem Mittelwertvektor von allen Daten. 28 / 75

29 Vergleich mit dem eindimensionalen Fall Im Fall p = 1 ergibt sich Λ 1 = W + B W = 1 + B W g j=1 = 1 + n j(x (j) x ( ) ) 2 g nj (j) j=1 m=1 (x m x (j) ) 2 H 0 wird verworfen, falls Λ kleine Werte annimmt, d.h. falls g B W = j=1 n j(x (j) x ( ) ) 2 g nj (j) j=1 m=1 (x m x (j) ) 2 große Werte annimmt. D.h. der Test von Wilk ist eine Verallgemeinerung des F -Test für multivariate Daten (vgl. Beispiel Methodenlehre II, 1.17) Für große Stichprobenumfänge kann man zeigen, dass der Test (n 1 g + p ) log Λ χ 2 p(g 1),1 α 2 näherungsweise das Niveau α hat. Dabei bezeichnet χ 2 p(g 1),1 α das Quantil der χ 2 -Verteilung mit p(g 1) Freiheitsgraden 29 / 75

30 SPSS und Wilk s Λ In SPSS wird statt der χ 2 -Approximation (Bartlett, 1947) eine F -Approximation verwendet (Rao, 1952). Man kann zeigen, dass F f1,f 2 = f 2 f 1 1 Λ1/s Λ 1/s näherunsweise F -verteilt ist mit (f 1, f 2 ) Freiheitsgraden, wobei f 1 = p(g 1), f 2 = m s 1 p(g 1) m = n 1 p + g 2 s = p 2 (g 1) 2 4 p 2 + (g 1) 2 5 Als Approximation für das α-quantil der Wilk s Λ-Verteilung erhält man ( 1 ) s Λ p,n g,n 1,α 1 + f1 f 2 F f1,f 2,α Ist n im Vergleich zu g und p klein, dann liefert die F -Approximation die genaueren Werte. 30 / 75

31 4.10 Abschließende Bemerkungen Wilk s Test setzt die Normalverteilungsannahme und Varianzund Kovarianzhomogenität voraus. Sind λ 1,..., λ g die Eigenwerte der Matrix W 1 B, dann gilt Λ = g 1 i=1 1+λ i = λ 1 1+λ 2 1+λ g Neben der Determinante werden noch andere Kriterien für die Konstruktion von Teststatistiken verwendet: Hotelling s Spurkriterium g H = Spur (B 1 1 W ) = Pillai s Spurkriterium P = Spur (W (W + B) 1 ) = λ i i=1 g i= λ i Roy s größter Eigenwert (der Matrix (W (W + B) 1 ): R = g max i= λ i 31 / 75

32 4.11 Beispiel: MANOVA Anhand von Aufsätzen wird bei 6 Unter-, 4 Mittel- und 5 Oberschichtenkindern ein Index für die Satzlänge (x1), ein Index für die Vielfalt der Wortwahl (x2) und ein Index für die Komplexität der Satzkonstruktionen (x3) erhoben. Stimmen die drei sozialen Schichten hinsichtlich dieser linguistischen Variablen überein? Daten (p = 3, n 1 = 6, n 2 = 4, n 3 = 5) Unterschicht Mittelschicht Oberschicht x 1 x 2 x 3 x 1 x 2 x 3 x 1 x 2 x / 75

33 Man berechnet die Gruppenmittelwerte x (1) = 1 ( 3 ) ( 4 ) ( = x (2) = ( ) ( 7, x (3) = ), ) den Gesamtmittelwert x ( ) = 1 ( ) ( ) ( = ) und erhält für die Streuung zwischen den Gruppen 33 / 75

34 ( 3 B = ( ( 0.53 = = ) ( ) ( ( ) ( ) ( ) ( 1.14 ( 0.53, 1.33, 4.4) ) ) ( ) ) ( T ) T ) (1.14, 1.0, 1.73) / 75

35 Für die Matrix W erhält man mit einer ähnlichen Rechnung wie in Beispiel W = und damit für Wilk s Λ (die Berechnung der Determinante wird hier nicht dargestellt) Λ = W (W + B) 1 = Es ist p = 3, n 1 = 6, n 2 = 4, n 3 = 5 und man erhält (Tabelle) = Λ Λ 3,12,14,0.95 = mit der F -Approximation (Rao) erzielt man die gleiche Testentscheidung (n = 15, s = 2, f 1 = 6, f 2 = 20) f 2 f 1 1 Λ1/s Λ 1/s = = F 6,20,0.95 Damit wird die Nullhypothese (die Erwartungswerte der Populationen sind gleich) zum Niveau 5% verworfen. 35 / 75

36 SPSS Output für Beispiel 4.11: Multivariate Tests c Effekt Konstanter Term Schicht Pillai-Spur Wilks-Lambda Hotelling-Spur Größte charakteristische Wurzel nach Roy Pillai-Spur Wilks-Lambda Hotelling-Spur Größte charakteristische Wurzel nach Roy Wert,990, , ,246,717,297 2,321 2,300 F 347,487 a 347,487 a 347,487 a 347,487 a 2,049 2,784 a 3,481 8,435 b Hypothese df 3,000 3,000 3,000 3,000 6,000 6,000 6,000 3,000 Fehler df 10,000 10,000 10,000 10,000 22,000 20,000 18,000 11,000 a. Exakte Statistik b. Die Statistik ist eine Obergrenze auf F, die eine Untergrenze auf dem Signifikanzniveau ergibt. c. Design: Konstanter Term + Schicht Sig.,000,000,000,000,102,039,018, / 75

37 37 / 75

38 5.1 Beispiel 20 Versuchspersonen werden gebeten einen Text abzuschreiben. Dabei werden der beim Schreiben gezeigte durchschnittliche Schreibdruck (x1) registriert die durchschnittliche Unterlänge der Buchstaben (x2) ermittelt Außerdem werden die Personen mit dem Rosenzweig PF (Picture Frustration) Test klassifiziert. Folgende Kategorien kommen hierbei in Betracht: extrapunitiv: Aggresivität ist gegen die Umwelt gerichtet intrapunitiv: Aggresivität ist gegen das eigene Ich gerichtet impunitiv: Aggresivität wird überhaupt umgangen 38 / 75

39 Daten zu Beispiel 5.1 extrapunitiv intropunitiv impunitiv x 1 x 2 x 1 x 2 x 1 x / 75

40 Streudiagramm zu Beispiel 5.1 Aggresivität Durchschnittliche Unterlänge der Buchstaben extrapunitiv: Aggresivität ist gegen die Umwelt gerichtet intropunitiv: Aggresivität ist gegen das eigene Ich gerichtet impunitiv: die Aggresivität wird überhaupt umgangen Schreibdruck 40 / 75

41 Mathematisches Modell der Diskriminanzanalyse g Gruppen von Probanden in jeder Gruppe n j Probanden, jeweils gemessen in p Variablen x (j) 1,..., x(j) n j (j = 1,..., g) x (j) m = (x (j) m1,..., x mp) (j) (m = 1,..., n j ) p ist die Anzahl der gemessenen Variablen Beachte: Das Modell entspricht der einfaktoriellen multivariaten Varianzanalyse (wobei hier keine Normalverteilungsannahme gemacht wird) Ziel: der Diskriminanzanalyse ist die Bildung optimaler Linearkombinationen y (j) ms = v 1s x (j) m1 + + v ps x (j) mp (s = 1, 2,... ), um die gegebenen Probandengruppen möglichst gut separieren zu können 41 / 75

42 Beispiele für Linearkombination für die Daten in 5.1 (g = 3, p = 2) Mittelwert aus beiden Merkmalen: v 1 = (v 11, v 21 ) = ( 1 2, 1 2 ) y (1) 11 = (1) 3 = 8, y 21 2 = = 10, y (3) 11 = = 9.5 Kontrast (Differenz aus den Merkmalen) (v 21, v 22 ) = ( 1 2, 1 2 ) y (1) 12 = (1) 3 = 5, y 22 2 = = 5, y (3) 12 = = / 75

43 Daten für die beiden Linearkombinationen ext int imp y 1 y 2 y 1 y 2 y 1 y Frage: was sind optimale Linearkombinationen? 43 / 75

44 5.2 Das Grundprinzip der Diskriminanzanalyse Schritt 1: Wir bestimmen zunächst eine Linearkombination y (j) m1 = v 11 x (j) m1 + + v p1 x (j) mp Beachte: die neuen Daten hängen von den Gewichten v 11,..., v p1 ab Das ergibt g Gruppen mit je n j (eindimensionalen) Daten Gruppe 1 : y (1) 11,..., y (1) n 11. Gruppe g : y (g) 11..., y (g) n g 1 Man versucht jetzt, die Gewichte v 11,..., v p1 so zu wählen, dass man die Gruppen möglichst gut unterscheiden kann 44 / 75

45 Eine (naheliegende) Möglichkeit: wähle v 11,..., v p1 so, dass sich (a) die Gruppenmittelwerte y (j) 1 = 1 nj n j m=1 y (j) m1 möglichst stark streuen. (b) die transformierten Daten innerhalb einer Gruppe möglichst wenig streuen. Betrachtet man als Maß für die Streuung die Varianz, dann führt (a) auf die Maximierung von g F (v 11,..., v p1 ) = n j (y (j) 1 y 1) 2. Dabei ist y ( ) 1 = 1 g nj n j=1 m=1 y (j) m1 der Mittelwert der transformierten Daten der Gesamtstichprobe und n = n n g die Anzahl aller Probanden. (b) führt auf die Minimierung von n g j G(v 11,..., v p1 ) = (y (j) m1 y (j) 1 )2 j=1 j=1 m=1 Eine simultane Maxi- und Minimierung der Größen F und G ist nicht möglich! 45 / 75

46 Man maximiert daher den Ausdruck H (1) (v 11,..., v p1 ) = F (v 11,..., v p1 ) G(v 11,..., v p1 ) = g j=1 n j (y (j) 1 y 1) 2 g nj (j) j=1 m=1 (y m1 y (j) 1 )2 Den Maximalwert bezeichnen wir mit λ 1. Man spricht auch von dem größten Eigenwert Man beachte: die Größe H (1) (v 11,..., v p1 ) ist (bis auf einen Faktor der Freiheitsgrade) die Statistik des F -Tests in der einfaktoriellen Varianzanalyse (vgl. Methodenlehre II, 1.17) D.h. die Gewichte v 11,..., v p1 für die erste Linearkombination werden so bestimmt, dass die Statistik des F -Tests für den Vergleich der Gruppenmittelwerte der transformierten Daten maximal wird 46 / 75

47 Beispiele für die erste Linearkombination für die Daten in 5.1 (g = 3, p = 2) (v 11, v 21 ) (0.8348, ) y (1) 11 y (1) 21 y (3) 31 = = , = = , = = / 75

48 Transformierte Daten für die erste optimale Linearkombination y (1) m1 y (2) m1 y (3) m1 ext int imp / 75

49 Schritt 2 (und Folgende): Man bestimmt nun eine weitere Linearkombinationen y (j) m2 = v 12 x (j) m1 + + v p2 x (j) mp so dass: (1) die Größe H (2) (v 12,..., v p2 ) = F (v 12,..., v p2 ) G(v 12,..., v p2 ) = g j=1 n j (y (j) 2 y 2) 2 g nj (j) j=1 m=1 (y m2 y (j) 2 )2 maximal wird und (2) die transformierten Daten {y (j) m1 m = 1,..., n j; j = 1,..., g} und {y (j) m2 m = 1,..., n j; j = 1,..., g} unkorreliert sind Den Maximalwert aus Schritt 2 bezeichnen wir mit λ 2 (zweitgrößter Eigenwert). Die aus den weiteren Schritten erhaltenen Größen werden mit λ 3 λ 4... bezeichnet. 49 / 75

50 Beispiele für die beiden Linearkombination für die Daten in 5.1 (g = 3, p = 2) (v 11, v 21 ) (0.8348, ) y (1) 11 y (1) 21 y (3) 31 = = , = = , = = (v 11, v 21 ) (0.4969, ) y (1) 12 y (1) 21 y (3) 31 = = , = = , = = / 75

51 Transformierte Daten für die ersten beiden optimalen Linearkombinationen ext int imp y 1 y 2 y 1 y 2 y 1 y Frage: Wie findet man die Transformationen? 51 / 75

52 Deskriptive Statistiken vor und nach der Transformation Aggresivität extrapunitiv: Aggresivität ist gegen die Umwelt gerichtet intropunitiv: Aggresivität ist gegen das eigene Ich gerichtet impunitiv: die Aggresivität wird überhaupt umgangen Gesamt Schreibdruck Mean 14,43 16,80 12,75 13,96 Sd 1,13,84 1,28 2,12 Durchschnittliche Unterlänge der Buchstaben Mean 4,14 6,60 7,13 5,69 Sd,69 1,95 1,25 1,83 Aggresivität extrapunitiv: Aggresivität ist gegen die Umwelt gerichtet intropunitiv: Aggresivität ist gegen das eigene Ich gerichtet impunitiv: die Aggresivität wird überhaupt umgangen Gesamt Y1 Mean 9,76 10,39 6,72 8,70 Sd,80 1,13,89 1,89 Y2 Mean 10,76 14,08 12,52 12,29 Sd 1,02 1,84 1,53 1,90 52 / 75

53 Streudiagramm zu Beispiel 5.1 mit Eigenvektoren Durchschnittliche Unterlänge der Buchstaben 9,00 8,00 7,00 6,00 5,00 4,00 Aggresivität extrapunitiv: Aggresivität ist gegen die Umwelt gerichtet intropunitiv: Aggresivität ist gegen das eigene Ich gerichtet impunitiv: die Aggresivität wird überhaupt umgangen Gruppenmittelwert 3,00 10,00 12,00 14,00 16,00 18,00 Schreibdruck 53 / 75

54 Altes und neues Koordiantensystem Durchschnittliche Unterlänge der Buchstaben Aggresivität extrapunitiv: Aggresivität ist gegen die Umwelt gerichtet intropunitiv: Aggresivität ist gegen das eigene Ich gerichtet impunitiv: die Aggresivität wird überhaupt umgangen Schreibdruck 12,00 Aggresivität extrapunitiv: Aggresivität ist gegen die Umwelt gerichtet intropunitiv: Aggresivität ist gegen das eigene Ich gerichtet impunitiv: die Aggresivität wird überhaupt umgangen 10,00 Y1 8,00 6,00 4,00 10,00 12,00 14,00 16,00 Y2 54 / 75

55 5.3 Bemerkungen (1) Ist x (j) m der Vektor der p-variablen des m-ten Probanden in Stichprobe j (= 1,..., g), dann ist x (j) = 1 n j n j m=1 x (j) m der Mittelwertvektor in Gruppe j und x = 1 N g j=1 n j x (j) = 1 n n g j j=1 m=1 x (j) m der Mittelwertvektor aller Beobachtungen. Die Matrix p p B = g j=1 n j (x (j) x)(x (j) x) T ist ein multivariates Maß für die Streuung zwischen den Gruppen (vgl. 4.10) 55 / 75

56 (2) die Matrix W = n g j j=1 m=1 (x (j) m x (j) )(x (j) m x (j) ) T ist ein multivariates Maß für die Streuung innerhalb der Gruppen (vgl. 4.8). (2) Man kann zeigen, dass die Vektoren v s = (v 1s,..., v ps ) (sukzessive unter der Nebenbedingung der Unkorreliertheit) die Größen H (s) (v s ) = vt s B v s vs T W v s maximieren. (3) Man kann zeigen, dass die Vektoren v 1, v 2,... die Eigenvektoren der Matrix W 1 B sind und die zugehörigen Maximalwerte λ 1, λ 2,... sind die Eigenwerte dieser Matrix, d.h. es gilt (W 1 B)v j = λ j v j j = 1, 2, / 75

57 Zahlenbeispiel für die Berechnung der Eigenvektoren SPSS liefert Schätzungen für Mittelwerte und Kovarianzmatrizen (innerhalb der Gruppen und in der gesamten Stichprobe); daraus berechnen sich: ( ) B = und Damit ergibt sich: W = W 1 B = ( ) ( ) mit λ 1 = 3.693, v 1 = ( ) und λ 2 = 0.902, v 2 = als Eigenwerten und zugehörigen Eigenvektoren ( ) / 75

58 Zahlenbeispiel: SPSS-Ausgaben Gemeinsam Matrizen innerhalb der Gruppen a Kovarianz Korrelation Schreibdruck Durchschnittliche Unterlänge der Buchstaben Schreibdruck Durchschnittliche Unterlänge der Buchstaben Schreibdruck 1,295 a. Die Kovarianzmatrix hat einen Freiheitsgrad von 17. W = (20 3) ( ) = ,613 1,000,413 Durchschnittliche Unterlänge der Buchstaben,613 1,702,413 1,000 ( ) / 75

59 Zahlenbeispiel: SPSS-Ausgaben Aggresivität extrapunitiv: Aggresivität ist gegen die Umwelt gerichtet intropunitiv: Aggresivität ist gegen das eigene Ich gerichtet impunitiv: die Aggresivität wird überhaupt umgangen Gesamt Kovarianz-Matrizen a Schreibdruck Durchschnittliche Unterlänge der Buchstaben Schreibdruck Durchschnittliche Unterlänge der Buchstaben Schreibdruck Durchschnittliche Unterlänge der Buchstaben Schreibdruck Durchschnittliche Unterlänge der Buchstaben Schreibdruck 1,286 a. Die Kovarianzmatrix für alle Fälle hat einen Freiheitsgrad von 19.,429,700,400 1,643,893 3,818,124 Durchschnittliche Unterlänge der Buchstaben,429,476,400 3,800,893 1,554,124 3,418 ( ) ( ) W = (7 1) + (5 1) ( ) ( ) (8 1) = / 75

60 Zahlenbeispiel: SPSS-Ausgaben Eigenwerte Funktion Eigenwert % der Varianz Kumulierte % Kanonische Korrelation 1 3,685 a 80,3 80,3,887 2,901 a 19,7 100,0,689 a. Die ersten 2 kanonischen Diskriminanzfunktionen werden in dieser Analyse verwendet. 60 / 75

61 5.4 Bemerkungen Die Vektoren v s = (v 1s,..., v ps ) in den Linearkombinationen heißen Diskriminanzfaktoren (man beachte die Analogie zur Faktorenanalyse). Allerdings sind die Diskriminanzfaktoren nicht notwendig orthogonal. Bei g Gruppen und p Variablen gibt es r = min {p, g 1} Faktoren. Wir erhalten also insgesamt r Maximalwerte λ 1 λ 2 λ r, die Eigenwerte genannt werden. Die Größe ρ s = λ s λ 1 + λ λ r ; s = 1,..., r bezeichnet den Diskriminanzanteil des Diskriminanzfaktors s 61 / 75

62 5.5 Bemerkungen Die Größe ω s = λ 1 + λ λ s λ 1 + λ λ r ; s = 1,..., r bezeichnet das Diskriminanzpotenzial der Diskriminanzfaktoren 1,..., s. In vielen verwendet man nicht alle Diskriminanzfaktoren sondern nur diejenigen, für die das Diskriminanzpotenzial groß ist. Damit erhält man wie bei der Faktorenanalyse eine Dimensionsreduktion. Durch die Diskriminanzanalyse werden r neue Koordinatenachsen bestimmt mit dem Ziel der sukzessiven maximalen Separierbarkeit der verglichenen Stichproben. Die neuen Achsen sind nicht notwendig orthogonal. 62 / 75

63 Beachte: Wichtige Kennwerte der Diskriminanzanalyse - Die z-standardisierten Positionen der Probanden auf den Koordinatenachsen heißen wie bei der Faktorenanalyse Faktorwerte. - Die Korrelation zwischen den ursprünglichen Messwerten und den Faktorwerten heißen Faktorladungen und werden wie bei der Faktorenanalyse für die Interpretation der Diskriminanzfaktoren verwendet. Eine sehr hohe positive oder sehr niedrige negative Faktorladung besagt, dass die entsprechende Variable besonders charakteristisch für den Diskriminanzfaktor ist. - Außerdem untersucht man die Mittelwerte der verglichenen Gruppen auf dem Diskriminanzfaktor. Dadurch kann man feststellen, wie gut die Gruppen durch den Diskriminanzfaktor getrennt werden. Oft werden die Diskriminanzfaktoren noch mit dem Varimax-Kriterium (vgl. 3.7) rotiert, um eine bessere Interpretation der Diskriminanzfaktoren zu erhalten 63 / 75

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Klausur, Multivariate Verfahren, SS 2006, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 08.08.2006 Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Gesamtpunkte: 39 Aufgabe

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert

Mehr

7. Mai 2010. Ruhr-Universität Bochum. Methodenlehre II, SS 2009. Prof. Dr. Holger Dette

7. Mai 2010. Ruhr-Universität Bochum. Methodenlehre II, SS 2009. Prof. Dr. Holger Dette Ruhr-Universität Bochum 7. Mai 2010 1 / 95 Methodenlehre II NA 3/73 Telefon: 0234 322 8284 Email: holger.dette@rub.de Internet: www.ruhr-uni-bochum.de/mathematik3/index.html Vorlesung: Montag, 8.30-10.00

Mehr

17. Januar Ruhr-Universität Bochum. Methodenlehre III, WS 2010/2011. Prof. Dr. Holger Dette. 1. Matrizenrechnung. 2.

17. Januar Ruhr-Universität Bochum. Methodenlehre III, WS 2010/2011. Prof. Dr. Holger Dette. 1. Matrizenrechnung. 2. Ruhr-Universität Bochum 17. Januar 2011 1 / 232 Methodenlehre III NA 3/73 Telefon: 0234 322 8284 Email: holger.dette@rub.de Internet: www.ruhr-uni-bochum.de/mathematik3/index.html Vorlesung: Montag, 8.30

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für eine zweifaktorielle Varianzanalyse mit Messwiederholung auf einem Faktor (univariate Lösung) Daten: POKIII_AG4_V06.SAV Hypothese: Die physische Attraktivität der Bildperson und das Geschlecht

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

Einfache statistische Testverfahren

Einfache statistische Testverfahren Einfache statistische Testverfahren Johannes Hain Lehrstuhl für Mathematik VIII (Statistik) 1/29 Hypothesentesten: Allgemeine Situation Im Folgenden wird die statistische Vorgehensweise zur Durchführung

Mehr

FAKTORIELLE VERSUCHSPLÄNE. Andreas Handl

FAKTORIELLE VERSUCHSPLÄNE. Andreas Handl FAKTORIELLE VERSUCHSPLÄNE Andreas Handl 1 Inhaltsverzeichnis 1 Versuchsplanung 4 2 Einfaktorielle Varianzanalyse 6 2.1 DieAnnahmen... 6 2.2 Die ANOVA-Tabelle und der F -Test... 6 2.3 Versuche mit zwei

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

Einfache Varianzanalyse für abhängige

Einfache Varianzanalyse für abhängige Einfache Varianzanalyse für abhängige Stichproben Wie beim t-test gibt es auch bei der VA eine Alternative für abhängige Stichproben. Anmerkung: Was man unter abhängigen Stichproben versteht und wie diese

Mehr

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.) ue biostatistik: nichtparametrische testverfahren / ergänzung 1/6 h. Lettner / physik Statistische Testverfahren Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003 Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003. Eine seltene Krankheit trete mit Wahrscheinlichkeit : 0000 auf. Die bedingte Wahrscheinlichkeit, dass ein bei einem Erkrankten durchgeführter

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

Statistik II für Betriebswirte Vorlesung 2

Statistik II für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 2 21. Oktober 2014 Verbundene Stichproben Liegen zwei Stichproben vor, deren Werte einander

Mehr

30. März Ruhr-Universität Bochum. Methodenlehre II, SS Prof. Dr. Holger Dette

30. März Ruhr-Universität Bochum. Methodenlehre II, SS Prof. Dr. Holger Dette Ruhr-Universität Bochum 30. März 2011 1 / 46 Methodenlehre II NA 3/73 Telefon: 0234 322 8284 Email: holger.dette@rub.de Internet: www.ruhr-uni-bochum.de/mathematik3/index.html Vorlesung: Montag, 8.30 10.00

Mehr

SozialwissenschaftlerInnen II

SozialwissenschaftlerInnen II Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Varianzanalyse Statistik

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Analytische Statistik I Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Testen Anpassungstests (goodness of fit) Weicht eine gegebene Verteilung signifikant von einer bekannten

Mehr

8. Methoden der klassischen multivariaten Statistik

8. Methoden der klassischen multivariaten Statistik 8. Methoden der klassischen multivariaten Statistik 8.1. Darstellung von Daten Voraussetzungen auch in diesem Kapitel: Grundgesamtheit (Datenraum) Ω von Objekten (Fällen, Instanzen), denen J-Tupel von

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Im Modell der Varianzanalyse (mit festen Effekten) ist das. aus dem Durchschnittsmesswert für y plus dem Effekt des.

Im Modell der Varianzanalyse (mit festen Effekten) ist das. aus dem Durchschnittsmesswert für y plus dem Effekt des. Einfatorielle Varianzanalyse Varianzanalyse untersucht den Einfluss verschiedener Bedingungen ( = nominalsalierte(r) Variable(r)) auf eine metrische Variable. Die Bedingungen heißen auch atoren und ihre

Mehr

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 Empirische Softwaretechnik Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 1 Experiment zur Vererbungstiefe Softwaretechnik: die Vererbungstiefe ist kein guter Schätzer für den Wartungsaufwand

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

3.3 Das allgemeine lineare Modell (ALM), Methode der kleinsten Quadrate

3.3 Das allgemeine lineare Modell (ALM), Methode der kleinsten Quadrate 31 und 31 und (), Methode der 33 Das allgemeine (), Methode der kleinsten Quadrate 37 Modelle mit Messwiederholungen 1 / 113 Eine grundsätzliche Bemerkung zu Beginn Es bestehen viele Ähnlichkeiten zwischen

Mehr

Anhang A: Fragebögen und sonstige Unterlagen

Anhang A: Fragebögen und sonstige Unterlagen Anhang Anhang A: Fragebögen und sonstige Unterlagen A.: Flyer zur Probandenrekrutierung 46 A.: Fragebogen zur Meditationserfahrung 47 48 A.3: Fragebogen Angaben zur Person 49 5 5 A.4: Termin- und Einladungsschreiben

Mehr

Kapitel 9: Verfahren für Nominaldaten

Kapitel 9: Verfahren für Nominaldaten Kapitel 9: Verfahren für Nominaldaten Eindimensionaler Chi²-Test Der eindimensionale χ²-test wird dann herangezogen, wenn die Versuchspersonen einer Population anhand eines Merkmals mit zwei oder mehr

Mehr

Grundlagen der Inferenzstatistik

Grundlagen der Inferenzstatistik Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) und der Wilcoxon-Test Dirk Metzler 22. Mai 2015 Inhaltsverzeichnis 1 Wiederholung:

Mehr

Evaluation & Forschungsmethoden (Multivariate Analyse) Hauptdiplom-Prüfungsklausur am 03.08.2007 (1.Termin)

Evaluation & Forschungsmethoden (Multivariate Analyse) Hauptdiplom-Prüfungsklausur am 03.08.2007 (1.Termin) Evaluation & Forschungsmethoden (Multivariate Analyse Hauptdiplom-Prüfungsklausur am 03.08.007 (1.Termin Name: Matrikel-Nr.: Aufgabe 1: (3 Punkte Es seien zwei Vektoren a und b (mit mehr als Koordinaten

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Statistik für Studenten der Sportwissenschaften SS 2008

Statistik für Studenten der Sportwissenschaften SS 2008 Statistik für Studenten der Sportwissenschaften SS 008 Aufgabe 1 Man weiß von Rehabilitanden, die sich einer bestimmten Gymnastik unterziehen, dass sie im Mittel µ=54 Jahre (σ=3 Jahre) alt sind. a) Welcher

Mehr

Varianzanalytische Methoden Zweifaktorielle Versuchspläne 4/13. Durchführung in SPSS (File Trait Angst.sav)

Varianzanalytische Methoden Zweifaktorielle Versuchspläne 4/13. Durchführung in SPSS (File Trait Angst.sav) Zweifaktorielle Versuchspläne 4/13 Durchführung in SPSS (File Trait Angst.sav) Analysieren > Allgemeines Lineares Modell > Univariat Zweifaktorielle Versuchspläne 5/13 Haupteffekte Geschlecht und Gruppe

Mehr

Aufgaben zu Kapitel 5:

Aufgaben zu Kapitel 5: Aufgaben zu Kapitel 5: Aufgabe 1: Ein Wissenschaftler untersucht, in wie weit die Reaktionszeit auf bestimmte Stimuli durch finanzielle Belohnung zu steigern ist. Er möchte vier Bedingungen vergleichen:

Mehr

Hypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav

Hypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav Hypothese: Die Beschäftigung mit Kunst ist vom Bildungsgrad abhängig. 1. Annahmen Messniveau: Modell: Die Skala zur Erfassung der

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

3. Der t-test. Der t-test

3. Der t-test. Der t-test Der t-test 3 3. Der t-test Dieses Kapitel beschäftigt sich mit einem grundlegenden statistischen Verfahren zur Auswertung erhobener Daten: dem t-test. Der t-test untersucht, ob sich zwei empirisch gefundene

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen Noémie Becker & Dirk Metzler 31. Mai 2016 Inhaltsverzeichnis 1 Binomialverteilung 1 2 Normalverteilung 2 3 T-Verteilung

Mehr

Eine zweidimensionale Stichprobe

Eine zweidimensionale Stichprobe Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen Noémie Becker & Dirk Metzler http://evol.bio.lmu.de/_statgen 7. Juni 2013 1 Binomialverteilung 2 Normalverteilung 3 T-Verteilung

Mehr

Beispiel für eine multivariate Varianzanalyse (MANOVA) Daten: POKIV_Terror_V12.sav

Beispiel für eine multivariate Varianzanalyse (MANOVA) Daten: POKIV_Terror_V12.sav Beispiel für eine multivariate Varianzanalyse () Daten: POKIV_Terror_V12.sav Es soll überprüft werden, inwieweit das ATB-Syndrom (Angst vor mit den drei Subskalen affektive Angst von, Terrorpersistenz,

Mehr

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Melanie Kaspar, Prof. Dr. B. Grabowski 1 7. Hypothesentests Ausgangssituation: Man muss sich zwischen 2 Möglichkeiten (=Hypothesen) entscheiden. Diese Entscheidung soll mit Hilfe von Beobachtungen ( Stichprobe ) getroffen werden. Die Hypothesen

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Teilklausur des Moduls Kurs 42221: Vertiefung der Statistik

Teilklausur des Moduls Kurs 42221: Vertiefung der Statistik Name, Vorname Matrikelnummer Teilklausur des Moduls 32741 Kurs 42221: Vertiefung der Statistik Datum Termin: 21. März 2014, 14.00-16.00 Uhr Prüfer: Univ.-Prof. Dr. H. Singer Vertiefung der Statistik 21.3.2014

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 2 Multivariate Verfahren Musterlösung Aufgabe 1 (28 Punkte) Der Marketing-Leiter einer Lebensmittelherstellers möchte herausfinden, mit welchem Richtpreis eine neue Joghurt-Marke auf

Mehr

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen Universität Karlsruhe (TH) Forschungsuniversität gegründet 825 Wilcoxon-Rangsummentest oder Mann-Whitney U-Test Motivation In Experimenten ist die Datenmenge oft klein Daten sind nicht normalverteilt Dann

Mehr

Fragestellungen der Schließenden Statistik

Fragestellungen der Schließenden Statistik Fragestellungen der Schließenden Statistik Bisher: Teil I: Beschreibende Statistik Zusammenfassung von an GesamtheitM N {e,,e N } erhobenem Datensatz x,,x N durch Häufigkeitsverteilung und Kennzahlen für

Mehr

Prüfen von Mittelwertsunterschieden: t-test

Prüfen von Mittelwertsunterschieden: t-test Prüfen von Mittelwertsunterschieden: t-test Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) t-test

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

Grundlagen von Versuchsmethodik und Datenanalyse

Grundlagen von Versuchsmethodik und Datenanalyse Grundlagen von Versuchsmethodik und Datenanalyse Der Anfang: Hypothesen über Ursache-Wirkungs-Zusammenhänge Ursache Wirkung Koffein verbessert Kurzzeitgedächtnis Gewaltfilme führen zu aggressivem Verhalten

Mehr

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr Die so genannte Gütefunktion g gibt allgemein die Wahrscheinlichkeit an, mit der ein Test die Nullhypothese verwirft. Für unser hier entworfenes Testverfahren gilt ( ) k np g(n, p) = Pr p [T K] = Pr p

Mehr

Hypothesentests mit SPSS. Beispiel für einen t-test

Hypothesentests mit SPSS. Beispiel für einen t-test Beispiel für einen t-test Daten: museum-f-v04.sav Hypothese: Als Gründe, in ein Museum zu gehen, geben mehr Frauen als Männer die Erweiterung der Bildung für Kinder an. Dies hängt mit der Geschlechtsrolle

Mehr

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Univariate Varianz- und Kovarianzanlyse, Multivariate Varianzanalyse und Varianzanalyse mit Messwiederholung finden sich unter

Mehr

Statistische Auswertung der Daten von Blatt 13

Statistische Auswertung der Daten von Blatt 13 Statistische Auswertung der Daten von Blatt 13 Problemstellung 1 Graphische Darstellung der Daten 1 Diskussion der Normalverteilung 3 Mittelwerte und deren Konfidenzbereiche 3 Signifikanz der Behandlung

Mehr

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung

Mehr

Multivariate Statistik mit Mathematica und SPSS

Multivariate Statistik mit Mathematica und SPSS Multivariate Statistik mit Mathematica und SPSS von Dipl.-Math. Marco Schuchmann Dipl.-Math. Werner Sanns Seite 2 Varianzanalyse Die Informationen in diesem Buch entstammen langjähriger Erfahrung in Praxis

Mehr

SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben

SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben ÜBERSICHT: Testverfahren bei abhängigen (verbundenen) Stichproben parametrisch nicht-parametrisch 2 Gruppen t-test bei verbundenen

Mehr

Multivariate Analysemethoden

Multivariate Analysemethoden Multivariate Analysemethoden 30.04.2014 Günter Meinhardt Johannes Gutenberg Universität Mainz Einführung Was sind multivariate Analysemethoden? Vorlesung Übung/Tut Prüfung Verfahrensdarstellung in Überblick

Mehr

Überblick über die Tests

Überblick über die Tests Anhang A Überblick über die Tests A.1 Ein-Stichproben-Tests A.1.1 Tests auf Verteilungsannahmen ˆ Shapiro-Wilk-Test Situation: Test auf Normalverteilung H 0 : X N(µ, σ 2 ) H 1 : X nicht normalverteilt

Mehr

Teil I Beschreibende Statistik 29

Teil I Beschreibende Statistik 29 Vorwort zur 2. Auflage 15 Vorwort 15 Kapitel 0 Einführung 19 0.1 Methoden und Aufgaben der Statistik............................. 20 0.2 Ablauf statistischer Untersuchungen..............................

Mehr

Teil II: Einführung in die Statistik

Teil II: Einführung in die Statistik Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu

Mehr

1.6 Der Vorzeichentest

1.6 Der Vorzeichentest .6 Der Vorzeichentest In diesem Kapitel soll der Vorzeichentest bzw. Zeichentest vorgestellt werden, mit dem man Hypothesen bezüglich des Medians der unabhängig und identisch stetig verteilten Zufallsvariablen

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

Varianzanalyse (ANOVA: analysis of variance)

Varianzanalyse (ANOVA: analysis of variance) Varianzanalyse (AOVA: analysis of variance) Einfaktorielle VA Auf der Basis von zwei Stichproben wird bezüglich der Gleichheit der Mittelwerte getestet. Variablen müssen Variablen nur nominalskaliert sein.

Mehr

3 Grundlagen statistischer Tests (Kap. 8 IS)

3 Grundlagen statistischer Tests (Kap. 8 IS) 3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung

Mehr

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen Univariate/ multivariate Ansätze Klaus D. Kubinger Effektgrößen Rasch, D. & Kubinger, K.D. (2006). Statistik für das Psychologiestudium Mit Softwareunter-stützung zur Planung und Auswertung von Untersuchungen

Mehr

Statistische Tests (Signifikanztests)

Statistische Tests (Signifikanztests) Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)

Mehr

9 Faktorenanalyse. Wir gehen zunächst von dem folgenden Modell aus (Modell der Hauptkomponentenanalyse): Z = F L T

9 Faktorenanalyse. Wir gehen zunächst von dem folgenden Modell aus (Modell der Hauptkomponentenanalyse): Z = F L T 9 Faktorenanalyse Ziel der Faktorenanalyse ist es, die Anzahl der Variablen auf wenige voneinander unabhängige Faktoren zu reduzieren und dabei möglichst viel an Information zu erhalten. Hier wird davon

Mehr

Tests einzelner linearer Hypothesen I

Tests einzelner linearer Hypothesen I 4 Multiple lineare Regression Tests einzelner linearer Hypothesen 4.5 Tests einzelner linearer Hypothesen I Neben Tests für einzelne Regressionsparameter sind auch Tests (und Konfidenzintervalle) für Linearkombinationen

Mehr

6.1 Definition der multivariaten Normalverteilung

6.1 Definition der multivariaten Normalverteilung Kapitel 6 Die multivariate Normalverteilung Wir hatten die multivariate Normalverteilung bereits in Abschnitt 2.3 kurz eingeführt. Wir werden sie jetzt etwas gründlicher behandeln, da die Schätzung ihrer

Mehr

? Unterscheiden sich Burschen und Mädchen im Ausmaß der Mithilfe im Haushalt?

? Unterscheiden sich Burschen und Mädchen im Ausmaß der Mithilfe im Haushalt? 341 i Metrische und kategoriale Merkmale An einer Beobachtungseinheit werden metrische und kategoriale Variable erhoben. Beispiel: Hausarbeit von Teenagern (Stunden/Woche) 25 15 STUNDEN 5-5 weiblich männlich?

Mehr

1 Gemischte Lineare Modelle

1 Gemischte Lineare Modelle 1 Gemischte Lineare Modelle Wir betrachten zunächst einige allgemeine Aussagen für Gemischte Lineare Modelle, ohne zu tief in die mathematisch-statistische Theorie vorzustoßen. Danach betrachten wir zunächst

Mehr

Kapitel 9: Verfahren für Nominaldaten

Kapitel 9: Verfahren für Nominaldaten Kapitel 9: Verfahren für Nominaldaten Eindimensionaler Chi²-Test 1 Der zweidimensionale Chi²-Test 4 Eindimensionaler Chi²-Test Der eindimensionale χ²-test wird dann herangezogen, wenn die Versuchspersonen

Mehr

Studiendesign/ Evaluierungsdesign

Studiendesign/ Evaluierungsdesign Jennifer Ziegert Studiendesign/ Evaluierungsdesign Praxisprojekt: Nutzerorientierte Evaluierung von Visualisierungen in Daffodil mittels Eyetracker Warum Studien /Evaluierungsdesign Das Design einer Untersuchung

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

Auswertung und Lösung

Auswertung und Lösung Dieses Quiz soll Ihnen helfen, Kapitel 4.7 und 4.8 besser zu verstehen. Auswertung und Lösung Abgaben: 71 / 265 Maximal erreichte Punktzahl: 8 Minimal erreichte Punktzahl: 0 Durchschnitt: 5.65 Frage 1

Mehr

Einfache Varianzanalyse für unabhängige Stichproben

Einfache Varianzanalyse für unabhängige Stichproben Einfache Varianzanalyse für unabhängige Stichproben VARIANZANALYSE Die Varianzanalyse ist das dem t-test entsprechende Mittel zum Vergleich mehrerer (k 2) Stichprobenmittelwerte. Sie wird hier mit VA abgekürzt,

Mehr

Abhängigkeit zweier Merkmale

Abhängigkeit zweier Merkmale Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich

Mehr

1.3 Die Beurteilung von Testleistungen

1.3 Die Beurteilung von Testleistungen 1.3 Die Beurteilung von Testleistungen Um das Testergebnis einer Vp zu interpretieren und daraus diagnostische Urteile ableiten zu können, benötigen wir einen Vergleichsmaßstab. Im Falle des klassischen

Mehr

Statistische Methoden: Tests, Regression und multivariate Verfahren

Statistische Methoden: Tests, Regression und multivariate Verfahren (CM)²-Nachwuchsring, Workshop Statistik, 25.Januar 2013 Statistische Methoden: Tests, Regression und multivariate Verfahren Ralf Korn ((CM)², TU Kaiserslautern, Fraunhofer ITWM) 0. Einige Probleme aus

Mehr

V A R I A N Z A N A L Y S E

V A R I A N Z A N A L Y S E V A R I A N Z A N A L Y S E Ziel / Funktion: statistische Beurteilung des Einflusses von nominal skalierten (kategorialen) Faktoren auf intervallskalierte abhängige Variablen Vorteil: die Wirkung von mehreren,

Mehr