25. Januar Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. 4. Multivariate Mittelwertvergleiche

Größe: px
Ab Seite anzeigen:

Download "25. Januar 2010. Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. 4. Multivariate Mittelwertvergleiche"

Transkript

1 Ruhr-Universität Bochum 25. Januar / 75

2 2 / 75

3 4.1 Beispiel: Vergleich von verschiedenen Unterrichtsmethoden Zwei Zufallsstichproben (A und B) mit je 10 Schülern und 8 Schülern Gruppe A wird nach Unterrichtsmethode A unterrichtet und Gruppe B nach Unterrichtsmethode B Für jeden Schüler werden zwei Variable gemessen Leistung (x1) Zufriedenheit (x2) Frage: besteht zwischen den beiden Unterrichtsmethoden ein Unterschied? 3 / 75

4 Daten zu Beispiel 4.1 Methode A x 1 x Methode B x 1 x Beachte: Im Prinzip könnte man beide Variablen getrennt untersuchen. (z.b. Hypothesen bzgl. der Variablen x 1 mit t-test für zwei unabhängige Stichproben). Die Anwendung von mutliplen Tests führt aber zu Schierigkeiten bei der Wahl des Niveaus (vgl. Methodenlehre II, 1.16). 4 / 75

5 4.2 Mathematisches Modell g Gruppen von Probanden in jeder Gruppe gibt es n j Probanden, für die Daten erhoben werden (j) x 1,..., x n (j) j (j = 1,..., g) jedes Datum (d.h. Messung an einem Probanden) hat p Variablen/Merkmale. x (j) m = (x (j) m1,..., x (j) mp) (m = 1,..., n j ) bezeichnet die Messwerte für Proband m in Gruppe j (man beachte, dass der obere Index j die Gruppe bezeichnet). alle Daten sind Realisierungen einer normalverteilten Zufallsvariable. die Daten entstammen aus unabhängigen Gruppen Ziel: Vergleich der Erwartungswertvektoren (d.h. den Vektoren aus den komponentenweise gebildeten Erwartungswerten). 5 / 75

6 4.3 Hypothesentest für den Erwartungswert (Vektor) der Population (g = 1) Frage: ist der Erwartungswertvektor µ der Grundgesamtheit gleich einem gegebenen Vektor µ 0 Idee: lehne die Nullhypothese H 0 : µ = µ 0 ab, falls der Vektor x (1) µ 0 groß ist. Dabei bezeichnet x (1) = 1 n 1 n 1 m=1 den Mittelwertvektor der beobachteten Daten. Beachte: Der Mittelwertvektor ist x (1) ist der Vektor gebildet aus den Mittelwerten für die einzelnen Variablen x m (1). x (1) m 6 / 75

7 4.4 Beispiel (Fortsetzung von 4.2) Ein Wissenschaftler behauptet, dass der Erwartungswertvektor der Population derjenigen Schüler, die nach Methode A unterrichtet werden, durch den Vektor µ 0 = ( 10 5 ) gegeben ist. In diesem Fall ist p = 2, n 1 = 10. Man berechnet den Mittelwertvektor x (1) = 1 n1 {( n 1 m=1 x(1) m = 1 11 ) ( ) ( ) } = ( ) und erhält x (1) µ 0 = ( ) Beachte: Wenn die Nullhypothese gilt, sollten die beiden Komponenten in diesem Vektor ungefähr gleich 0 sein, andernfalls sollte mindestens eine der Komponenten weit von 0 entfernt sein. 7 / 75

8 4.5 Hotellings T 2 -Test für eine Stichprobe Modellannahmen: die beobachteten Daten sind Realisationen von unabhängigen multivariat normalverteilten Zufallsvariablen. Testgröße wobei T 2 1 = n 1 (x (1) µ 0 ) D 1 1 (x (1) µ 0 ) D 1 = 1 n 1 1 n 1 (x (1) m=1 m x (1) )(x (1) ) T m x (1) eine Schätzung für die Kovarianzmatrix der Population ist. Diese Matrix dient hier der Standardisierung, da nicht davon ausgegangen werden kann, dass verschiedene Variablen dieselbe Größenordnug haben. Die Nullhypothese H 0 : µ = µ 0 wird verworfen, falls n 1 p (n 1 1)p T 2 1 > F p,n1 p,1 α ist. Dabei ist F p,n1 p,1 α das (1 α)-quantil der F -Verteilung mit (p, n 1 p) Freiheitsgraden. 8 / 75

9 Beispiel (Berechnung der Kovarianzmatrix) Beachte: In Beispiel 4.1 erhält man für Gruppe A als Kovarianzmatrix D 1 = 1 [ {( ) ( )} {( ) ( )} T { (9 ) ( ) } T {(9 ) ( )} ] = 1 [( ) ( ) ] (0.2, 0.6) + ( 1.8, 1.4) = 1 [ ( ) ( ) ] ( ) = / 75

10 Beachte: Berechnet man für das erste und das zweite Merkmal der Daten für Unterrichtsmethode A die Varianz, so ergibt sich s 2 x 1 = 1 9 {( )2 + (9 10.8) 2 + ( ) } = 3.29 s 2 x 2 = 1 9 {(5 4.4)2 + (3 4.4) 2 + (4 4.4) } = 1.82 D.h. in der Diagonalen der Kovarianzmatrix stehen die (empirischen) Varianzen der Merkmale. Berechnet man für das erste und zweite Merkmal die Kovarianz, so ergibt sich sx 2 1x 2 = 1 {( )(5 4.4) + (9 10.8)(3 4.4) +... } 9 = 0.36 D.h. in den Einträgen neben der Diagonalen stehen die (empirischen) Kovarianzen zwischen den Merkmalen. 10 / 75

11 Eine Bemerkung zur Kovarianzmatrix Beispiel: 500 simulierte Daten (zweidimensional) X1 X2 Beachte: Die Kovarianzmatrix D 1 wird zur Standardisierung verwendet. Ziel ist es, die Daten so zu transfomieren, dass Die einzelnen Komponenten dieselbe Größenordnung haben. Die beiden Komponenten unkorreliert sind. 11 / 75

12 Beispiel: Bei den 500 Daten, wurde jede Komponente getrennt z-standadisiert X1 X2 Beachte: Die einzelnen Komponenten haben dieselbe Größenordnung. Die beiden Komponenten sind aber nicht unkorreliert. 12 / 75

13 Beispiel: die 500 simulierten Daten werden wie folgt transformiert. Es gibt eine Matrix A mit A A = D 1. Transformiere die Daten durch z i = A 1 (x (1) i x (1) ) X1 X2 Beachte: Die einzelnen Komponenten haben dieselbe Größenordnung. Die beiden Komponenten sind unkorreliert. 13 / 75

14 Beispiel: Hotellings T 2 -Test für Beispiel 4.1 Für die Daten aus Gruppe A im Beispiel 4.1 ergibt sich für die Statistik T 1 der Wert ( ) 1 ( ) T = 10 (0.8, 0.6) ( ) ( ) = 10 (0.8, 0.6) ( ) 0.21 = 10 (0.8, 0.6) = Da F 2,8,0.95 = 4.46 und T 2 1 H 0 : µ = = 1.52, kann die Nullhypothese ( ) 10 5 zum Niveau 5% nicht verworfen werden (p-wert: 0.275) 14 / 75

15 Anschauliche Interpretation von Hotellings T 2 -Test für die Daten aus Beispiel 4.1 X Y X1 Links: Original Daten Rechts: Daten nach der Transformation z = A 1 (x µ 0 ) Beachte: Die Nullhypothese wird abgelehnt, falls der durchschnittliche Abstand der transformierten Daten zum Nullpunkt des Koordinatensystems zu groß ist. Y1 15 / 75

16 SPSS Output für die Daten aus Beispiel 4.1 Multivariate Tests b Effekt Konstanter Term a. Exakte Statistik Pillai-Spur Wilks-Lambda Hotelling-Spur Größte charakteristische Wurzel nach Roy Wert,276,724,380,380 F 1,522 a 1,522 a 1,522 a 1,522 a Hypothese df 2,000 2,000 2,000 2,000 Fehler df 8,000 8,000 8,000 8,000 Sig.,275,275,275,275 b. Design: Konstanter Term Beachte: Mit SPSS wurde die Nullhypothese H : µ = 0 mit den um den Vektor µ 0 = (10, 5) T verschobenen Daten überprüft. Der Wert von Hotellings T 2 berechnet sich indem man den Wert der Hotelling-Spur mit (n 1) multipliziert : T 2 1 = (10 1) = 3.42 SPSS liefert noch die Ergbnisse für drei weitere Tests für die Nullhypothese H : µ = 0 (Pillai-Spur, Wilk s-lambda, Roy s größter Eigenwert), die am Ende des Kapitels erklärt werden. 16 / 75

17 4.6 Wichtigste Anwendung des Einstichproben T 2 -Tests: Vergleich von zwei abhängigen Stichproben Beispiel: 5 Probanden machen ein Konzentrationstraining. Vor und nach dem Training wird ein Konzentrationstest gemacht, in dem 2 Variablen gemessen werden. Das ergibt die Daten: vorher x 1 x nachher x 1 x nachher - vorher x 1 x Frage: Bewirkt das Training einen Unterschied in der Konzentrationsfähigkeit? Idee: Falls kein Unterschied zwischen den Ergebnissen vor und nach dem Test besteht sollten die Differenzen (nachher-vorher) klein seien. 17 / 75

18 T 2 -Tests: für zwei abhängige Stichproben Idee: Man wendet Hotelling s Einstichproben T 2 -Test auf die komponentenweise gebildeten Differenzen der Daten an, um die Hypothese H 0 : µ = 0 zu testen. Im Beispiel ergibt sich (n = 5, p = 2): Mittelwertvektor der Differenzen: ( ) T1 2 = 5 F = = 1.87 Das 95%-Quantil der F -Verteilung mit (2, 3) Freiheitsgraden ist F 2,3,0.95 = Damit kann die Nullhypothese ( vor und nach dem Training besteht kein Unterschied ) nicht zum Niveau 5% verworfen werden. 18 / 75

19 Anschauliche Interpretation von Hotellings T 2 -Test für die Daten aus Beispiel 4.6 X Y X Y1 Links: Original Daten (Differenzen vorher - nachher) Rechts: Daten nach der Transformation z = A 1 (x µ 0 ) (in diesem Fall ist µ 0 = 0) Beachte: Die Nullhypothese wird abgelehnt, falls der durchschnittliche Abstand der transformierten Daten zum Nullpunkt des Koordinatensystems zu groß ist. 19 / 75

20 4.7 Vergleich von zwei unabhängigen Stichproben Frage: sind die Erwartungswertvektoren µ 1 und µ 2 der beiden Populationen (vgl. Beispiel 4.1) gleich H 0 : µ 1 = µ 2 Idee: die Nullhypothese wird abgelehnt falls der Vektor der Differenzen x (1) x (2) groß ist (d.h. sich mindestens eine der Komponenten deutlich von 0 unterscheidet). Dabei bezeichnet x (j) = 1 n j n j m=1 x (j) m j = 1, 2 den Mittelwert (Vektor) der Gruppe j (j = 1: Lernmethode A, j = 2 Lernmethode B) 20 / 75

21 4.8 Beispiel (Fortsetzung von 4.1) Ein Wissenschaftler behauptet, dass zwischen den Unterrichtsmethoden ein Unterschied bestht. mathematische Formulierung der Nullhypothese H 0 : µ 1 µ 2 = 0 H 0 : µ 1 = µ 2 µ j bezeichnet den Erwartungswert (Vektor) der Population j Als Schätzung für die Mittelwertdifferenz berechnet man zunächst den Mittelwertvektor der beiden Populationen (x (1) wurde bereits in Beispiel 4.4 berechnet) x (2) = 1 n 2 = n 2 m=1 ( Damit erhält man x (1) x (2) = x (j) m = 1 8 ) ( ) {( ) ( ) = 4.5 ( ) ( ) } ( ) / 75

22 4.9 Hotelling s T 2 -Test für den Vergleich von zwei Stichproben aus unabhängigen Populationen Modellannahmen: Zwei unabhängige Stichproben {x m (1) = (x (1) m1,..., x mp) (1) m = 1,..., n 1 } {x (2) m = (x (2) m1,..., x mp) (2) m = 1,..., n 2 } Die beobachteten Daten sind Realisationen von normalverteilten Zufallsvariablen. (x (1) 1,..., x(1) n 1 ) und (x (2) 1,..., x(2) n 2 ) sind Realisationen unabhängiger Zufallsvariablen (d.h. es liegen unabhängige Stichproben vor). Varianzhomogenität und Kovarianzhomogenität 22 / 75

23 4.9 Hotelling s T 2 -Test für den Vergleich von zwei Stichproben aus unabhängigen Populationen Testgröße T 2 2 = n 1n 2 (n 1 + n 2 2) n 1 + n 2 (x (1) x (2) ) T W 1 (x (1) x (2) ), wobei die Matrix W = n 2 j j=1 m=1 (x (j) m x (j) )(x (j) m x (j) ) T die (gewichteten) Summen der Varianzen und Kovarianzen innerhalb der beiden Gruppen enthält. Die Nullhypothese H 0 : µ 1 = µ 2 wird zum Niveau α verworfen, falls n 1 + n 2 p 1 (n 1 + n 2 2)p T 2 2 > F p,n1+n 2 p 1,1 α gilt. Dabei bezeichnet F p,n1+n 2 p 1,1 α das (1 α)-quantil der F -Verteilung mit (p, n 1 + n 2 p 1) Freiheitsgraden. 23 / 75

24 Bemerkung zu der Matrix W Kovarianzmatrix für Gruppe 1 D 1 = 1 n 1 1 n 1 (x (1) m=1 m x (1) )(x (1) ) T m x (1) Kovarianzmatrix für Gruppe 2 D 2 = 1 n 2 1 n 2 (x (1) m=1 m x (1) )(x (1) ) T m x (1) Die Matrix ergibt sich als gewichtete Summe von D 1 und D 2 : Im Beispiel 4.1 ist W = 9 W = (n 1 1) D 1 + (n 2 1) D 2 ( ) ( ) = ( ) / 75

25 Beispiel (Fortsetzung von 4.1) Für die Matrix W erhält man im Beispiel 4.1 ( ) ( ) W = W 1 = Das ergibt ( ) ( ) T = (0.925, 0.1) ( ) = (0.925, 0.1) = Wegen ( ) 2 T 2 3 = 0.54 und F 2,15,0.95 = 3.68 kann die Nullhypothese H 0 : µ 1 = µ 2 ( zwischen den Unterrichtsmethoden besteht kein Unterschied ) zum Niveau 5% nicht verworfen werden (p-wert: 0.593). 25 / 75

26 SPSS Output: Vergleich von zwei unabhängigen Stichproben Effekt Konstanter Term GRUPPE Pillai-Spur Wilks-Lambda Hotelling-Spur Größte charakteristische Wurzel nach Roy Pillai-Spur Wilks-Lambda Hotelling-Spur Größte charakteristische Wurzel nach Roy a. Exakte Statistik b. Design: Konstanter Term + GRUPPE Multivariate Tests b Wert,981,019 50,785 50,785,068,932,073,073 F 380,886 a 380,886 a 380,886 a 380,886 a,547 a,547 a,547 a,547 a Hypothese df 2,000 2,000 2,000 2,000 2,000 2,000 2,000 2,000 Fehler df 15,000 15,000 15,000 15,000 15,000 15,000 15,000 15,000 Sig.,000,000,000,000,590,590,590,590 Der Wert von Hotellings T 2 berechnet sich durch Multiplikation des Werts der Hotelling-Spur mit (n 1 + n 2 2): T 2 2 = ( ) = SPSS liefert noch die Ergbnisse für drei weitere Tests für die Nullhypothese H : µ 1 = µ 2 (Pillai-Spur, Wilk s-lambda, Roy s größter Eigenwert), die am Ende des Kapitels erklärt werden. 26 / 75

27 4.10 Einfaktorielle multivariate Varianzanalyse (MANOVA) Modellannahmen: g 2 unabhängige Stichproben. {x (1) m = (x (1) m1,..., x (1) mp) m = 1,..., n 1 }. {x (g) m = (x (g) m1,..., x (g) mp ) m = 1,..., n g } die beobachteten Daten sind Realisationen von normalverteilten Zufallsvariablen. (x (1) 1,..., x(1) n 1 ),..., (x (g) 1,..., x(g) n 2 ) sind Realisationen unabhängiger Zufallsvariablen (d.h. es liegen g unabhängige Stichproben vor). Varianzhomogenität und Kovarianzhomogenität. 27 / 75

28 4.10 MANOVA Es bezeichne µ j den Erwartungswert (-vektor) der j-ten Population (j = 1,..., g). Nullhypothese: H 0 : µ 1 = = µ g Die Nullhypothese wird zu Gunsten der Alternative für H 1 : µ i µ j für mindestens ein Paar i, j (i j) verworfen falls für Wilk s gilt: Λ = W (W + B) 1 Λ p,n g,n 1,α Dabei bezeichnet Λp,n g,n 1,α das (1 α)-quantil der Wilk s-λ-verteilung mit (p, n g, n 1) Freiheitsgraden n = g j=1 n j die Anzahl aller Beobachtungen Die Matrix B = g j=1 n j (x (j) x ( ) )(x (j) x ( ) ) T dient als Maß für die Unterschiede zwischen den Gruppen (Streuung zwischen den Gruppen). D.h. man vergleicht jeden Gruppenmittelwertvektor mit dem Mittelwertvektor von allen Daten. 28 / 75

29 Vergleich mit dem eindimensionalen Fall Im Fall p = 1 ergibt sich Λ 1 = W + B W = 1 + B W g j=1 = 1 + n j(x (j) x ( ) ) 2 g nj (j) j=1 m=1 (x m x (j) ) 2 H 0 wird verworfen, falls Λ kleine Werte annimmt, d.h. falls g B W = j=1 n j(x (j) x ( ) ) 2 g nj (j) j=1 m=1 (x m x (j) ) 2 große Werte annimmt. D.h. der Test von Wilk ist eine Verallgemeinerung des F -Test für multivariate Daten (vgl. Beispiel Methodenlehre II, 1.17) Für große Stichprobenumfänge kann man zeigen, dass der Test (n 1 g + p ) log Λ χ 2 p(g 1),1 α 2 näherungsweise das Niveau α hat. Dabei bezeichnet χ 2 p(g 1),1 α das Quantil der χ 2 -Verteilung mit p(g 1) Freiheitsgraden 29 / 75

30 SPSS und Wilk s Λ In SPSS wird statt der χ 2 -Approximation (Bartlett, 1947) eine F -Approximation verwendet (Rao, 1952). Man kann zeigen, dass F f1,f 2 = f 2 f 1 1 Λ1/s Λ 1/s näherunsweise F -verteilt ist mit (f 1, f 2 ) Freiheitsgraden, wobei f 1 = p(g 1), f 2 = m s 1 p(g 1) m = n 1 p + g 2 s = p 2 (g 1) 2 4 p 2 + (g 1) 2 5 Als Approximation für das α-quantil der Wilk s Λ-Verteilung erhält man ( 1 ) s Λ p,n g,n 1,α 1 + f1 f 2 F f1,f 2,α Ist n im Vergleich zu g und p klein, dann liefert die F -Approximation die genaueren Werte. 30 / 75

31 4.10 Abschließende Bemerkungen Wilk s Test setzt die Normalverteilungsannahme und Varianzund Kovarianzhomogenität voraus. Sind λ 1,..., λ g die Eigenwerte der Matrix W 1 B, dann gilt Λ = g 1 i=1 1+λ i = λ 1 1+λ 2 1+λ g Neben der Determinante werden noch andere Kriterien für die Konstruktion von Teststatistiken verwendet: Hotelling s Spurkriterium g H = Spur (B 1 1 W ) = Pillai s Spurkriterium P = Spur (W (W + B) 1 ) = λ i i=1 g i= λ i Roy s größter Eigenwert (der Matrix (W (W + B) 1 ): R = g max i= λ i 31 / 75

32 4.11 Beispiel: MANOVA Anhand von Aufsätzen wird bei 6 Unter-, 4 Mittel- und 5 Oberschichtenkindern ein Index für die Satzlänge (x1), ein Index für die Vielfalt der Wortwahl (x2) und ein Index für die Komplexität der Satzkonstruktionen (x3) erhoben. Stimmen die drei sozialen Schichten hinsichtlich dieser linguistischen Variablen überein? Daten (p = 3, n 1 = 6, n 2 = 4, n 3 = 5) Unterschicht Mittelschicht Oberschicht x 1 x 2 x 3 x 1 x 2 x 3 x 1 x 2 x / 75

33 Man berechnet die Gruppenmittelwerte x (1) = 1 ( 3 ) ( 4 ) ( = x (2) = ( ) ( 7, x (3) = ), ) den Gesamtmittelwert x ( ) = 1 ( ) ( ) ( = ) und erhält für die Streuung zwischen den Gruppen 33 / 75

34 ( 3 B = ( ( 0.53 = = ) ( ) ( ( ) ( ) ( ) ( 1.14 ( 0.53, 1.33, 4.4) ) ) ( ) ) ( T ) T ) (1.14, 1.0, 1.73) / 75

35 Für die Matrix W erhält man mit einer ähnlichen Rechnung wie in Beispiel W = und damit für Wilk s Λ (die Berechnung der Determinante wird hier nicht dargestellt) Λ = W (W + B) 1 = Es ist p = 3, n 1 = 6, n 2 = 4, n 3 = 5 und man erhält (Tabelle) = Λ Λ 3,12,14,0.95 = mit der F -Approximation (Rao) erzielt man die gleiche Testentscheidung (n = 15, s = 2, f 1 = 6, f 2 = 20) f 2 f 1 1 Λ1/s Λ 1/s = = F 6,20,0.95 Damit wird die Nullhypothese (die Erwartungswerte der Populationen sind gleich) zum Niveau 5% verworfen. 35 / 75

36 SPSS Output für Beispiel 4.11: Multivariate Tests c Effekt Konstanter Term Schicht Pillai-Spur Wilks-Lambda Hotelling-Spur Größte charakteristische Wurzel nach Roy Pillai-Spur Wilks-Lambda Hotelling-Spur Größte charakteristische Wurzel nach Roy Wert,990, , ,246,717,297 2,321 2,300 F 347,487 a 347,487 a 347,487 a 347,487 a 2,049 2,784 a 3,481 8,435 b Hypothese df 3,000 3,000 3,000 3,000 6,000 6,000 6,000 3,000 Fehler df 10,000 10,000 10,000 10,000 22,000 20,000 18,000 11,000 a. Exakte Statistik b. Die Statistik ist eine Obergrenze auf F, die eine Untergrenze auf dem Signifikanzniveau ergibt. c. Design: Konstanter Term + Schicht Sig.,000,000,000,000,102,039,018, / 75

37 37 / 75

38 5.1 Beispiel 20 Versuchspersonen werden gebeten einen Text abzuschreiben. Dabei werden der beim Schreiben gezeigte durchschnittliche Schreibdruck (x1) registriert die durchschnittliche Unterlänge der Buchstaben (x2) ermittelt Außerdem werden die Personen mit dem Rosenzweig PF (Picture Frustration) Test klassifiziert. Folgende Kategorien kommen hierbei in Betracht: extrapunitiv: Aggresivität ist gegen die Umwelt gerichtet intrapunitiv: Aggresivität ist gegen das eigene Ich gerichtet impunitiv: Aggresivität wird überhaupt umgangen 38 / 75

39 Daten zu Beispiel 5.1 extrapunitiv intropunitiv impunitiv x 1 x 2 x 1 x 2 x 1 x / 75

40 Streudiagramm zu Beispiel 5.1 Aggresivität Durchschnittliche Unterlänge der Buchstaben extrapunitiv: Aggresivität ist gegen die Umwelt gerichtet intropunitiv: Aggresivität ist gegen das eigene Ich gerichtet impunitiv: die Aggresivität wird überhaupt umgangen Schreibdruck 40 / 75

41 Mathematisches Modell der Diskriminanzanalyse g Gruppen von Probanden in jeder Gruppe n j Probanden, jeweils gemessen in p Variablen x (j) 1,..., x(j) n j (j = 1,..., g) x (j) m = (x (j) m1,..., x mp) (j) (m = 1,..., n j ) p ist die Anzahl der gemessenen Variablen Beachte: Das Modell entspricht der einfaktoriellen multivariaten Varianzanalyse (wobei hier keine Normalverteilungsannahme gemacht wird) Ziel: der Diskriminanzanalyse ist die Bildung optimaler Linearkombinationen y (j) ms = v 1s x (j) m1 + + v ps x (j) mp (s = 1, 2,... ), um die gegebenen Probandengruppen möglichst gut separieren zu können 41 / 75

42 Beispiele für Linearkombination für die Daten in 5.1 (g = 3, p = 2) Mittelwert aus beiden Merkmalen: v 1 = (v 11, v 21 ) = ( 1 2, 1 2 ) y (1) 11 = (1) 3 = 8, y 21 2 = = 10, y (3) 11 = = 9.5 Kontrast (Differenz aus den Merkmalen) (v 21, v 22 ) = ( 1 2, 1 2 ) y (1) 12 = (1) 3 = 5, y 22 2 = = 5, y (3) 12 = = / 75

43 Daten für die beiden Linearkombinationen ext int imp y 1 y 2 y 1 y 2 y 1 y Frage: was sind optimale Linearkombinationen? 43 / 75

44 5.2 Das Grundprinzip der Diskriminanzanalyse Schritt 1: Wir bestimmen zunächst eine Linearkombination y (j) m1 = v 11 x (j) m1 + + v p1 x (j) mp Beachte: die neuen Daten hängen von den Gewichten v 11,..., v p1 ab Das ergibt g Gruppen mit je n j (eindimensionalen) Daten Gruppe 1 : y (1) 11,..., y (1) n 11. Gruppe g : y (g) 11..., y (g) n g 1 Man versucht jetzt, die Gewichte v 11,..., v p1 so zu wählen, dass man die Gruppen möglichst gut unterscheiden kann 44 / 75

45 Eine (naheliegende) Möglichkeit: wähle v 11,..., v p1 so, dass sich (a) die Gruppenmittelwerte y (j) 1 = 1 nj n j m=1 y (j) m1 möglichst stark streuen. (b) die transformierten Daten innerhalb einer Gruppe möglichst wenig streuen. Betrachtet man als Maß für die Streuung die Varianz, dann führt (a) auf die Maximierung von g F (v 11,..., v p1 ) = n j (y (j) 1 y 1) 2. Dabei ist y ( ) 1 = 1 g nj n j=1 m=1 y (j) m1 der Mittelwert der transformierten Daten der Gesamtstichprobe und n = n n g die Anzahl aller Probanden. (b) führt auf die Minimierung von n g j G(v 11,..., v p1 ) = (y (j) m1 y (j) 1 )2 j=1 j=1 m=1 Eine simultane Maxi- und Minimierung der Größen F und G ist nicht möglich! 45 / 75

46 Man maximiert daher den Ausdruck H (1) (v 11,..., v p1 ) = F (v 11,..., v p1 ) G(v 11,..., v p1 ) = g j=1 n j (y (j) 1 y 1) 2 g nj (j) j=1 m=1 (y m1 y (j) 1 )2 Den Maximalwert bezeichnen wir mit λ 1. Man spricht auch von dem größten Eigenwert Man beachte: die Größe H (1) (v 11,..., v p1 ) ist (bis auf einen Faktor der Freiheitsgrade) die Statistik des F -Tests in der einfaktoriellen Varianzanalyse (vgl. Methodenlehre II, 1.17) D.h. die Gewichte v 11,..., v p1 für die erste Linearkombination werden so bestimmt, dass die Statistik des F -Tests für den Vergleich der Gruppenmittelwerte der transformierten Daten maximal wird 46 / 75

47 Beispiele für die erste Linearkombination für die Daten in 5.1 (g = 3, p = 2) (v 11, v 21 ) (0.8348, ) y (1) 11 y (1) 21 y (3) 31 = = , = = , = = / 75

48 Transformierte Daten für die erste optimale Linearkombination y (1) m1 y (2) m1 y (3) m1 ext int imp / 75

49 Schritt 2 (und Folgende): Man bestimmt nun eine weitere Linearkombinationen y (j) m2 = v 12 x (j) m1 + + v p2 x (j) mp so dass: (1) die Größe H (2) (v 12,..., v p2 ) = F (v 12,..., v p2 ) G(v 12,..., v p2 ) = g j=1 n j (y (j) 2 y 2) 2 g nj (j) j=1 m=1 (y m2 y (j) 2 )2 maximal wird und (2) die transformierten Daten {y (j) m1 m = 1,..., n j; j = 1,..., g} und {y (j) m2 m = 1,..., n j; j = 1,..., g} unkorreliert sind Den Maximalwert aus Schritt 2 bezeichnen wir mit λ 2 (zweitgrößter Eigenwert). Die aus den weiteren Schritten erhaltenen Größen werden mit λ 3 λ 4... bezeichnet. 49 / 75

50 Beispiele für die beiden Linearkombination für die Daten in 5.1 (g = 3, p = 2) (v 11, v 21 ) (0.8348, ) y (1) 11 y (1) 21 y (3) 31 = = , = = , = = (v 11, v 21 ) (0.4969, ) y (1) 12 y (1) 21 y (3) 31 = = , = = , = = / 75

51 Transformierte Daten für die ersten beiden optimalen Linearkombinationen ext int imp y 1 y 2 y 1 y 2 y 1 y Frage: Wie findet man die Transformationen? 51 / 75

52 Deskriptive Statistiken vor und nach der Transformation Aggresivität extrapunitiv: Aggresivität ist gegen die Umwelt gerichtet intropunitiv: Aggresivität ist gegen das eigene Ich gerichtet impunitiv: die Aggresivität wird überhaupt umgangen Gesamt Schreibdruck Mean 14,43 16,80 12,75 13,96 Sd 1,13,84 1,28 2,12 Durchschnittliche Unterlänge der Buchstaben Mean 4,14 6,60 7,13 5,69 Sd,69 1,95 1,25 1,83 Aggresivität extrapunitiv: Aggresivität ist gegen die Umwelt gerichtet intropunitiv: Aggresivität ist gegen das eigene Ich gerichtet impunitiv: die Aggresivität wird überhaupt umgangen Gesamt Y1 Mean 9,76 10,39 6,72 8,70 Sd,80 1,13,89 1,89 Y2 Mean 10,76 14,08 12,52 12,29 Sd 1,02 1,84 1,53 1,90 52 / 75

53 Streudiagramm zu Beispiel 5.1 mit Eigenvektoren Durchschnittliche Unterlänge der Buchstaben 9,00 8,00 7,00 6,00 5,00 4,00 Aggresivität extrapunitiv: Aggresivität ist gegen die Umwelt gerichtet intropunitiv: Aggresivität ist gegen das eigene Ich gerichtet impunitiv: die Aggresivität wird überhaupt umgangen Gruppenmittelwert 3,00 10,00 12,00 14,00 16,00 18,00 Schreibdruck 53 / 75

54 Altes und neues Koordiantensystem Durchschnittliche Unterlänge der Buchstaben Aggresivität extrapunitiv: Aggresivität ist gegen die Umwelt gerichtet intropunitiv: Aggresivität ist gegen das eigene Ich gerichtet impunitiv: die Aggresivität wird überhaupt umgangen Schreibdruck 12,00 Aggresivität extrapunitiv: Aggresivität ist gegen die Umwelt gerichtet intropunitiv: Aggresivität ist gegen das eigene Ich gerichtet impunitiv: die Aggresivität wird überhaupt umgangen 10,00 Y1 8,00 6,00 4,00 10,00 12,00 14,00 16,00 Y2 54 / 75

55 5.3 Bemerkungen (1) Ist x (j) m der Vektor der p-variablen des m-ten Probanden in Stichprobe j (= 1,..., g), dann ist x (j) = 1 n j n j m=1 x (j) m der Mittelwertvektor in Gruppe j und x = 1 N g j=1 n j x (j) = 1 n n g j j=1 m=1 x (j) m der Mittelwertvektor aller Beobachtungen. Die Matrix p p B = g j=1 n j (x (j) x)(x (j) x) T ist ein multivariates Maß für die Streuung zwischen den Gruppen (vgl. 4.10) 55 / 75

56 (2) die Matrix W = n g j j=1 m=1 (x (j) m x (j) )(x (j) m x (j) ) T ist ein multivariates Maß für die Streuung innerhalb der Gruppen (vgl. 4.8). (2) Man kann zeigen, dass die Vektoren v s = (v 1s,..., v ps ) (sukzessive unter der Nebenbedingung der Unkorreliertheit) die Größen H (s) (v s ) = vt s B v s vs T W v s maximieren. (3) Man kann zeigen, dass die Vektoren v 1, v 2,... die Eigenvektoren der Matrix W 1 B sind und die zugehörigen Maximalwerte λ 1, λ 2,... sind die Eigenwerte dieser Matrix, d.h. es gilt (W 1 B)v j = λ j v j j = 1, 2, / 75

57 Zahlenbeispiel für die Berechnung der Eigenvektoren SPSS liefert Schätzungen für Mittelwerte und Kovarianzmatrizen (innerhalb der Gruppen und in der gesamten Stichprobe); daraus berechnen sich: ( ) B = und Damit ergibt sich: W = W 1 B = ( ) ( ) mit λ 1 = 3.693, v 1 = ( ) und λ 2 = 0.902, v 2 = als Eigenwerten und zugehörigen Eigenvektoren ( ) / 75

58 Zahlenbeispiel: SPSS-Ausgaben Gemeinsam Matrizen innerhalb der Gruppen a Kovarianz Korrelation Schreibdruck Durchschnittliche Unterlänge der Buchstaben Schreibdruck Durchschnittliche Unterlänge der Buchstaben Schreibdruck 1,295 a. Die Kovarianzmatrix hat einen Freiheitsgrad von 17. W = (20 3) ( ) = ,613 1,000,413 Durchschnittliche Unterlänge der Buchstaben,613 1,702,413 1,000 ( ) / 75

59 Zahlenbeispiel: SPSS-Ausgaben Aggresivität extrapunitiv: Aggresivität ist gegen die Umwelt gerichtet intropunitiv: Aggresivität ist gegen das eigene Ich gerichtet impunitiv: die Aggresivität wird überhaupt umgangen Gesamt Kovarianz-Matrizen a Schreibdruck Durchschnittliche Unterlänge der Buchstaben Schreibdruck Durchschnittliche Unterlänge der Buchstaben Schreibdruck Durchschnittliche Unterlänge der Buchstaben Schreibdruck Durchschnittliche Unterlänge der Buchstaben Schreibdruck 1,286 a. Die Kovarianzmatrix für alle Fälle hat einen Freiheitsgrad von 19.,429,700,400 1,643,893 3,818,124 Durchschnittliche Unterlänge der Buchstaben,429,476,400 3,800,893 1,554,124 3,418 ( ) ( ) W = (7 1) + (5 1) ( ) ( ) (8 1) = / 75

60 Zahlenbeispiel: SPSS-Ausgaben Eigenwerte Funktion Eigenwert % der Varianz Kumulierte % Kanonische Korrelation 1 3,685 a 80,3 80,3,887 2,901 a 19,7 100,0,689 a. Die ersten 2 kanonischen Diskriminanzfunktionen werden in dieser Analyse verwendet. 60 / 75

61 5.4 Bemerkungen Die Vektoren v s = (v 1s,..., v ps ) in den Linearkombinationen heißen Diskriminanzfaktoren (man beachte die Analogie zur Faktorenanalyse). Allerdings sind die Diskriminanzfaktoren nicht notwendig orthogonal. Bei g Gruppen und p Variablen gibt es r = min {p, g 1} Faktoren. Wir erhalten also insgesamt r Maximalwerte λ 1 λ 2 λ r, die Eigenwerte genannt werden. Die Größe ρ s = λ s λ 1 + λ λ r ; s = 1,..., r bezeichnet den Diskriminanzanteil des Diskriminanzfaktors s 61 / 75

62 5.5 Bemerkungen Die Größe ω s = λ 1 + λ λ s λ 1 + λ λ r ; s = 1,..., r bezeichnet das Diskriminanzpotenzial der Diskriminanzfaktoren 1,..., s. In vielen verwendet man nicht alle Diskriminanzfaktoren sondern nur diejenigen, für die das Diskriminanzpotenzial groß ist. Damit erhält man wie bei der Faktorenanalyse eine Dimensionsreduktion. Durch die Diskriminanzanalyse werden r neue Koordinatenachsen bestimmt mit dem Ziel der sukzessiven maximalen Separierbarkeit der verglichenen Stichproben. Die neuen Achsen sind nicht notwendig orthogonal. 62 / 75

63 Beachte: Wichtige Kennwerte der Diskriminanzanalyse - Die z-standardisierten Positionen der Probanden auf den Koordinatenachsen heißen wie bei der Faktorenanalyse Faktorwerte. - Die Korrelation zwischen den ursprünglichen Messwerten und den Faktorwerten heißen Faktorladungen und werden wie bei der Faktorenanalyse für die Interpretation der Diskriminanzfaktoren verwendet. Eine sehr hohe positive oder sehr niedrige negative Faktorladung besagt, dass die entsprechende Variable besonders charakteristisch für den Diskriminanzfaktor ist. - Außerdem untersucht man die Mittelwerte der verglichenen Gruppen auf dem Diskriminanzfaktor. Dadurch kann man feststellen, wie gut die Gruppen durch den Diskriminanzfaktor getrennt werden. Oft werden die Diskriminanzfaktoren noch mit dem Varimax-Kriterium (vgl. 3.7) rotiert, um eine bessere Interpretation der Diskriminanzfaktoren zu erhalten 63 / 75

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

8. Methoden der klassischen multivariaten Statistik

8. Methoden der klassischen multivariaten Statistik 8. Methoden der klassischen multivariaten Statistik 8.1. Darstellung von Daten Voraussetzungen auch in diesem Kapitel: Grundgesamtheit (Datenraum) Ω von Objekten (Fällen, Instanzen), denen J-Tupel von

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

Beispiel für eine multivariate Varianzanalyse (MANOVA) Daten: POKIV_Terror_V12.sav

Beispiel für eine multivariate Varianzanalyse (MANOVA) Daten: POKIV_Terror_V12.sav Beispiel für eine multivariate Varianzanalyse () Daten: POKIV_Terror_V12.sav Es soll überprüft werden, inwieweit das ATB-Syndrom (Angst vor mit den drei Subskalen affektive Angst von, Terrorpersistenz,

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 2 Multivariate Verfahren Musterlösung Aufgabe 1 (28 Punkte) Der Marketing-Leiter einer Lebensmittelherstellers möchte herausfinden, mit welchem Richtpreis eine neue Joghurt-Marke auf

Mehr

Grundlagen von Versuchsmethodik und Datenanalyse

Grundlagen von Versuchsmethodik und Datenanalyse Grundlagen von Versuchsmethodik und Datenanalyse Der Anfang: Hypothesen über Ursache-Wirkungs-Zusammenhänge Ursache Wirkung Koffein verbessert Kurzzeitgedächtnis Gewaltfilme führen zu aggressivem Verhalten

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Varianzanalytische Methoden Zweifaktorielle Versuchspläne 4/13. Durchführung in SPSS (File Trait Angst.sav)

Varianzanalytische Methoden Zweifaktorielle Versuchspläne 4/13. Durchführung in SPSS (File Trait Angst.sav) Zweifaktorielle Versuchspläne 4/13 Durchführung in SPSS (File Trait Angst.sav) Analysieren > Allgemeines Lineares Modell > Univariat Zweifaktorielle Versuchspläne 5/13 Haupteffekte Geschlecht und Gruppe

Mehr

Statistische Methoden: Tests, Regression und multivariate Verfahren

Statistische Methoden: Tests, Regression und multivariate Verfahren (CM)²-Nachwuchsring, Workshop Statistik, 25.Januar 2013 Statistische Methoden: Tests, Regression und multivariate Verfahren Ralf Korn ((CM)², TU Kaiserslautern, Fraunhofer ITWM) 0. Einige Probleme aus

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Fragestellungen der Schließenden Statistik

Fragestellungen der Schließenden Statistik Fragestellungen der Schließenden Statistik Bisher: Teil I: Beschreibende Statistik Zusammenfassung von an GesamtheitM N {e,,e N } erhobenem Datensatz x,,x N durch Häufigkeitsverteilung und Kennzahlen für

Mehr

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen Univariate/ multivariate Ansätze Klaus D. Kubinger Effektgrößen Rasch, D. & Kubinger, K.D. (2006). Statistik für das Psychologiestudium Mit Softwareunter-stützung zur Planung und Auswertung von Untersuchungen

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Multivariate Statistik mit Mathematica und SPSS

Multivariate Statistik mit Mathematica und SPSS Multivariate Statistik mit Mathematica und SPSS von Dipl.-Math. Marco Schuchmann Dipl.-Math. Werner Sanns Seite 2 Varianzanalyse Die Informationen in diesem Buch entstammen langjähriger Erfahrung in Praxis

Mehr

9 Diskriminanzanalyse

9 Diskriminanzanalyse 9 Diskriminanzanalyse 9.1 Problemstellung Ziel einer Diskriminanzanalyse: Bereits bekannte Objektgruppen (Klassen/Cluster) anhand ihrer Merkmale charakterisieren und unterscheiden sowie neue Objekte in

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Anhang A: Fragebögen und sonstige Unterlagen

Anhang A: Fragebögen und sonstige Unterlagen Anhang Anhang A: Fragebögen und sonstige Unterlagen A.: Flyer zur Probandenrekrutierung 46 A.: Fragebogen zur Meditationserfahrung 47 48 A.3: Fragebogen Angaben zur Person 49 5 5 A.4: Termin- und Einladungsschreiben

Mehr

Multivariate Analysemethoden

Multivariate Analysemethoden Multivariate Analysemethoden 30.04.2014 Günter Meinhardt Johannes Gutenberg Universität Mainz Einführung Was sind multivariate Analysemethoden? Vorlesung Übung/Tut Prüfung Verfahrensdarstellung in Überblick

Mehr

Diskriminanzanalyse Beispiel

Diskriminanzanalyse Beispiel Diskriminanzanalyse Ziel bei der Diskriminanzanalyse ist die Analyse von Gruppenunterschieden, d. h. der Untersuchung von zwei oder mehr Gruppen hinsichtlich einer Vielzahl von Variablen. Diese Methode

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

V A R I A N Z A N A L Y S E

V A R I A N Z A N A L Y S E V A R I A N Z A N A L Y S E Ziel / Funktion: statistische Beurteilung des Einflusses von nominal skalierten (kategorialen) Faktoren auf intervallskalierte abhängige Variablen Vorteil: die Wirkung von mehreren,

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Varianzanalyse * (1) Varianzanalyse (2)

Varianzanalyse * (1) Varianzanalyse (2) Varianzanalyse * (1) Einfaktorielle Varianzanalyse (I) Die Varianzanalyse (ANOVA = ANalysis Of VAriance) wird benutzt, um Unterschiede zwischen Mittelwerten von drei oder mehr Stichproben auf Signifikanz

Mehr

9. StatistischeTests. 9.1 Konzeption

9. StatistischeTests. 9.1 Konzeption 9. StatistischeTests 9.1 Konzeption Statistische Tests dienen zur Überprüfung von Hypothesen über einen Parameter der Grundgesamtheit (bei einem Ein-Stichproben-Test) oder über die Verteilung einer Zufallsvariablen

Mehr

Faktorenanalyse. 1. Grundlegende Verfahren. Bacher, SoSe2007

Faktorenanalyse. 1. Grundlegende Verfahren. Bacher, SoSe2007 Faktorenanalyse Bacher, SoSe2007 1. Grundlegende Verfahren explorative FA (EXFA): Für eine Menge von Variablen/Items werden zugrunde liegende gemeinsame (latente) Dimensionen/Faktoren gesucht, die Faktorstruktur

Mehr

Prüfen von Mittelwertsunterschieden: t-test

Prüfen von Mittelwertsunterschieden: t-test Prüfen von Mittelwertsunterschieden: t-test Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) t-test

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

T-TEST BEI EINER STICHPROBE:

T-TEST BEI EINER STICHPROBE: Kapitel 19 T-Test Mit Hilfe der T-TEST-Prozeduren werden Aussagen über Mittelwerte getroffen. Dabei wird versucht, aus den Beobachtungen einer Stichprobe Rückschlüsse auf die Grundgesamtheit zu ziehen.

Mehr

Risikomessung und Value at Risk Wintersemester 2013/14

Risikomessung und Value at Risk Wintersemester 2013/14 Risikomessung und Value at Risk Wintersemester 2013/14 Walter Sanddorf-Köhle Statistik und Ökonometrie Foliensatz Nr. 11 Version vom 24. Januar 2014 1 / 45 6.5.1 Bisherige Vorgehensweise zur Berechnung

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Hans-Friedrich Eckey SS 2004. Skript zur Lehrveranstaltung Multivariate Statistik

Hans-Friedrich Eckey SS 2004. Skript zur Lehrveranstaltung Multivariate Statistik Hans-Friedrich Eckey SS 2004 Skript zur Lehrveranstaltung Multivariate Statistik Vormerkungen I Vorbemerkungen Das Manuskript beinhaltet den gesamten Stoff, der Bestandteil der Lehrveranstaltung "Multivariate

Mehr

Kapitel 7: Varianzanalyse mit Messwiederholung

Kapitel 7: Varianzanalyse mit Messwiederholung Kapitel 7: Varianzanalyse mit Messwiederholung Durchführung einer einfaktoriellen Varianzanalyse mit Messwiederholung 1 Durchführung einer zweifaktoriellen Varianzanalyse mit Messwiederholung auf einem

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Univariate Varianz- und Kovarianzanlyse, Multivariate Varianzanalyse und Varianzanalyse mit Messwiederholung finden sich unter

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 8. Februar 2007 Hinweise:

Mehr

LISREL/CFA: Modelltest

LISREL/CFA: Modelltest LISREL/CFA: Modelltest im Rahmen des Interdisziplinären Seminars Multivariate Statistik bei psychologischen Fragestellungen Martina Feilke, Martina Unterburger, Christoph Burkhardt Dozenten: Prof. Dr.

Mehr

Varianzananalyse. How to do

Varianzananalyse. How to do Varianzananalyse How to do Die folgende Zusammenfassung zeigt beispielhaft, wie eine Varianzanalyse mit SPSS durchgeführt wird und wie die Ergebnisse in einem Empra-Bericht oder in einer Bachelor- oder

Mehr

2 Multivariate Statistik

2 Multivariate Statistik MS13 1 2 Multivariate Statistik 21 Grundbegriffe In diesem Abschnitt sollen die ersten wichtigen Grundbegriffe der Multivariaten Statistik eingeführt werden: Mehrdimensionale Variablen, Erwartungswerte,

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Biostatistik, Winter 2011/12

Biostatistik, Winter 2011/12 Biostatistik, Winter 2011/12 Vergleich zweier Stichproben, nichtparametrische Tests Prof. Dr. Achim Klenke http://www.aklenke.de 11. Vorlesung: 27.01.2012 1/86 Inhalt 1 Tests t-test 2 Vergleich zweier

Mehr

Abhängigkeit zweier Merkmale

Abhängigkeit zweier Merkmale Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich

Mehr

Beispiel: Sonntagsfrage. Einführung in die induktive Statistik. Statistische Tests. Statistische Tests

Beispiel: Sonntagsfrage. Einführung in die induktive Statistik. Statistische Tests. Statistische Tests Beispiel: Sonntagsfrage Vier Wochen vor der österreichischen Nationalratswahl 1999 wurde 499 Haushalten die Sonntagsfrage gestellt: Falls nächsten Sonntag Wahlen wären, welche Partei würden Sie wählen?

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

Statistische Verfahren für das Data Mining in einem Industrieprojekt

Statistische Verfahren für das Data Mining in einem Industrieprojekt Statistische Verfahren für das Data Mining in einem Industrieprojekt Thorsten Dickhaus Forschungszentrum Jülich GmbH Zentralinstitut für Angewandte Mathematik Telefon: 02461/61-4193 E-Mail: th.dickhaus@fz-juelich.de

Mehr

Data Mining und Statistik: Gemeinsamkeiten und Unterschiede

Data Mining und Statistik: Gemeinsamkeiten und Unterschiede Universität Ulm Seminararbeit zum Thema Data Mining und Statistik: Gemeinsamkeiten und Unterschiede vorgelegt von: Daniel Meschenmoser betreut von: Dr. Tomas Hrycej Dr. Matthias Grabert Ulm, im Februar

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Elemente der Analysis II

Elemente der Analysis II Elemente der Analysis II Kapitel 3: Lineare Abbildungen und Gleichungssysteme Informationen zur Vorlesung: http://www.mathematik.uni-trier.de/ wengenroth/ J. Wengenroth () 15. Mai 2009 1 / 35 3.1 Beispiel

Mehr

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Andreas Berlin 14. Juli 2009 Bachelor-Seminar: Messen und Statistik Inhalt: 1 Aspekte einer Messung 2 Mess-System-Analyse 2.1 ANOVA-Methode 2.2 Maße

Mehr

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis:

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis: Inhaltsverzeichnis: Übungsaufgaben zu Kapitel 5... 1 Aufgabe 101... 1 Aufgabe 102... 2 Aufgabe 103... 2 Aufgabe 104... 2 Aufgabe 105... 3 Aufgabe 106... 3 Aufgabe 107... 3 Aufgabe 108... 4 Aufgabe 109...

Mehr

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen Ergebnisse 77 5 Ergebnisse Das folgende Kapitel widmet sich der statistischen Auswertung der Daten zur Ü- berprüfung der Hypothesen. Die hier verwendeten Daten wurden mit den in 4.3 beschriebenen Instrumenten

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

SFB 833 Bedeutungskonstitution. Kompaktkurs. Datenanalyse. Projekt Z2 Tübingen, Mittwoch, 18. und 20. März 2015

SFB 833 Bedeutungskonstitution. Kompaktkurs. Datenanalyse. Projekt Z2 Tübingen, Mittwoch, 18. und 20. März 2015 SFB 833 Bedeutungskonstitution Kompaktkurs Datenanalyse Projekt Z2 Tübingen, Mittwoch, 18. und 20. März 2015 Messen und Skalen Relativ (Relationensystem): Menge A von Objekten und eine oder mehrere Relationen

Mehr

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

Kapitel 3. Erste Schritte der Datenanalyse. 3.1 Einlesen und Überprüfen der Daten

Kapitel 3. Erste Schritte der Datenanalyse. 3.1 Einlesen und Überprüfen der Daten Kapitel 3 Erste Schritte der Datenanalyse 3.1 Einlesen und Überprüfen der Daten Nachdem die Daten erfasst worden sind, etwa mit Hilfe eines Fragebogens, ist die nächste Frage, wie ich sie in den Rechner

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

werden können. Wenn der Benutzer zudem eine konkrete Differenz mit praktischen Konsequenzen angibt, berechnet der Assistent den Stichprobenumfang,

werden können. Wenn der Benutzer zudem eine konkrete Differenz mit praktischen Konsequenzen angibt, berechnet der Assistent den Stichprobenumfang, Dieses White Paper ist Teil einer Reihe von Veröffentlichungen, welche die Forschungsarbeiten der Minitab-Statistiker erläutern, in deren Rahmen die im Assistenten der Minitab 17 Statistical Software verwendeten

Mehr

Statistik Musterlösungen

Statistik Musterlösungen Statistik Musterlösungen Regina Tüchler & Achim Zeileis Institut für Statistik & Mathematik Wirtschaftsuniversität Wien 1 Grundbegriffe (1.23) Skript Reaktionen auf Videofilm. Aussagen M, E, P, S h(m)

Mehr

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Andreas Berlin 14. Juli 009 Bachelor-Seminar: Messen und Statistik Inhalt: 1 Aspekte einer Messung Mess-System-Analyse.1 ANOVA-Methode. Maße für

Mehr

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Wiederholung Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell

Mehr

LINEARE ALGEBRA Ferienkurs. Hanna Schäfer Philipp Gadow

LINEARE ALGEBRA Ferienkurs. Hanna Schäfer Philipp Gadow LINEARE ALGERA Ferienkurs Hanna Schäfer Philipp Gadow INHALT Eigenwerte und Eigenvektoren. asiswechsel.2 Eigenwertgleichung 2.3 Diagonalisierbarkeit 5.4 Trigonalisierung 8.5 Zusatzmaterial 8 Aufgaben 9

Mehr

Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen. Das folgende Modell ist ein GARCH(1,1)-Modell:

Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen. Das folgende Modell ist ein GARCH(1,1)-Modell: Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen LV-Leiterin: Univ.Prof.Dr. Sylvia Frühwirth-Schnatter 1 Wahr oder falsch? 1. Das folgende Modell ist ein GARCH(1,1)-Modell: Y

Mehr

5.2 Optionen Auswahl der Statistiken, die bei der jeweiligen Prozedur zur Verfügung stehen.

5.2 Optionen Auswahl der Statistiken, die bei der jeweiligen Prozedur zur Verfügung stehen. 5 Statistik mit SPSS Die Durchführung statistischer Auswertungen erfolgt bei SPSS in 2 Schritten, der Auswahl der geeigneten Methode, bestehend aus Prozedur Variable Optionen und der Ausführung. 5.1 Variablen

Mehr

Die Verteilung dieser Werte y ist eine Normalverteilung. hängt nicht von u ab

Die Verteilung dieser Werte y ist eine Normalverteilung. hängt nicht von u ab Einfache lineare Regression als Beispiel für das ALM ALM : Allgemeines Lineares Modell Y : Kriterium U : Prädiktor Modell : Erwartungswert von Y ist lineare Funktion von U Genauer : Für festes u gilt für

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse Multiple Regression II: Signifikanztests,, Multikollinearität und Kohortenanalyse Statistik II Übersicht Literatur Kausalität und Regression Inferenz und standardisierte Koeffizienten Statistik II Multiple

Mehr

Multivariate Verfahren

Multivariate Verfahren Multivariate Verfahren Lineare Reression Zweck: Vorhersae Dimensionsreduktion Klassifizierun Hauptkomponentenanalyse Korrespondenzanalyse Clusteranalyse Diskriminanzanalyse Eienschaften: nicht-linear verteilunsfrei

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung Die Messung Skalenniveaus 2 Univariate deskriptive Statistik 3 Multivariate Statistik 4 Regression 5 Ergänzungen Grundbegriffe Statistische Einheit,

Mehr

Modellierung von Korrelationen zwischen Kreditausfallraten für Kreditportfolios. Bernd Rosenow, 3. Kölner Workshop Quantitative Finanzmarktforschung

Modellierung von Korrelationen zwischen Kreditausfallraten für Kreditportfolios. Bernd Rosenow, 3. Kölner Workshop Quantitative Finanzmarktforschung Modellierung von Korrelationen zwischen Kreditausfallraten für Kreditportfolios Bernd Rosenow Rafael Weißhaupt Frank Altrock Universität zu Köln West LB AG, Düsseldorf Gliederung Beschreibung des Datensatzes

Mehr

Welch-Test. Welch-Test

Welch-Test. Welch-Test Welch-Test Welch-Test Test auf Lageunterschied zweier normalverteilter Grundgesamtheiten mit unbekannten Varianzen durch Vergleich der Mittelwerte zweier unabhängiger Zufallsstichproben. Beispiel Im Labor

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/35 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

Kommentierter SPSS-Output für die multiple Regressionsanalyse (SPSS-Version 17)

Kommentierter SPSS-Output für die multiple Regressionsanalyse (SPSS-Version 17) R.Niketta Multiple Regressionsanalyse Kommentierter SPSS-Output für die multiple Regressionsanalyse (SPSS-Version 17) Daten: Selbstdarstellung und Kontaktsuche in studi.vz (POK VIII, AG 3) Fragestellung:

Mehr

Modellbildung und Simulation

Modellbildung und Simulation Modellbildung und Simulation 5. Vorlesung Wintersemester 2007/2008 Klaus Kasper Value at Risk (VaR) Glossar Portfolio: In der Ökonomie bezeichnet der Begriff Portfolio ein Bündel von Investitionen, das

Mehr

Computer Vision: 3D-Geometrie. D. Schlesinger () Computer Vision: 3D-Geometrie 1 / 17

Computer Vision: 3D-Geometrie. D. Schlesinger () Computer Vision: 3D-Geometrie 1 / 17 Computer Vision: 3D-Geometrie D. Schlesinger () Computer Vision: 3D-Geometrie 1 / 17 Lochkamera Modell C Projektionszentrum, Optische Achse, Bildebene, P Hauptpunkt (optische Achse kreuzt die Bildebene),

Mehr

Conjoint Analyse. Ordnen Sie bitte die Objekte Ihren Präferenzen entsprechend in eine Rangreihe.

Conjoint Analyse. Ordnen Sie bitte die Objekte Ihren Präferenzen entsprechend in eine Rangreihe. Conjoint Analyse CONsidered JOINTly Conjoint Analyse Ordnen Sie bitte die Objekte Ihren Präferenzen entsprechend in eine Rangreihe. traditionelle auswahlbasierte Wählen Sie bitte aus den Alternativen,

Mehr

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip Sommersemester 2010 KLAUSUR Statistik B Hinweise zur Bearbeitung: Bei allen Teilaufgaben

Mehr

Formelsammlung zu Multivariate Verfahren

Formelsammlung zu Multivariate Verfahren Institut für Statistik Gerhard Tutz, Moritz, Wolfgang Pößnecker Sommersemester 204 Formelsammlung zu Multivariate Verfahren Inhaltsverzeichnis Version 0804204 Diese Formelsammlung darf in der Klausur verwendet

Mehr

Test für hochdimensionale Messwiederholungen mit unbekannten Kovarianzmatrizen

Test für hochdimensionale Messwiederholungen mit unbekannten Kovarianzmatrizen Test für hochdimensionale Messwiederholungen mit unbekannten Kovarianzmatrizen Diplomarbeit vorgelegt von Benjamin Markus Becker aus Stuttgart angefertigt am Institut für Mathematische Stochastik Georg-August-Universität

Mehr

Kapitel 3: Interpretationen

Kapitel 3: Interpretationen Kapitel 3: 1. Interpretation von Outputs allgemein... 1 2. Interpretation von Signifikanzen... 1 2.1. Signifikanztests / Punktschätzer... 1 2.2. Konfidenzintervalle... 2 3. Interpretation von Parametern...

Mehr

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23 Fragestellungen und Methoden 11 Vorwort 15 Kapitel 1 Einführung 17 1.1 KonzeptiondesBuchs... 18 1.2 AufbaudesBuchs... 19 1.3 Programmversionen von PASW bzw. SPSS..... 20 1.4 WiekanndiesesBuchverwendetwerden?...

Mehr

Varianzanalyse. Seminar: Multivariate Verfahren Dr. Thomas Schäfer. Datum: 25. Mai 2010

Varianzanalyse. Seminar: Multivariate Verfahren Dr. Thomas Schäfer. Datum: 25. Mai 2010 Varianzanalyse Seminar: Multivariate Verfahren Dozent: Dr. Thomas Schäfer Referenten: Ralf Hopp, Michaela Haase, Tina Giska Datum: 25. Mai 2010 Gliederung I Theorieteil 1. Das Prinzip der Varianzanalyse

Mehr