Materialband Marktforschung Multivariate statistische Verfahren 5. Sem. Prof. Dr. Rößler
Themenbereiche 1 Regressionsanalyse 2 Varianzanalyse 3 Diskriminanzanalyse 4 Faktorenanalyse 5 Clusteranalyse
Regressionsanalyse Menge y i Besuche x 1i 2585 109 1819 107 1647 99 1496 70 921 81 2278 102 1810 110 1987 92 1612 87 1913 79 Streudiagramm 3000 2500 Menge y i 2000 1500 1000 500 60 70 80 90 100 110 120 Besuche x 2i Prof. Dr. Rößler Seite 1
Regressionsanalyse Regression Modellzusammenfassung (b) Korrigiertes Standardfehler des Durbin-Watson- Modell R R-Quadrat R-Quadrat Schätzers Statistik 1 0,588 (a) 0,346 0,264 385,4678 2,656 (a) Einflußvariablen : (Konstante), BESUCHE x1i (b) Abhängige Variable: ABSATZ Modell 1 ANOVA (b) Quadratdf Mittel der Quadrate F Signifikanz summe Regression 627572,108 1 627572,108 4,224 0,074 (a) Residuen 1188683,492 8 148585,436 Gesamt 1816255,6 9 (a) Einflußvariablen : (Konstante), BESUCHE x1i (b)abhängige Variable: ABSATZ Modell Koeffizienten (a) Nicht standardisierte Standardisierte 95%-Konfidenzintervall für B Koeffizienten Koeffizienten T Signifikanz Standard- B Beta Untergrenze Obergrenze fehler (Konstante) 39,534 868,517 0,046 0,965-1963,268 2042,335 1 BESUCHE x1i 18,881 9,187 0,588 2,055 0,074-2,305 40,067 (a) Abhängige Variable: ABSATZ Prof. Dr. Rößler Seite 2
Regressionsanalyse Menge y i Besuche x 1i Preis x 2i Ausgaben x 3i 2585 109 12,5 2000 1819 107 10 550 1647 99 9,95 1000 1496 70 11,5 800 921 81 12 0 2278 102 10 1500 1810 110 8 800 1987 92 9 1200 1612 87 9,5 1100 1913 79 12,5 1300 Prof. Dr. Rößler Seite 3
Regressionsanalyse Modell Regression Aufgenommene/Entfernte Variablen (b) Aufgenommene Variablen Entfernte Variablen AUSGABEN x3i, 1 PREIS x2i, () g BESUCHE x1i(a) aufgenommen. (b) Abhängige Variable: ABSATZ Methode, Eingeben Modell R R-Quadrat Modellzusammenfassung (b) Korrigiertes R- Quadrat Standardfehler des Schätzers Durbin- Watson- Statistik 1,962 (a) 0,926 0,888 150,126 3,49 (a) Einflußvariablen : (Konstante), AUSGABEN x3i, PREIS x2i, BESUCHE x1i (b) Abhängige Variable: ABSATZ ANOVA (b) Modell Quadrat- Mittel der df summe Quadrate F Signifikanz Regression 1681028,7 3 560342,9 24,862 0,001 (a) 1 Residuen 135226,9 6 22537,817 Gesamt 1816255,6 9 (a) Einflußvariablen : (Konstante), AUSGABEN x3i, PREIS x2i, BESUCHE x1i (b) Abhängige Variable: ABSATZ Modell Koeffizienten (a) Nicht standardisierte Koeffizienten Standard- B fehler Standardisierte Koeffizienten Beta T Signifikanz 95%-Konfidenzintervall für B Untergrenze Obergrenze (Konstante) -6,866 673,205-0,01 0,992-1654,129 1640,398 1 BESUCHE x1i 11,085 4,428 0,345 2,504 0,046 0,251 21,919 PREIS x2i 9,927 38,164 0,034 0,26 0,803-83,458 103,312 AUSGABEN x3i 0,655 0,103 0,794 6,382 0,001 0,404 0,907 (a) Abhängige Variable: ABSATZ Prof. Dr. Rößler Seite 4
Regressionsanalyse Aufgenommene/Entfernte Variablen (b) Modell Aufgenommene Variablen Entfernte Variablen 1 AUSGABEN x3i, BESUCHE x1i (a) (a) Alle gewünschten Variablen wurden aufgenommen. (b) Abhängige Variable: ABSATZ Methode, Eingeben Modellzusammenfassung Modell R R-Quadrat Korrigiertes Standardfehler R-Quadrat des Schätzers 1,962 (a) 0,925 0,903 139,7711 (a) Einflußvariablen : (Konstante), AUSGABEN x3i, BESUCHE x1i ANOVA(b) Modell Quadratsumme df Mittel der Quadrate F Signifikanz Regression 1679503,802 2 839751,901 42,99 0,000(a) 1 Residuen 136751,798 7 19535,971 Gesamt 1816255,6 9 (a) Einflußvariablen : (Konstante), AUSGABEN x3i, BESUCHE x1i (b) Abhängige Variable: ABSATZ Koeffizienten (a) Nicht standardisierte Koeffizienten Standardisierte Koeffizienten T Signifikanz Korrelationen Modell B Standardfehler Beta Nullter Ordnung Partiell Teil (Konstante) 144,482 315,25 0,458 0,661 1 BESUCHE x1i 10,487 3,522 0,326 2,977 0,021 0,588 0,748 0,309 AUSGABEN x3i 0,664 0,091 0,805 7,338 0 0,911 0,941 0,761 (a) Abhängige Variable: ABSATZ r 2 = 0,748 2 = 0,559 r 2 = 0,941 2 = 0,885 Prof. Dr. Rößler Seite 5
Varianzanalyse Plazierung Absatz Normalregal 1 47 Normalregal 1 39 Normalregal 1 40 Normalregal 1 46 Normalregal 1 45 Zweitplazierung 2 68 Zweitplazierung 2 65 Zweitplazierung 2 63 Zweitplazierung 2 59 Zweitplazierung 2 67 Kühlregal 3 59 Kühlregal 3 50 Kühlregal 3 51 Kühlregal 3 48 Kühlregal 3 53 Prof. Dr. Rößler Seite 6
Varianzanalyse ANOVA ABSATZ Quadratsumme ANOVA df Mittel der Quadrate F Signifikanz Zwischen den Gruppen 1112,133 2 556,067 38,087 0 Innerhalb der Gruppen 175,2 12 14,6 Gesamt 1287,333 14 ABSATZ Test der Homogenität der Varianzen Levenedf1 df2 Signifikanz Statistik 0,062 2 12 0,94 Post-Hoc-Tests Homogene Untergruppen ABSATZ Subset for alpha =.05 N PLAZIERU 1 2 3 1 5 43,4 Duncan (a) 3 5 52,2 2 5 64,4 Signifikanz 1 1 1 Die Mittelwerte für die in homogenen Untergruppen befindlichen Gruppen werden angezeigt. (a) Uses Harmonic Mean Sample Size = 5,000 Prof. Dr. Rößler Seite 7
Varianzanalyse Plazierung Absatz Verpackung Normalregal 1 47 1 Becher Normalregal 1 39 1 Becher Normalregal 1 40 1 Becher Normalregal 1 46 1 Becher Normalregal 1 45 1 Becher Normalregal 1 40 2 Papier Normalregal 1 39 2 Papier Normalregal 1 35 2 Papier Normalregal 1 36 2 Papier Normalregal 1 37 2 Papier Zweitplazierung 2 68 1 Becher Zweitplazierung 2 65 1 Becher Zweitplazierung 2 63 1 Becher Zweitplazierung 2 59 1 Becher Zweitplazierung 2 67 1 Becher Zweitplazierung 2 59 2 Papier Zweitplazierung 2 57 2 Papier Zweitplazierung 2 54 2 Papier Zweitplazierung 2 56 2 Papier Zweitplazierung 2 53 2 Papier Kühlregal 3 59 1 Becher Kühlregal 3 50 1 Becher Kühlregal 3 51 1 Becher Kühlregal 3 48 1 Becher Kühlregal 3 53 1 Becher Kühlregal 3 53 2 Papier Kühlregal 3 47 2 Papier Kühlregal 3 48 2 Papier Kühlregal 3 50 2 Papier Kühlregal 3 51 2 Papier Prof. Dr. Rößler Seite 8
Varianzanalyse 70 60 50 kg 40 30 Becher Papier 20 10 0 Normalreg. Zweitplaz. Kühlreg. Plazierung Becher Papier Normalreg. 43,4 37,4 Zweitplaz. 64,4 55,8 Kühlreg. 52,2 49,8 Prof. Dr. Rößler Seite 9
Varianzanalyse Gesamtstreuung SQT Streuung zwischen den Gruppen SQE Streuung innerhalb der Gruppen SQR Streuung durch Faktor A SQE A Streuung durch Faktor B SQE B Streuung durch Wechselwirkung von A und B SQE AxB Prof. Dr. Rößler Seite 10
Varianzanalyse ANOVA Verarbeitete Fälle (a) Fälle Eingeschlossen Ausgeschlossen Insgesamt N Prozent N Prozent N Prozent 30 100,00% 0 0,00% 30 100,00% (a) ABSATZ /nach PLAZIERU, VERPACKU ANOVA (a,b) Eindeutige Methode Quadratsumme df Mittel der Quadrate F Sig. (Kombiniert) 2185,033 3 728,344 73,446 0 Haupteffekte PLAZIERU 1944,2 2 972,1 98,027 0 VERPACKU 240,833 1 240,833 24,286 0 ABSATZ 2-Weg-Wechselwirkungen PLAZIERU * VERPACKU 48,467 2 24,233 2,444 0,108 Modell 2233,5 5 446,7 45,045 0 Residuen 238 24 9,917 Insgesamt 2471,5 29 85,224 (a) ABSATZ /nach PLAZIERU, VERPACKU (b) Alle Effekte gleichzeitig eingegeben Prof. Dr. Rößler Seite 11
Varianzanalyse Multiple Klassifikationsanalyse (MCA) (a) Vorhergesagtes Mittel Abweichung N Nicht angepaßt Korrigiert nach Faktoren Nicht angepaßt Korrigiert nach Faktoren 1 10 40,400 40,400-10,100-10,100 PLAZIERU 2 10 60,100 60,100 9,600 9,600 ABSATZ 3 10 51,000 51,000 0,500 0,500 1 15 53,333 53,333 2,833 2,833 VERPACKU 2 15 47,667 47,667-2,833-2,833 (a) ABSATZ /nach PLAZIERU, VERPACKU ABSATZ Faktorauswertung (a) (a) ABSATZ /nach PLAZIERU, VERPACKU Beta Eta Korrigiert nach Faktoren PLAZIERU 0,887 0,887 VERPACKU 0,312 0,312 Güte der Anpassung für das Modell R R-Quadrat ABSATZ nach PLAZIERU, VERPACKU 0,94 0,884 Prof. Dr. Rößler Seite 12
Varianzanalyse Gesamtstreuung SQT Streuung zwischen den Gruppen SQb Streuung innerhalb der Gruppen SQR Haupteffekte Interaktionen Streuung durch Faktor A SQE A Streuung durch Wechselwirkung von AxB SQE AxB Streuung durch Faktor B SQE B Streuung durch Wechselwirkung von AxC SQE AxC Streuung durch Faktor C SQE C Streuung durch Wechselwirkung von BxC SQE BxC Streuung durch Wechselwirkung von AxBxC SQE AxBxC Prof. Dr. Rößler Seite 13
t-test Gewicht Maschine 235 1 248 1 265 1 257 1 276 1 245 1 239 1 216 1 263 1 271 1 260 1 235 1 256 2 228 2 225 2 234 2 236 2 260 2 252 2 256 2 271 2 279 2 221 2 250 2 246 2 289 2 255 2 Prof. Dr. Rößler Seite 14
t-test T-Test GEWICHT Gruppenstatistiken MASCHINE N Mittelwert Standardabweichung Standardfehler des Mittelwertes 1 12 250,8333 17,6008 5,0809 2 15 250,5333 19,6718 5,0792 GEWICHT Levene-Test der Varianzgleichheit Test bei unabhängigen Stichproben F Signifikanz T df T-Test für die Mittelwertgleichheit Sig. (2-seitig) Mittlere Differenz Standardfehler der Differenz 95% Konfidenzintervall des Mittelwerts Untere Obere Varianzen sind gleich 0,026 0,874 0,041 25 0,967 0,3 7,2768-14,6869 15,2869 Varianzen sind nicht gleich 0,042 24,638 0,967 0,3 7,1843-14,5074 15,1074 Prof. Dr. Rößler Seite 15
Diskriminanzanalyse Marke Streichfähigkeit Haltbarkeit 1 2 3 1 3 4 1 6 5 1 4 4 1 3 2 1 4 7 1 3 5 1 2 4 1 5 6 1 3 6 1 3 3 1 4 5 2 5 4 2 4 3 2 7 5 2 3 3 2 4 4 2 5 2 2 4 2 2 5 5 2 6 7 2 5 3 2 6 4 2 6 6 Prof. Dr. Rößler Seite 16
Diskriminanzanalyse 8 7 Marke A Marke B Haltbarkeit 6 5 4 3 2 1 0 0 2 4 6 8 Streichfähigkeit Marke 6 5 Marke A Marke B Häufigkeit 4 3 2 1 0 2 3 4 5 6 7 Streichfähigkeit Marke 3,5 3 Marke A Marke B 2,5 Häufigkeit 2 1,5 1 0,5 0 2 3 4 5 6 7 Haltbarkeit Prof. Dr. Rößler Seite 17
Diskriminanzanalyse Zusammenfassung der kanonischen Diskriminanzfunktionen Eigenwerte Funktion Eigenwert % der Kumulierte Kanonische Varianz % Korrelation 1,912 (a) 100 100 0,691 (a) Die ersten 1 kanonischen Diskriminanzfunktionen werden in dieser Analyse verwendet. Wilks' Lambda Test der Funktion(en) Wilks-Lambda Chi-Quadrat df Signifikanz 1 0,523 13,614 2 0,001 Standardisierte kanonische Diskriminanzfunktionskoeffizienten Funktion 1 HALTBAR -0,843 STREICHF 1,184 Struktur-Matrix Funktion STREICHF 0,714 HALTBAR -0,183 Gemeinsame Korrelationen innerhalb der Gruppen zwischen Diskriminanzvariablen und standardisierten kanonischen Diskriminanzfunktionen Variablen sind nach ihrer absoluten Korrelationsgröße innerhalb der Funktion geordnet. 1 Kanonische Diskriminanzfunktionskoeffizienten Funktion 1 HALTBAR -0,565 STREICHF 1,031 (Konstant) -1,982 Nicht-standardisierte Koeffizienten Funktionen bei den Gruppen-Zentroiden Funktion MARKE 1 1-0,914 2 0,914 Nicht-standardisierte kanonische Diskriminanzfunktionen, die bezüglich des Gruppen-Mittelwertes bewertet werden Prof. Dr. Rößler Seite 18
Fallweise Statistiken Höchste Gruppe P(D>d G=g) Tatsächliche Gruppe Vorhergesagte P(G=g D=d) Fallnummer Gruppe p df Quadrierter Mahalanobis- Abstand zum Zentroid Zweithöchste Gruppe Gruppe P(G=g D=d) Diskriminanzanalyse Quadrierter Mahalanobis- Abstand zum Zentroid Diskriminanzwerte Funktion 1 1 1 1 0,484 1 0,95 0,49 2 0,05 6,394-1,614 2 1 1 0,816 1 0,891 0,054 2 0,109 4,252-1,148 3 1 2(**) 0,641 1 0,926 0,218 1 0,074 5,269 1,381 4 1 1 0,425 1 0,553 0,637 2 0,447 1,063-0,117 5 1 1 0,37 1 0,508 0,803 2 0,492 0,87-0,018 6 1 1 0,37 1 0,965 0,803 2 0,035 7,425-1,81 7 1 1 0,425 1 0,958 0,637 2 0,042 6,9-1,712 8 1 1 0,206 1 0,982 1,598 2 0,018 9,568-2,179 9 1 1 0,484 1 0,597 0,49 2 0,403 1,275-0,215 10 1 1 0,173 1 0,985 1,856 2 0,015 10,185-2,277 11 1 1 0,74 1 0,744 0,11 2 0,256 2,242-0,583 12 1 1 0,816 1 0,777 0,054 2 0,223 2,546-0,681 Original 13 2 2 1 1 0,842 0 1 0,158 3,345 0,914 14 2 2 0,641 1 0,694 0,218 1 0,306 1,856 0,448 15 2 2 0,134 1 0,988 2,242 1 0,012 11,065 2,412 16 2 1(**) 0,74 1 0,744 0,11 2 0,256 2,242-0,583 17 2 1(**) 0,425 1 0,553 0,637 2 0,447 1,063-0,117 18 2 2 0,259 1 0,977 1,275 1 0,023 8,751 2,044 19 2 2 0,922 1 0,864 0,01 1 0,136 3,714 1,013 20 2 2 0,572 1 0,655 0,319 1 0,345 1,598 0,35 21 2 2 0,507 1 0,613 0,439 1 0,387 1,36 0,252 22 2 2 0,572 1 0,937 0,319 1 0,063 5,729 1,479 23 2 2 0,303 1 0,972 1,063 1 0,028 8,179 1,946 24 2 2 0,922 1 0,817 0,01 1 0,183 2,995 0,816 ** Falsch klassifizierter Fall Prof. Dr. Rößler Seite 19
Diskriminanzanalyse Diskriminanzachse Marke A Marke B -3-2,5-2 -1,5-1 -0,5 0 0,5 1 1,5 2 2,5 3 Prof. Dr. Rößler Seite 20
Diskriminanzanalyse Klassifizierungsstatistiken Original Anzahl % Klassifizierungsergebnisse (a) (a) 87,5% der ursprünglich gruppierten Fälle wurden korrekt klassifiziert. Vorhergesagte Gruppenzugehörigkeit MARKE 1 2 Gesamt 1 11 1 12 2 2 10 12 1 91,7 8,3 100 2 16,7 83,3 100 Zusammenfassung der Verarbeitung von Klassifizierungen Verarbeitet 24 Ausgeschlossen Fehlende oder außerhalb des Bereichs liegende Gruppencodes 0 Wenigstens eine Diskriminanzvariable fehlt 0 In der Ausgabe verwendet 24 A-priori-Wahrscheinlichkeiten der Gruppen In der Analyse A-priori verwendete Fälle MARKE Ungewichtet Gewichtet 1 0,5 12 12 2 0,5 12 12 Gesamt 1 24 24 Klassifizierungsfunktionskoeffizienten MARKE 1 2 STREICHF 1,729 3,614 HALTBAR 1,28 0,247 (Konstant) -6,597-10,223 Lineare Diskriminanzfunktionen nach Fisher Prof. Dr. Rößler Seite 21
Diskriminanzanalyse Univariate Analyse der Streichfähigkeit Eigenwerte Funktion Eigenwert % der Varianz Kumulierte % Kanonische Korrelation 1 0,466 (a) 100 100 0,564 (a) Die ersten 1 kanonischen Diskriminanzfunktionen werden in dieser Analyse verwendet. Wilks' Lambda Test der Funktion(en) Wilks-Lambda Chi-Quadrat df Signifikanz 1 0,682 8,217 1 0,004 Univariate Analyse der Haltbarkeit Eigenwerte Funktion Eigenwert % der Varianz Kumulierte % Kanonische Korrelation 1 0,031 (a) 100 100 0,172 (a) Die ersten 1 kanonischen Diskriminanzfunktionen werden in dieser Analyse verwendet. Wilks' Lambda Test der Funktion(en) Wilks-Lambda Chi-Quadrat df Signifikanz 1 0,97 0,648 1 0,421 Gruppenstatistik Gültige Werte (listenweise) Standard- Mittelwert MARKE abweichung Ungewichtet Gewichtet 1 2 Gesamt STREICHF 3,5 1,1677 12 12 HALTBAR 4,5 1,446 12 12 STREICHF 5 1,1282 12 12 HALTBAR 4 1,5374 12 12 STREICHF 4,25 1,3593 24 24 HALTBAR 4,25 1,4818 24 24 Gleichheitstest der Gruppenmittelwerte Wilks-Lambda F df1 df2 Signifikanz STREICHF 0,682 10,241 1 22 0,004 HALTBAR 0,97 0,673 1 22 0,421 Prof. Dr. Rößler Seite 22
Faktorenanalyse Marke Anteil ungesättigter Fettsäuren Kaloriengehalt Vitamingehalt Haltbarkeit Preis Rama 1 1 2 1 2 Sanella 2 6 3 3 4 Becel 4 5 4 4 5 Du darfst 5 6 6 2 3 Holl. Butter 2 3 3 5 7 Weihnachtsbutter 3 4 4 6 7 FETTSÄUR HALTBARK KALORIEN MARKE weihnach PREIS s anella rama holl. bu VITAMING du darfs becel Prof. Dr. Rößler Seite 23
Faktorenanalyse Marke 2 Du darfst 1,5 Faktor1 1 0,5 0 Becel Weihnachtsbutter -0,5 Sanella Holl. Butter -1 Rama -1,5-1,5-1 -0,5 0 0,5 1 1,5 Faktor2 Marke fac1_1 fac2_1 Rama -1,21136-1,25027 Sanella -0,48288-0,26891 Becel 0,5705 0,19027 Du darfst 1,56374-0,88742 Holl. Butter -0,63529 0,94719 Weihnachtsbutter 0,1953 1,26914 Prof. Dr. Rößler Seite 24
Faktorenanalyse Korrelation Korrelationsmatrix (a) FETTSÄUR KALORIEN VITAMING HALTBARK PREIS FETTSÄUR 1 0,712 0,961 0,109 0,044 KALORIEN 0,712 1 0,704 0,138 0,067 VITAMING 0,961 0,704 1 0,078 0,024 HALTBARK 0,109 0,138 0,078 1 0,983 PREIS 0,044 0,067 0,024 0,983 1 FETTSÄUR 0,056 0,001 0,419 0,467 KALORIEN 0,056 0,059 0,397 0,45 Signifikanz VITAMING 0,001 0,059 0,441 0,482 (1-seitig) HALTBARK 0,419 0,397 0,441 0 PREIS 0,467 0,45 0,482 0 (a) Determinante = 9,603E-04 KMO- und Bartlett-Test Maß der Stichprobeneignung nach Kaiser-Meyer-Olkin. 0,576 Bartlett-Test auf Sphärizität Ungefähres Chi-Quadrat 17,371 df 10 Signifikanz nach Bartlett 0,067 Anti-Image-Matrizen FETTSÄUR KALORIEN VITAMING HALTBARK PREIS FETTSÄUR,597 (a) -0,108-0,926-0,237 0,223 Anti-Image- Korrelation KALORIEN -0,108,878 (a) -0,15-0,239 0,227 VITAMING -0,926-0,15,598 (a) 0,207-0,193 HALTBARK -0,237-0,239 0,207,471 (a) -0,986 PREIS 0,223 0,227-0,193-0,986,467 (a) (a) Maß der Stichprobeneignung Prof. Dr. Rößler Seite 25
Faktorenanalyse Berechnung von partiellen Korrelationskoeffizienten der Anti-Image-Korrelationsmatrix Führt man eine lineare Regressionsanalyse durch mit der abhängigen Variablen ungesättigte Fettsäuren und den 3 unabhängigen Variablen Vitamine, Haltbarkeit und Preis, so erhält man das Bestimmtheitsmaß Modellzusammenfassung Korrigiertes Standardfehler Modell R R-Quadrat R-Quadrat des Schätzers 1 0,964 (a) 0,9302172 0,826 0,6148 (a) Einflußvariablen : (Konstante), VITAMING, PREIS, HALTBARK Fügt man jetzt die Variable Kalorien als weitere unabhängige Variable hinzu, so daß die Regressionsanalyse für die abhängige Variable ungesättigte Fettsäuren und die 4 unabhängigen Variablen Vitamine, Haltbarkeit, Preis und Kalorien durchgeführt wird, so ergibt sich das Bestimmtheitsmaß Modellzusammenfassung Korrigiertes Standardfehler Modell R R-Quadrat R-Quadrat des Schätzers 1,965 (a) 0,9310302 0,655 0,8644 (a) Einflußvariablen : (Konstante), KALORIEN, PREIS, VITAMING, HALTBARK Aus diesen beiden Bestimmtheitsmaßen berechnet sich das partielle Bestimmtheitsmaß der Variablen ungesättigte Fettsäuren und Kalorien als Quotient (0,9310302-0,9302172)/(1-0,9302172)=0,0116504 D.h.: 1,17% der durch die 3 Variablen Vitamine, Haltbarkeit und Preis nicht erklärten Varianz der ungesättigten Fettsäuren wird durch Hinzunahme der Variablen Kalorien erklärt. Zieht man die Wurzel, so erhält man den partiellen Korrelationskoeffizienten der Variablen ungesättigte Fettsäuren und Kalorien 0,10794 In der Anti-Image-Korrelationsmatrix werden nicht die partiellen Korrelationskoeffizienten selbst, sondern ihre negativen Werte ausgewiesen. Prof. Dr. Rößler Seite 26
Kommunalitäten Anfänglich Extraktion FETTSÄUR 0,931 0,968 KALORIEN 0,541 0,526 VITAMING 0,929 0,953 HALTBARK 0,974 0,991 PREIS 0,973 0,981 Extraktionsmethode: Hauptachsen- Faktorenanalyse. Faktorenanalyse Erklärte Gesamtvarianz Anfängliche Eigenwerte Summen von quadrierten Faktorladungen Rotierte Summe der quadrierten Ladungen für Extraktion Faktor Gesamt % der Kumulierte % der Kumulierte % der Kumulierte Gesamt Gesamt Varianz % Varianz % Varianz % 1 2,645 52,903 52,903 2,507 50,138 50,138 2,447 48,946 48,946 2 1,934 38,678 91,581 1,911 38,225 88,363 1,971 39,417 88,363 3 0,369 7,374 98,955 4 3,930E-02 0,786 99,741 5 1,296E-02 0,259 100 Extraktionsmethode: Hauptachsen-Faktorenanalyse. Faktorenmatrix (a) Faktor 1 2 FETTSÄUR 0,943-0,28 KALORIEN 0,707-0,162 VITAMING 0,928-0,302 HALTBARK 0,389 0,916 PREIS 0,323 0,936 Extraktionsmethode: Hauptachsen- Faktorenanalyse. (a) 2 Faktoren extrahiert. Es werden 7 Iterationen benötigt. Prof. Dr. Rößler Seite 27
Faktorenanalyse Reproduzierte Korrelation Residuum (a) Reproduzierte Korrelationen FETTSÄUR KALORIEN VITAMING HALTBARK PREIS FETTSÄUR 0,968 (b) 0,712 0,96 0,11 4,241E-02 KALORIEN 0,712 0,526 (b) 0,705 0,127 7,717E-02 VITAMING 0,96 0,705 0,953 (b) 8,461E-02 1,722E-02 HALTBARK 0,11 0,127 8,461E-02 0,991 (b) 0,983 PREIS 4,241E-02 7,717E-02 1,722E-02 0,983 0,981 (b) FETTSÄUR -1,708E-04 1,006E-03-1,412E-03 1,445E-03 KALORIEN -1,708E-04-8,276E-04 1,061E-02-1,065E-02 VITAMING 1,006E-03-8,276E-04-6,363E-03 6,400E-03 HALTBARK -1,412E-03 1,061E-02-6,363E-03 9,539E-05 PREIS 1,445E-03-1,065E-02 6,400E-03 9,539E-05 Extraktionsmethode: Hauptachsen-Faktorenanalyse. (a) Residuen werden zwischen beobachteten und reproduzierten Korrelationen berechnet. Es gibt 0 (,0%) nichtredundante Residuen mit Absolutwerten > 0,05. (b) Reproduzierte Kommunalitäten Rotierte Faktorenmatrix (a) Koeffizientenmatrix der Faktorwerte Faktor Faktor 1 2 1 2 FETTSÄUR 0,984 3,229E-02 FETTSÄUR 0,551-0,049 KALORIEN 0,722 7,020E-02 KALORIEN 0,015-0,01 VITAMING 0,976 6,941E-03 VITAMING 0,422 0,001 HALTBARK 7,962E-02 0,992 HALTBARK 0,261 0,673 PREIS 1,060E-02 0,99 Extraktionsmethode: Hauptachsen- Faktorenanalyse. Rotationsmethode: Varimax mit Kaiser- Normalisierung. (a) Die Rotation ist in 3 Iterationen konvergiert. PREIS -0,281 0,331 Extraktionsmethode: Hauptachsen- Faktorenanalyse. Rotationsmethode: Varimax mit Kaiser- Normalisierung. Methode für Faktorwerte: Regression. Faktor-Transformationsmatrix Kovarianzmatrix für Faktorwerte Faktor 1 2 Faktor 1 2 1 0,949 0,316 1 0,983 2,270E-03 2-0,316 0,949 2 2,270E-03 0,993 Extraktionsmethode: Hauptachsen- Extraktionsmethode: Hauptachsen- Faktorenanalyse. Faktorenanalyse. Rotationsmethode: Varimax mit Kaiser- Normalisierung. Rotationsmethode: Varimax mit Kaiser- Normalisierung. Methode für Faktorwerte: Regression. Prof. Dr. Rößler Seite 28
Faktorenanalyse 3,0 Screeplot 2,5 2,0 1,5 1,0 Eigenwert,5 0,0 1 2 3 4 5 Faktornummer Prof. Dr. Rößler Seite 29
Faktorenanalyse 1,0 Faktordiagramm preis haltbark,5 0,0 kalorien vitaming fettsäur -,5 Faktor 2-1,0-1,0 -,5 0,0,5 1,0 Faktor 1 1,0 Faktordiagramm im gedrehten Faktorbereich,5 0,0 kalorien vitaming fettsäur -,5 Faktor 2-1,0-1,0 -,5 0,0,5 1,0 Faktor 1 1,0 Faktordiagramm im gedrehten Faktorbereich,5 0,0 kalorien vitaming fettsäur -,5 Faktor 2-1,0-1,0 -,5 0,0,5 1,0 Faktor 1 Prof. Dr. Rößler Seite 30
Clusteranalyse Lagerzeit mehr als 1 Monat Diätprodukt Nationale Werbung Becherverpackung Pfundgröße Verkaufshilfen Eignung für Sonder- angebote Direktbezug vom Hersteller Handelsspanne mehr als 20% Becel 1 1 1 1 0 0 1 0 0 0 Du darfst 1 1 0 1 0 1 0 1 0 1 Rama 1 0 1 1 1 1 1 1 1 0 Delicado Sahnebutter 0 0 1 1 0 0 1 0 1 0 Holländische Butter 0 0 0 0 0 1 0 0 0 0 Weihnachtsbutter 0 0 0 0 1 0 1 0 0 1 Homa 1 0 0 1 1 1 0 1 0 1 Flora 1 1 1 1 1 0 1 0 1 0 SB 1 1 0 1 1 1 0 0 1 0 Sanella 1 0 1 1 1 0 1 1 1 0 Botteram 0 0 1 1 1 1 0 0 0 1 Beanstandungen im letzten Jahr Prof. Dr. Rößler Seite 31
Clusteranalyse Fall 1:Becel 2:Du darfst 3:Rama 4:Delicado Sahnebutter Näherungsmatrix Ähnlichkeitsmaß nach Jaccard 5:Holländ. Butter 6:Weihnachtsbutter 7:Homa 8:Flora 9:SB 10:Sanella 11:Botteram 1:Becel 0,375 0,444 0,5 0 0,143 0,222 0,714 0,375 0,5 0,25 2:Du darfst 0,375 0,4 0,111 0,167 0,125 0,714 0,3 0,5 0,3 0,375 3:Rama 0,444 0,4 0,5 0,125 0,222 0,556 0,667 0,556 0,875 0,444 4:Delicado Sahnebutter 0,5 0,111 0,5 0 0,167 0,111 0,571 0,25 0,571 0,286 5:Holländische Butter 0 0,167 0,125 0 0 0,167 0 0,167 0 0,2 6:Weihnachtsbutter 0,143 0,125 0,222 0,167 0 0,286 0,25 0,125 0,25 0,333 7:Homa 0,222 0,714 0,556 0,111 0,167 0,286 0,3 0,5 0,444 0,571 8:Flora 0,714 0,3 0,667 0,571 0 0,25 0,3 0,625 0,75 0,333 9:SB 0,375 0,5 0,556 0,25 0,167 0,125 0,5 0,625 0,444 0,375 10:Sanella 0,5 0,3 0,875 0,571 0 0,25 0,444 0,75 0,444 0,333 11:Botteram 0,25 0,375 0,444 0,286 0,2 0,333 0,571 0,333 0,375 0,333 Dies ist eine Ähnlichkeitsmatrix Prof. Dr. Rößler Seite 32
Clusteranalyse Fall 1:Becel 2:Du darfst 3:Rama 4:Delicado Sahnebutter Näherungsmatrix Ähnlichkeitsmaß nach Russell und Rao 5:Holländ. Butter 6:Weihnachtsbutter 7:Homa 8:Flora 9:SB 10:Sanella 11:Botteram 1:Becel 0,3 0,4 0,3 0 0,1 0,2 0,5 0,3 0,4 0,2 2:Du darfst 0,3 0,4 0,1 0,1 0,1 0,5 0,3 0,4 0,3 0,3 3:Rama 0,4 0,4 0,4 0,1 0,2 0,5 0,6 0,5 0,7 0,4 4:Delicado Sahnebutter 0,3 0,1 0,4 0 0,1 0,1 0,4 0,2 0,4 0,2 5:Holländische Butter 0 0,1 0,1 0 0 0,1 0 0,1 0 0,1 6:Weihnachtsbutter 0,1 0,1 0,2 0,1 0 0,2 0,2 0,1 0,2 0,2 7:Homa 0,2 0,5 0,5 0,1 0,1 0,2 0,3 0,4 0,4 0,4 8:Flora 0,5 0,3 0,6 0,4 0 0,2 0,3 0,5 0,6 0,3 9:SB 0,3 0,4 0,5 0,2 0,1 0,1 0,4 0,5 0,4 0,3 10:Sanella 0,4 0,3 0,7 0,4 0 0,2 0,4 0,6 0,4 0,3 11:Botteram 0,2 0,3 0,4 0,2 0,1 0,2 0,4 0,3 0,3 0,3 Dies ist eine Ähnlichkeitsmatrix Prof. Dr. Rößler Seite 33
Clusteranalyse Fall 1:Becel 2:Du darfst 3:Rama Näherungsmatrix Ähnlichkeitsmaß der einfachen Übereinstimmung 4:Delicado Sahnebutter 5:Holländ. Butter 6:Weihnachtsbutter 7:Homa 8:Flora 9:SB 10:Sanella 11:Botteram 1:Becel 0,5 0,5 0,7 0,4 0,4 0,3 0,8 0,5 0,6 0,4 2:Du darfst 0,5 0,4 0,2 0,5 0,3 0,8 0,3 0,6 0,3 0,5 3:Rama 0,5 0,4 0,6 0,3 0,3 0,6 0,7 0,6 0,9 0,5 4:Delicado Sahnebutter 0,7 0,2 0,6 0,5 0,5 0,2 0,7 0,4 0,7 0,5 5:Holländische Butter 0,4 0,5 0,3 0,5 0,6 0,5 0,2 0,5 0,2 0,6 6:Weihnachtsbutter 0,4 0,3 0,3 0,5 0,6 0,5 0,4 0,3 0,4 0,6 7:Homa 0,3 0,8 0,6 0,2 0,5 0,5 0,3 0,6 0,5 0,7 8:Flora 0,8 0,3 0,7 0,7 0,2 0,4 0,3 0,7 0,8 0,4 9:SB 0,5 0,6 0,6 0,4 0,5 0,3 0,6 0,7 0,5 0,5 10:Sanella 0,6 0,3 0,9 0,7 0,2 0,4 0,5 0,8 0,5 0,4 11:Botteram 0,4 0,5 0,5 0,5 0,6 0,6 0,7 0,4 0,5 0,4 Dies ist eine Ähnlichkeitsmatrix Prof. Dr. Rößler Seite 34
Clusteranalyse Start Berechnung der Ausgangsdistanzmatrix Suche nach den beiden Objekten/Clustern mit der geringsten Distanz Zusammenfassung der ähnlichsten Objekte/Cluster zu einer Gruppe Berechnung neuer Abstände und Veränderung der Distanzmatrix Alle Untersuchungsobjekte nein in einer Gruppe ja Ende Prof. Dr. Rößler Seite 35
Clusteranalyse Kaloriengehalt Preis Vitamingehalt Rama 1 2 1 Homa 2 3 3 Flora 3 2 1 SB 5 4 7 Weihnachtsbutter 6 7 6 Prof. Dr. Rößler Seite 36
Clusteranalyse Verarbeitete Fälle (a) Fälle Gültig Fehlend Gesamt N Prozent N Prozent N Prozent 5 83,3 1 16,7 6 100 (a) Linkage zwischen den Gruppen Näherungsmatrix City-Block-Distanzmaß 1:Rama 2:Homa 3:Flora 4:SB 5:Weih- Fall nach 1:Rama 4 2 12 15 2:Homa 4 4 8 11 3:Flora 2 4 10 13 4:SB 12 8 10 5 5:Weihnach 15 11 13 5 Dies ist eine Unähnlichkeitsmatrix Zuordnungsübersicht für Linkage zwischen den Gruppen Zusammen- Erstes Nächgeführte Cluster Koeffizi Vorkommen des ster Cluster Cluster enten Cluster Cluster Schritt Schritt 1 2 1 2 1 1 3 2 0 0 2 2 1 2 4 1 0 4 3 4 5 5 0 0 4 4 1 4 11,5 2 3 0 Vertikales Eiszapfendiagramm Fall Anzahl der Cluster 5:Weihnach 4:SB 2:Homa 3:Flora 1:Rama 1 X X X X X X X X X 2 X X X X X X X X 3 X X X X X X X 4 X X X X X X Dendrogramm * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ Rama 1 -+---------+ Flora 3 -+ +-------------------------------------+ Homa 2 -----------+ I SB 4 ---------------+---------------------------------+ Weihnach 5 ---------------+ Prof. Dr. Rößler Seite 37
Clusteranalyse Verarbeitete Fälle (a) Fälle Gültig Fehlend Gesamt N Prozent N Prozent N Prozent (a) Einfach-Linkage 5 83,3 1 16,7 6 100 Näherungsmatrix Quadriertes euklidisches Distanzmaß 1:Rama 2:Homa 3:Flora 4:SB 5:Weih- Fall nach 1:Rama 6 4 56 75 2:Homa 6 6 26 41 3:Flora 4 6 44 59 4:SB 56 26 44 11 5:Weihnach 75 41 59 11 Dies ist eine Unähnlichkeitsmatrix Zuordnungsübersicht für Einfach-Linkage Zusammenge- Erstes Nächführte Cluster Koeffizi Vorkommen des ster Cluster Cluster enten Cluster Cluster Schritt Schritt 1 2 1 2 1 1 3 4 0 0 2 2 1 2 6 1 0 4 3 4 5 11 0 0 4 4 1 4 26 2 3 0 Vertikales Eiszapfendiagramm Fall Anzahl der Cluster 5:Weihnach 4:SB 2:Homa 3:Flora 1:Rama 1 X X X X X X X X X 2 X X X X X X X X 3 X X X X X X X 4 X X X X X X Dendrogramm * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * Dendrogram using Single Linkage Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ Rama 1 -+---+ Flora 3 -+ +-------------------------------------------+ Homa 2 -----+ I SB 4 ---------------+---------------------------------+ Weihnach 5 ---------------+ Prof. Dr. Rößler Seite 38
Clusteranalyse Näherungsmatrix Korrelation zwischen Wertevektoren Fall 1:Rama 2:Homa 3:Flora 4:SB 5:Weihnach 1:Rama 0,5 0-0,756 1 2:Homa 0,5-0,866 0,189 0,5 3:Flora 0-0,866-0,655 0 4:SB -0,756 0,189-0,655-0,756 5:Weihnach 1 0,5 0-0,756 Dies ist eine Ähnlichkeitsmatrix Prof. Dr. Rößler Seite 39
Clusteranalyse Verarbeitete Fälle (a) Fälle Gültig Fehlend Gesamt N Prozent N Prozent N Prozent (a) Gesamt-Linkage 5 83,3 1 16,7 6 100 Näherungsmatrix Quadriertes euklidisches Distanzmaß 1:Rama 2:Homa 3:Flora 4:SB 5:Weih- Fall nach 1:Rama 6 4 56 75 2:Homa 6 6 26 41 3:Flora 4 6 44 59 4:SB 56 26 44 11 5:Weihnach 75 41 59 11 Dies ist eine Unähnlichkeitsmatrix Zuordnungsübersicht für Gesamt-Linkage Zusammen- Erstes Nächgeführte Cluster Koeffizi Vorkommen des ster Cluster Cluster enten Cluster Cluster Schritt Schritt 1 2 1 2 1 1 3 4 0 0 2 2 1 2 6 1 0 4 3 4 5 11 0 0 4 4 1 4 75 2 3 0 Vertikales Eiszapfendiagramm Fall Anzahl der Cluster 5:Weihnach 4:SB 2:Homa 3:Flora 1:Rama 1 X X X X X X X X X 2 X X X X X X X X 3 X X X X X X X 4 X X X X X X Dendrogramm * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * Dendrogram using Complete Linkage Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ Rama 1 -+ Flora 3 -+-----------------------------------------------+ Homa 2 -+ I SB 4 -----+-------------------------------------------+ Weihnach 5 -----+ Prof. Dr. Rößler Seite 40
Clusteranalyse Verarbeitete Fälle (a) Fälle Gültig Fehlend Gesamt N Prozent N Prozent N Prozent (a) Ward-Linkage 5 83,3 1 16,7 6 100 Näherungsmatrix Quadriertes euklidisches Distanzmaß 1:Rama 2:Homa 3:Flora 4:SB 5:Weih- Fall nach 1:Rama 6 4 56 75 2:Homa 6 6 26 41 3:Flora 4 6 44 59 4:SB 56 26 44 11 5:Weihnach 75 41 59 11 Dies ist eine Unähnlichkeitsmatrix Zuordnungsübersicht für Ward-Linkage Zusammenge- Erstes Nächführte Cluster Koeffizi Vorkommen des ster Cluster Cluster enten Cluster Cluster Schritt Schritt 1 2 1 2 1 1 3 2 0 0 2 2 1 2 5,333 1 0 4 3 4 5 10,833 0 0 4 4 1 4 65,6 2 3 0 Vertikales Eiszapfendiagramm Fall Anzahl der 5:Weih- Cluster nach 4:SB 2:Homa 3:Flora 1:Rama 1 X X X X X X X X X 2 X X X X X X X X 3 X X X X X X X 4 X X X X X X Dendrogramm * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * Dendrogram using Ward Method Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ Rama 1 -+ Flora 3 -+-----------------------------------------------+ Homa 2 -+ I SB 4 ---+---------------------------------------------+ Weihnach 5 ---+ Prof. Dr. Rößler Seite 41