Klaus Backhaus Bernd Erichson Wulff Plinke Rolf Weiber Multivariate Analysemethoden Eine anwendungsorientierte Einführung Elfte, überarbeitete Auflage mit 559 Abbildungen und 6 Tabellen Springer
Zur Verwendung dieses Buches 1 1 Regressionsanalyse 45 2 Varianzanalyse 119 3 Diskriminanzanalyse 155 4 Kreuztabeilierung und Kontingenzanalyse 229 5 Faktorenanalyse 259 6 Strukturgleichungsmodelle 337 7 Logistische Regression 425 8 Clusteranalyse 489 9 Conjoint-Measurement 557 10 Multidimensionale Skalierung 619 11 Korrespondenzanalyse 685 12 Neuronale Netze 749 Tabellenanhang 807 Stichwortverzeichnis 823 Bestellschein für Daten und Abbildungsvorlagen 831 Ein ausführliches Inhaltsverzeichnis steht zu Beginn eines jeden Kapitels.
Zur Verwendung dieses Buches 1 Zielsetzung des Buches 2 2 Daten und Skalen 4 3 Einteilung multivariater Analysemethoden 7 3.1 Strukturen-prüfcnde Verfahren 8 3.2 Strukturen-entdeckende Verfahren 12 3.3 Zusammenfassende Betrachtung 15 4 Zur Verwendung von SPSS 15 4.1 Die Daten 16 4.1.1 Der Daten-Editor 18 4.1.2 Erstellung einerneuen Datendatei 19 4.2 Einfache Statistiken und Grafiken 24 4.3 Die Kommandosprache 31 4.3.1 Aufbau einer Syntaxdatei 31 4.3.2 Syntax der Kommandos 32 4.3.3 Kommandos zur Datendefinition 34 4.3.4 Prozedurkommandos 35 4.3.5 Hilfskommandos 35 4.3.6 Erstellen, Öffnen und Speichern einer Syntaxdatei 36 4.3.7 Ausführen der Synlaxdatei 40 4.4 Die Systeme von SPSS 41 5 Literaturhinweise 43
1 Regressionsanalyse 1.1 Problemstellung 46 1.2 Vorgehensweise 51 1.2.1 Modcllformulierung 52 1.2.2 Die Schätzung der Regressionsfunktion 53 1.2.2.1 Einfache Regression 53 1.2.2.2 Multiple Regression 60 1.2.3 Prüfung der Regressionsfunktion 63 1.2.3.1 Bestimmtheitsmaß 64 1.2.3.2 F-Statistik 68 1.2.3.3 Standardfehler der Schätzung 73 1.2.4 Prüfung der Regressionskoeffizienten 73 1.2.4.1 1-Test des Regressionskoeffizienten 73 1.2.4.2 Konfidenzintervall des Regressionskoeffizienten 77 1.2.5 Prüfung der Modellprämissen 78 1.2.5.1 Nichtlincarität 80 1.2.5.2 Erwartungswert der Störgröße ungleich Null 83 1.2.5.3 Falsche Auswahl der Regressoren 84 1.2.5.4 Hetcroskedastizität 85 1.2.5.5 Autokorrelation 88 1.2.5.6 Multikolünearität 89 1.2.5.7 Nicht-Normalvcrteilung der Störgrößen 92 1.3 Failbcispiel 94 1.3.1 Blockweise Regressionsanalyse 94 1.3.2 Schrittweise Regressionsanalyse 105 1.3.3 SPSS-Kommandos 111 1.4 Anwcndungsempfehlungen 113 1.5 Mathematischer Anhang 114 1.6 Literaturhinweise 1L7
2 Varianzanalyse 2.1 Problemstellung 120 2.2 Vorgehensweise 122 2.2.1 Einfaktorielle Varianzanalyse 122 2.2.1.1 Problemformulierung 122 2.2.1.2 Analyse der Abweichungsquadrate 124 2.2.1.3 Prüfung der statistischen Unabhängigkeit...' 128 2.2.2 Zweifaktoriefle Varianzanalyse 130 2.2.2.1 Problemformulierung 130 2.2.2.2 Analyse der Abweichungsquadrate 132 2.2.2.3 Prüfung der statistischen Unabhängigkeit 139 2.2.3 Ausgewählte Erweiterungen der Varianzanalyse 140 2.3 Fallbeispiel 143 2.3.1 Problemstellung 143 2.3.2 Ergebnisse 146 2.3.3 SPSS-Kommandos 149 2.4 Anwendungserapfehlungen 150 2.5 Literaturhinweise 153
3 Diskriminanzanalyse 3.1 Problemstellung 156 3.2 Vorgehensweise 159 3.2.1 Definition der Gruppen 160 3.2.2 Formulierung der Diskriminanzfünktion 161 3.2.3 Schätzung der Diskriminanzfünktion 164 3.2.3.1 Das Diskriminanzkriterium 164 3.2.3.2 Rechenbeispiel 167 3.2.3.3 Geometrische Ableitung 173 3.2.3.4 Normierung der Diskriminanzfünktion 176 3.2.3.5 Vergleich mit der Regressionsanalyse 177 3.2.3.6 Mehrfache Diskriminanzfunktionen 177 3.2.4. Prüfung der Diskrimmanzfunktion 179 3.2.4.1 Prüfung der Klassifikation 179 3.2.4.2 Prüfung des Diskriminanzkriteriums 181 3.2.5 Prüfung der Merkmalsvariablen 185 3.2.6 Klassifikation neuer Elemente 188 3.2.6.1 Klassifizierungsfunktionen 189 3.2.6.2 Das Distanzkonzept 191 3.2.6.3 Das Wahrscheinlichkeitskonzept 192 3.2.6.4 Berechnung der Klassifizierungswahrscheinlichkeiten 195 3.2.6.5 Überprüfung der Klassifizierung 197 3.3 Fallbeispiel 199 3.3.1 Problemstellung 199 3.3.2 Ergebnisse 201 3.3.3 Schrittweise Diskriminanzanalyse 216 3.3.4 SPSS-Kommandos 216 3.4 Anwendungsempfehlungen 21 8 3.5 Mathematischer Anhang 219 3.6 Literaturhinweise 227
4 Kreuztabellierung und Kontingenzanalyse 4.1 Problemstellung 230 4.2 Vorgehensweise 234 4.2.1 Erstellung der Kreuztabelle 235 4.2.2 Ergebnisinterpretation 236 4.2.3 Prüfung der Zusammenhänge 240 4.2.3.1 Prüfung der statistischen Unabhängigkeit 240 4.2.3.2 Prüfung der Stärke des Zusammenhangs 243 4.3 Falibeispiel 247 4.3.1 Problemstellung 247 4.3.2 Ergebnisse 251 4.3.3 SPSS-Kommandos 255 4.4 Anwendungsempfehlungen 256 4.5 Literaturhinweise 258
Faktorenanalyse 5.1 Problemstellung 260 5.2 Vorgehensweise 269 5.2.1 Variablenauswahl und Errechnung der Korrelationsmatrix 269 5.2.1.1 Korrelationsanalyse zur Aufdeckung der Variablenzusammenhänge 269 5.2.1.2 Eignung der Korrelationsmatrix 272 5.2.2 Extraktion der Faktoren 277 5.2.2.1 Das Fundamentaltheorem 278 5.2.2.2 Graphische Interpretation von Faktoren 279 5.2.2.3 Das Problem der Faktorextraktion 284 5.2.3 Bestimmung der Kommunalitäten 289 5.2.4 Zahl der Faktoren 295 5.2.5 Faktorinterpretation 298 5.2.6 Bestimmung der Faktorwerte 302 5.2.7 Zusammenfassende Darstellung der Faktorenanalyse 305 5.3 Fallbeispiel 308 5.3.1 Problemstellung 308 5.3.2 Ergebnisse 310 5.3.3 SPSS-Kommandos 324 5.4 Anwendungsempfehlungen 325 5.4.1 Probleme bei der Anwendung der Faktorenanalyse 325 5.4.1.1 Unvollständig beantwortete Fragebögen: Das Missing Value-Problem 325 5.4.1.2 Starke Streuung der Antworten: Das Problem der Durchschnittsbildung 326 5.4.1.3 Entdeckungs- oder Begründungszusammenhang: Exploratorische versus konfirmatorische Faktorenanalyse 330 5.4.2 Empfehlungen zur Durchführung einer Faktorenanalyse 330 5.5 Mathematischer Anhang 332 5.6 Literaturhinweise 336
Strukturgleichungsmodelle 6.1 Problemstellung 338 6.1.1 Grundgedanke von Strukturgleichungsmodellen 338 6.1.2 Grundlegende Zusammenhänge der Kausalanalyse 344 6.1.2. i Begriff der Kausalität: Kovarianz und Korrelation 344 6.1.2.2 Die Überprüfung kausaler Zusammenhänge im Rahmen von SlrukturgteichungsmodeJien mit latenten Variablen 348 6.1.3 Abiaufschritte eines Slrukturgleichungsmodells 355 6.2 Vorgehensweise 358 6.2.! Hypothesenbildung 358 6.2.2 Pfaddiagramm und Modellspezifikation 359 6.2.2.1 Erstellung eines Pfaddiagramms, 359 6.2.2.2 Mathematische Spezifikation der Modellstruktur 362 6.2.2.3 Parameter und Annahmen in Strukturgleichungsmodellen 364 6.2.3 Identifizierbarkeit der Modellstruktur 366 6.2.4 Schätzung der Parameter 368 6.2.4.1 Spektrum iterativer Schätzverfahren 368 6.2.4.2 Berechnung der Parameterschätzer mit Hilfe des modelltheoretischen Mehrgleichungssystems 371 6.2.5 Beurteilung der Schätzergebnisse 376 6.2.5.1 Plausibilitätsbetrachtungen der Schätzungen 376 6.2.5.2 Stafistische Testkriterien zur Prüfung der Zuverlässigkeit der Schätzungen 377 6.2.5.3 Die Beurteilung der Gesamtstruktur 379 6.2.5.4 Die Beurteilung der Teilstrukturen 383 6.2.6 Modifikation der Modellstruktur 384 6.2.6.1 Vereinfachung der Modellstruktur 385 6.2.6.2 Vergrößerung der Modellstruktur 386 6.3 Fallbeispiel 387 6.3.1 Problemstellung 387 6.3.1.1 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und Einlesen der Rohdaten 389 6.3.1.2 Pfaddiagramm für das Fallbeispiel 392
338 Strukturgieichungsmodelle 6.3.1.3 Das Gleichungssystem für das Fallbeispiel 394 6.3.1.4 Festlegung der Parameter für das Fallbeispiel 395 6.3.1.5 Identifizierbarkeit im Fallbeispiel 398 6.3.2 Ergebnisse 39g 6.3.2.1 Auswahl des Schätzverfahrens 398 6.3.2.2 Ergebnisse der Parameterschätzungen 400 6.3.2.3 Indirekte und totale Beeinffussungseffekte 406 6.3.2.4 Beurteilung der Gesamtstruktur 409 6.3.2.5 Beurteilung der Teilstrukturen 410 6.3.2.6 Modifikation der Modellstruktur 41i 6.4 Anwendungsempfehlungen 414 6.4.1 Annahmen und Voraussetzungen von Strukturgleichungsmodellen.414 6.4.2 Empfehlung zur Durchführung von Kausalanalysen mit Strukturgleichungsmodellen 415 6.5 Mathematischer Anhang 417 6.6 Literaturhinweise 421 6.1 Problemstellung 6.1.1 Grundgedanke von Strukturgleichungsmodellen Bei vielen Fragestellungen im praktischen und wissenschaftlichen Bereich geht es darum, kausale Abhängigkeiten zwischen bestimmten Merkmalen (Variablen) zu untersuchen. Werden mit Hilfe eines Datensatzes Kausalitäten überprüft, so wird all gemein von einer Kausalanalyse gesprochen. Im Rahmen der Kausalanalyse ist es von besonderer Wichtigkeit, daß der Anwender vor Anwendung eines statistischen Verfahrens intensive sachlogische Überlegungen über die Beziehungen zwischen den Variablen anstellt. Auf Basis eines theoretisch fundierten Hypothesensystems wird dann mit Hälfe der Kausalanalyse überprüft, ob die theoretisch aufgestellten Beziehungen mit dem empirisch gewonnenen Datenmaterial übereinstimmen. Die Kausalanalyse besitzt damit konfirmatorischen Charakter, d. h. sie ist den hypothesenprüfenden statistischen Verfahren zuzurechnen. Die Besonderheit von Strukturgleichungsmodellen im Rahmen von Kausalanalysen ist nun darin zu sehen, daß mit ihrer Hilfe auch Beziehungen zwischen latenten, d. h. nicht direkt beobachtbaren Variablen überprüft werden können.
7 Logistische Regression 7.1 Problemstellung 426 7.1.1 Grundgedanke der logistischen Regression 426 7.1.2 Fomiulierung des logistischen Regressionsansatzes 428 7.2 Vorgehensweise 433 7.2.1 Modellformulicrung 434 7.2.2 Schätzung der logistischen Regressionsfunktion 436 7.2.3 Interpretation der Regressionskoeffizienten 439 7.2.4 Prüfung des Gesamtmodells 445 7.2.4.1 Gütemaße für den Regressionsansatz 445 7.2.4.2 Ausreißerdiagnostik 457 7.2.5 Prüfung der Merkmalsvariablen 459 7.3 fallbeispiel 461 7.3.1 Problemstellung 461 7.3.2 Ergebnisse 463 7.3.3 SPSS-Kommandos 478 7.4 Anwendungsempfehlungen 480 7.5 Mathematischer Anhang 481 7.6 Literaturhinweise 487
8 Clusteranalyse 8.1 Problemstellung 490 8.2 Vorgehensweise 492 8.2.1 Bestimmung der Ähnlichkeiten 493 8.2.1.1 Ähnlichkeitsermittlung bei binärer Variablenstruktur 494 8.2.1.2 Ähnlichkeitsermittlung mittels Tanimolo-, RR- und M-Koeffizient496 8.2.1.3 Ähnlichkeitsermittlung bei metrischer Variablenstruktur 502 8.2.1.4 Ähnlichkeitsermittlung bei gemischt skalierter Variablenstruktur... 507 8.2.2 Auswahl des Fusionicrungsalgorithmus 510 8.2.2.1 Parlitionierende Verfahren 512 8.2.2.2 Hierarchische Verfahren 514 8.2.2.2.1 Ablauf der agglomerativen Verfahren 514 8.2.2.2.2 Vorgehensweise der Verfahren "Single-Linkage", "Complele-Linkage" und "Ward" 517 8.2.2.3 Fusionierungseigenschaften ausgewählter Clustervcrfahren 527 8.2.3 Bestimmung der Clusterzahl 534 8.3 Fallbeispiel 537 8.3.1 Problemstellung 537 8.3.2 Ergebnisse 538 8.3.3 SPSS-Kommandos 548 8.4 Anwendungsempfehlungen 549 8.4.1 Vorüberlegungen bei der Clusteranalyse 549 8.4.2 Empfehlungen zur Durchführung einer Clusteranalyse 55! 8.5 Literaturhinweise 555
9 Conjoint-Measurement 9.1 Problemstellung 558 9.2 Vorgehensweise 562 9.2,! Eigenschaften und Eigenschaftsausprägungen 562 9.2.2 Erhebungsdesign 564 9.2.2.1 Definition der Stimuli 564 9.2.2.2 Zahl der Stimuli 566 9.2.3 Bewertung der Stimuli 570 9.2.4 Schätzung der Nutzenwerte 571 9.2.4.1 Metrische Lösung 572 9.2.4.2 Nichtmetrische Lösung 574 9.2.4.3 Monotone Regression 577 9.2.4.4 Fehlende Rangdaten 579 9.2.5 Aggregation der Nutzenwerte 580 9.3 Fallbeispiel 583 9.3.1 Problemstellung 583 9.3.2 Ergebnisse 5S9 9.3.2.1 Individuelle Ergebnisse 589 9.3.2.2 Aggregierte Ergebnisse 599 9.3.2.2.1 Aggregation der Individualanalvsen 599 9.3.2.2.2 Gemeinsame Conjoint-Analyse 600 9.3.3 SPSS-Kommandos 601 9.4 Anwendungsempfehkingen 609 9.4.1 Durchführung einer klassischen Conjoinl-Analyse 609 9.4.2 Anwendung alternativer conjointanalytischer Verfahren 610 9.5 Mathematischer Anhang 615 9.6 Literaturhinweise 617
10 Multidimensionale Skalierung 10.1 Problemstellung 620 10.2 Aufbau und Ablauf einer MDS 627 10.2.1 Messung von Ähnlichkeiten 627 10.2.1.1 Die Methode der Rangreihung 627 10.2.1.2 Die Ankerpunktmethode 628 10.2.1.3 Das Ratingverfahren 629 10.2.1.4 Vergleich der Erhebungsverfahren 630 10.2.2 Wahl des Distanzmodells 630 10.2.2.1 Euklidische Metrik 630 10.2.2.2 City-Block-Metrik 632 10.2.2.3 Minkowski-Metrik 633 10.2.3 Ermittlung der Konfiguration 634 10.2.4 Zahl und Interpretation der Dimensionen 645 10.2.5 Aggregation von Personen 647 10.2.6 Fallbeispiel 648 10.3 Einbeziehung von Präferenzurteilen 653 10.3.1 Externe Präferenzanalyse 653 10.3.1.1 Messung von Präferenzen 654 10.3.1.2 Nutzenmodelle 654 10.3.1.3 Rechnerische Durchführung 658 10.3.1.4 Ablauf von PREFMAP 662 10.3.1.5 Fallbeispiel 664 10.3.2 Interne Präferenzanalyse 668 10.4 Einbeziehung von Eigenschaftsurteilen 668 10.5 Anwendungsempfehlungen 670 10.5.1 POLYCON-Kommandos 671 10.5.2 PREFMAP-Kommandos 674 10.5.3 Multidimensionale Skalierung mit SPSS 677 10.6 Literaturhinweise 684
11 Korrespondenzanalyse 11.1 Problemstellung 686 11.1.1 Beispiel 686 11.1.2 Entstehung und Einordnung der Korrespondenzanalyse 688 11.1.3 Anwendungsbereiche der Korrespondenzanalyse 690 11.2 Vorgehensweise 692 11.2.1 Vorbereitende Schritte 693 11.2.1.1 Erstellung einer Kontingenztabelle 693 11.2.1.2 Erstellung von Zeilen- und Spaltenprofilen 695 11.2.1.3 Ermittlung der Streuung in den Daten 699 11.2.2 Standardisierung der Daten 704 11.2.3 Extraktion der Dimensionen 707 11.2.4 "Normalisierung der Koordinaten 710 11.2.4.1 Symmetrische Normalisierung 710 11.2.4.2 Varianten der Normalisierung 715 11.2.5 Interpretation 720 11.3 Fallbcispiel 725 11.3.1 Problemstellung 725 11.3.2 Ergebnisse 728 11.4 Anwendungsemp fehlungen 734 11.5 Mathematischer Anhang 742 11.6 Literaturhinweise 746
Neuronale Netze 12.1 Problemstellung 750 12.1.1 Biologisches Lernen und Lernen in KNN 750 12.1.2 Grundlegende funktionale Zu sammenhänge und Rechenoperationen im KNN 757 12.2 Vorgehensweise 763 12.2.1 Probtemstrukturierung und Netztypauswahl 765 12.2.2 Festlegung der Netztopologie 767 12.2.3 Bestimmung der Informationsverarbeitung in Neuronen 768 12.2.3.1 Auswahl der Propagierungsfunktion 769 12.2.3.2 Auswahl der Aktivierungsfunktion 770 12.2.4 Trainieren des Netzes 775 12.2.4.1 Abbildung des Lernprozesses durch den Backpropagation- Algorithmus 776 12.2.4.2 Problemfelder bei der Anwendung des Backpropagation- Algorithmus 783 12.2.5 Anwendung des trainierten Netzes 784 12.3 Fallbeispiel 785 12.3.1 Problemsteilung 785 12.3.1.1 Modellbildung und Netztypauswahl... 785 12.3.1.2 Festlegung der Netztopologie 791 12.3.1.3 Trainieren des Netzes 794 12.3.2 Ergebnisse 797 12.4 Anwendungsempfehlungen 803 12.5 Literaturhinweise 806
Tabellenanhang Anhang 1: t-tabelle 808 Anhang 2: F-Tabelte 809 Anhang 3: c-tabelle nach Cochran 817 Anhang 4: x2-tabelle 818 Anhang 5: Durbin-Watson-Tabelle 819 Anhang 6: q-werte-tabelle 821 Über die Internet-Adresse www.multivanate.de oder mit der Bestellkarte am Ende dieses Buches kann die Support-CD angefordert werden, die alle Daten- und Programm-Dateien sowie Abbildungsvorlagen enthält.