Empirische Forschungsmethoden: Multivariate Datenanalyse

Größe: px
Ab Seite anzeigen:

Download "Empirische Forschungsmethoden: Multivariate Datenanalyse"

Transkript

1 Vorlesung Empirische Forschungsmethoden: Multivariate Datenanalyse Prof. Dr. Jost Adler Lehrstuhl für Marketing Department of Management & Marketing Universität Duisburg-Essen Umbenennung der Veranstaltungen im Masterprogramm Empirische Forschungsmethoden I (Prof. Schmitz, WS 01/013) wird zu Empirische Forschungsmethoden: Datengewinnung Empirische Forschungsmethoden II (Prof. Adler, SS 013) wird zu Empirische Forschungsmethoden: Multivariate Datenanalyse Univ.-Prof. Dr. Jost Adler 1

2 Klausurstruktur Wahr-Falsch-Fragen (5%) -> 15 Punkte Multiple Choice-Fragen (5%) -> 15 Punkte Text- und Rechenaufgaben (50%) -> 30 Punkte 60 Punkte Univ.-Prof. Dr. Jost Adler 3 SPSS Netzwerk-Lizenz unter Univ.-Prof. Dr. Jost Adler 5

3 Pflichtliteratur Univ.-Prof. Dr. Jost Adler 6 Klausurrelevante Literatur Backhaus, Klaus/Erichson, Bernd/Plinke, Wulff/Weiber, Rolf (011):, 13. Auflage, Berlin u.a (Kapitel 3, 5, 7, 8, 9) Backhaus, Klaus/Erichson, Bernd/Weiber, Rolf (013): Fortgeschrittene,. Aufl. Berlin u.a (Kapitel I.1, I., II.6) Univ.-Prof. Dr. Jost Adler 7 3

4 Ergänzende Literatur Ergänzende Literatur: Aaker, David A./Kumar V./Day, George S. (003): Marketing Research, 7. Auflage, New York 003. Berekoven, Ludwig/Eckert, Werner/Ellenrieder, Peter (004): Marktforschung, 10. Auflage, Wiesbaden 004. Bliemel, Friedhelm/Theobald, Axel (00): Marktforschung im Internet; in: Weiber, Rolf (Hrsg.): Handbuch Electronic Business,. Auflage, Wiesbaden 00. Böhler, Heymo (004): Marktforschung, 3. Auflage, Stuttgart, Berlin, Köln 004. Bühner, Markus (003): Einführung in die Test- und Fragebogenkonstruktion, München 003. Churchill, Gilbert A. Jr./Iacobucci, Dawn (00): Marketing Research, 8. Auflage, Orlando 00 Green, Paul. E./Tull, Donald. S./Albaum, Gerald (1988): Research for Marketing Decisions, 5. Auflage, Englewood Cliffs, N.J., Hair, Joseph F. Jr./Anderson, Rolph E./Tatham, Ronald L./Black, William C. (1998): Multivariate Data Analysis, 5. Auflage, Upper Saddle River, N.J Hammann, P./Erichson, B. (000): Marktforschung, 4. Aufl., Stuttgart 000. Hildebrandt, Lutz (1984): Kausalanalytische Validierung in der Marketingforschung, in: Marketing - ZFP, 6 (1984). Hüttner, Manfred/Schwarting, Ulf (00): Grundzüge der Marktforschung, 7. Auflage, München, Wien Janssens, Wim/Wijnen, Katrien/De Pelsmacker, Patrick/Van Kenhove, Patrick (008): Marketing Research with SPSS, Harlow et al. 008 Malhotra, Naresh K. (003), Marketing Research. An Applied Orientation, Upper Saddle River 003. McDaniel, Carl/Gates, Roger (1999): Contemporary Marketing Research, 4. Auflage, Cincinnati, OH, Meffert, Heribert (199): Marketingforschung und Käuferverhalten,. Auflage, Wiesbaden 199. Schnell, Rainer/Hill, Paul B./Esser, Elke (1999): Methoden der empirischen Sozialforschung, 6. Auflage, München, Wien Zikmund, William G. (000): Exploring Marketing Research, 7. Auflage, Fort Worth 000. Univ.-Prof. Dr. Jost Adler 8 Empirische Forschungsmethoden: Multivariate Datenanalyse 1 Klassifikationsansätze Explorative Verfahren der Datenanalyse (strukturentdeckend).1 Faktorenanalyse. Clusteranalyse.3 Multidimensionale Skalierung 3 Konfirmatorische Verfahren der Datenanalyse (strukturprüfend) 3.1 Nichtlineare Regressionsanalyse 3. Varianzanalyse 3.3 Logistische Regression 3.4 Conjoint Measurement 3.5 Kausalanalyse Univ.-Prof. Dr. Jost Adler 9 4

5 Klassifikation multivariater Analysemethoden nach der zugrundeliegenden Forschungsabsicht Einteilungskriterium strukturbeschreibend Art des Analyseverfahrens deskriptive Datenanalyse Beispiele Mittelwert Streuung Häufigkeiten primär strukturprüfend primär strukturentdeckend konfirmatorische Datenanalyse explorative Datenanalyse Regressionsanalysen Varianzanalyse Diskriminanzanalyse logistische Regression Conjoint-Analyse Kontingenzanalyse Kausalanalyse Faktorenanalyse Clusteranalyse Multidimensionale Skalierung (MDS) Univ.-Prof. Dr. Jost Adler 10 Skalenniveaus und ihre Eigenschaften Skala Merkmal mögliche Rechenoperationen nicht metrische Skalen NOMINAL- SKALA Klassifizierung qualitativer Eigenschaftsausprägungen Bildung von Häufigkeiten ORDINAL- SKALA Rangwert mit Ordinalzahlen Median Quantile metrische Skalen INTERVALL- SKALA Skala mit gleichgroßen Abschnitten ohne natürlichen Nullpunkt Subtraktion Mittelwert VERHÄLTNIS- SKALA Skala mit gleichgroßen Abschnitten und natürlichem Nullpunkt Summe Division Multiplikation Univ.-Prof. Dr. Jost Adler 11 5

6 Empirische Forschungsmethoden: Multivariate Datenanalyse 1 Klassifikationsansätze Explorative Verfahren der Datenanalyse (strukturentdeckend).1 Faktorenanalyse. Clusteranalyse.3 Multidimensionale Skalierung 3 Konfirmatorische Verfahren der Datenanalyse (strukturprüfend) 3.1 Nichtlineare Regressionsanalyse 3. Varianzanalyse 3.3 Logistische Regression 3.4 Conjoint Measurement 3.5 Kausalanalyse Univ.-Prof. Dr. Jost Adler 1 Beispiel: Kundenbindung im Mobilfunk Das Mobilfunkunternehmen M-Talk hat seit einiger Zeit das Problem, dass im Schnitt ca. 30% seiner Kunden ihre Mobilfunkverträge kündigen. Die Geschäftsleitung nimmt dieses Problem sehr ernst und kam in einer ersten Analyse zu dem Ergebnis, dass M-Talk seine Kunden nicht gezielt genug anspricht. Daher wird von Kundenseite auch keine ausreichende Bindung an das Unternehmen aufgebaut. Zur weiteren Analyse dieses Problems und zur Unterbreitung von Lösungsvorschlägen hat die Geschäftsleitung von M-Talk eine Arbeitsgruppe eingerichtet. Diese wird vom Marketingleiter, Herrn Dr. Geyer geleitet. In der konstituierenden Sitzung formulierte Dr. Geyer das Ziel der Arbeitsgruppe wie folgt: "Wir müssen endlich dazu kommen, unsere Kunden in möglichst verschiedene Gruppen einzuteilen, die sich auch wirklich durch ihre Bedürfnisse und ihr Telefonierverhalten unterscheiden. Unsere bisherige umsatzbezogene Einteilung nach ABC-Kunden ist nicht länger tragfähig. Diese Gruppen zu identifizieren, wird die erste Aufgabe von uns sein. Anschließend wird eine zweite Aufgabe darin bestehen, mit den uns vorliegenden Kundendaten, einzelne Personen diesen Gruppen auch zuordnen zu können. Im weiteren Verlauf der Sitzung stellte die Arbeitsgruppe fest, dass ihr zur Bildung von Kundensegmenten Informationen über die genauen Präferenzen der Mobilfunkkunden fehlten. Daher wurde beschlossen, zunächst eine Befragung an einer repräsentativen Stichprobe der Bestandskunden von M-Talk durchzuführen. Mit der Kundenbefragung wurde die Abteilungsleiterin Marktforschung, Frau Dipl.-Kff. Ruppich, beauftragt. Sie erstellte in Zusammenarbeit mit der Marktforschungsagentur MarketInform einen Fragebogen, mit dem insbesondere die Wichtigkeit von unterschiedlichen Kaufkriterien auf einer sechsstufigen Ratingskala abgefragt werden sollte. (vgl. die folgende Folie) Nach zwei Wochen lieferte die Marktforschungsagentur einen Datensatz von 556 befragten Mobilfunkkunden. Da die Zahl der abgefragten Kaufkriterien mit 13 für eine Interpretation relativ groß ist, ließ Frau Ruppich die Daten zunächst mit Hilfe einer Faktorenanalyse verdichten. Die Ergebnisse sind mit Hilfe des Statistikprogramms SPSS ermittelt worden. Univ.-Prof. Dr. Jost Adler 13 6

7 Wie wichtig sind Ihnen folgende Aspekte beim mobilen Telefonieren? günstige Tarife Aussehen/Design des Handy lange Akkustandzeiten hervorragende Netz-/Sprachqualität vielfältige Informationsdienste gute Netzabdeckung Funktionalität des Handy (z. B. SMS, WAP) Erreichbarkeit Indoors Komfortable Mailbox Austauschbarkeit des Handy-Cover Verfügbarkeit vielfältiger Logos und Klingeltöne für das Handy zuverlässige und kompetente Hotline Möglichkeit jederzeit den Tarif zu wechseln Univ.-Prof. Dr. Jost Adler 14 sehr wichtig überhaupt nicht wichtig Faktorenanalyse Zielsetzung: Reduktion von hoch korrelierten Variablen auf einige wenige unabhängige Faktoren. Annahme: Die Korrelation zwischen zwei Variablen wird durch eine hypothetische Größe (Faktor) verursacht, die hinter diesen Variablen zu vermuten ist. x 1 x x 3 x 4 x 5 F 1 F Univ.-Prof. Dr. Jost Adler 15 7

8 Ablaufschritte einer Faktorenanalyse Berechnung der Korrelationsmatrix auf Basis standardisierter Ausgangsdaten Prüfung der Eignung der Korrelationsmatrix für eine Faktorenanalyse Extraktion der Faktoren (Festlegen der Anzahl) Bestimmung der Kommunalitäten und des Verfahrens zur Extraktion der Faktoren Ermittlung der Faktorladungen und Faktorinterpretation (Faktorrotation) Bestimmung von Faktorwerten Univ.-Prof. Dr. Jost Adler 16 Vorgehensweise und Probleme der Faktorenanalyse Vorgehensweise 1. Korrelationsberechnung. Bestimmung der Kommunalitäten 3. Faktorextraktion 4. Festlegen der Zahl von Faktoren 5. Rotation Probleme Eignung der Korrelationsmatrix Kommunalitätenschätzung Hauptkomponenten- oder Hauptachsenanalyse Bestimmung der Faktorenzahl 6. Interpretation der Faktoren 7. Berechnung von Faktorwerten Rotationsmethode (z.b. Varimax) Interpretationsproblem Schätzverfahren (z.b. Regression) Univ.-Prof. Dr. Jost Adler 17 8

9 Ablaufschritte einer Faktorenanalyse Berechnung der Korrelationsmatrix auf Basis standardisierter Ausgangsdaten Prüfung der Eignung der Korrelationsmatrix für eine Faktorenanalyse Extraktion der Faktoren (Festlegen der Anzahl) Bestimmung der Kommunalitäten und des Verfahrens zur Extraktion der Faktoren Ermittlung der Faktorladungen und Faktorinterpretation (Faktorrotation) Bestimmung von Faktorwerten Univ.-Prof. Dr. Jost Adler 18 Korrelation Korrelationskoeffizient: rx1,x K k1 K k1 (x (x 1k 1k x )(x x ) 1 mögliche Interpretationen der Korrelation: 1 K k1 k x ) (x k x ) X 1 X 1 X 1 F 1 X X X Univ.-Prof. Dr. Jost Adler 19 9

10 Korrelationsmatrix Korrelation Signifikanz (1-seitig) Funktionalität des Handy (z.b. SMS, WAP) Aussehen/Design Austauschbarkeit des Cover Akkustandzeiten Verfügbarkeit vielfältiger Logos und Klingeltöne für das Handy Netzabdeckung Netz-/Sprachqualität Erreichbarkeit Indoors günstige Tarife Möglichkeit des Tarifwechsels zuverlässige und kompetente Hotline Comfortable Mailbox vielfältige Informationsdienste Funktionalität des Handy (z.b. SMS, WAP) Aussehen/Design Austauschbarkeit des Cover Akkustandzeiten Verfügbarkeit vielfältiger Logos und Klingeltöne für das Handy Netzabdeckung Netz-/Sprachqualität Erreichbarkeit Indoors günstige Tarife Möglichkeit des Tarifwechsels zuverlässige und kompetente Hotline Comfortable Mailbox vielfältige Informationsdienste Verfügbarkeit Funktionalität vielfältiger zuverlässige des Handy Logos und Möglichkeit und vielfältige (z.b. SMS, Aussehe Austauschbar Akkustan Klingeltöne für Netzabde Netz-/Spra Erreichbarkeit günstige des kompetente Comfortable Informatio WAP) n/design keit des Cover dzeiten das Handy ckung chqualität Indoors Tarife Tarifwechsels Hotline Mailbox nsdienste Univ.-Prof. Dr. Jost Adler 0 Ablaufschritte einer Faktorenanalyse Berechnung der Korrelationsmatrix auf Basis standardisierter Ausgangsdaten Prüfung der Eignung der Korrelationsmatrix für eine Faktorenanalyse Extraktion der Faktoren (Festlegen der Anzahl) Bestimmung der Kommunalitäten und des Verfahrens zur Extraktion der Faktoren Ermittlung der Faktorladungen und Faktorinterpretation (Faktorrotation) Bestimmung von Faktorwerten Univ.-Prof. Dr. Jost Adler 1 10

11 Verfahren zur Prüfung der Eignung der Korrelationsmatrix für eine Faktorenanalyse (I) 1. Signifikanzniveau der Korrelationen Prüft die Hypothese, dass die Korrelationen gleich Null sind. Bei entsprechendem Signifikanzniveau kann diese Nullhypothese verworfen werden.. Inverse der Korrelationsmatrix Eignung, wenn die Inverse der Korrelationsmatrix eine Diagonalmatrix darstellt, d. h. die Nichtdiagonal-Elemente möglichst nahe Null sind. 3. Bartlett-Test (test of sphericity) Überprüfung der Hypothese, ob die Stichprobe aus einer Grundgesamtheit stammt, in der die Variablen unkorreliert sind. ( KM weicht nur zufällig von der Einheitsmatrix ab) Voraussetzung: Variablen in GG normalverteilt Univ.-Prof. Dr. Jost Adler Korrelationsmatrix Korrelation Signifikanz (1-seitig) Funktionalität des Handy (z.b. SMS, WAP) Aussehen/Design Austauschbarkeit des Cover Akkustandzeiten Verfügbarkeit vielfältiger Logos und Klingeltöne für das Handy Netzabdeckung Netz-/Sprachqualität Erreichbarkeit Indoors günstige Tarife Möglichkeit des Tarifwechsels zuverlässige und kompetente Hotline Comfortable Mailbox vielfältige Informationsdienste Funktionalität des Handy (z.b. SMS, WAP) Aussehen/Design Austauschbarkeit des Cover Akkustandzeiten Verfügbarkeit vielfältiger Logos und Klingeltöne für das Handy Netzabdeckung Netz-/Sprachqualität Erreichbarkeit Indoors günstige Tarife Möglichkeit des Tarifwechsels zuverlässige und kompetente Hotline Comfortable Mailbox vielfältige Informationsdienste Verfügbarkeit Funktionalität vielfältiger zuverlässige des Handy Logos und Möglichkeit und vielfältige (z.b. SMS, Aussehe Austauschbar Akkustan Klingeltöne für Netzabde Netz-/Spra Erreichbarkeit günstige des kompetente Comfortable Informatio WAP) n/design keit des Cover dzeiten das Handy ckung chqualität Indoors Tarife Tarifwechsels Hotline Mailbox nsdienste Univ.-Prof. Dr. Jost Adler 3 11

12 Verfahren zur Prüfung der Eignung der Korrelationsmatrix für eine Faktorenanalyse (I) 1. Signifikanzniveau der Korrelationen Prüft die Hypothese, dass die Korrelationen gleich Null sind. Bei entsprechendem Signifikanzniveau kann diese Nullhypothese verworfen werden.. Inverse der Korrelationsmatrix Eignung, wenn die Inverse der Korrelationsmatrix eine Diagonalmatrix darstellt, d. h. die Nichtdiagonal-Elemente möglichst nahe Null sind. 3. Bartlett-Test (test of sphericity) Überprüfung der Hypothese, ob die Stichprobe aus einer Grundgesamtheit stammt, in der die Variablen unkorreliert sind. ( KM weicht nur zufällig von der Einheitsmatrix ab) Voraussetzung: Variablen in GG normalverteilt Univ.-Prof. Dr. Jost Adler 4 Inverse der Korrelationsmatrix Funktionalität des Handy (z.b. SMS, WAP) Aussehen/Design Austauschbarkeit des Cover Akkustandzeiten Verfügbarkeit vielfältiger Logos und Klingeltöne für das Handy Netzabdeckung Netz-/Sprachqualität Erreichbarkeit Indoors günstige Tarife Möglichkeit des Tarifwechsels zuverlässige und kompetente Hotline Comfortable Mailbox vielfältige Informationsdienste Verfügbarkeit Funktionalität vielfältiger zuverlässige des Handy Logos und Möglichkeit und vielfältige (z.b. SMS, Aussehe Austauschbar Akkustan Klingeltöne für Netzabde Netz-/Spra Erreichbarkeit günstige des kompetente Comfortable Informatio WAP) n/design keit des Cover dzeiten das Handy ckung chqualität Indoors Tarife Tarifwechsels Hotline Mailbox nsdienste Univ.-Prof. Dr. Jost Adler 5 1

13 Verfahren zur Prüfung der Eignung der Korrelationsmatrix für eine Faktorenanalyse (I) 1. Signifikanzniveau der Korrelationen Prüft die Hypothese, dass die Korrelationen gleich Null sind. Bei entsprechendem Signifikanzniveau kann diese Nullhypothese verworfen werden.. Inverse der Korrelationsmatrix Eignung, wenn die Inverse der Korrelationsmatrix eine Diagonalmatrix darstellt, d. h. die Nichtdiagonal-Elemente möglichst nahe Null sind. 3. Bartlett-Test (test of sphericity) Überprüfung der Hypothese, ob die Stichprobe aus einer Grundgesamtheit stammt, in der die Variablen unkorreliert sind. ( KM weicht nur zufällig von der Einheitsmatrix ab) Voraussetzung: Variablen in GG normalverteilt Univ.-Prof. Dr. Jost Adler 6 KMO- und Bartlett-Test H 0 : Stichprobe stammt aus einer Grundgesamtheit, in der die Variablen unkorreliert sind. KMO- und Bartlett-Test Maß der Stichprobeneignung nach Kaiser-Meyer-Olkin..804 Bartlett-Test auf Sphärizität Ungefähres Chi-Quadrat df Signifikanz nach Bartlett Univ.-Prof. Dr. Jost Adler 7 13

14 Verfahren zur Prüfung der Eignung der Korrelationsmatrix für eine Faktorenanalyse (II) 4. Anti-Image-Kovarianz-Matrix Image: Anteil der Varianz einer Variablen, der durch die verbleibenden Variablen mit Hilfe einer multiplen Regression erklärt werden kann. Anti-Image: Anteil der Varianz, der von den übrigen Variablen unabhängig ist. Eignung: wenn das Anti-Image möglichst gering ausfällt, d.h. der Anteil der Nicht-diagonal-Elemente, die ungleich Null sind (> 0,09 ), in der Anti-Image-Kovarianz-Matrix weniger als 5% beträgt. 5. Kaiser-Meyer-Olkin-Kriterium (Measure of Sampling Adequacy (MSA)) Prüfgröße, die angibt, in welchem Umfang die Ausgangs-variablen insgesamt bzw. individuell zusammenhängen Eignung: MSA 0,8; mindestens jedoch 0,6 Univ.-Prof. Dr. Jost Adler 8 Anti-Image-Matrizen 8 Elemente > 0,09 8/78 = 10,6% << 5% Anti-Image-Kovarianz Funktionalität des Handy (z.b. SMS, WAP) Aussehen/Design Austauschbarkeit des Cover Akkustandzeiten Verfügbarkeit vielfältiger Logos und Klingeltöne für das Handy Netzabdeckung Netz-/Sprachqualität Erreichbarkeit Indoors günstige Tarife Möglichkeit des Tarifwechsels zuverlässige und kompetente Hotline Comfortable Mailbox vielfältige Informationsdienste Anti-Image-Korrelation Funktionalität des Handy (z.b. SMS, WAP) Aussehen/Design Austauschbarkeit des Cover Akkustandzeiten Verfügbarkeit vielfältiger Logos und Klingeltöne für das Handy Netzabdeckung Netz-/Sprachqualität Erreichbarkeit Indoors günstige Tarife Möglichkeit des Tarifwechsels zuverlässige und kompetente Hotline Comfortable Mailbox vielfältige Informationsdienste Verfügbarkeit Funktionalität vielfältiger zuverlässige des Handy Logos und Möglichkeit und vielfältige (z.b. SMS, Aussehe Austauschbar Akkustan Klingeltöne für Netzabde Netz-/Spra Erreichbarkeit günstige des kompetente Comfortable Informatio WAP) n/design keit des Cover dzeiten das Handy ckung chqualität Indoors Tarife Tarifwechsels Hotline Mailbox nsdienste e e E-0-1.3E E E E E E E E E E E E E E E E E E E E E E E-0.31E E E E E E E E E-0.039E E E E E E E E-0-5.8E E-0-8.0E E-0.664E E E E E E E-0-1.8E E E E E E E E E-0.476E E E E-0.039E-0.664E E E E E E E E E-0.31E E E E E E E E E E E E E E-0.59E E-0.076E E E-0 1.3E E E E E E E E E E E E E E E E E E E E E-0.681E E-0-3.5E E E E E E E E E E E E E-0.976E E-0.476E E E-0 1.3E E E a E E E E E E E E E E a E E E E E E E E E a E-0.966E E E E-0.008E E-0-3.0E a E E E E E-0.15E E E E a E-0.881E E-0.930E E E E E-0.851E-0.966E-0 -.9E a E E E E E E E E E a E E E E E E E E E-0.881E a 3.47E E-0.93E E E E E E E E E E-0.67 a E E E E E E E-0.930E E E E a 5.006E E E E E-0.008E E E E E-0.93E E E-0.6 a E E E-0.15E E E E E E E a E-0-1.0E-0-3.0E E E E E E E E a a. Maß der Stichprobeneignung Univ.-Prof. Dr. Jost Adler 9 14

15 Verfahren zur Prüfung der Eignung der Korrelationsmatrix für eine Faktorenanalyse (II) 4. Anti-Image-Kovarianz-Matrix Image: Anteil der Varianz einer Variablen, der durch die verbleibenden Variablen mit Hilfe einer multiplen Regression erklärt werden kann. Anti-Image: Anteil der Varianz, der von den übrigen Variablen unabhängig ist. Eignung: wenn das Anti-Image möglichst gering ausfällt, d.h. der Anteil der Nicht-diagonal-Elemente, die ungleich Null sind (> 0,09 ), in der Anti-Image-Kovarianz-Matrix weniger als 5% beträgt. 5. Kaiser-Meyer-Olkin-Kriterium (Measure of Sampling Adequacy (MSA)) Prüfgröße, die angibt, in welchem Umfang die Ausgangs-variablen insgesamt bzw. individuell zusammenhängen Eignung: MSA 0,8; mindestens jedoch 0,6 Univ.-Prof. Dr. Jost Adler 30 KMO- und Bartlett-Test KMO- und Bartlett-Test Maß der Stichprobeneignung nach Kaiser-Meyer-Olkin..804 Bartlett-Test auf Sphärizität Ungefähres Chi-Quadrat df Signifikanz nach Bartlett Univ.-Prof. Dr. Jost Adler 31 15

16 Anti-Image-Matrizen Individuelle KMO-Werte Anti-Image-Kovarianz Funktionalität des Handy (z.b. SMS, WAP) Aussehen/Design Austauschbarkeit des Cover Akkustandzeiten Verfügbarkeit vielfältiger Logos und Klingeltöne für das Handy Netzabdeckung Netz-/Sprachqualität Erreichbarkeit Indoors günstige Tarife Möglichkeit des Tarifwechsels zuverlässige und kompetente Hotline Comfortable Mailbox vielfältige Informationsdienste Anti-Image-Korrelation Funktionalität des Handy (z.b. SMS, WAP) Aussehen/Design Austauschbarkeit des Cover Akkustandzeiten Verfügbarkeit vielfältiger Logos und Klingeltöne für das Handy Netzabdeckung Netz-/Sprachqualität Erreichbarkeit Indoors günstige Tarife Möglichkeit des Tarifwechsels zuverlässige und kompetente Hotline Comfortable Mailbox vielfältige Informationsdienste Verfügbarkeit Funktionalität vielfältiger zuverlässige des Handy Logos und Möglichkeit und vielfältige (z.b. SMS, Aussehe Austauschbar Akkustan Klingeltöne für Netzabde Netz-/Spra Erreichbarkeit günstige des kompetente Comfortable Informatio WAP) n/design keit des Cover dzeiten das Handy ckung chqualität Indoors Tarife Tarifwechsels Hotline Mailbox nsdienste e e E-0-1.3E E E E E E E E E E E E E E E E E E E E E E E-0.31E E E E E E E E E-0.039E E E E E E E E-0-5.8E E-0-8.0E E-0.664E E E E E E E-0-1.8E E E E E E E E E-0.476E E E E-0.039E-0.664E E E E E E E E E-0.31E E E E E E E E E E E E E E-0.59E E-0.076E E E-0 1.3E E E E E E E E E E E E E E E E E E E E E-0.681E E-0-3.5E E E E E E E E E E E E E-0.976E E-0.476E E E-0 1.3E E E a E E E E E E E E E E a E E E E E E E E E a E-0.966E E E E-0.008E E-0-3.0E a E E E E E-0.15E E E E a E-0.881E E-0.930E E E E E-0.851E-0.966E-0 -.9E a E E E E E E E E E a E E E E E E E E E-0.881E a 3.47E E-0.93E E E E E E E E E E-0.67 a E E E E E E E-0.930E E E E a 5.006E E E E E-0.008E E E E E-0.93E E E-0.6 a E E E-0.15E E E E E E E a E-0-1.0E-0-3.0E E E E E E E E a a. Maß der Stichprobeneignung Univ.-Prof. Dr. Jost Adler 3 Ablaufschritte einer Faktorenanalyse Berechnung der Korrelationsmatrix auf Basis standardisierter Ausgangsdaten Prüfung der Eignung der Korrelationsmatrix für eine Faktorenanalyse Extraktion der Faktoren (Festlegen der Anzahl) Bestimmung der Kommunalitäten und des Verfahrens zur Extraktion der Faktoren Ermittlung der Faktorladungen und Faktorinterpretation (Faktorrotation) Bestimmung von Faktorwerten Univ.-Prof. Dr. Jost Adler 33 16

17 Das Fundamentaltheorem der Faktorenanalyse (I) Die Korrelationsmatrix R lässt sich durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren. Bei Unterstellung von unkorrelierten Faktoren entspricht C der Einheitsmatrix Annahme: Jeder Beobachtungswert einer Ausgangsvariablen x j oder der standardisierten Variablen z j lässt sich als eine Linearkombination mehrerer (hypothetischer) Faktoren beschreiben. x kj a j1 p k1 a k Univ.-Prof. Dr. Jost Adler 34 j p... a bzw. für standardisierte x-werte z kj a j1 Z P A' p k1 a j p In Matrixschreibweise: k... a jq jq p p (Grundgleichung der Faktorenanalyse) kq kq Q q1 a jq p kq Bezeichnungen: Merkmalsvariable j Fall/Objekt k Faktor q Faktorladungen a jq Faktorwert p kq Das Fundamentaltheorem der Faktorenanalyse (II) Ermittlung der Korrelationsmatrix R aus den standardisierten Ausgangsdaten (Matrix Z): 1 R Z' Z K 1 Einsetzen von Z = P A : 1 R ( P A' )' ( P A' ) K 1 Ausmultiplizieren der Klammern: 1 1 R A P' P A' A P' P A' K 1 K 1 C R A C A' Bei Unterstellung von unkorrelierten Faktoren: R A A' Univ.-Prof. Dr. Jost Adler 35 17

18 Ablaufschritte einer Faktorenanalyse Berechnung der Korrelationsmatrix auf Basis standardisierter Ausgangsdaten Prüfung der Eignung der Korrelationsmatrix für eine Faktorenanalyse Extraktion der Faktoren (Festlegen der Anzahl) Bestimmung der Kommunalitäten und des Verfahrens zur Extraktion der Faktoren Ermittlung der Faktorladungen und Faktorinterpretation (Faktorrotation) Bestimmung von Faktorwerten Univ.-Prof. Dr. Jost Adler 36 Komponenten der Gesamtvarianz bei einer -Faktoren-Lösung a j1 = 0,7 a j = 0,1 s jrest = 0, Kommunalität h 1 = 0,8 (erklärte Varianz) Univ.-Prof. Dr. Jost Adler 37 18

19 Faktorextraktionsverfahren: Hauptachsenanalyse (I) Annahme: Die gesamte Varianz der Ausgangsvariablen kann nicht vollständig durch die Extraktion von Faktoren erklärt werden, was dadurch zum Ausdruck kommt, dass die Varianz einer Variablen in die Komponenten Kommunalität und Einzelrestvarianz aufgeteilt wird. Ziel: Die Varianzen der Variablen sollen lediglich in Höhe der Kommunalitäten erklärt werden. Bei der Kommunalitätenschätzung werden als "Startwerte immer Werte kleiner 1 vorgegeben. Die Vorgabe kann aufgrund inhaltlicher Überlegungen oder über den Iterationsprozess erfolgen. Die Kommunalitäten werden immer in Höhe der Vorgaben reproduziert, wenn ebenso viele Faktoren wie Variable extrahiert werden (vgl. Anfängliche Statistik). Werden weniger Faktoren als Variable extrahiert, so ergeben sich im Ergebnis (Statistik Extraktion) Kommunalitäten, die i.d.r. kleiner sind als die Vorgaben. Die jeweiligen Differenzen (Vorgabe - Kommunalität) stellen den durch die Faktoren nicht reproduzierten Varianzanteil dar. Univ.-Prof. Dr. Jost Adler 38 Faktorextraktionsverfahren: Hauptachsenanalyse (II) Frage bei der Interpretation der Faktoren: Wie lässt sich die Ursache bezeichnen, die für die hohen Ladungen der Variablen auf diesem Faktor verantwortlich ist?" D. h. der Hauptachsenanalyse liegt eine kausale Interpretation der Faktoren zugrunde. Univ.-Prof. Dr. Jost Adler 39 19

20 Faktorenextraktionsverfahren: Hauptkomponentenanalyse Annahme: Die gesamte Varianz der Ausgangsvariablen kann vollständig durch die Extraktion von Faktoren erklärt werden, d.h. es existiert keine Einzelrestvarianz (spezifische Varianz + Messfehlervarianz). Bei der Kommunalitätenschätzung wird als "Startwert immer der Wert 1 vorgegeben. Die Kommunalitäten von 1 werden immer dann vollständig reproduziert, wenn ebenso viele Faktoren wie Variable extrahiert werden (vgl. Anfängliche Statistik). Werden weniger Faktoren als Variable extrahiert, so ergeben sich im Ergebnis (Statistik Extraktion) Kommunalitäten von kleiner 1. Die jeweiligen Differenzen (1 - Kommunalität) stellen den durch die Faktoren nicht reproduzierten Varianzanteil dar. Frage bei der Interpretation der Faktoren: "Wie lassen sich die auf einen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen?" D. h. der Hauptkomponentenanalyse liegt keine kausale Interpretation der Faktoren zugrunde Univ.-Prof. Dr. Jost Adler 40 Ablaufschritte einer Faktorenanalyse Berechnung der Korrelationsmatrix auf Basis standardisierter Ausgangsdaten Prüfung der Eignung der Korrelationsmatrix für eine Faktorenanalyse Extraktion der Faktoren (Festlegen der Anzahl) Bestimmung der Kommunalitäten und des Verfahrens zur Extraktion der Faktoren Ermittlung der Faktorladungen und Faktorinterpretation (Faktorrotation) Bestimmung von Faktorwerten Univ.-Prof. Dr. Jost Adler 41 0

21 Cattell s Scree-Test und Kaiser-Kriterium 5 4 Extraktion von 4 Faktoren Eigenwert 3 Elbow Extraktion von 5 Faktoren 1 Kaiser-Kriterium Zahl der Faktoren Univ.-Prof. Dr. Jost Adler 4 Güte der Faktorenanalyse Faktor Summen von quadrierten Faktorladungen Anfängliche Eigenwerte für Extraktion Gesamt % der Varianz Kumulierte % Gesamt % der Varianz Kumulierte % : Extraktionsmethode: Hauptachsen-Faktorenanalyse. Univ.-Prof. Dr. Jost Adler 43 1

22 Kommunalitäten Funktionalität des Handy (z.b. SMS, WAP) Aussehen/Design Austauschbarkeit des Cover Akkustandzeiten Verfügbarkeit vielfältiger Logos und Klingeltöne für das Handy Netzabdeckung Netz-/Sprachqualität Erreichbarkeit Indoors günstige Tarife Möglichkeit des Tarifwechsels zuverlässige und kompetente Hotline Comfortable Mailbox vielfältige Informationsdienste Extraktionsmethode: Hauptachsen-Faktorenanalyse. Anfänglich Extraktion Univ.-Prof. Dr. Jost Adler 44 Ablaufschritte einer Faktorenanalyse Berechnung der Korrelationsmatrix auf Basis standardisierter Ausgangsdaten Prüfung der Eignung der Korrelationsmatrix für eine Faktorenanalyse Bestimmung der Kommunalitäten und des Verfahrens zur Extraktion der Faktoren Extraktion der Faktoren (Festlegen der Anzahl) Ermittlung der Faktorladungen und Faktorinterpretation (Faktorrotation) Bestimmung von Faktorwerten Univ.-Prof. Dr. Jost Adler 45

23 Faktorladungsmatrix q j Matrix A Akkustandzeiten Austauschbarkeit des Cover Aussehen/Design Funktionalität des Handy (z.b. SMS, WAP) Verfügbarkeit vielfältiger Logos und Klingeltöne für das Handy Netzabdeckung Netz-/Sprachqualität zuverlässige und kompetente Hotline Comfortable Mailbox vielfältige Informationsdienste Erreichbarkeit Indoors Möglichkeit des Tarifwechsels günstige Tarife R A A' U wobei U = Residuum Univ.-Prof. Dr. Jost Adler 46 Faktor E E E E E E E E E E E E E Kommunalität Eigenwert q j a a jq jq Reproduzierte Korrelationen Reproduzierte Korrelation R^=A*A Residuum a U Verfügbarkeit Funktionalität vielfältiger zuverlässige des Handy Logos und Möglichkeit und vielfältige (z.b. SMS, Aussehe Austauschbar Akkustan Klingeltöne für Netzabde Netz-/Spra Erreichbarkeit günstige des kompetente Comfortable Informatio WAP) n/design keit des Cover dzeiten das Handy ckung chqualität Indoors Tarife Tarifwechsels Hotline Mailbox nsdienste Funktionalität des.645 b E E E-0 Handy (z.b. SMS, WAP) Aussehen/Design b E-0.615E E-03 Austauschbarkeit des b E E-0 Cover Akkustandzeiten b E E-0 Verfügbarkeit vielfältiger Logos und Klingeltöne b E E E E-03 für das Handy Netzabdeckung b E E-0 Netz-/Sprachqualität b E E E-03 Erreichbarkeit Indoors b E E-0.893E-0 günstige Tarife b e E E-0 Möglichkeit des E b 1.498E E E-0 Tarifwechsels zuverlässige und -9.64E E E E E E-0.88E E b kompetente Hotline Comfortable Mailbox E-0.615E E-0 -.6E E E E E E b.448 vielfältige -.793E E E E E E E E E E b Informationsdienste Funktionalität des 1.756E E E E E E E E E E E E-0 Handy (z.b. SMS, WAP) Aussehen/Design 1.756E E E-0.090E E E E E E E E E-03 Austauschbarkeit des -.818E E E E E E E E E E E E-0 Cover Akkustandzeiten 1.449E E E E E E E E E E E E-0 Verfügbarkeit vielfältiger Logos und Klingeltöne E E E E E E E E E E E-0.690E-03 für das Handy Netzabdeckung E E E E E E E E E E E E-0 Netz-/Sprachqualität 8.745E E-0 -.5E-0-1.4E E E E E E E E E-03 Erreichbarkeit Indoors E E E E E E E E E E-0.95E-03.71E-0 günstige Tarife -1.97E E E E E E E E E E E E-0 Möglichkeit des 3.744E E E E E E E E E E E E-0 Tarifwechsels zuverlässige und -1.45E E E E E-0 1.3E-0.679E E E E-03.45E E-03 kompetente Hotline Comfortable Mailbox 7.676E E E E E-0-8.0E E-04.95E E E-03.45E E-03 vielfältige 1.067E E E E-0.690E E E-03.71E E E E E-03 Informationsdienste Extraktionsmethode: Hauptachsen-Faktorenanalyse. a. Residuen werden zwischen beobachteten und reproduzierten Korrelationen berechnet. Es gibt 0 (.0%) nichtredundante Residuen mit Absolutwerten > 0,05. b. Reproduzierte Kommunalitäten Univ.-Prof. Dr. Jost Adler 47 3

24 Interpretationshilfe durch Faktorrotation: Rotierte Faktorladungen Univ.-Prof. Dr. Jost Adler 48 Interpretation der Faktoren: Rotierte Faktorladungsmatrix Faktoren: Akkustandzeiten Austauschbarkeit des Cover Aussehen/Design Handy Funktionalität des Handy (z.b. SMS, WAP) Verfügbarkeit vielfältiger Logos und Klingeltöne für das Handy Netzabdeckung Netz-/Sprachqualität Erreichbarkeit Indoors zuverlässige und kompetente Hotline Comfortable Mailbox vielfältige Informationsdienste Möglichkeit des Tarifwechsels günstige Tarife Extraktionsmethode: Hauptachsen-Faktorenanalyse. Rotationsmethode: Varimax mit Kaiser-Normalisierung. a. Die Rotation ist in 5 Iterationen konvergiert. Netz Faktor E E E E E E E E E E-0 4.5E E E E E E-0-8.0E E-0.897E E E-03 Service E E-03.6E E E E-0.741E Tarif E-0.77 Univ.-Prof. Dr. Jost Adler 49 4

25 Ablaufschritte einer Faktorenanalyse Berechnung der Korrelationsmatrix auf Basis standardisierter Ausgangsdaten Prüfung der Eignung der Korrelationsmatrix für eine Faktorenanalyse Bestimmung der Kommunalitäten und des Verfahrens zur Extraktion der Faktoren Extraktion der Faktoren (Festlegen der Anzahl) Ermittlung der Faktorladungen und Faktorinterpretation (Faktorrotation) Bestimmung von Faktorwerten Univ.-Prof. Dr. Jost Adler 50 Besonderheiten von Faktorwerten Der Faktorwert spiegelt die Ausprägung eines bestimmten Objektes (Fall) bei einem bestimmten Faktor wider. Faktorwerte sind standardisierte Größen und besitzen immer eine relative Aussage im Sinne einer positiven oder negativen Abweichung vom Durchschnitt. 1 Berechnung bspw. über Regression: P Z A ( A' A) Interpretation: negativer Faktorwert: Objekt im Vergleich zu allen anderen Objekten auf diesem Faktor unterdurchschnittlich ausgeprägt Faktorwert = 0: Objekt im Vergleich zu allen anderen Objekten auf diesem Faktor durchschnittlich ausgeprägt positiver Faktorwert: Objekt im Vergleich zu allen anderen Objekten auf diesem Faktor überdurchschnittlich ausgeprägt Univ.-Prof. Dr. Jost Adler 51 5

26 Positionierung anhand von Faktorwerten Faktor Univ.-Prof. Dr. Jost Adler 5 Faktor 1 Wie wichtig sind Ihnen folgende Aspekte beim mobilen Telefonieren? günstige Tarife Aussehen/Design des Handy lange Akkustandzeiten hervorragende Netz-/Sprachqualität vielfältige Informationsdienste gute Netzabdeckung Funktionalität des Handy (z. B. SMS, WAP) Erreichbarkeit Indoors Komfortable Mailbox Austauschbarkeit des Handy-Cover Verfügbarkeit vielfältiger Logos und Klingeltöne für das Handy zuverlässige und kompetente Hotline Möglichkeit jederzeit den Tarif zu wechseln Univ.-Prof. Dr. Jost Adler 53 sehr wichtig überhaupt nicht wichtig

27 Zentrale Begriffe der Faktorenanalyse Korrelation: Der Korrelationskoeffizient r gibt die Stärke des Zusammenhangs zwischen zwei Variablen an und liegt absolut zwischen 0 und 1. Kommunalität: Die Kommunalität einer Variablen gibt an, welchen Beitrag alle Faktoren gemeinsam zur Erklärung der Varianz einer Variablen liefern. (= i a j : Summierung der quadrierten Faktorladungen je Variable j über alle Faktoren i) Eigenwert: Der Eigenwert eines Faktors gibt an, welchen Beitrag dieser Faktor zur Erklärung der Gesamtvarianz liefert. (= j a i : Summierung der quadrierten Faktorladungen je Faktor i über alle Variablen j) Faktorladung: Die Faktorladung a einer Variable gibt an, wie stark diese Variable mit einem Faktor korreliert ist. Univ.-Prof. Dr. Jost Adler 54 Zusammenfassung der Rechenschritte einer Faktorenanalyse Univ.-Prof. Dr. Jost Adler 55 7

28 Praktische Anwendung in SPSS Getting Started (I) 1. Analysemethode auswählen Univ.-Prof. Dr. Jost Adler 57 8

29 Getting Started (II). Variablen in das Modell einbeziehen 3. Deskriptive Statistiken wählen 6. Rotation: Varimax (rechtwinklig) 4. Option Sortiert nach Größe wählen 5. Extraktion: Analyseverfahren wählen Univ.-Prof. Dr. Jost Adler 58 Aufgabe: Faktorenanalyse In einer empirischen Erhebung wurden elf Automobilmarken im Hinblick auf bestimmte Eigenschaften beurteilt. Im einzelnen handelte es sich um die in der Abbildung angeführten Marken und Eigenschaften. 0 Personen wurden befragt. Obwohl die 0 Personen alle Marken beurteilt haben und somit nicht ausgeschlossen werden kann, dass die Beurteilung der Marken nicht unabhängig erfolgte, wird dies für die weitere Analyse unterstellt. Bei empirischen Untersuchungen ist jedoch darauf zu achten, dass unsere Annahme auch tatsächlich erfüllt ist. Die Daten stellen entsprechend Mittelwerte über die 0 Befragten dar. Die Marken werden als Fälle interpretiert. Es sollte auf Basis dieser Befragung geprüft werden, ob die zehn Eigenschaften alle unabhängig voneinander zur (subjektiven) Beurteilung der Marken notwendig waren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben. In einem zweiten Schritt sollten die Marken entsprechend der Faktorenausprägung positioniert werden. Univ.-Prof. Dr. Jost Adler 59 9

30 Aufgabe: Faktorenanalyse Marken Eigenschaften 1 Toyota A Ersatzteilverfügbarkeit Opel B Rabatte 3 Mitsubishi C Wartungsintervall 4 Mercedes D Preisgünstigkeit 5 BMW E Fahrkomfort 6 Porsche F Motorleistung 7 Rover G Ersatzwagen 8 Mazda H Sicherheit 9 Volvo I Korrosionsanfälligkeit 10 VW J Notfallhilfe 11 Ford Führen Sie eine Faktoranalyse durch! Univ.-Prof. Dr. Jost Adler 60 Empirische Forschungsmethoden: Multivariate Datenanalyse 1 Klassifikationsansätze Explorative Verfahren der Datenanalyse (strukturentdeckend).1 Faktorenanalyse. Clusteranalyse.3 Multidimensionale Skalierung 3 Konfirmatorische Verfahren der Datenanalyse (strukturprüfend) 3.1 Nichtlineare Regressionsanalyse 3. Varianzanalyse 3.3 Logistische Regression 3.4 Conjoint Measurement 3.5 Kausalanalyse Univ.-Prof. Dr. Jost Adler 61 30

31 Beispiel: Kundenbindung im Mobilfunk (Forts.) Nachdem Frau Ruppich die Ergebnisse hinsichtlich der Kaufkriterien der Arbeitsgruppe präsentiert hat, soll in einem weiteren Analyseschritt eine Gruppierung der befragten Mobilfunkkunden vorgenommen werden. Hierzu wird auf Basis der errechneten Faktorwerte eine Clusteranalyse durchgeführt. Die Ergebnisse der Custeranalyse sind für 57 repräsentativ ausgewählte Befragungsteilnehmer anhand des Statistikpaketes SPSS ermittelt worden. In der nächsten Sitzung der Arbeitsgruppe erläutert Frau Ruppich die Ergebnisse der Gruppierung. Zur Präsentation der Ergebnisse hat Frau Ruppich neben dem Dendrogramm noch zwei weitere Charts mitgebracht: Fehlerquadratsumme durchschnittlicher Faktorwert 1 0,5 0-0,5-1 -1,5 - -,5 Faktor 1 Faktor Faktor 3 Faktor 4 0, ,55E-0-0, ,9571 Cluster 1 Cluster 1 Cluster Cluster 3 Cluster Cluster Cluster -6,55E-0 0, , , Cluster 3 0,51-0, , , Cluster 4 -, ,11E-0-0, ,07476 Univ.-Prof. Dr. Jost Adler 6 Ablauf einer Clusteranalyse Bestimmung der zu klassifizierenden Objekte und Auswahl der Beurteilungsvariablen Feststellung des Proximitätsmaßes Wahl des Fusionierungsalgorithmus Bestimmung der optimalen Gruppenzahl Durchführung des Gruppierungsvorgangs Beurteilung der gefundenen Clusterlösung Univ.-Prof. Dr. Jost Adler 63 31

32 Grundprobleme bzw. Entscheidungstatbestände der Clusteranalyse Wahl des Proximitätsmaßes metrisches Skalenniveau Quadrierte Euklidische Distanz nominales Skalenniveau Wahl des Fusionierungsalgorithmus Single Linkage Complete Linkage Ward Festlegung der Zahl der Cluster Elbow-Kriterium Stopping Rules Test von Mojena Beurteilung und Interpretation der gefundenen Cluster-Lösung F-Werte T-Werte Univ.-Prof. Dr. Jost Adler 64 Ablauf einer Clusteranalyse Bestimmung der zu klassifizierenden Objekte und Auswahl der Beurteilungsvariablen Feststellung des Proximitätsmaßes Wahl des Fusionierungsalgorithmus Bestimmung der optimalen Gruppenzahl Durchführung des Gruppierungsvorgangs Beurteilung der gefundenen Clusterlösung Univ.-Prof. Dr. Jost Adler 65 3

33 Ablauf einer Clusteranalyse Bestimmung der zu klassifizierenden Objekte und Auswahl der Beurteilungsvariablen Feststellung des Proximitätsmaßes Wahl des Fusionierungsalgorithmus Bestimmung der optimalen Gruppenzahl Durchführung des Gruppierungsvorgangs Beurteilung der gefundenen Clusterlösung Univ.-Prof. Dr. Jost Adler 66 Überblick über ausgewählte Proximitätsmaße Proximitätsmaße bei Nominal-Skalen bei metrischen Skalen Tanimoto- Koeffizient M- Koeffizient Kulczynski- Koeffizient L 1 -Norm Q-Korre- lations- Koeffizient RR- Koeffizient Dice- Koeffizient L -Norm Mahalanobis- Distanz Univ.-Prof. Dr. Jost Adler 67 33

34 Ausgangsdatenmatrix zur Darstellung von Ähnlichkeitskoeffizienten bei binären Variablen Merkmale Objekte Objekt Objekt Muster Objekt 3 a1 a0 1c a1 d1 b1 1c b1 d1 b0 Objekt Anzahl4 a 0 = b = c = 1 0 1d = 0 Objekt Objekt Objekt Univ.-Prof. Dr. Jost Adler 68 Kombinationsmöglichkeiten binärer Variablen Objekt 1 Eigenschaft vorhanden (1) Eigenschaft nicht vorhanden (0) Eigenschaft vorhanden (1) a b Objekt Eigenschaft nicht vorhanden (0) c d Zeilensumme a + c b + d Spaltensumme a + b c + d m Univ.-Prof. Dr. Jost Adler 69 34

35 Kombinationsmöglichkeiten binärer Variablen Objekt 1 Eigenschaft vorhanden (1) Eigenschaft nicht vorhanden (0) Eigenschaft vorhanden (1) a = 3 b = 3 Objekt Eigenschaft nicht vorhanden (0) c = d = Zeilensumme a + c = 5 b + d = 5 Spaltensumme a + b = 6 c + d = 4 m = 10 Univ.-Prof. Dr. Jost Adler 70 Definition ausgewählter Ähnlichkeitsmaße bei binären Variablen Ähnlichkeit von Objekt i und j: Name des Koeffizienten Tanimoto (Jaccard) Simple Matching (M) Russel & Rao (RR) Dice Kulczynski s ij Univ.-Prof. Dr. Jost Adler 71 a δ d a δ d λ(b c) Gewichtungsfaktoren / - - und m = a+b+c+d Definition a a b c a d m a m a a (b c) a b c 35

36 Definition ausgewählter Ähnlichkeitsmaße bei binären Variablen Ähnlichkeit von Objekt i und j: s ij a δ d a δ d λ(b c) und m = a+b+c+d Name des Koeffizienten Formel Berechnung Ergebnis Tanimoto (Jaccard) Simple Matching (M) Russel & Rao (RR) Dice Kulczynski a a b c a d m a m a a (b c) a b c Univ.-Prof. Dr. Jost Adler (3 ) ,3750 0,5000 0,3000 0,5454 0,6000 Distanzmaße zur Bestimmung der Ähnlichkeiten bzw. Unähnlichkeiten bei metrischen Variablen J Minkowski-Metrik: dkl x j1 r =1: City-Block-Metrik: d kl kj x r lj 1 r 4, wobei r = Minkowski-Konstante x 6 Objekt k Objekt l 1 6 x 1 5 r =: Euklidische Distanz: d kl ,4 x 6 Objekt k Objekt l 1 6 x 1 Univ.-Prof. Dr. Jost Adler 73 36

37 Distanzmatrix: Quadrierte Euklidische Distanz Fall Univ.-Prof. Dr. Jost Adler 74 Q-Korrelationskoeffizient als Ähnlichkeitsmaß bei metrischen Variablen Q-Korrelationskoeffizient: r k,l J j1 J j1 (x (x jk jk x k k x ) ) (x J j1 jl (x x ) jl l x ) l, mit x k 1 J J j1 x jk Problem: Verwendung von Distanz- oder Ähnlichkeitsmaßen bei metrischen Variablen Distanzmaße: geeignet, wenn der absolute Abstand zwischen den Objekten von Interesse ist. Ähnlichkeitsmaße: geeignet, wenn der primäre Ähnlichkeitsaspekt im Gleichlauf zweier Profile (unabhängig vom Niveau) zu sehen ist. Univ.-Prof. Dr. Jost Adler 75 37

38 Möglichkeiten zur Behandlung gemischt skalierter Variablen zur Bestimmung der Proximität 1. getrennte Berechnung der Distanz- oder Ähnlichkeitsmaße über die unterschiedlich skalierten Variablen Gesamtähnlich- oder -unähnlichkeit ergibt sich dann als ungewichteter oder gewichteter Durchschnitt der jeweiligen Proximitäten. Transformation der metrisch skalierten Variablen auf niedrigeres Skalenniveau, z. B. durch Klassenbildung und Binärzerlegung Binärkodierung klassifizierter Beschreibung der Objekte Merkmale anhand der binären Variablen Einkommen binäre Merkmale in EURO 1 3 < > Univ.-Prof. Dr. Jost Adler 76 binäre Merkmale Objekte 1 3 > < Ablauf einer Clusteranalyse Bestimmung der zu klassifizierenden Objekte und Auswahl der Beurteilungsvariablen Feststellung des Proximitätsmaßes Wahl des Fusionierungsalgorithmus Bestimmung der optimalen Gruppenzahl Durchführung des Gruppierungsvorgangs Beurteilung der gefundenen Clusterlösung Univ.-Prof. Dr. Jost Adler 77 38

39 Überblick über ausgewählte Clusteralgorithmen Clusterverfahren Graphentheoretische Verfahren Hierarchische Verfahren Partitionierende Verfahren Optimierungs- Verfahren agglomerativ divisiv Austauschverfahren Iteriertes Minimaldistanzverfahren Single- Linkage Complete- Linkage Average- Linkage Centroid Median Ward Univ.-Prof. Dr. Jost Adler 78 Ablauf des Austauschverfahrens Start Vorgabe einer Anfangspartition Berechnung der arithmetischen Mittel für die Gruppeneigenschaften Ermittlung der Fehlerquadratsumme Untersuchung der Auswirkungen einer Objektverlagerung Verminderung der Fehlerquadratsumme Nein alle Objekte untersucht Nein Ja Verlagerung des Objektes Ja Berechnung neuer Mittelwerte bei der empfangenden und abgebenden Gruppe Ende Univ.-Prof. Dr. Jost Adler 79 39

40 Ablaufschritte des agglomerativen hierarchischen Clusterverfahrens Start mit der feinsten Partition Berechnung der Ausgangsdistanzmatrix Suche nach den beiden Clustern mit der geringsten Distanz Zusammenfassung der ähnlichen Cluster zu einer Gruppen Berechnung neuer Abstände und Veränderung der Distanzmatrix alle Untersuchungsobjekte in einer Gruppe Nein Ende Univ.-Prof. Dr. Jost Adler 80 Ja Problem der Distanzberechnung für fusionierte Objekte (Cluster) R R D(R,P) D(R,Q) D(R,P+Q) 5 Distanzen 4 54 Complete Single Linkage Linkage P D(P,Q) Q P+Q Berechnung der Distanz D(R; P+Q) zwischen Objekt/Gruppe R und der neu zusammengefassten Gruppe P und Q durch folgende Formel: D(R; P+Q) = A D(R, P) + B D(R, Q) + E D(P, Q) + G D(R, P) - D(R, Q) Single Linkage: D(R; P+Q) = min {D(R, P); D(R, Q)} Complete Linkage: D(R; P+Q) = max {D(R, P); D(R, Q)} Univ.-Prof. Dr. Jost Adler 81 40

41 Distanzberechnung bei ausgewählten agglomerativen Verfahren Univ.-Prof. Dr. Jost Adler 8 Ausgangsdaten Merkmale Ausprägungen x 1 : x : x 3 : x 4 : x 5 : x 6 : Kurvenstabilität PS - Zahl Beschleunigungsvermögen Ausstattung Benzinverbrauch Preis Audi BMW Mercedes VW Univ.-Prof. Dr. Jost Adler 83 41

42 Beispiel: Hierarchische Clusteranalyse (1) Berechnung der Euklidischen Distanz: d kl J x j1 kj x lj 1 Distanzmatrix (Werte gerundet) Audi VW BMW Mercedes A B C D A B C D Univ.-Prof. Dr. Jost Adler 84 Beispiel: Hierarchische Clusteranalyse () Suche d kl* = min {d kl } = 3 G 1 = {C, D} Reduzierte Distanzmatrix 1 A B CD Neue Distanzen d CD,A = min {d CA ; d DA } = d DA = 8 d CD,B = min {d CB ; d DB } = d CB = 8 A B CD Univ.-Prof. Dr. Jost Adler 85 4

43 Beispiel: Hierarchische Clusteranalyse (3) Suche d kl* = min {d kl } = 5 Reduzierte Distanzmatrix G = {A, B} AB CD Neue Distanzen d AB,CD = min {d A,CD ; d B,CD } = d A,CD = d B,CD = 8 AB CD Univ.-Prof. Dr. Jost Adler 86 Dendrogramm 8 Distanz A B C D Univ.-Prof. Dr. Jost Adler 87 43

44 Ward-Verfahren Distanzmaß zwischen Gruppen: 1 D( R; P Q) *{( NR NP)* D( R, P) ( NR NQ)* D( R, Q) NR * D( PQ)} NR NP NQ Mit: D(R;P+Q): Distanz zwischen Objekt (Gruppe) R und Gruppe P+Q NR: Zahl der Objekte in Gruppe R NP: Zahl der Objekte in Gruppe P NQ: Zahl der Objekte in Gruppe Q Vorgehen bei der Clusterung (Heterogenitätsmaß): Zusammenfassung der Gruppen anhand der kleinsten Varianzvergrößerung in der neu entstehenden Gruppe V x K g J g (xkjg x jg) k1 j1 jg 1 K K g x kjg g k1 x x kjg jg : Beobachtungswert der Variablen jbeiobjekt k der Gruppeg : Mittelwert über diebeobachtungswerte der Variablen jinder Gruppeg Univ.-Prof. Dr. Jost Adler 88 Charakterisierung agglomerativer Clusterverfahren Verfahren Eigenschaft Monoton? Proximitätsmaße Single- Linkage Complete- Linkage Average- Linkage kontrahierend ja alle dilatierend ja alle konservativ ja alle - Centroid konservativ nein Distanzmaße - Median konservativ nein Distanzmaße - Bemerkung neigt zur Kettenbildung neigt zu kleinen Gruppen Ward konservativ ja Distanzmaße bildet etwa gleich große Gruppen Univ.-Prof. Dr. Jost Adler 89 44

45 Ablauf einer Clusteranalyse Bestimmung der zu klassifizierenden Objekte und Auswahl der Beurteilungsvariablen Feststellung des Proximitätsmaßes Wahl des Fusionierungsalgorithmus Bestimmung der optimalen Gruppenzahl Durchführung des Gruppierungsvorgangs Beurteilung der gefundenen Clusterlösung Univ.-Prof. Dr. Jost Adler 90 Bestimmung der optimalen Clusterzahl: Das Elbow-Kriterium Fehlerquadratsumme Bildung von 4 Clustern Fehlerquadratsumme Zahl der Custer Elbow Zahl der Custer Univ.-Prof. Dr. Jost Adler 91 45

46 Bestimmung der optimalen Clusterzahl: Stopping Rule von Calinski/Harabasz Das Kriterium nach Calinski/Harabasz stellt in Analogie zur Varianzanalyse die Inner-Gruppen-Streuung (W) und die Zwischengruppenstreuung (B) gegenüber: Dazu wird die CH-Statistik für jede Clusterlösung mit K Gruppen berechnet: (hier: nur mit einer Clustervariablen y!) tr ( B) n K Interpretation: CH( K ) tr ( W ) K 1 Wenn ein Maximum von CH an der Stelle K existiert, so K 1 deutet das darauf hin, dass tr( B) nk ( y y) ( y y) k k K Gruppen existieren! tr( W ) y k y k 1 K k 1 nk j1 n 1 k Mittelwert der Gruppe K ( y Mittelwert aller Beobachtungen n Anzahl der Elemente in Gruppe K k Univ.-Prof. Dr. Jost Adler 9 kj y ) ( y k kj y ) Formeln im Buch falsch! k Ist der CH-Wert mit steigender Gruppenanzahl monoton fallend, so liegt keine Gruppenstruktur vor! Bestimmung der optimalen Clusterzahl: Test von Mojena Der Ausgangspunkt für den Test von Mojena sind die standardisierten Fusionskoeffizienten ( ~ ) je Fusionsstufe i, die wie folgt berechnet werden: n 1 n1 n1 1 i und S ( i ) 1 i1 n i1 i daraus folgt : ~ i s Interpretation: berechnen Als eine gute Cluster-Lösung gilt die größte Gruppenzahl, bei der ein vorgegebener Wert des standardisierten Fusionskoeffizienten zum ersten Mal überschritten wird (in der Literatur bestehen verschieden Maßgaben). Mojena empfiehlt einen Schwellenwert von,75 Optimale Schwellenwerte hängen stark von der vorliegenden Datenstruktur ab, Werte im Bereich von 1,8 bis,75 haben sich jedoch als gut geeignet erwiesen! Univ.-Prof. Dr. Jost Adler 94 46

47 Ablauf einer Clusteranalyse Bestimmung der zu klassifizierenden Objekte und Auswahl der Beurteilungsvariablen Feststellung des Proximitätsmaßes Wahl des Fusionierungsalgorithmus Bestimmung der optimalen Gruppenzahl Durchführung des Gruppierungsvorgangs Beurteilung der gefundenen Clusterlösung Univ.-Prof. Dr. Jost Adler 96 Zuordnungsübersicht: Fusionierungsschritte Schritt Zusammengeführte Cluster Cluster 1 Cluster Koeffizienten Cluster 1 Cluster Schritt E E E Schritt zu Fehlerquadratsumme nimmt um = 0.75 im Cluster 199 & 56 werden fusioniert Univ.-Prof. Dr. Jost Adler 97 Erstes Vorkommen des Clusters Nächster 47

48 Dendrogramm 1 5 Cluster- Lösung Cluster- Lösung 3 Cluster- Lösung Univ.-Prof. Dr. Jost Adler 98 Cluster-Zugehörigkeit Fall Univ.-Prof. Dr. Jost Adler 99 5 Cluster 4 Cluster 3 Cluster Cluster

49 Darstellung der Gruppenzugehörigkeit: Dendrogramm und Cluster-Zugehörigkeit Dendrogramm: Graphische Verdeutlichung der einzelnen Fusionierungsschritte. Normierung der Fehlerquadratsumme auf eine Skala von 0 bis 5. Man erkennt die Gruppenzugehörigkeit der einzelnen Objekte bei einer vorgegebenen normierten Fehlerquadratsumme. Vergleich zu Output Cluster-Zugehörigkeit : Dendrogramm und Cluster-Zugehörigkeit liefern beide Informationen zur Gruppenzugehörigkeit der Objekte Cluster-Zugehörigkeit verdeutlicht auch in Grenzfällen die Gruppenzugehörigkeit Dendrogramm gibt Hinweise zur jeweiligen Fehlerquadratsumme Die Informationen, die beide Objekte liefern, sind aus dem Output Zuordnungsübersicht ableitbar Univ.-Prof. Dr. Jost Adler 100 Ablauf einer Clusteranalyse Bestimmung der zu klassifizierenden Objekte und Auswahl der Beurteilungsvariablen Feststellung des Proximitätsmaßes Wahl des Fusionierungsalgorithmus Bestimmung der optimalen Gruppenzahl Durchführung des Gruppierungsvorgangs Beurteilung der gefundenen Clusterlösung Univ.-Prof. Dr. Jost Adler

50 Beurteilung der Homogenität der Gruppen: F-Wert V(J,G) F V(J) mit V(J,G) = Varianz der Variablen J in Gruppe G V(J) = Varianz der Variablen J in der Erhebungsgesamtheit Für jede Variable in einer Gruppe kann ein F-Wert errechnet werden. Je kleiner ein F-Wert, desto geringer ist die Streuung dieser Variablen in einer Gruppe im Vergleich zur Erhebungsgesamtheit. F-Werte sollten immer kleiner 1 sein ("vollkommen homogene Cluster"). Univ.-Prof. Dr. Jost Adler 10 F-Werte 3,5 F-Wert 1,5 1 0,5 0 Faktor 1 Faktor Faktor 3 Faktor 4 Cluster 1 0, , , , Cluster 0, , , , Cluster 3 0, , , , Cluster 4 1, , ,083313, Cluster 1 Cluster Cluster 3 Cluster 4 Univ.-Prof. Dr. Jost Adler

51 Interpretation der Gruppen: T-Wert X(J,G) X(J) T S(J) mit : X(J,G) = Mittelwert der X(J) S(J) Variablen J über die Objekte in Gruppe G = Gesamtmittelwert der Variablen J in der Erhebungsgesamtheit = Standardabweichung der Variablen J in der Erhebungsgesamtheit Interpretation: T < 0: Eine Variable ist in der betrachteten Gruppe im Vergleich zur Erhebungsgesamtheit unterrepräsentiert. T > 0: Eine Variable ist in der betrachteten Gruppe im Vergleich zur Erhebungsgesamtheit überrepräsentiert. Durch die jeweiligen T-Werte kann eine Charakterisierung der Cluster vorgenommen werden. Univ.-Prof. Dr. Jost Adler 104 T-Werte: Durchschnittlicher Faktorwert je Cluster durchschnittlicher Faktorwert 1 0,5 0-0,5-1 -1,5 - -,5 Faktor 1 Faktor Faktor 3 Faktor 4 Cluster 1 0, ,55E-0-0, ,9571 Cluster -6,55E-0 0, , , Cluster 3 0,51-0, , , Cluster 4 -, ,11E-0-0, ,07476 Cluster 1 Cluster Cluster 3 Cluster 4 Univ.-Prof. Dr. Jost Adler

52 Aktive und passive Segmentierungskriterien Aktive Segmentierungskriterien: die in der Clusteranalyse zur Gruppenbildung verwendeten Merkmale Passive Segmentierungskriterien: nicht zur Gruppenbildung verwendeten Merkmale Verfahren zur Analyse von Gruppenunterschieden: Dependenzanalytische Verfahren, bei denen die abhängige Variable nominales Skalenniveau aufweist Diskriminanzanalyse: nur weitere metrische Segmentierungskriterien logistische Regression: sowohl weitere metrische als auch nominale Segmentierungskriterien Kontingenzanalyse (Logit-Analyse): nur weitere nominale Segmentierungskriterien Univ.-Prof. Dr. Jost Adler 106 Praktische Anwendung in SPSS 5

53 Getting Started (0) Da in unserem Beispiel nur eine Stichprobe aus der Gesamterhebung als repräsentative Stichprobe in die Cluster-Analyse einbezogen wurde, erfolgt zunächst eine Fallunterscheidung: Univ.-Prof. Dr. Jost Adler 108 Getting Started (I) 1. Analysemethode auswählen. Variablen in das Modell einbeziehen Univ.-Prof. Dr. Jost Adler

54 Getting Started (II) 3. Verfahren wählen 4. Statistiken wählen 5. Diagramme wählen Univ.-Prof. Dr. Jost Adler 110 Fallstudie: Mette GmbH In Folge eines dramatischen Umsatzeinbruchs hat die Geschäftsleitung des Versandunternehmens Mette GmbH den Entschluss gefasst, zukünftig nicht mehr alle Kunden des Unternehmens mit den gleichen Marketingaktivitäten zu bearbeiten. Daher entschloss man sich, eine Segmentierung der Kunden nach den folgenden Kriterien vorzunehmen: Durchschnittlicher Umsatz, Durchschnittliche Bestellhäufigkeit pro Jahr, Durchschnittliches Jahreseinkommen (in Tausend Euro), Anzahl der Familienmitglieder. Für diese 4 Kriterien wurden bei 10 repräsentativen Kunden die folgenden Daten erhoben (vgl. Abb. 1): Univ.-Prof. Dr. Jost Adler

55 Fallstudie: Mette GmbH Proband Umsatz pro Jahr (in ) Bestellhäufigkeit pro Jahr Jahreseinkommen (in Tausend ) Anzahl Familienmitglieder μ 190 4,5 33,6 3 Varianz ,11 9,61 46,71 1,11 Univ.-Prof. Dr. Jost Adler 11 Aufgabe: Clusteranalyse Führen Sie für das gewählte Beispiel den ersten Schritt der Fusionierung durch. Berechnen Sie hierzu die entsprechende Distanz. Verwenden Sie als Proximitätsmaß die Quadrierte Euklidische Distanz (siehe die unten angegebene Formel). Erläutern Sie Ihre Vorgehensweise. J d k,l (xkj x lj) j1 mit: d ij Distanz der Objekte k und l x kj Wert der Variablen j bei Objekt k x lj Wert der Variablen j bei Objekt l Erläutern Sie die Tabelle Zuordnungsübersicht. Wie lässt sich beispielsweise der 6. Fusionierungsschritt interpretieren? Für welche Cluster-Lösung würden Sie sich auf Basis der in dieser Tabelle aufgeführten Daten entscheiden? Bitte begründen Sie Ihre Antwort. Bitte charakterisieren Sie die identifizierten Cluster. Welches Cluster ist für die Mette GmbH am attraktivsten. Gehen Sie bei der Beantwortung dieser Frage davon aus, dass jede Bestellung Kosten in Höhe von 10 bei der Mette GmbH verursacht. Eine Berücksichtigung von Zinseffekten ist bei der Beantwortung dieser Frage nicht erforderlich. Bestimmen Sie die F-Werte für eine -Cluster-Lösung. Wozu dienen die F-Werte und wie sind sie im vorliegenden Fall zu interpretieren? Univ.-Prof. Dr. Jost Adler

56 Empirische Forschungsmethoden: Multivariate Datenanalyse 1 Klassifikationsansätze Explorative Verfahren der Datenanalyse (strukturentdeckend).1 Faktorenanalyse. Clusteranalyse.3 Multidimensionale Skalierung 3 Konfirmatorische Verfahren der Datenanalyse (strukturprüfend) 3.1 Nichtlineare Regressionsanalyse 3. Varianzanalyse 3.3 Logistische Regression 3.4 Conjoint Measurement 3.5 Kausalanalyse Univ.-Prof. Dr. Jost Adler 114 Beispiel: Positionierung von Schokoriegeln Sie sind als Marketingassistent bei der Firma Lustle eingestellt worden, einem Hersteller von Schokoriegeln. Der Marketingleiter Herr Dr. Radler gibt Ihnen den Auftrag eine Positionierungsanalyse der verschiedenen Marken in Schokoriegelmarkt durchzuführen. Die durchschnittlichen Positionen der unterschiedlichen Riegel möchten Sie mit Hilfe einer MDS ermitteln, indem Sie sog. Lead User befragen. Folgende Marken sollen in die Positionierungsüberlegungen mit einbezogen werden: Mars Milky Way Nuts Snickers Twix Lion Lila Pause Kitkat Balisto Univ.-Prof. Dr. Jost Adler

57 Ermittlung von Wahrnehmungsräumen mittels MDS Ausgangspunkte: Es existiert eine Menge von Objekten (z.b. Produkte, Konkurrenten), die durch eine Anzahl von Attributen beschrieben werden kann. Die Attribute können als Achsen im Beurteilungs- bzw. Wahrnehmungsraum aufgefasst werden. Der Objektbeurteilung liegt ein ganzheitlicher Wahrnehmungsprozess zu Grunde. Die Auskunftspersonen nehmen globale, subjektiv empfundene Ähnlichkeits- oder Unähnlichkeitseinschätzungen zwischen den Objekten vor. Die Dimensionen des Wahrnehmungsraumes werden aus den Ähnlichkeitsurteilen erschlossen (dekompositionelles Verfahren). Univ.-Prof. Dr. Jost Adler 116 Ablauf einer Multidimensionalen Skalierung Messung von Ähnlichkeiten Wahl des Distanzmodells Ermittlung der Konfiguration Festlegung der Anzahl und Interpretation der Dimensionen Aggregation von Personen Univ.-Prof. Dr. Jost Adler

58 Ablauf einer Multidimensionalen Skalierung Messung von Ähnlichkeiten Wahl des Distanzmodells Ermittlung der Konfiguration Festlegung der Anzahl und Interpretation der Dimensionen Aggregation von Personen Univ.-Prof. Dr. Jost Adler 118 Wichtige Methoden der Ähnlichkeitsmessung (I) Rangreihung: Objektpaare werden durch Auskunftsperson mittels Paarkärtchen in eine Rangfolge gebracht; bei K Objekten ergeben sich K(K-1)/ Paare (Kärtchen); entsprechend der Reihenfolge werden Objektpaare mit Zahlen (Rangwerten) versehen; üblich sind Unähnlichkeitsdaten, mit 1 = ähnlichstes Paar und K(K-1)/ = unähnlichstes Paar. Ankerpunkt: jedes Objekt dient genau einmal als Vergleichsobjekt (Ankerpunkt); für K Objekte erhält man K(K-1) Paarvergleiche oder Rangwerte; Zusammenfassung in einer (asymmetrischen) Datenmatrix; rechnerische Transformation streng getrennt für jede Zeile. Univ.-Prof. Dr. Jost Adler

59 Wichtige Methoden der Ähnlichkeitsmessung (II) Rating-Verfahren: Objektpaare werden einzeln auf eine Ähnlichkeits- oder Unähnlichkeitsskala eingestuft: vollkommen ähnlich vollkommen unähnlich Jedes Paar wird nur einmal beurteilt, so dass für K Objekte K(K-1)/ Paare zu beurteilen sind; man erhält damit halb so viele Werte wie bei der Ankerpunktmethode; es lässt sich am schnellsten durchführen, liefert aber auch die ungenauesten Daten, weil verschiedene Paare gleiche Ähnlichkeitswerte (Ties) erhalten. Vergleich der Erhebungsverfahren: Für individuelle Analysen ist die Methode der Rangreihung besser geeignet, da sie detailliertere Daten liefert. Für aggregierte Analysen sind dagegen Ankerpunktmethode oder Ratingverfahren vorteilhaft, da sie die Datenerhebung erleichtern. Univ.-Prof. Dr. Jost Adler 10 (Un)ähnlichkeiten zwischen Objekten: Beispielhafte Beurteilung auf einer Ratingskala Mars Twix Mars Lila Pause Mars Milky Way Nuts Snickers Twix Lion Lila Pause Kitkat Balisto Mars Milky Way Nuts Snickers Twix Lion Lila Pause Kitkat, 4,000, 5,000 6,000, 3,000 5,000 3,000,,000 5,000 5,000 4,000, 4,000 6,000 4,000 3,000 3,000, 7,000 5,000 6,000 6,000 7,000 6,000, 7,000 7,000 7,000 7,000 7,000 7,000 5,000, 7,000 7,000 7,000 7,000 7,000 7,000 6,000,000 vollkommen ähnlich vollkommen unähnlich Univ.-Prof. Dr. Jost Adler 11 59

60 Ablauf einer Multidimensionalen Skalierung Messung von Ähnlichkeiten Wahl des Distanzmodells Ermittlung der Konfiguration Festlegung der Anzahl und Interpretation der Dimensionen Aggregation von Personen Univ.-Prof. Dr. Jost Adler 1 Distanzmaße zur Bestimmung der Ähnlichkeiten bzw. Unähnlichkeiten bei metrischen Variablen Euklidische Metrik: Distanz zweier Punkte nach ihrer kürzesten Entfernung zueinander x 1 R x k dkl k 6 5 (xkr xlr ) r1 4 mit d kl : Distanz der Punkte k, l x kr, x lr : Koordinaten der Punkte k, l auf der r-ten Dimension (r= 1,,... R) City-Block-Metrik: Distanz zweier Punkte als Summe der absoluten Abstände zwischen den Punkten d R x x kl kr lr r1 mit d kl : Distanz der Punkte k, l x kr, x lr : Koordinaten der Punkte k, l auf der r-ten Dimension (r= 1,,... R) Univ.-Prof. Dr. Jost Adler 13 3 x l e l x k1 x l1 x 1 x x k x l e k x 1 x k1 x l1 l R = R = 60

61 Distanzmaße zur Bestimmung der Ähnlichkeiten bzw. Unähnlichkeiten bei metrischen Variablen Minkowski-Metrik: Distanz zweier Punkte als Differenz der Koordinaten-werte über alle Dimensionen; Differenzen werden mit einem konstanten Faktor c potenziert, aufsummiert, und anschließend wird die c-te Wurzel aus dieser Summe gezogen. d kl R x r1 kr x lr c 1 c mit d kl : Distanz der Punkte k, l x kr, x lr : Koordinaten der Punkte k, l auf der r-ten Dimension (r= 1,,... R) c 1 : Minkowski-Konstante Univ.-Prof. Dr. Jost Adler 14 Euklidische Distanz Mars Milky Way Nuts Snickers Twix Lion Lila Pause Kitkat Balisto Mars Milky Way Nuts Snickers Twix Lion Lila Pause Kitkat Balisto,000,974,000,594,498,000,38,647,331,000,316 1,187,76,576,000,445 1,046,551,54,84,000 1,355,757,773 1,100 1,406 1,147,000 1,47 1,344 1,048 1,39 1,303 1,07,765,000 1,379 1,479 1,108 1,343 1,01,946,994,69,000 Univ.-Prof. Dr. Jost Adler 15 61

62 Ablauf einer Multidimensionalen Skalierung Messung von Ähnlichkeiten Wahl des Distanzmodells Ermittlung der Konfiguration Festlegung der Anzahl und Interpretation der Dimensionen Aggregation von Personen Univ.-Prof. Dr. Jost Adler 16 Vorgehensweise bei der Ermittlung der Konfiguration Ausgangspunkt ist eine Matrix mit Unähnlichkeitsdaten u kl Festlegung der Dimensionen des Wahrnehmungsraums und des Distanzmaßes (z.b. Euklidische Metrik) Vorgabe beliebiger Koordinatenwerte für die Startkonfiguration (keine Übereinstimmung der Rangfolge der Distanzen und der Unähnlichkeiten notwendig) Berechnung der Distanzen (z.b. Euklidische Distanzen d kl ) Veranschaulichung der Güte der Übereinstimmung mittels Shepard-Diagramm Wenn die Rangfolge der Distanzen der Rangfolge der Unähnlichkeiten entspricht, entsteht durch Verbindung der Punkte ein monoton steigender Verlauf Verbesserung durch Veränderung der Ausgangskonfiguration Univ.-Prof. Dr. Jost Adler 17 6

63 Rangordnung der Ähnlichkeiten U rk bei Schokoriegeln (Handbeispiel) Mars Milky Way Nuts Snickers Mars Milky Way Nuts Snickers, 4,000, 5,000 3,000, 1,000 6,000,000, 1 = ähnlichste Paar 6 = unähnlichste Paar Univ.-Prof. Dr. Jost Adler 18 Koordinatenwerte und Distanzen in der Startkonfiguration für das Handbeispiel Snickers Mars 5 Nuts Milky Way Euklidische Distanz Marke 1 Mars Mars Mars Milky Way Milky Way Nuts Marke Milky Way Nuts Snickers Nuts Snickers Snickers Distanz 8,06 7,81,00 7,6 8,54 6,40 dsnicker s, Nuts ,4 Univ.-Prof. Dr. Jost Adler 19 63

64 Beziehung zwischen Unähnlichkeiten und Distanzen (Shepard-Diagramm) Distanz Unähnlichkeit Mars Nuts Milky Way Univ.-Prof. Dr. Jost Adler Snickers Snickers Nuts 130 Mars Milky Way Mars Nuts Milky Way Snickers Disparitäten Disparitäten sind Zahlen, die von den Distanzen möglichst wenig abweichen sollen und die folgende Bedingung erfüllen müssen: Wenn u kl u, ij dann dˆ kl dˆ Disparitäten bilden schwach monotone Transformationen der Unähnlichkeiten (Distanzen). Rechnerische Ermittlung durch Mittelwertbildung zwischen den Distanzen der nichtmonotonen Objektpaare. (4) Mars Milky Way 8,06 (5) Mars Nuts 7,81 15,87 / = 7,94 ij Univ.-Prof. Dr. Jost Adler

65 Beziehung zwischen Unähnlichkeiten und Disparitäten (Shepard-Diagramm) Disparität ,94 Unähnlichkeit Univ.-Prof. Dr. Jost Adler 13 Berechnung der neuen Koordinatenwerte Berechnung der Koordinatenwerte x kr von Objekt k auf Dimension r relativ zu Objekt l mit Hilfe der Formel: x kr x kr α K 1 K 1 l1 dˆ 1 d für = 3 ergeben sich folgende neue Koordinaten für Mars: l = Milky Way Nuts Snickers kl kl x lr x kr (r = 1,..., R) x Mars1 x Mars 3 7, ,06 0, , , Univ.-Prof. Dr. Jost Adler 133 7,94 7,81 3 7, ,06 7, , , ,

66 Veränderung der Startkonfiguration für das Handbeispiel Snickers Mars Nuts Milky Way Euklidische Distanz Marke 1 Mars Mars Mars Milky Way Milky Way Nuts Marke Milky Way Nuts Snickers Nuts Snickers Snickers Distanz 7,88 7,99,11 7,61 8,4 6,53 Univ.-Prof. Dr. Jost Adler 134 STRESS-Maße als Gütemaß einer Konfiguration Das STRESS-Maß misst, wie gut (genauer gesagt, wie schlecht) eine Konfiguration die Monotoniebedingung erfüllt. Je größer der STRESS ausfällt, desto schlechter ist die Anpassung der Distanzen an die (Un)Ähnlichkeiten (badness of fit). Berechnung der Stress-Maße: (dkl dˆ kl ) k l STRESS Faktor STRESS1 k l k (d dˆ ) l kl d kl kl mit d kl dˆ kl d : Distanz zwischen Objekten k und l : Disparitäten für Objekte k und l : Mittelwert der Distanzen aller Objektpaare ( dkl k l dˆ kl ) Normalisierter Roh STRESS dˆ k l kl STRESS k l k l (d dˆ ) kl kl kl (d d) S STRESS k l k (d dˆ ) kl l dˆ 4 kl kl Univ.-Prof. Dr. Jost Adler

67 Güte der Anpassung Stress- und Anpassungsmaße Normalisierter Roh-Stress Stress-I Stress-II S-Stress Erklärte Streuung (D.A.F.) Kongruenzkoeffizient nach Tucker,0388,1970 a,5094 a,095 b,961,9804 PROXSCAL minimiert den normalisierten Roh-Stress. a. Faktor für optimale Skalierung = 1,040. b. Faktor für optimale Skalierung =,95. Univ.-Prof. Dr. Jost Adler 136 Ablauf einer Multidimensionalen Skalierung Messung von Ähnlichkeiten Wahl des Distanzmodells Ermittlung der Konfiguration Festlegung der Anzahl und Interpretation der Dimensionen Aggregation von Personen Univ.-Prof. Dr. Jost Adler

68 Zahl der Dimensionen Als Kriterium für die Zahl der Dimensionen bieten sich an: der Verdichtungskoeffizient Q, der eine obere Grenze liefert, K( K 1)/ Zahl der Ähnlichkeiten Q K R Zahl der Koordinaten Faustregel: Q der STRESS-Wert, der möglichst klein sein sollte (im Sinne des Elbow Kriteriums) die Interpretierbarkeit der Ergebnisse, die letztlich das wichtigste Kriterium bildet. Univ.-Prof. Dr. Jost Adler 138 Werte des Datenverdichtungskoeffizienten Q Zahl der Objekte k Dimensionen R = R = Univ.-Prof. Dr. Jost Adler

69 Positionierung der Objekte im Wahrnehmungsraum Dimension,6,4, Mars Tw ix Lion Balisto Kitkat 0,0 -, Snickers Nuts -,4 Lila Pause -,6 Milky Way -,8-1,0 -,5 0,0,5 1,0 Dimension 1 Univ.-Prof. Dr. Jost Adler 140 Ablauf einer Multidimensionalen Skalierung Messung von Ähnlichkeiten Wahl des Distanzmodells Ermittlung der Konfiguration Festlegung der Anzahl und Interpretation der Dimensionen Aggregation von Personen Univ.-Prof. Dr. Jost Adler

70 Möglichkeiten zur Lösung des Aggregationsproblems 1. Es werden vor der Durchführung der MDS die Ähnlichkeitsdaten durch Bildung von Mittelwerten oder Medianen aggregiert. Auf die so aggregierten Daten wird dann eine klassische MDS angewendet.. Es wird eine klassische MDS für jede Person durchgeführt und anschließend werden die Ergebnisse aggregiert. Da die Ergebnisse immer metrisch sind im Gegensatz zu den empirischen Ähnlich-keitsdaten, erscheint diese Vorgehensweise adäquater. Sie ist allerdings sehr aufwendig und infolge von Ties und fehlenden Werten nicht immer möglich. 3. Einige Computer-Programme, wie POLYCON, KYST, PROXSCAL oder ALSCAL, erlauben eine gemeinsame Analyse der Ähnlichkeitsdaten einer Mehrzahl von Personen, für die dann eine gemeinsame Konfiguration ermittelt wird. Man bezeichnet diese Art der MDS auch als RMDS (replicated MDS). Univ.-Prof. Dr. Jost Adler 14 Einbeziehung von Präferenzen und Eigenschaftsurteilen 70

71 Präferenzvektor beim Vektor-Modell x A C B Präferenzvektor E D x 1 Quelle: Backhaus, K. et al. (000) S Univ.-Prof. Dr. Jost Adler 144 Berechnung der Präferenz im Vektormodell Verwendung eines Regressionsmodells: yˆ k a R r 1 b r x rk (k = 1,..., K). mit ŷ k : geschätzter Präferenzwert einer Person bezüglich Objekt k x rk : Koordinate von Objekt k auf Dimension r (r = 1,..., R) a, b r : zu schätzende Parameter. Die Lage des Präferenzvektors lässt sich mit Hilfe der ermittelten Regressionskoeffizienten b r (r = 1,... R) bestimmen. Univ.-Prof. Dr. Jost Adler

72 Rangwerte und Koordinatenwerte zur Berechnung des Präferenzvektors Koordinatenwerte Marke Rang Dimension 1 x 1k Dimension x k Mars 9-0,606 0,19 Milky Way 6-0,16-0,701 Nuts 4-0,164-0,05 Snickers 5-0,481-0,111 Twix 8-0,446 0,464 Lion 7-0,188 0,345 Lila Pause 1 0,57-0,55 Kitkat 3 0,8 0,154 Balisto 0,755 0,415 Univ.-Prof. Dr. Jost Adler 146 Berechnung des Präferenzvektors Vorzeichen der errechneten Koeffizienten umdrehen, da die höchste Präferenz dem niedrigsten Rangwert entspricht. Koordinatenwerte zur Einzeichnung des Präferenzvektors (Punkt mit Ursprung verbinden): b 1 = 4,04 b = -,11 Modell 1 (Konstante) DIM_1 DIM_ Nicht standardisierte Koeffizienten Standardi sierte Koeffizien ten Standardf B ehler Beta T Signifikanz 5,000,446 11,13,000-4,04,859 -,845-4,896,003,11 1,13,36 1,888,108 Univ.-Prof. Dr. Jost Adler 147 7

73 Positionierung der Objekte im Wahrnehmungsraum und Präferenzvektor Dimension,6,4, Mars Tw ix Lion Balisto Kitkat 0,0 -, Snickers Nuts -,4 Lila Pause -,6 Milky Way -,8-1,0 -,5 0,0,5 1,0 Dimension 1 Univ.-Prof. Dr. Jost Adler 148 Idealpunktmodell Quelle: Backhaus, K. et al. (000) S Univ.-Prof. Dr. Jost Adler

74 Berechnung der Präferenz im Idealpunktmodell Verwendung eines modifizierten Regressionsmodells: yˆ k a R r 1 b x r rk b R1 q R qk xrk (k = 1,..., K) r 1 mit ŷ : geschätzter Präferenzwert einer Person bezüglich Objekt k x k rk : Koordinate von Objekt k auf Dimension r (r = 1,..., R) a, b r : zu schätzende Parameter Die Koordinaten des Idealpunktes erhält man durch: x * r b r br 1 k (r = 1,..., R) Univ.-Prof. Dr. Jost Adler 150 Rangwerte und (quadrierte) Koordinatenwerte zur Berechnung des Idealpunktes Koordinatenwerte =q k Marke Rang Dimension 1 x 1k Dimension x k x 1k x k x 1k + x k Mars 9-0,606 0,19 0, , ,4041 Milky Way 6-0,16-0,701 0, , , Nuts 4-0,164-0,05 0, ,0405 0,06891 Snickers 5-0,481-0,111 0, ,0131 0,4368 Twix 8-0,446 0,464 0, ,1596 0,4141 Lion 7-0,188 0,345 0, , , Lila Pause 1 0,57-0,55 0,7779 0, ,58433 Kitkat 3 0,8 0,154 0,674 0, , Balisto 0,755 0,415 0, ,175 0,745 Univ.-Prof. Dr. Jost Adler

75 Berechnung des Idealpunktes x * r b r br 1 Vorzeichen aller errechneten Koeffizienten (B) umdrehen, da die höchste Präferenz dem niedrigsten Wert entspricht. x x * 1 * 5,64 5,64 0,7514 ( 3,503) 7,006,16 ( 3,503),16 7,006 0,3035 Modell 1 (Konstante) DIM_1 DIM_ DIM_Q Nicht standardisierte Koeffizienten Standardi sierte Koeffizien ten Standardf B ehler Beta T Signifikanz 3,504 1,0,871,035-5,64 1,148-1,059-4,586,006,16 1,063,37,001,10 3,503,681,30 1,307,48 Univ.-Prof. Dr. Jost Adler 15 Positionierung der Objekte im Wahrnehmungsraum und Idealpunkt Dimension,6,4, Mars Tw ix Lion Balisto Kitkat 0,0 -, Snickers Nuts -,4 -,6 Milky Way Lila Pause -,8-1,0 -,5 0,0,5 1,0 Dimension 1 Univ.-Prof. Dr. Jost Adler

76 Einbeziehung von Eigenschaftsurteilen in die MDS (Property Fitting) Analog zur Einbeziehung von Präferenzen mittels externer Präferenzanalyse werden beim Property Fitting Eigenschaftsbeurteilungen der Befragten in die MDS-Konfiguration (Wahrnehmungsraum) einbezogen. Methodisch sind Property Fitting und externe Präferenzanalyse identisch (vgl. Vektorenmodell). Beim Property Fitting werden i.d.r. die über die Personen aggregierten Eigenschaftsbeurteilungen herangezogen. Eigenschaftsurteile können als Interpretationshilfe der mit der MDS ermittelten Dimensionen des Wahrnehmungsraumes dienen. Univ.-Prof. Dr. Jost Adler 154 MDS Univ.-Prof. Dr. Jost Adler

77 MDS Optionen Univ.-Prof. Dr. Jost Adler 156 Städte in Deutschland Univ.-Prof. Dr. Jost Adler

78 Empirische Forschungsmethoden: Multivariate Datenanalyse 1 Klassifikationsansätze Explorative Verfahren der Datenanalyse (strukturentdeckend).1 Faktorenanalyse. Clusteranalyse.3 Multidimensionale Skalierung 3 Konfirmatorische Verfahren der Datenanalyse (strukturprüfend) 3.1 Nichtlineare Regressionsanalyse 3. Varianzanalyse 3.3 Logistische Regression 3.4 Conjoint Measurement 3.5 Kausalanalyse Univ.-Prof. Dr. Jost Adler 158 Klassifikation multivariater Analysemethoden nach dem Skalenniveau der Variablen unabhängige Variable metrisches Skalenniveau nominales Skalenniveau abhängige Variable metrisches Skalenniveau nominales Skalenniveau (nichtlineare) Regressionsanalyse Diskriminanzanalyse Varianzanalyse Kontingenzanalyse Logistische Regression Univ.-Prof. Dr. Jost Adler

79 Empirische Forschungsmethoden: Multivariate Datenanalyse 1 Klassifikationsansätze Explorative Verfahren der Datenanalyse (strukturentdeckend).1 Faktorenanalyse. Clusteranalyse.3 Multidimensionale Skalierung 3 Konfirmatorische Verfahren der Datenanalyse (strukturprüfend) 3.1 Nichtlineare Regressionsanalyse 3. Varianzanalyse 3.3 Logistische Regression 3.4 Conjoint Measurement 3.5 Kausalanalyse Univ.-Prof. Dr. Jost Adler 166 Einführung: Lineare Regression Univ.-Prof. Dr. Jost Adler

80 80 Univ.-Prof. Dr. Jost Adler 168 Schätzung der Regressionsfunktion Regressionsgleichung: wahrer Wert: Schätzung: e x b b y 1 0 Zielfunktion der Einfachregression: Gleichungen zur Bestimmung der Regressionskoeffizienten: x b b ŷ 1 0 min! x b b y ŷ y e K 1 k k 1 0 k K 1 k k k K 1 k k Minimierung der Summe der Abweichungsquadrate! K 1 k k K 1 k k K 1 k k K 1 k k k K 1 k k K 1 k k 0 x x K x y x y x b K 1 k k K 1 k k K 1 k k K 1 k k K 1 k k k 1 x x K y x y x K b x b y b 1 0 ; Univ.-Prof. Dr. Jost Adler 169 Lineare Regressionsanalyse: Siehe Veranstaltung Grundlagen des Marketing oder auch Empirische Forschungsmethoden von Frau Prof. Dr. Schmitz Hier: Fokus auf Nichtlineare Regressionsanalyse Nicht immer ist ein linearer Zusammenhang anzunehmen. So ist zum Beispiel der wechselseitige Zusammenhang von Marktwachstum und Zeit oder Werbeausgaben und Werbewirkungen nicht linear. Eingrenzung

81 Modellübersicht lineares Modell, linearisierbares Modell (intrinsisch lineares Modell) Nicht linearisierbares Modell (intrinsisch nichtlineares Modell) Univ.-Prof. Dr. Jost Adler 170 Nichtlineare Modelle: Potenzmodell Y = Abhängige Variable (Regressand) X = Unabhängige Variable (Regressor) u = Störgröße (stochastischer Term) α und β = Lineare Regressionsparameter γ = Regressionspotenz Für γ = 1 ergibt sich ein lineares Regressionsmodell. Univ.-Prof. Dr. Jost Adler

82 Lineares und nichtlineares Modell Y Y X X a) Lineares Modell b) Nichtlineares Modell Univ.-Prof. Dr. Jost Adler 17 Lineares und nichtlineares Modell Es existiert eine hohe Flexibilität des nichtlinearen Modells. γ > 1 ergibt einen progressiven Verlauf γ < 1 ergibt einen degressiven Verlauf Das lineare Modell ist ein Spezialfall des nichtlinearen Modells mit γ = 1. Intrinsisch lineare Modelle mit J unabhängigen Variablen enthalten maximal J+1 zu schätzende Parameter. Intrinsisch nichtlineare Modell erschweren die Schätzung der relevanten Parameter, da deren Anzahl größer als beim intrinsisch linearen Modell ist. Univ.-Prof. Dr. Jost Adler 173 8

83 Vorgehensweise der nichtlinearen Regression 1. Visualisierung der Daten. Formulierung von Modellen 3. Finden von Startwerten 4. Schätzung der Modelle 5. Prüfung der Modelle Vgl. Backhaus et. al. (010): Fortgeschrittene, S.43ff. Univ.-Prof. Dr. Jost Adler 174 Visualisierung der Daten Angenommenes Beispiel: Zusammenhang zwischen Werbeausgaben und Absatzmenge. Ein einfaches Streudiagramm kann den Zusammenhang zwischen beiden Datenreihen grafisch verdeutlichen: Absatzmenge In Tsd. Kg Werbeausgaben in Tsd. Euro Univ.-Prof. Dr. Jost Adler

84 Vorgehensweise der nichtlinearen Regression 1. Visualisierung der Daten. Formulierung von Modellen 3. Finden von Startwerten 4. Schätzung der Modelle 5. Prüfung der Modelle Univ.-Prof. Dr. Jost Adler 176 Formulierung von Modellen Vergleich der besten Parameterschätzung anhand unterschiedlicher Modelle: Y= Absatzmenge, W = Werbeausgaben, u = Störgröße (nicht direkt beobachtbar), lineares Modell (hier nur zum Vergleich angeführt) Quadratwurzel-Modell Potenzmodell Univ.-Prof. Dr. Jost Adler

85 Formulierung von Modellen Lineares Modell kann hier vernachlässigt werden, da dies implizieren würde, dass sich bei einer Verdoppelung der Werbeausgaben auch der Konsum (Absatz) verdoppeln würde. Sowohl das Potenz- als auch das Quadratwurzelmodell (γ<1) besitzen einen degressiven (konkaven) Verlauf und berücksichtigen somit abnehmende Ertragszuwächse bei steigenden Werbeausgaben. Als weitere Überlegung bietet sich das Exponentialmodell an, welches ein sog. Wachstumsmodell bzw. Sättigungsmodell darstellt. Das Exponentialmodell konvergiert im Unterschied zum Quadratwurzel- und Potenzmodell gegen eine obere Sättigungsgrenze M. Univ.-Prof. Dr. Jost Adler 178 Exponential-Modell M=Sättigungsmenge Univ.-Prof. Dr. Jost Adler

86 Wachstumsmodelle Wachstumsmodelle sind eine wichtige Klasse von nichtlineare Modellen. Wachstumsmodelle sind dadurch gekennzeichnet, dass sie an Grenzen stoßen, die das Wachstum abschwächen und begrenzen. Im Gegensatz zum Potenz- und Exponentialmodell ist in Wachstumsmodellen üblicherweise die Zeit t die unabhängige Variable. Ausprägungen dieser Modelle mit S-förmigem Verlauf sind: Logistisches Modell Gompertz-Modell Quelle: Vgl. Backhaus et. al. (010): Fortgeschrittene, S.43ff. Univ.-Prof. Dr. Jost Adler 180 Beispiele elementarer Wachstumsmodelle (I) Konkav / Konvex (Potenzmodell) (0<c<1) / (1<c< ) Konkav mit Abschwung (Quadratisches Modell) tc (c>0) Univ.-Prof. Dr. Jost Adler

87 Beispiele elementarer Wachstumsmodelle (II) Univ.-Prof. Dr. Jost Adler 18 Konkav mit Sättigungsgrenze (Exponentialmodell) (0<b<1) S-förmig mit Sättigungsgrenze (Logistisches Modell) 1 (Gompertz-Modell) (0<b<1) (b>0) Vorgehensweise der nichtlinearen Regression 1. Visualisierung der Daten. Formulierung von Modellen 3. Finden von Startwerten 4. Schätzung der Modelle 5. Prüfung der Modelle Univ.-Prof. Dr. Jost Adler

88 Finden von Startwerten Nichtlineare Regression benötigt iterative Algorithmen. Für die zu schätzenden Parameter sind entsprechende Startwerte notwendig, damit der Optimierungsalgorithmus eine optimale Lösung finden kann. Die Wahl der Startwerte ist für die Modellberechnung von zentraler Bedeutung, da der Algorithmus ansonsten nicht konvergiert bzw. eine optimale Lösung nicht berechnen kann. Mit Hilfe von Plausibilitätsüberlegungen, bereits gewonnener Erfahrung oder einer groben subjektiven Schätzung der Modellparameter können Startwerte identifiziert werden. Weiterer Lösungsansatz: Vereinfachung des Modells (zu einfacher linearer Regression, die Ergebnisse können dann wiederum als Startwerte für das nichtlineare Modell verwendet werden). Univ.-Prof. Dr. Jost Adler 184 Vereinfachung des Modells - Potenzmodell Startwerte für das Potenzmodel: Vereinfachend sein angenommen, dass γ = 0,5, wodurch wir das Quadratwurzelmodell erhalten:, mit W = W 0,5 Ergebnis der linearen Regression: Y= 3, ,796 W Startwert α = 3,18 und β = 48,8 zur Schätzung des Potenzmodells Univ.-Prof. Dr. Jost Adler

89 Vereinfachung des Modells Exponentialmodell (I) Um Startwerte für das Exponentialmodell zu finden, ist folgende Modifikation erforderlich: Störterm jetzt im Exponenten Durch Umformung zu: ln ln Y a Univ.-Prof. Dr. Jost Adler 186 Vereinfachung des Modells Exponentialmodell (II) Daraus lässt sich ableiten, dass ln, ln Definieren: Ergebnis der Schätzung mit linearer Regression: Werte einsetzen, Annahme der Sättigungsmenge M = 300 zur Schätzung des Exponentialmodells (siehe Grafik) 5,7 0,1 Univ.-Prof. Dr. Jost Adler

90 Erweiterte Datenmatrix Nr. Werbeausgaben Absatzmenge W Y W'=Wurzel(W) Y'=ln(300-Y) 1 64,9 4, , ,1, , ,7 3, , ,3 5, , ,5 3, , ,7 1, , ,9 3, , ,3 4, , ,4, , ,3 5, , , ,9 4, , ,4 4, , ,3 5, ,6 5,91506, Univ.-Prof. Dr. Jost Adler 188 Vorgehensweise der nichtlinearen Regression 1. Visualisierung der Daten. Formulierung von Modellen 3. Finden von Startwerten 4. Schätzung der Modelle 5. Prüfung der Modelle Univ.-Prof. Dr. Jost Adler

91 Schätzung der Modelle Bei der nichtlinearen Regression bietet sich ebenfalls die Methode der kleinsten Quadrate zur Schätzung der Parameter an. Bestimmung der Modellparameter derart, dass die Residualstreuung bzw. die Summe der quadrierten Residuen (Sum of Squared Residuals) minimal wird: Bei intrinsisch nichtlinearen Parametern ist auch das entstehende Gleichungssystem nichtlinear und besitzt deshalb keine explizite Lösung. SSR muss mittels iterativer Algorithmen minimiert werden. Bspw. mit der Gauss-Newton oder Newton-Raphson-Methode. Univ.-Prof. Dr. Jost Adler 190 Installation des Solvers Bitte prüfen Sie, ob der Excel-Solver installiert ist! Zur Installation ist evtl. die Office/Excel-Programm CD notwendig! Installation Excel 003: Excel starten Extras Add-Ins Analysefunktionen Solver Installation Excel 007/010: Excel starten Schaltfläche Office Excel-Optionen Add-Ins Verwalten: Excel-Add-Ins Gehe zu Analysefunktionen Solver Univ.-Prof. Dr. Jost Adler

92 Durchführung der Schätzung mit Excel Microsoft Excel besitzt als zusätzliches Add-In den Excel Solver zur Optimierung von Entscheidungsproblemen. Solver kann sowohl lineare als auch nichtlineare Modelle berechnen. Die Zielzelle des Solvers enthält die zu optimierende Zielfunktion, in diesem Fall die SSR. Als veränderbare Zellen sind die zu schätzenden Parameter anzugeben: M, α und β. Univ.-Prof. Dr. Jost Adler 19 Durchführung der Schätzung mit Excel (II) Excel Univ.-Prof. Dr. Jost Adler 193 9

93 Durchführung der Schätzung mit Excel (III) Univ.-Prof. Dr. Jost Adler 194 Maximum-Likelihood Methode (I) Die Maximum-Likelihood Methode ist ein Schätzverfahren zur Bestimmung von Parametern auf der Basis von bekannten Daten. Der Likelihood stellt die Wahrscheinlichkeit der Parameter bei gegebenen Daten dar. Bei einer nichtlinearen Regression ist der Likelihood formuliert als:,, 1 /, Der Likelihood wird maximiert, wenn die Summe der quadrierten Residuen minimiert wird:, Univ.-Prof. Dr. Jost Adler

94 Maximum-Likelihood Methode (II) Zur Schätzung der Parameter wird der LogLikelihood LL maximiert:,, ln ln 1, Univ.-Prof. Dr. Jost Adler 196 Parameterschätzung mit Excel Univ.-Prof. Dr. Jost Adler

95 Schätzung der Varianz Die für den Likelihood erforderliche Varianz kann geschätzt werden mit: 1, Es gilt: n = Anzahl Perioden p = Anzahl der zu schätzenden Parameter = Kreiszahl Pi e = Eulersche Zahl Univ.-Prof. Dr. Jost Adler 198 Vorgehensweise der nichtlinearen Regression 1. Visualisierung der Daten. Formulierung von Modellen 3. Finden von Startwerten 4. Schätzung der Modelle 5. Prüfung der Modelle Univ.-Prof. Dr. Jost Adler 00 95

96 Statistische Prüfung der globalen Güte Prüfung der Güte mit: R (Bestimmtheitsmaß) = 1 SSR/SST Gesamtstreuung (SST, Total Sum of Squares) F-Statistik (mit Einschränkungen) Standardfehler des Modells s K= Anzahl der Beobachtungen P = Anzahl der Modellparameter Univ.-Prof. Dr. Jost Adler 01 Fallbeispiel mit SPSS Um anhand eines Fallbeispiels unterschiedliche Wachstumsmodelle zu betrachten, wird die Anwendung der Nichtlinearen Regression mit SPSS an der Betrachtung der Teilnehmerentwicklung in deutschen Mobilfunknetzen demonstriert. Das folgende Diagramm zeigt den nichtlinearen Zusammenhang der Teilnehmernutzung über den Zeitverlauf von 1990 bis

97 Teilnehmerentwicklung in deutschen Mobilfunknetzen Teilnehmer in Mio Univ.-Prof. Dr. Jost Adler 08 Schätzung von Logistischem Modell und Gompertz-Modell (I) Ermittlung von Startwerten für das Logistische Modell: 1 Linearisierung ln Ergebnis: Schätzwerte a = 6,18 und b = -0,47 Univ.-Prof. Dr. Jost Adler 09 97

98 Schätzung von Logistischem Modell und Gompertz-Modell (II) Ermittlung von Startwerten für das Gompertz-Modell mit M=100: ln Y ln M a a ln M ln Y a ln Linearisierung ln ln 110 ln ln ln Ergebnis: ln a =,748; ln(b) =-0,74 Nach Delogarithmierung erhält die Startwerte: a = 15,61 und b = 0,76 Univ.-Prof. Dr. Jost Adler 10 Schätzung von Logistischem Modell und Gompertz-Modell (III) Logistisches Modell Gompertz-Modell Delogarithmieren Univ.-Prof. Dr. Jost Adler 11 98

99 Fallbeispiel mit SPSS Rohdaten Datenimport in SPSS Univ.-Prof. Dr. Jost Adler 1 Fallbeispiel mit SPSS Logistisches Modell Univ.-Prof. Dr. Jost Adler 13 99

100 Fallbeispiel mit SPSS Logistisches Modell Modellformel eingeben, hier Logistisches Modell Parameter hinzufügen und Startwerte setzen Univ.-Prof. Dr. Jost Adler 14 Fallbeispiel mit SPSS Logistisches Modell Ergebnis der SPSS- Parameterschätzung Univ.-Prof. Dr. Jost Adler

101 Fallbeispiel mit SPSS Gompertz-Modell Modellformel eingeben, hier Gompertz-Modell Parameter hinzufügen und Startwerte setzen Univ.-Prof. Dr. Jost Adler 16 Fallbeispiel mit SPSS Gompertz-Modell Ergebnis der SPSS- Parameterschätzung Univ.-Prof. Dr. Jost Adler

102 Fallbeispiel mit SPSS Weitere Kriterien können neben der Summe der quadrierten Residuen angewendet werden. In SPSS kann unter Optionen -> Schätzmethode bspw. die Levenberg-Marquardt-Methode (LMM) neben der Sequentiellen Quadratischen Optimierung (SQO) angewendet werden. Die SQO wird insbesondere auch angewendet, wenn benutzerdefinierte Verlustfunktionen oder Nebenbedingungen für Schätzwerte der Parameter berücksichtigt werden sollen. LMM = Kombination von Gauss-Newton mit Gradienten-Verfahren Weitere Möglichkeit: Bootstrapping Ist eine Methode des Resamplings. Erzeugung wiederholter Statistiken auf Basis einer einzelnen Stichprobe. Verwendung des Bootstrap-Schätzers für den Standardfehler. Univ.-Prof. Dr. Jost Adler 18 Fallbeispiel mit SPSS Univ.-Prof. Dr. Jost Adler 19 10

103 Multivariate Wachstumsmodelle Die bisher betrachteten Modelle enthielten jeweils nur eine unabhängige Variable. Nichtlineare Modelle ermöglichen auch die Behandlung von mehreren unabhängigen Variablen (Regressoren). Aber dadurch noch mal deutlich erhöhte Komplexität in Bezug auf das Auffinden einer optimalen Lösung. Rechenaufwand wächst quadratisch mit der Zahl an zusätzlichen Variablen. Univ.-Prof. Dr. Jost Adler 1 Moderator Regression 103

104 Moderierte lineare Regression Moderator: Drittvariable, die Einfluss auf die Stärke des Zusammenhangs zwischen unabhängigen und abhängiger Variable nimmt. Prinzip der moderierten Regression: X b* Y Y = b 0 + b* X b einsetzen M b* = b 1 + b M Regressionsgleichung mit Moderatorvariablen: Y = b 0 + b 1 X + b M X Univ.-Prof. Dr. Jost Adler 30 Moderator Regression Model 1 Model Summary Adjusted Std. Error of R R Square R Square the Estimate.989 a a. Predictors: (Constant), budget_recall, budget Model 1 Regression Residual Total ANOVA b Sum of Squares df Mean Square F Sig a a. Predictors: (Constant), budget_recall, budget b. Dependent Variable: umsatz Model 1 (Constant) budget budget_recall a. Dependent Variable: umsatz Unstandardized Coefficients Coefficients a Standardized Coefficients B Std. Error Beta t Sig Univ.-Prof. Dr. Jost Adler

105 Empirische Forschungsmethoden: Multivariate Datenanalyse 1 Klassifikationsansätze Explorative Verfahren der Datenanalyse (strukturentdeckend).1 Faktorenanalyse. Clusteranalyse.3 Multidimensionale Skalierung 3 Konfirmatorische Verfahren der Datenanalyse (strukturprüfend) 3.1 Nichtlineare Regressionsanalyse 3. Varianzanalyse 3.3 Logistische Regression 3.4 Conjoint Measurement 3.5 Kausalanalyse Univ.-Prof. Dr. Jost Adler 44 Ablaufschritte einer Varianzanalyse Formulierung des Modells Streuungszerlegung F-Test Einbeziehung von Kovariaten Multiple Classification Analysis (MCA) Univ.-Prof. Dr. Jost Adler

106 Varianzanalyse abhängige Variable: metrisch skaliert unabhängige Variable: nominal skaliert Vermutung über Wirkungszusammenhang liegt zugrunde (strukturprüfendes Analyseverfahren) Typen der Varianzanalyse: Zahl der abhängigen Variablen Mindestens Zahl der unabhängigen Variablen 1 3 n Eine oder mehrere Bezeichnung des Verfahrens Einfaktorielle Varianzanalyse Zweifaktorieller Varianzanalyse Dreifaktorielle Varianzanalyse n-faktorielle Vatianzanalyse Mehrdimensionale Varianzanalyse Univ.-Prof. Dr. Jost Adler 46 Beispiel 106

107 Beispiel: Repositionierung einer Biermarke Sie sind Marketingleiter der Warburger GmbH, einer großen deutschen Brauerei. Die Produktpalette Ihres Unternehmens umfasst neben zwei Pilssorten auch Kölsch, Alt und Weizenbiere. In jüngster Zeit ist der Umsatz ihrer beiden Pilssorten eher rückläufig. Sie denken nun darüber nach, ob die beiden Pilssorten nicht spezieller auf bestimmte Marktsegmente zugeschnitten werden sollen. Ihnen schwebt eine Repositionierung der einen Sorte (Marke ) als Bier für die selbstbewusste, berufstätige Frau unter 35 vor. Die andere Sorte (Marke 1) könnte beispielsweise als Bier für den jungen erfolgreichen Mann zwischen 5 und 40 positioniert werden. Zur Überprüfung Ihrer Positionierungsüberlegungen geben Sie bei dem Marktforschungsinstitut Mafofix einen Geschmackstest in Auftrag. In einem von diesem Institut durchgeführten xx-experiment haben 4 repräsentativ ausgewählte Versuchspersonen (1 männliche und 1 weibliche) die beiden Biersorten im Blindversuch auf ihren Geschmack hin überprüft. Die Probanden mussten auf einer sechsstufigen Skala (1 = sehr gut; 6 = sehr schlecht) angeben, wie gut ihnen die Biersorten geschmeckt haben. Neben dem Geschlecht [GESCHL] und der Biersorte [BIERSORT] wurde auch der Einfluss der Verpackung (Flasche oder Dose) [VERPACK] experimentell variiert. Darüber hinaus wurde der Einfluss des Bierkonsum der Versuchspersonen (in Gläsern pro Woche) [GLÄSER] durch die Einbeziehung als Kovariate kontrolliert. Die Ergebnisse der varianzanalytischen Auswertung des Experiments sind in den entsprechenden Tabellen wiedergegeben. Univ.-Prof. Dr. Jost Adler 48 Experimentaldesign Abhängige Größe: Geschmacksbeurteilung Einflussvariablen: Geschlecht (X): männlich (1) vs. weiblich () Biersorte (Y): Marke 1 (1) vs. Marke () Verpackung (Z): Flasche (1) vs. Dose () Hieraus ergib sich ein x x -Design, d. h. 8 verschiedene Stimuluskombinationen: X1 -Y1 -Z1 (A) X1 -Y1 -Z (B) X1 -Y -Z1 (C) X1 -Y -Z (D) X - Y1 - Z1 (A) X - Y1 - Z (B) X - Y - Z1 (C) X - Y - Z (D) Univ.-Prof. Dr. Jost Adler

108 Stimuli für den Geschmackstest Flasche Dose Marke 1 A B Marke C D Univ.-Prof. Dr. Jost Adler 50 Biersorten bei den einzelnen Versuchspersonen Univ.-Prof. Dr. Jost Adler

109 Kurz-Fragebogen Stimuli: A - D Person Nr. 3 1 Bitte geben sie an, wie Ihnen das Bier A geschmeckt hat. sehr gut sehr schlecht Bitte geben sie an, wie Ihnen das Bier D geschmeckt hat. sehr gut sehr schlecht Wie viele Gläser Bier trinken Sie durchschnittlich pro Woche? ca., Gläser 4 Wie würden Sie sich selbst in Bezug auf Ihren Bierkonsum einschätzen? 1 Ich trinke regelmäßig Bier. Ich trinke gelegentlich Bier. 3 Ich trinke nur selten Bier. 4 Ich trinke normalerweise nie Bier. Univ.-Prof. Dr. Jost Adler 5 Ergebnis der Untersuchung - Männer sortiert nach Stimuli Univ.-Prof. Dr. Jost Adler

110 Ergebnis der Untersuchung - Frauen sortiert nach Stimuli Mittelwert der gesamten Stichprobe (Männer und Frauen): 3,96 Univ.-Prof. Dr. Jost Adler 54 Ablaufschritte einer Varianzanalyse Formulierung des Modells Streuungszerlegung F-Test Einbeziehung von Kovariaten Multiple Classification Analysis (MCA) Univ.-Prof. Dr. Jost Adler

111 Erklärte und nicht erklärte Abweichungen (I) Einfaktorielles Design Unterscheidung nur für eine unabhängige Variable (hier: Geschlecht) Fragestellung: Gibt es Unterschiede in der Beurteilung der Biersorten für Männer und Frauen Vorgehensweise: Summe der quadrierten Differenz der Mittelwerte der Beurteilungen der einzelnen Gruppen [Faktor: Geschlecht, Faktorstufen: Mann/Frau] mit dem Mittelwert der gesamten Stichprobe erklärte Streuung Summe der quadrierten Differenz der einzelnen Faktorstufenausprägungen (Geschmacksbeurteilungen [ Spalte Ergebnis]) mit dem Mittelwert der einzelnen Gruppen nicht-erklärte Streuung Prinzip der Streuungszerlegung: Gesamtstreuung = erklärte Streuung + nicht-erklärte Streuung Univ.-Prof. Dr. Jost Adler 56 Erklärte und nicht erklärte Abweichungen (II) abh. Var. y 11 4,15 4,1 nicht erklärte Abweichung 4,05 3,96 y 1 erklärte Abweichung y 3,9 erklärte Abweichung 3,85 y 3,8 nicht erklärte Abweichung y 3,0 1 Frauen Männer unabhängige Variable Kennzeichnung der Mittelwerte der Gruppen [Geschlecht] Univ.-Prof. Dr. Jost Adler

112 Erklärte und nicht erklärte Abweichungen (III) Mann SSt(otal) G K g 1 k 1 ( y gk y) SS b(etween) SSw(ithin) G G K K( y g y) g1 g 1 k 1 ( y gk y g ) Frau = 37,1184 = 0,1614 = 36,95834 = 46,7984 Univ.-Prof. Dr. Jost Adler 58 = 0,1734 = 46,65 Erklärte und nicht erklärte Abweichungen (IV) Gesamtabweichung = erklärte Abweichung + unerklärte Abweich. SS (gesamt) = SS (zwischen) + SS (innerhalb) G K g1 k1 (ygk y) = yg y) + G g1 ( G K g1 k1 (ygk yg) 83,9168 = 0, ,58334 Varianzen: SSt 83,9168 MSt 1,7855 G * K 1 * 4 1 SSb 0,3348 MSb 0,3348 G 1 1 MS w SSw 83, ,817 G * (K 1) * (4 1) MS F Test MS b w 0,3348 0,1843 1,817 (kommt später!) Univ.-Prof. Dr. Jost Adler 59 11

113 Zweifaktorielles Design (x experimentelles Design) Mann + Biersorte 1 Mann + Biersorte Frau + Biersorte 1 Frau + Biersorte Univ.-Prof. Dr. Jost Adler 60 Aufteilung der Gesamtstreuung im faktoriellen Design mit Faktoren (I) Gesamtstreuung SS t Streuung zwischen den Gruppen SS b Streuung innerhalb der Gruppen SS w Streuung durch Faktor A Streuung durch Faktor B Streuung durch Wechselwirkung von A und B SS A SS B SS AxB Univ.-Prof. Dr. Jost Adler

114 Aufteilung der Gesamtstreuung im faktoriellen Design mit Faktoren (II): Biersorte Univ.-Prof. Dr. Jost Adler 6 Aufteilung der Gesamtstreuung im faktoriellen Design mit Faktoren (III) : Biersorte Faktor Geschlecht Univ.-Prof. Dr. Jost Adler

115 Aufteilung der Gesamtstreuung im faktoriellen Design mit Faktoren (IV) Mittelwerte, die von Interesse sind: A B Biersorte 1 Biersorte Zeilenmittelwerte Mann 3, ,1667 4,04 Frau 3,75 4,0 3,875 Spaltenmittelwerte ,96 Streuungszerlegung: G H K SSt (ygkh y) 0,939 18,779 16,179 8,019 83, 917 g h k SS H * K * A SS G * K * B G g H h (y y) *1 * [(4,04 3,96) (3,875 3,96) ] 0,3348 g (y y) *1 * [(3,833 3,96) (4,083 3,96) ] h ŷ y y y gh ŷ 4,04 3,833 3,96 3, ŷ 4,04 4,083 3,96 4,165 1 ŷ 3,875 3,833 3,96 3,748 1 ŷ 3,875 4,083 3,96 3,998 g h G H SSAxB K * (y ŷgh) 1 * [(3,9167 3,915) (4,1667 4,165) (3,75 3,748) (4,0 3,998) ] G H g h K gh SSw (ygkh y ) 0, ,5 15, t g h k SS SS A gh SS B SS AxB SS w Univ.-Prof. Dr. Jost Adler 64 Berechnung der Varianzen Zahl der Freiheitsgrade im zweifaktoriellen Design: df A = G 1 wobei: df B = H 1 G: Zahl der Ausprägungen des Faktors A (Geschlecht) df AxB = (G - 1) (H - 1) H: Zahl der Ausprägungen des Faktors B (Biersorte) df w = G H (K - 1) K: Zahl der Beobachtungswerte df t = G H K - 1 Varianzen: SSt 83,9168 MSt 1,7855 G * H * K 1 * *1 1 SSA 0,3348 MSA 0,3348 G 1 1 SSB 0,750 MSB 0,750 H 1 1 SSAxB 0, MSAxB 0, (G 1) * (H 1) 1 MS w SSw 83, G * H * (K 1) * * (1 1) Univ.-Prof. Dr. Jost Adler

116 Aufteilung der Gesamtstreuung im dreifaktoriellen Design Gesamtstreuung SS t Streuung zwischen den Gruppen SS b Streuung innerhalb der Gruppen SS w Haupteffekte Streuung durch Faktor A SS A Streuung durch Faktor B SS B Streuung durch Faktor C SS C Interaktionen Streuung durch Wechselwirkung von A und B SS AxB Streuung durch Wechselwirkung von A und C SS AxC Streuung durch Wechselwirkung von B und C SS BxC Streuung durch Wechselwirkung von A x B x C SS AxBxC Univ.-Prof. Dr. Jost Adler 66 Ablaufschritte einer Varianzanalyse Formulierung des Modells Streuungszerlegung F-Test Einbeziehung von Kovariaten Multiple Classification Analysis (MCA) Univ.-Prof. Dr. Jost Adler

117 F-Test zur Prüfung des Zusammenhangs (I) 1. Hypothesenformulierung: H 0 : Es bestehen bzgl. der abhängigen Variable keine Unterschiede in der Wirkung alternativer Ausprägungen der unabhängige(n) Variable(n). H 1 : Es bestehen bzgl. der abhängigen Variable Unterschiede in der Wirkung alternativer Ausprägungen der unabhängige(n) Variable(n).. Festlegung der Irrtumswahrscheinlichkeit: z. B. = 5% Mit 95%iger Wahrscheinlichkeit kann man sich darauf verlassen, dass eine Ablehnung der Nullhypothese nicht zu unrecht erfolgt. Das Risiko, dass die richtige Nullhypothese irrtümlich abgelehnt wird (-Fehler), beträgt demnach 5%. 3. Berechnung der Prüfgröße: F emp = SS b SS G 1 w G erklärter Streuungsanteil MS G 1 b nicht erklärter Streuungsanteil MS w K 1 G K 1 Univ.-Prof. Dr. Jost Adler 68 F-Test zur Prüfung des Zusammenhangs (II) 4. Festlegen des kritischen F-Wertes aus der F-Tabelle: Zahl der Freiheitsgrade im zweifaktoriellen Design: df A = G 1 wobei: df B = H 1 G: Zahl der Ausprägungen des Faktors A df AxB = (G - 1) (H - 1) H: Zahl der Ausprägungen des Faktors B df w = G H (K - 1) K: Zahl der Beobachtungswerte df t = G H K - 1 und =0,05 SSA SSB MSA G 1 0,3348 MSB 0,750 0,17785 H 1 0, 3985 MS SS w w 1,885 MS SS w w 1,885 G * H* (K 1) G * H* (K 1) MS MS AxB w SSAxB (G 1) * (H 1) 0, , SSw 1,885 G * H * (K 1) Univ.-Prof. Dr. Jost Adler

118 F-Test zur Prüfung des Zusammenhangs (III) 5. Entscheidung: F emp F tab : H 0 ablehnen, d. h. mit einer Irrtumswahrscheinlichkeit von 5% wird darauf geschlossen, dass in der GG zwischen der abhängigen und den unabhängigen Variablen ein Zusammenhang besteht. F : H 0 nicht ablehnen, d. h. mit einer Irrtumswahrscheinlichkeit von 5% emp F tab kann davon ausgegangen werden, dass in der GG zwischen der abhängigen und den unabhängigen Variablen kein Zusammenhang besteht. F ; mit Freiheitsgraden 1 und 44 ca. 4,0 tab,a F tab,b ; mit Freiheitsgraden 1 und 44 ca. 4,0 H 0 nicht ablehnen kein Zusammenhang bzw. Einfluss!!! F tab,axb ; mit Freiheitsgraden 1 und 44 ca. 4,0 Univ.-Prof. Dr. Jost Adler 70 Ablaufschritte einer Varianzanalyse Formulierung des Modells Streuungszerlegung F-Test Einbeziehung von Kovariaten Multiple Classification Analysis (MCA) Univ.-Prof. Dr. Jost Adler

119 Einbeziehung von Kovariaten in die Analyse Kovariate: Metrisch skalierte unabhängige Variablen, die vermutlich einen Einfluss auf die abhängige Variabel haben Beispiel: Unterschiedlicher durchschnittlicher Bierkonsum der Probanden könnte Einfluss auf die Beurteilung/Beurteilungsvermögen der Testpersonen haben. Erklärung eines Teils der Gesamtstreuung geringere Reststreuung Univ.-Prof. Dr. Jost Adler 7 Ablaufschritte einer Varianzanalyse Formulierung des Modells Streuungszerlegung F-Test Einbeziehung von Kovariaten Analyse der Einflussstärke Univ.-Prof. Dr. Jost Adler

120 Einflussstärke: Partielles Eta Die Eta-Statistik gibt die Erklärungskraft (Varianzerklärungsanteil) der einzelnen Faktoren sowie der Interaktionseffekte im Hinblick auf die abhängige Variable an: Partielles Eta i dfi Fi df F df i i Fehler Univ.-Prof. Dr. Jost Adler 74 Multiple Classification Analysis Beurteilung der Erklärungskraft eines Faktors i: η i SSi SS t Durch quadrieren von erhält man den Anteil des Faktors an der Gesamtvarianz: Beurteilung der Qualität des Gesamtmodells: r SS b(haupteffekte) SS t Anteil der durch die Faktoren (und Kovariaten) erklärten Streuung an der Gesamtstreuung, wobei Interaktionseffekte nicht berücksichtigt werden. Univ.-Prof. Dr. Jost Adler 75 10

121 Praktische Anwendung in SPSS Getting Started (I) Analysemethode auswählen Abhängige und Unabhängige Variablen (+Kovariate) in das Modell einbeziehen Univ.-Prof. Dr. Jost Adler 77 11

122 Getting Started (II) Optionen wählen ANOVA nur mit Syntaxdatei möglich Univ.-Prof. Dr. Jost Adler 78 Mittelwerte Univ.-Prof. Dr. Jost Adler 79 1

123 Test des Zusammenhangs: Abhängige Variable Geschmacksbeurteilung Univ.-Prof. Dr. Jost Adler 80 Test des Zusammenhangs: Abhängige Variable Geschmacksbeurteilung + Univ.-Prof. Dr. Jost Adler 81 13

124 Test des Zusammenhangs: Abhängige Variable Geschmacksbeurteilung : Univ.-Prof. Dr. Jost Adler 8 Test des Zusammenhangs: Abhängige Variable Geschmacksbeurteilung : Univ.-Prof. Dr. Jost Adler 83 14

125 Test des Zusammenhangs: Abhängige Variable Geschmacksbeurteilung : + : Univ.-Prof. Dr. Jost Adler 84 Test des Zusammenhangs: Abhängige Variable Geschmacksbeurteilung Kovariate Univ.-Prof. Dr. Jost Adler 85 15

126 Test des Zusammenhangs: Abhängige Variable Geschmacksbeurteilung Haupteffekte Univ.-Prof. Dr. Jost Adler 86 Test des Zusammenhangs: Abhängige Variable Geschmacksbeurteilung Interaktionen Univ.-Prof. Dr. Jost Adler 87 16

127 Test des Zusammenhangs: Abhängige Variable Geschmacksbeurteilung Univ.-Prof. Dr. Jost Adler 88 Syntax Anova ANOVA VARIABLES= varlist BY varlist(min,max)...varlist(min,max) [WITH varlist] [/VARIABLES=...] [/COVARIATES= {FIRST**}] {WITH } {AFTER } [/MAXORDERS= {ALL** }] {n } {NONE } [/METHOD= {UNIQUE** }] {EXPERIMENTAL} [/STATISTICS= [/MISSING= Multiple Classification Analysis {HIERARCHICAL} [MCA] [REG ] [MEAN] [ALL] [NONE]] {EXCLUDE**}] {INCLUDE } **Default if the subcommand is omitted. REG (table of regression coefficients) is displayed only if the design is relevant. Univ.-Prof. Dr. Jost Adler 89 17

128 Multiple Klassifikationsanalyse (MCA) - Gesamtmittel = 3,96 Univ.-Prof. Dr. Jost Adler 90 Stärke des Zusammenhangs Univ.-Prof. Dr. Jost Adler 91 18

129 Fallstudie: Trek Enterprises Der Firma Trek Enterprises ist es durch jahrelange Forschungsarbeit gelungen, ein persönliches Kommunikationssystem in der Größe eines 5 Mark-Stückes zu entwickeln. Dieses System soll auf mittlere Sicht die bisherigen Handys ablösen. Die Entwicklung des sog. STAR Communicator, liegt in 3 Varianten (A, B und C) mit unterschiedlichem Design und geringfügig abweichendem Funktionsumfang vor. Nach Aussage des Entwicklungsleiters, Herrn Dr. Wollmann, zeichnet sich das neue System durch folgende Eigenschaften aus: Unser neuer STAR Communicator ist sehr klein und ermöglicht daher ein bequemes Tragen an der Kleidung. Er verfügt über einen integrierten Lautsprecher mit extrem hoher Klangqualität und ist zudem über eine spezielle Sprachsteuerung kinderleicht zu bedienen. Vor der weltweiten Markteinführung soll der STAR Communicator einem Testmarkt in verschiedenen deutschen Metropolen unterzogen werden. Insbesondere möchte die Marketingleitung wissen, ob die unterschiedlichen Modellvarianten (A, B und C) einen Einfluss auf die Absatzmenge haben, und welche der drei Varianten von den Nachfragern bevorzugt wird. Außerdem soll überprüft werden, ob der Vermarktungskanal (Fachhandel, Elektronik-Discounter oder Direktvertrieb über die eigenen Trek-Punkte ) einen signifikanten Einfluss auf den Absatz hat. Des Weiteren soll herausgefunden werden, ob unterstützende Werbemaßnahmen (W1, W und W3) zu einer Absatzverbesserung führen. Nach Abschluss der Datenerhebung soll Trek Enterprises einen Zwischenbericht erhalten, in dem erste Ergebnisse vorgestellt werden sollen. Für die morgige Präsentation liegen jedoch bisher nur die Daten vor. Univ.-Prof. Dr. Jost Adler 9 Fragen Sie erhalten nun die Aufgabe, die Präsentation vorzubereiten. Dazu überreicht Herr Dr. Hillen Ihnen eine Liste mit Aufgaben, die Sie möglichst bis zum Nachmittagsmeeting bearbeitet haben sollen: Wie lassen sich die Ergebnisse des Testmarktes interpretieren? Was würden Sie Trek Enterprises vor dem Hintergrund der vorliegenden Ergebnisse raten, welche der drei Varianten (A, B oder C) produziert und mit welcher Werbemaßnahme (W1, W oder W3) die Vermarktung unterstützt werden sollte. Begründen Sie Ihre Empfehlung. Welche zusätzlichen Informationen lassen sich aus der Factor Summary und dem Model Goodness of Fit der MCA ableiten, und wie sind diese im vorliegenden Fall zu interpretieren? Univ.-Prof. Dr. Jost Adler 93 19

130 Empirische Forschungsmethoden: Multivariate Datenanalyse 1 Klassifikationsansätze Explorative Verfahren der Datenanalyse (strukturentdeckend).1 Faktorenanalyse. Clusteranalyse.3 Multidimensionale Skalierung 3 Konfirmatorische Verfahren der Datenanalyse (strukturprüfend) 3.1 Nichtlineare Regressionsanalyse 3. Varianzanalyse 3.3 Logistische Regression 3.4 Conjoint Measurement 3.5 Kausalanalyse Univ.-Prof. Dr. Jost Adler 94 Beispiel: Kundenbindung im Mobilfunk (Forts.) Nachdem durch die vorangegangene Analyse vier Kundensegmente gefunden wurden, stellt sich der Arbeitgruppe im nächsten Schritt die Frage, ob diese auf Basis im Unternehmen vorhandener Daten über das individuelle Telefonierverhalten identifiziert werden können. Da die Erhebung nicht anonym stattfand, ist es der Marktforschungsabteilung auch nachträglich noch möglich, einzelnen Befragten ihre Kunden- und Gesprächsdaten zuzuordnen. Nach einer halbstündigen Brainstorming-Session werden die folgenden Variablen als mögliche Unterscheidungskriterien der vier Gruppen vorgeschlagen: Anzahl gesendeter und erhaltener SMS pro Monat Prozent der Telefonate am Wochenende Incoming-/Outgoing-Ratio (Verhältnis der eingehenden und ausgehenden Gespräche (nach Anzahl)) Umsatz pro Monat in Haupt-/Nebenzeit-Ratio (Verhältnis der Gespräche (nach Anzahl) in der Haupt- und Nebenzeit) Um zu überprüfen, ob sich die gefundenen Kundengruppen auch tatsächlich anhand dieser Merkmale unterscheiden lassen, verwendet Frau Ruppich eine logistische Regressionsanalyse. Univ.-Prof. Dr. Jost Adler

131 Ablauf einer logistischen Regression Formulierung der logistischen Regressionsfunktion Schätzung der Modellparameter Beurteilung der Modellgüte Beurteilung einzelner Variablen Klassifizierung von neuen Elementen Univ.-Prof. Dr. Jost Adler 96 Ablauf einer logistischen Regression Formulierung der logistischen Regressionsfunktion Schätzung der Modellparameter Beurteilung der Modellgüte Beurteilung einzelner Variablen Klassifizierung von neuen Elementen Univ.-Prof. Dr. Jost Adler

132 Logistisches Regressionsmodell Linking-Funktion 1 abhängige Variable 0,5 P(Y=1) Y = 1 Y = 0 0 Z b 1 b b 3 b 4 b 5 X1 X X3 X4 X5 P( Y 1 1) 1 e Z unabhängige Variablen Univ.-Prof. Dr. Jost Adler 98 Formulierung des Modells P(Y Z e 1) 1 e Z 1 1 e Z, mit Z b 0 b X b X... b X 1 1 J J P(Y 0) 1 P(Y 1) P(Y=1) 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0, 0,1 Z Univ.-Prof. Dr. Jost Adler 99 13

133 Implikationen des Logit-Models Hoch P(Y=1) 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0, 0,1 Z Marginale Wirkung einer Marketing- Aktion Low Wahrscheinlichkeit der Wahl von Alternative g Univ.-Prof. Dr. Jost Adler 300 Grundlegende Zusammenhänge unabhängige Variable aggregierte Einflussstärke (Logit) Chancenverhältnis (Odds): [p(y=1)/p(y=0)] Eintrittswahrscheinlichkeit lineare Exponentielle X j Z e Z logistische P(y=1) Verknüpfung Verknüpfung Verknüpfung Univ.-Prof. Dr. Jost Adler

134 Anwendungsvoraussetzungen Metrische oder nicht-metrische unabhängige und nominal skalierte abhängige Variable logistische Verteilung der Residuen (Annahme des logistischen Funktionsverlaufes) und Plausibilität des logistischen Wahrscheinlichkeitsverlaufs Fallzahl genügend groß (kleinste Gruppe > 5) keine Multikollinearität keine Autokorrelation Univ.-Prof. Dr. Jost Adler 303 Ablauf einer logistischen Regression Formulierung der logistischen Regressionsfunktion Schätzung der Modellparameter Beurteilung der Modellgüte Beurteilung einzelner Variablen Klassifizierung von neuen Elementen Univ.-Prof. Dr. Jost Adler

135 Die Likelihood-Funktion im binären Fall (Y=1 oder Y=0) Daten PDaten Parameter L Parameter L X, Y PX, Y I j i 1 j 1 e 1 J j X 0 j j 1 ij y i j I i e 1 J X 0 j j 1 ij 1 y i Univ.-Prof. Dr. Jost Adler 305 Maximum-Likelihood-Schätzung Ziel der Maximum-Likelihood-Methode ist es, die Parameter b j des logistischen Regressionsmodells so zu schätzen, dass die Wahrscheinlichkeit, die beobachteten Datensets zu erhalten, maximal wird. Likelihood L G K G g 1 k 1 g 1 j 0 LogLikelihood LL G K g 1 k 1 y gk ygk J exp( bhj X kj ) j 0 J exp( bgj X kj ) ln J exp( bhj X kj ) j 1 J exp( bgj X kj ) g 1 j 1 Univ.-Prof. Dr. Jost Adler 306 G mit: b gj : Parameter des logistische Regressionsmodells X kj : unabhängige Variable (j = 1,, J) g,h: Kategorie (g, h = 1,, G) k: Nachfrager (k = 1,, IK y gk: Exponent, der den Wert 1annimmt, wenn für den kten Nachfrager die Kategorie g beobachtet wird; Null sonst 135

136 Ablauf einer logistischen Regression Formulierung der logistischen Regressionsfunktion Schätzung der Modellparameter Beurteilung der Modellgüte Beurteilung einzelner Variablen Klassifizierung von neuen Elementen Univ.-Prof. Dr. Jost Adler 307 Güte des Modells Beurteilung insgesamt: Likelihood-Ratio-Test Devianz, Pearson Pseudo R-Quadrat Klassifikationsmatrix Beurteilung der einzelnen Variablen: Likelihood-Ratio-Test Wald-Test Odds-Ratio Univ.-Prof. Dr. Jost Adler

137 Unterschiedliche Formen des Likelihood -LL Minimieren L Maximieren 1 LL Maximieren - Univ.-Prof. Dr. Jost Adler 309 Der Zusammenhang zwischen den verschiedenen LogLikelihood-Werten 0 Maximal erreichbarer LL-Wert LL v Je größer die Distanz, desto besser das Modell Maximierter LL-Wert unter Berücksichtigung aller erklärenden Variablen LL o Maximierter LL-Wert des Nullmodells für den gegebenen Datensatz Quelle: Backhaus et al. (000), S Univ.-Prof. Dr. Jost Adler

138 Güte des Modells I: Likelihood-Ratio-Test Informationen zur Modellanpassung Modell Nur konstanter Term Endgültig - log Likelihood Chi-Quadrat Freiheitsg rade Signifikanz Univ.-Prof. Dr. Jost Adler 311 Güte des Modells II: Devianz und Pearson Chi-Quadrat Güte der Anpassung Pearson Abweichung Freiheitsg Chi-Quadrat rade Signifikanz H 0 : Modell bietet perfekte Anpassung, d.h. Abweichungen = 0 H 0 kann hier nicht verworfen werden. Doch Vorsicht! Werte werden auf Basis der Kovariatenmuster berechnet! Leerzellen führen zur Verzerrung der Ergebnisse. Warnungen Es gibt 1485 (75.0%) Zellen (d.h. Niveaus der abhängigen Variablen für Teilgesamtheiten) mit der Häufigkeit Null. Univ.-Prof. Dr. Jost Adler

139 Pseudo R -Statistiken Cox and Snell-R : Cox and Snell R Nagelkerke-R : McFadden-R : L 0 1 L V L 0 1 L V Nagel ker ke R 1 L 0I I I McFadden R LL 1 LL V 0 Univ.-Prof. Dr. Jost Adler 313 Güte des Modells III: Pseudo R-Quadrat und Klassifikationsmatrix Pseudo-R-Quadrat Cox und Snell Nagelkerke McFadden Grenzwerte: > 0.5 > 0. Klassifikation Vorhergesagt Beobachtet Erreichbarse in Wollende Normaltel efonierer Geschäft sleute Kids Prozent richtig Erreichbarsein Wollende % Normaltelefonierer % Geschäftsleute % Kids % Prozent insgesamt 4.0% 37.5% 31.0% 7.4% 9.9% Univ.-Prof. Dr. Jost Adler

140 Maximale und proportionale Zufallswahrscheinlichkeit Maximale Zufallswahrscheinlichkeit Anzahl der Elemente in der größten Gruppe MZW Summe aller Elemente Proportionale Zufallswahrscheinlichkeit (a: Anteilswert) zwei Gruppen-Fall allgemein PZW a 1 a PZW G a g g1 Univ.-Prof. Dr. Jost Adler 315 Press s Q-Test Kreuzvalidierung von Klassifikationsergebnissen Prüfgröße folgt einer Chi-Quadrat-Verteilung mit einem Freiheitsgrad Pr ess s Q K K K G G 1 a wobei: K = Stichprobenumfang (hier: 538) G = Anzahl der Gruppen (hier: 4) a = Anteil der korrekt klassifizierten Elemente (hier: 9,9%) , ,9 Chi-Quadrat (df = 1; = 0,05): 3,84 Klassifikationsergebnisse daher signifikant verschieden von einer zufälligen Zuordnung. Univ.-Prof. Dr. Jost Adler

141 Ablauf einer logistischen Regression Formulierung der logistischen Regressionsfunktion Schätzung der Modellparameter Beurteilung der Modellgüte Beurteilung einzelner Variablen Klassifizierung von neuen Elementen Univ.-Prof. Dr. Jost Adler 317 Güte einzelner Variablen I: Likelihood-Ratio-Test Likelihood-Quotienten-Tests Effekt Konstanter Term SMS WEEKEND IO_RATIO UMSATZ HN_RATIO - log Likelihood für reduziertes Freiheitsg Modell Chi-Quadrat rade Signifikanz Univ.-Prof. Dr. Jost Adler 318 -LL des endgültigen Modells 141

142 Güte einzelner Variablen II: Wald-Test ( : ) Cluster Erreichbarsein Wollende Normaltelefonierer Geschäftsleute Konstanter Term SMS WEEKEND IO_RATIO UMSATZ HN_RATIO Konstanter Term SMS WEEKEND IO_RATIO UMSATZ HN_RATIO Konstanter Term SMS WEEKEND IO_RATIO UMSATZ HN_RATIO 95% Konfidenzintervall für Standardf Freiheitsg Exp(B) B ehler Wald rade Signifikanz Exp(B) Untergrenze Obergrenze E E E E E E E E-04.97E E E B E E S.E Überprüfung der Nullhypothese, dass ein Regressionskoeffizient gleich 0 ist. Wald Statistik folgt bei hinreichend großer Stichprobe einer -Verteilung Univ.-Prof. Dr. Jost Adler 319 Der Ansatz der multinomialen logistischen Regression am Beispiel von vier Gruppen Gruppe Gruppe 1 p Gruppe ln p Gruppe 4 Gruppe 3 p Gruppe 1 ln p Gruppe 4 Gruppe 4 p Gruppe 3 ln p Gruppe 4 Univ.-Prof. Dr. Jost Adler 30 In SPSS: höchste Gruppe als Referenzkategorie 14

143 Interpretation der Regressionskoeffizienten bei einzelnen Variablen Bei Änderung der unabhängigen Größe X j um eine Einheit... B Exp (B) Logit Odds P(Y=1) b > 0 e b > 1 steigt um b steigt um e b steigt b < 0 e b < 1 sinkt um b sinkt um e b sinkt Odds-Ratio Univ.-Prof. Dr. Jost Adler 31 Interpretation der Parameterschätzer B bei multinomialer logistischer Regression p Gruppe 1 ln p Gruppe 4 p Gruppe ln p Gruppe 4 p Gruppe 3 ln p Gruppe 4 Cluster Erreichbarsein Wollende Normaltelefonierer Geschäftsleute Konstanter Term SMS WEEKEND IO_RATIO UMSATZ HN_RATIO Konstanter Term SMS WEEKEND IO_RATIO UMSATZ HN_RATIO Konstanter Term SMS WEEKEND IO_RATIO UMSATZ HN_RATIO B Standardf ehler Wald Freiheitsg rade Signifikanz Exp(B) E E E E E E E E E Odds Ratio Univ.-Prof. Dr. Jost Adler

144 Ablauf einer logistischen Regression Formulierung der logistischen Regressionsfunktion Schätzung der Modellparameter Beurteilung der Modellgüte Beurteilung einzelner Variablen Klassifizierung von neuen Elementen Univ.-Prof. Dr. Jost Adler 34 Klassifikation neuer Elemente Klassifizierungswahrscheinlichkeit für Ausprägungen g der abhängigen Variable Y (außer der Referenzkategorie g 0 ): P k Y h mit h 1,..., G 1 1 exp( X j G1 J j 0 exp( g 1 j 0 Klassifizierungswahrscheinlichkeit für die Referenzkategorie: P k Y G X j G1 1 b hj J 1 exp( J g 1 j 0 X b kj gj b gj ) X X kj kj ) ) Quelle: In Anlehnung an Menard, Scott (1995): Applied Logistic Regression, Thousand Oaks, CA 1995, S. 80f. Univ.-Prof. Dr. Jost Adler

145 Berechnung der Klassifizierungswahrscheinlichkeiten Gruppe B Z e^z p(y=g) Neues Element Erreichbarsein Konstanter Term Wollende SMS SMS 3 WEEKEND WEEKEND 40 IO_RATIO IO_RATIO 0.8 UMSATZ UMSATZ 60 HN_RATIO HN_RATIO 1. Normaltelefonierer Konstanter Term SMS WEEKEND IO_RATIO UMSATZ HN_RATIO Geschäftsleute Konstanter Term SMS WEEKEND IO_RATIO UMSATZ HN_RATIO.4700 Kids Konstanter Term 0 0 (1) SMS WEEKEND IO_RATIO UMSATZ HN_RATIO Summen Univ.-Prof. Dr. Jost Adler 36 Empirische Forschungsmethoden: Multivariate Datenanalyse 1 Klassifikationsansätze Explorative Verfahren der Datenanalyse (strukturentdeckend).1 Faktorenanalyse. Clusteranalyse.3 Multidimensionale Skalierung 3 Konfirmatorische Verfahren der Datenanalyse (strukturprüfend) 3.1 Nichtlineare Regressionsanalyse 3. Varianzanalyse 3.3 Logistische Regression 3.4 Conjoint Measurement 3.5 Kausalanalyse Univ.-Prof. Dr. Jost Adler

146 Beispiel: PC-Reparaturservice Sie sind von der Geschäftsleitung der JUPITER Enterprises, einem Unternehmen, das Computer und Unterhaltungselektronik vertreibt, als Berater verpflichtet worden. Im Unternehmen hat insbesondere die Computersparte mit Schwierigkeiten zu kämpfen. Durch den rasanten Preisverfall bei den Komponenten sind die Gewinnspannen in diesem Bereich deutlich unter Druck. JUPITER plant nun, durch Ausbau seines Servicebereiches den Gewinnrückgang im Hardwarebereich mindestens zu kompensieren. In einer Voruntersuchung zu diesem Thema bei Servicekunden haben sich die Kriterien: Reparaturzeit, Leihgerät, Abholdienst und Technikerpreis pro Stunde für die Beurteilung eines solchen Serviceangebotes als besonders bedeutsam herausgestellt. Um Hinweise für die konkrete Ausgestaltung des Reparaturservices zu erhalten, führen Sie mit ausgesuchten Nachfragern eine Conjoint-Analyse durch. Univ.-Prof. Dr. Jost Adler 330 Ziele der Conjoint-Analyse Analyse individueller Nutzenvorstellungen bezüglich verschiedener Leistungseigenschaften Ermittlung der relativen Wichtigkeit verschiedener Leistungseigenschaften im Hinblick auf ihre Fähigkeit zur Präferenzveränderung Berechnung von metrischen Teilnutzenwerten für die einzelnen Eigenschaftsausprägungen Ableitung metrischer Gesamtnutzenwerte von fiktiven Produkten Bestimmung der Preisbereitschaft einzelner Nachfrager Univ.-Prof. Dr. Jost Adler

147 Grobe Vorgehensweise bei einer Conjoint-Analyse Die Conjoint-Analyse gehört zu den dekompositionellen Verfahren: Gesamtbeurteilung von Stimuli durch die Befragten -> z. B. nach Präferenz sortieren! Informationen über die subjektive Präferenzveränderung bei Variation von Eigenschaftsausprägungen Univ.-Prof. Dr. Jost Adler 33 Ablaufschritte der Conjoint-Analyse Festlegung von Eigenschaften und Eigenschaftsausprägungen Erhebungsdesign Bewertung der Stimuli durch den/die Befragten Schätzung der Nutzenwerte und Interpretation Aggregation der Nutzenwerte Univ.-Prof. Dr. Jost Adler

148 Anforderungen an die Auswahl von Leistungseigenschaften und deren Ausprägungen Die Eigenschaften (Merkmale) müssen für den Probanden präferenzrelevant sein. Die Eigenschaften müssen vom Anbieter beeinflussbar sein. Die Eigenschaften müssen unabhängig voneinander sein. Die Merkmalsausprägungen müssen realisierbar sein. Die einzelnen Eigenschaftsausprägungen müssen in einer kompensatorischen Beziehung zueinander stehen. Die betrachteten Merkmale bzw. Merkmalsausprägungen dürfen keine Ausschlusskriterien (K.O.-Kriterien) darstellen. Die Anzahl der Eigenschaften und deren Ausprägungen müssen handhabbar bleiben. Univ.-Prof. Dr. Jost Adler 334 Beispiel zur Conjoint-Analyse: Computer-Reparatur-Service Merkmale Ausprägungen Maximale Reparaturzeit 3 Tage 1 Woche Wochen kostenfreies Leihgerät Nein Ja Abholdienst 4 Std. 48 Std. Keine Abholung Technikerpreis (je Std.) Univ.-Prof. Dr. Jost Adler

149 Ablaufschritte der Conjoint-Analyse Festlegung von Eigenschaften und Eigenschaftsausprägungen Erhebungsdesign Bewertung der Stimuli durch den/die Befragten Schätzung der Nutzenwerte und Interpretation Aggregation der Nutzenwerte Univ.-Prof. Dr. Jost Adler 336 Definition der Stimuli Profilmethode: Ein Stimulus besteht aus der Kombination je einer Ausprägung aller Eigenschaften J Anzahl möglicher Stimuli K, wobei M j = Anzahl der Ausprägungen m der Eigenschaft j Zwei-Faktor-Methode (Trade-Off-Analyse): Ein Stimulus besteht lediglich aus zwei Eigenschaften Anzahl möglicher Trade-Off-Matrizen für jedes möglich Paar von J Eigenschaften j (j = 1,..., J) ist gegeben durch Jede Zelle einer Trade-Off-Matrix bildet einen Stimulus M j j 1 Entscheidung zwischen den Methoden auf Basis: der Ansprüche an die Auskunftsperson des Realitätsbezuges des Zeitaufwandes Univ.-Prof. Dr. Jost Adler

150 Zahl der Stimuli vollständige Designs: Beispiel: 3 x x 3 x 3 = 54 mögliche Stimuli-Kombinationen bei einer zu großen Anzahl an Stimuli (> 0) ergeben sich erhebliche Schwierigkeiten bei der erhebungstechnischen Realisierung reduzierte Designs: Grundidee: Teilmenge von Stimuli zu finden, die das vollständige Design möglichst gut repräsentiert symmetrische Designs: jeweils gleiche Anzahl an Ausprägungen, z.b. Lateinisches Quadrat. asymmetrische Designs: verschiedene Eigenschaften weisen eine unterschiedliche Zahl von Ausprägungen auf. SPSS: orthogonales Haupteffekte-Design (ORTHOPLAN) Univ.-Prof. Dr. Jost Adler 338 Design in SPSS Univ.-Prof. Dr. Jost Adler

151 (Orthogonal) reduziertes Design der Conjoint-Analyse: Servicepakete Servicepaket 1 Reparaturzeit: Wochen Leihgerät: Ja Abholdienst: Keine Abholung Technikerpreis (je Std.): 10 Servicepaket Reparaturzeit: Wochen Leihgerät: Nein Abholdienst: 4 Std. Technikerpreis (je Std.): 100 Servicepaket 3 Reparaturzeit: 1 Woche Leihgerät: Nein Abholdienst: Keine Abholung Technikerpreis (je Std.): 100 Servicepaket 4 Reparaturzeit: 1 Woche Leihgerät: Nein Abholdienst: 48 Std. Technikerpreis (je Std.): 10 Servicepaket 5 Reparaturzeit: 1 Woche Leihgerät: Ja Abholdienst: 4 Std. Technikerpreis (je Std.): 80 Servicepaket 6 Reparaturzeit: 3 Tage Leihgerät: Nein Abholdienst: keine Abholung Technikerpreis (je Std.): 80 Servicepaket 7 Reparaturzeit: 3 Tage Leihgerät: Nein Abholdienst: 4 Std. Technikerpreis (je Std.): 10 Servicepaket 8 Reparaturzeit: Wochen Leihgerät: Nein Abholdienst: 48 Std. Technikerpreis (je Std.): 80 Servicepaket 9 Reparaturzeit: 3 Tage Leihgerät: Ja Abholdienst: 48 Std. Technikerpreis (je Std.): 100 Univ.-Prof. Dr. Jost Adler 341 Ablaufschritte der Conjoint-Analyse Festlegung von Eigenschaften und Eigenschaftsausprägungen Erhebungsdesign Bewertung der Stimuli durch den/die Befragten Schätzung der Nutzenwerte und Interpretation Aggregation der Nutzenwerte Univ.-Prof. Dr. Jost Adler

152 Bewertungsmöglichkeiten Rangreihung: Stimuli werden nach dem empfundenen Nutzen in eine Reihenfolge gebracht. Abbildung dieser Reihenfolge in der Rohdatenmatrix von SPSS: RANK: Die Eingabedaten geben den Rangplatz des betreffenden Stimuli an, beginnend mit Stimulus 1, dann usw. SEQUENCE: Die Eingabedaten geben die Profil- bzw. Stimulusnummern wieder, sortiert von der höchsten bis zur niedrigsten Präferenz. Rangwerte können auch über Ratingskalen (SCORE) oder Paarvergleiche abgefragt werden. Univ.-Prof. Dr. Jost Adler 343 Eingabedaten Rangreihung der Stimuli durch den Befragten: Servicepaket 9 Reparaturzeit: 3 Tage Leihgerät: Ja Abholdienst: 48 Std. Technikerpreis (je Std.): 100 Servicepaket 5 Reparaturzeit: 1 Woche Leihgerät: Ja Abholdienst: 4 Std. Technikerpreis (je Std.): 80 Servicepaket 6 Reparaturzeit: 3 Tage Leihgerät: Nein Abholdienst: keine Abholung Technikerpreis (je Std.): 80 Servicepaket 7 Reparaturzeit: 3 Tage Leihgerät: Nein Abholdienst: 4 Std. Technikerpreis (je Std.): 10 Servicepaket 3 Reparaturzeit: 1 Woche Leihgerät: Nein Abholdienst: Keine Abholung Technikerpreis (je Std.): 100 Servicepaket 4 Reparaturzeit: 1 Woche Leihgerät: Nein Abholdienst: 48 Std. Technikerpreis (je Std.): 10 Servicepaket 8 Reparaturzeit: Wochen Leihgerät: Nein Abholdienst: 48 Std. Technikerpreis (je Std.): 80 Servicepaket Reparaturzeit: Wochen Leihgerät: Nein Abholdienst: 4 Std. Technikerpreis (je Std.): 100 Servicepaket 1 Reparaturzeit: Wochen Leihgerät: Ja Abholdienst: Keine Abholung Technikerpreis (je Std.): 10 Eingabe in die SPSS-Rohdatenmatrix: SEQUENCE: Karte Nr.: Platz: Eingabe in SPSS RANK: Spaltenbezeichnung Platz: Karte Nr.: Univ.-Prof. Dr. Jost Adler

153 Ablaufschritte der Conjoint-Analyse Festlegung von Eigenschaften und Eigenschaftsausprägungen Erhebungsdesign Bewertung der Stimuli durch den/die Befragten Schätzung der Nutzenwerte und Interpretation Aggregation der Nutzenwerte Univ.-Prof. Dr. Jost Adler 345 Schätzung der Nutzenwerte Linear additives Modell der Conjoint-Analyse: J M j y k β x β j 1 m1 jm jm y k : geschätzter Gesamtnutzenwert für Stimulus k jm : Teilnutzenwert der Ausprägung m von Eigenschaft j x jm : 1, falls bei Stimulus k Eigenschaft j in Ausprägung m vorliegt; 0 sonst Zielkriterium zur Schätzung der Teilnutzenwerte: Die Teilnutzenwerte jm sollen so bestimmt werden, dass die resultierenden Gesamtnutzenwerte y k möglichst gut den empirischen Rangwerten p k entsprechen. 0 Univ.-Prof. Dr. Jost Adler

154 Ermittlung der Teilnutzenwerte durch metrische Lösung (I) J M j y k β x β j1 m1 jm jm 0 β 0 = Basisnutzen Beispiel: Produkt mit zwei Eigenschaften: Maximale Reparaturzeit kostenfreies Leihgerät Nein Ja Univ.-Prof. Dr. Jost Adler Tage 1 Woche Wochen Rangdaten 1 Ermittlung der Teilnutzenwerte durch metrische Lösung (II) Damit ergeben sich folgende Teilnutzenwerte: A1 A A3 = +,0 = 0,0 = -,0 B1 B = -0,166 = +0,166 0 = 3,5 Für Stimulus 1 (3 Tage/Nein) ergibt sich somit ein Gesamtnutzenwert von: Y = 3,5 + + (-0,166) = 5,33 Univ.-Prof. Dr. Jost Adler

155 Ermittlung der Teilnutzenwerte durch metrische Lösung (III) Empirische und geschätzte Nutzenwerte sowie die einfache und quadrierte Abweichung Zu der gleichen Lösung gelangt man, wenn man eine lineare Regression (Dummy-Regression) der p-werte auf die x jm Werte (0/1) aus der Conjoint-Formel durchführt. Excel Univ.-Prof. Dr. Jost Adler 349 Ermittlung der Teilnutzenwerte durch monotone Varianzanalyse monotone Varianzanalyse: f J M j p k M z k y k j 1 m1 β jm x p k : empirischer Rangwert der Stimuli (k = 1,..., K) z k : monoton angepasste Rangwerte y k : metrischer geschätzter Gesamtnutzenwert für Stimulus k f M : monotone Transformation zur Anpassung der z-werte an die y-werte : möglichst gute Anpassung i.s. des Kleinst-Quadrat-Kriteriums Zielkriterium der monotonen Varianzanalyse (Stress-Maß): jm MinMinSTRESS fm K k 1 K k 1 ( z y ) k ( y k k y ) Univ.-Prof. Dr. Jost Adler

156 Teilnutzenwerte für Proband 1 (SPSS-Ausgabedatei) Univ.-Prof. Dr. Jost Adler 351 Ablaufschritte der Conjoint-Analyse Festlegung von Eigenschaften und Eigenschaftsausprägungen Erhebungsdesign Bewertung der Stimuli durch den/die Befragten Schätzung der Nutzenwerte und Interpretation Aggregation der Nutzenwerte Univ.-Prof. Dr. Jost Adler

157 Normierung der Teilnutzenwerte Normierung: Errechnete Teilnutzenwerte (TNW) sollen für alle Befragten jeweils auf dem gleichen Nullpunkt und gleichen Skaleneinheiten basieren. Festlegung des Nullpunktes: Eigenschaftsausprägung, die den geringsten Nutzenbeitrag je Eigenschaft j liefert, d.h. Berechnung der jeweiligen Differenzen zwischen dem einzelnen TNW ( jm ) und dem kleinsten TNW ( Min j ). Formal: β * jm β Min j Justierung der Skaleneinheit: Summe der maximalen TNW je Eigenschaft j entspricht dem Maximalwert des individuellen Wertebereiches individuellen Gesamtnutzenwert des am stärksten präferierten Stimulus auf 1 setzen. * β jm Normierte Teilnutzenwerte: Univ.-Prof. Dr. Jost Adler 353 jm β βˆ jm J j 1 max β * jm Ermittlung der Teilnutzenwerte durch metrische Lösung Damit ergeben sich folgende Teilnutzenwerte: A1 A A3 = +,0 = 0,0 = -,0 B1 B = -0,166 = +0,166 0 = 3,5 Für Stimulus 1 (3 Tage/Nein) ergibt sich somit ein Gesamtnutzenwert von: Y = 3,5 + + (-0,166) = 5,33 Univ.-Prof. Dr. Jost Adler

158 Beispiel Normierung Für unser -Variablenbeispiel ergeben sich als transformierte Teilnutzenwerte: Eigenschaft A Eigenschaft B * A1 = (+,0 - (-,0)) = 4,0 * B1 = (-0,166 - (-0,1667)) = 0,0 * A = (0,0 - (-,0)) =,0 * B = (+0,166 - (-0,1667)) = 0,333 * A3 = (-,0 - (-,0)) = 0,0 Nullpunkt ergibt sich als Eigenschaftsausprägung mit dem geringsten Nutzenbeitrag Es ergeben sich folgende normierten Teilnutzenwerte durch Division durch die max. Spannweite, die der Summe der höchsten Teilnutzenwertdifferenzen je Eigenschaft entspricht (hier: 4,0 + 0,333 = 4,333): Eigenschaft A Eigenschaft B ^ ^ ˆ A = 4,0/4,333 = 0,93 1 B = 0,0/4,333 = 0,0 jm J 1 ^ ^ A =,0/4,333 = 0,46 B = 0,333/4,333 = 0,077 j1 ^ = 0,0/4,333 = 0,0 A 3 Entsprechend wird das am höchsten präferierte Produkt (3 Tage + Leihgerät) auf dem Intervall [0; 1] mit 1 (= 0,93 + 0,077) abgebildet. Das schlechteste Produkt ( Wochen + kein Leihgerät) bekommt den Gesamtnutzenwert 0. * jm max * jm Univ.-Prof. Dr. Jost Adler 355 Interpretation der Ergebnisse Teilnutzenwert ( jm ): Bedeutsamkeit der Ausprägung m von Eigenschaft j für den Gesamtnutzenwert eines Stimulus Spannweite: Differenz zwischen höchstem und niedrigstem Teilnutzenwert der verschiedenen Ausprägungen einer Eigenschaft relative Wichtigkeiten (W j ): Bedeutung einzelner Eigenschaften für die Präferenzvariation W j J m m maxβ jm minβ jm j1 max(β m jm ) min(β m jm ) Univ.-Prof. Dr. Jost Adler

159 Beispiel relative Wichtigkeit Bei Nutzung normierter Teilnutzenwerte: min(β ) 0 Entsprechend ergeben sich die relativen Wichtigkeiten der einzelnen Eigenschaften als maximale normierte Teilnutzenwerte der betreffenden Eigenschaft: m jm für Eigenschaft A (Reparaturzeit): w A = 0,93 für Eigenschaft B (Ersatzgerät): w B = 0,077 Univ.-Prof. Dr. Jost Adler 357 Teilnutzenwerte, Spannweiten und relative Wichtigkeiten der Conjoint-Ergebnisse Vollständiges Beispiel: Person Prof. Adler Merkmale Teilnutzenwerte Spannweiten rel. Wichtigkeit Maximale Reparaturzeit -3,00 ( Wochen) 0,67 (1 Woche),33 (3 Tage) 5,33 5,33/10,16 = 5,46% Leihgerät -0,75 (Nein) 0,75 (Ja) 1,50 1,50/10,16 = 14,75% Abholdienst -0,67 (keine Abholung) 0,33 (48 Std.) 0,33 (4 Std.) 1,00 1,00/10,16 = 9,84% Technikerpreis 3,50 (80 /Std.),33 (100 /Std.) 1,17 (10 /Std.),33,33/10,16 =,95% 10,16 100% Univ.-Prof. Dr. Jost Adler

160 Relative Wichtigkeiten der Leistungsmerkmale , ,75 9,84,95 0 Maximale Reparaturzeit kostenfreies Leihgerät Univ.-Prof. Dr. Jost Adler 359 Abholdienst Technikerpreis (je Std.) Relative Wichtigkeiten für Proband 1 (SPSS-Ausgabedatei) Univ.-Prof. Dr. Jost Adler

161 Möglichkeiten der Aggregation von Conjoint- Ergebnissen Zusammenfassung von Individualanalysen: Durchführung einer Individualanalyse für jede Auskunftsperson Aggregation der individuellen (normierten) TNW durch Mittelwertbildung über die Personen Durchführung einer gemeinsamen Conjoint-Analyse: die verschiedenen Auskunftspersonen werden als Wiederholung (Replikation) des Untersuchungsdesigns aufgefasst. Anzahl der Datenpunkte = N * Anzahl der Stimuli K Univ.-Prof. Dr. Jost Adler 361 Ergebnisse der Befragung Utilities Phillip Daniel Markus Jeannette Kathrin Gabor repzeit 3 Tage Woche Wochen leihger Nein Ja abhold Keine Abholung Stunden Stunden tpreis (Constant) Importance repzeit leihger abhold tpreis Univ.-Prof. Dr. Jost Adler

162 Ergebnisse einer Conjoint-Analyse für Proband 1 (SPSS-Ausgabedatei) Teilnutzenwerte für jede Eigenschaftsausprägung mit ihren jeweiligen Standardfehlern Relative Wichtigkeiten der Eigenschaften Regressionskoeffizient der metrischen Variablen Technikerpreis Gütemaße der Conjoint Analyse Univ.-Prof. Dr. Jost Adler 364 Gütemaße der Conjoint-Analyse Pearson sche Korrelationskoeffizient: Korrelation zwischen den metrischen Gesamtnutzenwerten und den tatsächlichen (empirischen) Rängen empirische Rangdaten müssen als metrisch unterstellt werden (nur bei Präferenzwertmethode der Fall) Kendall s Tau: Korrelation zwischen den tatsächlichen und den aus den Conjoint- Ergebnissen resultierenden Rängen Validitätsprüfung der Ergebnisse: mittels der auf die Holdout-Karten bezogenen Korrelationskoeffizienten Holdoutkarten: Stimuli, die bei der Rangreihung durch den Befragten mit einsortiert, bei der Schätzung der TNW jedoch nicht berücksichtigt werden. Univ.-Prof. Dr. Jost Adler

163 Aggregierte Ergebnisse Univ.-Prof. Dr. Jost Adler 366 Praktische Anwendung in SPSS 163

164 Getting Started (I) 1. Stimuli-Design mittels Orthoplan erzeugen. Eigenschaften definieren 3. Eigenschaftsausprägungen definieren 4. Optionen wählen: wir wollen 9 Stimulikarten (optional können Holdout Karten definiert werden) für unser Experiment Univ.-Prof. Dr. Jost Adler 368 Getting Started (II) 5. Arbeitsdatei ersetzen und OK klicken 6. Wir erhalten ein reduziertes Design mit 9 Stimuli (und 3 Holdout Karten zur Validierung) 7. Orthogonales Design anzeigen lassen 8. Relevante Eigenschaften auswählen und Liste sowie Profile auswählen Univ.-Prof. Dr. Jost Adler

165 Getting Started (III) Wir erhalten eine Liste für den Experimentator (Übersicht) Und die einzelnen Karten zur Durchführung des Experimentes (Karten werden den Probanden zur Sortierung vorgelegt). Die so erhaltenen Eigenschaftsausprägungskombinationen können ausgedruckt und ausgeschnitten werden, oder mit einem Grafikprogramm schöner gestaltet werden. Univ.-Prof. Dr. Jost Adler 370 Getting Started (IV) Das Experiment wird nun durchgeführt, d.h. die Karten werden den Probanden zur Sortierung vorgelegt und in einem Fragebogen die Reihenfolge der Präferenzen abgefragt Daten der Probanden werden in eine SPSS-Datei übertragen (hier: Experiment ohne Holdout-Karten!) Verwendete Methode: Methode der Rangreihung; bspw. beurteilt Phillip den Stimuli Nummer 5 am besten (pref1) => Sequence! Univ.-Prof. Dr. Jost Adler

166 Getting Started (V) Die eigentliche Conjoint Analyse kann in SPSS nicht aus dem Menü gestartet werden. Schreiben einer Syntaxdatei zwingend erforderlich. Univ.-Prof. Dr. Jost Adler 37 Getting Started (VI) Definition des Nutzenmodells: Conjoint Plan Data Sequenz Subject Factors Plot Methodenaufruf der Conjoint Analyse Befehl, der dem Programm den Pfad zu der zuvor erstellten Datei mit dem Stimulidesign (Orthogonales Design) mitteilt Befehl, der dem Programm den Pfad zu der Datei mit den Erhebungsdaten (Präferenzordnungen der Probanden) mitteilt Befehl zur Methode der Rangreihung Befehl zur Identifizierung einzelner Fälle; Datenzeilen mit dem gleichen ID-Wert werden als ein Fall betrachtet Angabe der in die Analyse einfließenden Variablen (Eigenschaften) Grafische Anzeige der relativen Wichtigkeiten Univ.-Prof. Dr. Jost Adler

167 Getting Started (VII) Unter Hilfe/Themen bietet SPSS zu allen Syntaxbefehlen eine umfassende Dokumentation Univ.-Prof. Dr. Jost Adler 374 Getting Started (VIII) Konkretes Beispiel einer Syntaxdatei Der Befehl Utility speichert zusätzlich die Datei Utility.sav ab, die folgende Daten zu jeder Person enthält: Personenkennung Konstanter Term der Conjoint-Schätzung Teilnutzenwerte der einzelnen Eigenschaftsausprägungen Gesamtnutzenwerte des reduzierten Designs (Score) Univ.-Prof. Dr. Jost Adler

168 Getting Started (IX) Univ.-Prof. Dr. Jost Adler 376 Anwendungsmöglichkeiten von Conjoint-Analysen 168

169 Anwendungsbezogene Ergebnisnutzung Marktsegmentierungen und Positionierungen (Normierte) Teilnutzenwerte dienen als Basis der Segmentierung und Positionierung Clusteranalyse kann zur Segmentbildung herangezogen werden Wettbewerberpositionen z.b. auf den Dimensionen Preis und Leistung Simulationen Ermittlung von Preisabsatzfunktionen Berechnung von Marktanteilen für unterschiedliche PC- Service-Konfigurationen in definierten Segmenten Abschätzung von Marktanteilsveränderungen bei Konkurrenzreaktionen Bestimmung gewinnmaximaler Produktkonzepte durch Einbeziehung von Kosten Univ.-Prof. Dr. Jost Adler 378 Übertragung von Leistungseigenschaften auf Preisbereitschaften TNW TNW 3 -L- - P Leistungsniveau Preisniveau Eine Leistungssteigerung von L entspricht einer Preissteigerung von P, d.h. Nutzensteigerung durch Leistungssteigerung wird durch sinkenden Nutzen aufgrund eines steigenden Preises kompensiert. Univ.-Prof. Dr. Jost Adler

170 Positionierung mit Conjoint-Daten: Beispielhafte Marktcharakterisierung Neben dem eigenen Unternehmen (Wir) sind zwei relevante Konkurrenzangebote (Konkurrent 1 und Konkurrent ) am Markt vertreten Die am Markt angebotenen Produktalternativen unterscheiden sich wie folgt: Wir Konkurrent 1 Konkurrent Maximale Reparaturzeit 0,67 (1 Woche) 0,67 (1 Woche) -3,00 ( Wochen) Leihgerät -0,75 (Nein) 0,75 (Ja) -0,75 (Nein) Abholdienst 0,33 (48 Std.) 0,33 (48 Std.) -0,67 (keine Abholung) Technikerpreis,33 (100 /Std.),33 (100 /Std.) 3,50 (80 /Std.) Basisnutzen,9,9,9 Gesamtnutzen 5,50 7,00,00 Univ.-Prof. Dr. Jost Adler 380 Leistung schlägt Preis 8 7 7,50 7,00 Gesamtnutzenwert ,00 5, Zielposition Konkurrent 1 Konkurrent Wir Maximale Reparaturzeit kostenfreies Leihgerät Abholdienst Technikerpreis 3 Tage Univ.-Prof. Dr. Jost Adler 381 Ja 4 Std. 10 /Std. 1 Woche Ja Wochen Nein 48 Std. keine Abholung 100 /Std. 80 /Std. 1 Woche Nein 48 Std. 100 /Std. TNW Leistung 3,41 1,75-4,4 0,5 TNW Preis 1,17,33 3,50,33 170

171 Wettbewerbspositionierung auf Basis der Conjoint-Ergebnisse Teilnutzenwert Leistung Zielposition Konkurrent 1 Wir Konkurrent Teilnutzenwert Preis Univ.-Prof. Dr. Jost Adler 38 Auswirkung der Verbesserung der Reparaturzeit 8 7 7,50 7,00 7,16 Gesamtnutzenwert ,00 Zielposition Konkurrent 1 Konkurrent Wir Maximale Reparaturzeit kostenfreies Leihgerät Abholdienst Technikerpreis 3 Tage Univ.-Prof. Dr. Jost Adler 383 Ja 4 Std. 10 /Std. 1 Woche Ja Wochen Nein 48 Std. keine Abholung 100 /Std. 80 /Std. 3 Tage Nein 48 Std. 100 /Std. TNW Leistung 3,41 1,75-4,4 1,91 TNW Preis 1,17,33 3,50,33 171

172 Bestimmung einer Preis-Absatz-Funktion mit Hilfe der traditionellen Conjoint-Analyse (I) Beispiel: PC-Angebot der Firma FireDrive Marktvolumen Stück Gesamtnutzenwerte bei alternativen Preisen für 10 repräsentative Nachfrager Unternehmen FireDrive Well Jungernate Preis in EURO NF 1 3,30 3,70 6,50 11,30 6,40 10,50 NF 4,10 8,60 11,60 14,90 7,60 8,10 NF 3,80 4,10 8,0 13,10 1,80 10,50 NF 4 1,40 6,50 10,50 14,80 5,40 10,00 NF 5 5,40 11,40 1,60 14,00 9,30 10,90 NF 6 3,0 4,10 5,00 10,80 10,50 8,40 NF 7 5,50 9,00 1,0 13,30 7,60 8,90 NF 8 3,0 9,90 10,70 1,80 8,0 9,50 NF 9 3,40 4,40 8,80 13,50 1,50 9,40 NF 10 5,30 7,90 1,70 16,30 11,70 10,0 Univ.-Prof. Dr. Jost Adler 384 Bestimmung einer Preis-Absatz-Funktion mit Hilfe der traditionellen Conjoint-Analyse (II) Gesamtnutzenwerte bei alternativen Anbietern und Preisen Anzahl der Käufe bei alternativen Preisen Unternehmen FireDrive Well Jungernate FireDrive Preis in EURO NF 1 3,30 3,70 6,50 11,30 6,40 10, NF 4,10 8,60 11,60 14,90 7,60 8, NF 3,80 4,10 8,0 13,10 1,80 10, NF 4 1,40 6,50 10,50 14,80 5,40 10, NF 5 5,40 11,40 1,60 14,00 9,30 10, NF 6 3,0 4,10 5,00 10,80 10,50 8, NF 7 5,50 9,00 1,0 13,30 7,60 8, NF 8 3,0 9,90 10,70 1,80 8,0 9, NF 9 3,40 4,40 8,80 13,50 1,50 9, NF 10 5,30 7,90 1,70 16,30 11,70 10, Summe Stichprobe Gesamtmarkt Univ.-Prof. Dr. Jost Adler

173 Bestimmung einer Preis-Absatz-Funktion mit Hilfe der traditionellen Conjoint-Analyse (III) PAF für FireDrive: Preis x (Gesamtmarkt) Univ.-Prof. Dr. Jost Adler 386 Zentrale Annahmen bei der Ermittlung der Preis-Absatz-Funktion mittels Conjoint-Analyse Bei dem zu untersuchenden Objekt handelt es sich um ein langlebiges Gebrauchsgut, d.h. Wiederkäufe sind ausgeschlossen. Es liegt eine repräsentative Erhebung vor. Die relevanten Preissprünge sind bekannt. Eine Bestimmung aller relevanten Konkurrenzangebote ist möglich. Unter den am Markt verfügbaren Angeboten wird nur der Stimulus (Leistung) mit der höchsten Präferenz auch gekauft (First Choice-Regel). Univ.-Prof. Dr. Jost Adler

174 Weitere Entscheidungsregeln von Konsumenten (I) Attraktionsregel: Das auch BTL (Bradley/Terry/Luce) genannte Modell geht davon aus, dass der Nachfrager i ein Produkt k nur mit einer bestimmten Wahrscheinlichkeit erwirbt. Logit-choice-Regel: Die Regel geht in ähnlicher Weise vor, wie die Attraktionsregel. Der Unterschied besteht jedoch darin, dass der bevorzugten Alternative ein höheres Gewicht als den weniger präferierten Alternativen beigemessen wird. P i k P i k i k K U k 1 K e k 1 U U i k e i k U i k mit: P ik U ik Wahrscheinlichkeit, dass Nachfrager i Produkt k kauft Nutzen für Nachfrager i von Produkt k Univ.-Prof. Dr. Jost Adler 388 Weitere Entscheidungsregeln von Konsumenten (II) Alpha-Regel: Bei der Alpha-Regel wird ein Zusammenhang zwischen der Attraktionsregel und dem aktuellen Marktanteil eines Produktes hergestellt. Hierzu wird der Parameter so geschätzt, dass der prognostizierte Marktanteil auf Basis der Conjoint-Ergebnisse dem aktuellen Marktanteil möglichst gut annähert. P i k U α i k K Uα i k k 1 Schätzung des Parameters Alpha l 1 mˆ k P k I aus dem Modell (geschätzter Marktanteil) i1 K m k Minimierung der Entropie: Entropie m k ln k1 mˆ k ( ak ) m k : tatsächlicher Marktanteil der Marke k Univ.-Prof. Dr. Jost Adler

175 Empirische Forschungsmethoden: Multivariate Datenanalyse 1 Klassifikationsansätze Explorative Verfahren der Datenanalyse (strukturentdeckend).1 Faktorenanalyse. Clusteranalyse.3 Multidimensionale Skalierung 3 Konfirmatorische Verfahren der Datenanalyse (strukturprüfend) 3.1 Nichtlineare Regressionsanalyse 3. Varianzanalyse 3.3 Logistische Regression 3.4 Conjoint Measurement 3.5 Kausalanalyse Univ.-Prof. Dr. Jost Adler 390 Abbildung von Ursache-Wirkungs-Zusammenhängen (I) Hypothese 1: Die Herstellungskosten eines Produktes (X1) beeinflussen den Kaufpreis dieses Produktes (X). X 1 X Hypothese : Die Einstellung gegenüber einem Produkt () bestimmt die Kaufabsicht des Kunden (). ξ η Univ.-Prof. Dr. Jost Adler

176 Abbildung von Ursache-Wirkungs-Zusammenhängen (II) Ursache Zusammenhang Wirkung latent 1 1 latent kontinuierlich/diskret - linear/nicht linear - stetig/nicht stetig kontinuierlich/diskret manifest x 1 x manifest Theorie Univ.-Prof. Dr. Jost Adler 39 Problem: Operationalisierung hypothetischer Konstrukte Hypothetische Konstrukte stellen nicht direkt messbare Größen dar, die deshalb häufig auch als latente Variable bezeichnet werden. Da latente Variable nicht direkt beobachtbar sind, bedarf es der Entwicklung eines Messinstruments, d.h. das hypothetische Konstrukt ist zu definieren und es ist nach Messindikatoren zu suchen - was als Operationalisierung bezeichnet wird. Ziel einer jeden Konstruktmessung ist es, Beziehungen zwischen beobachtbaren Variablen (auch als Indikatorvariablen oder Indikatoren bezeichnet) und dem interessierenden Konstrukt zu spezifizieren, um mit Hilfe dieser Zusammenhänge das latente Konstrukt empirisch messbar zu machen und damit dann Zusammenhänge zwischen latenten Konstrukten untersuchen zu können. Univ.-Prof. Dr. Jost Adler

177 Beziehung zwischen hypothetischem Konstrukt und seinen Indikatoren Reflektive Indikatoren Formative Indikatoren Hypothetisches Konstrukt Messfehler Hypothetisches Konstrukt Indikator Indikator Indikator Messfehler Messfehler Messfehler Indikator Indikator Indikator Quelle: In Anlehnung an: Homburg, Christian/Giering, Annette (1996): Konzeptualisierung und Operationalisierung komplexer Konstrukte, in: Marketing ZFP, Heft 1, S. 7. Univ.-Prof. Dr. Jost Adler 400 Reflektives Modell und klassische Testtheorie (II) Klassisches Messmodell: O = T + Fehler Effektindikator O xx Latente Variable T xx : Reliabilitätskoeffizient: quadrierte Korrelation (SMC) zwischen Indikator und latenter Variablen : Fehlervarianz Univ.-Prof. Dr. Jost Adler

178 Beispiel: Consumer Innovativeness aus dem Handbook of Marketing Scales Univ.-Prof. Dr. Jost Adler 448 Konstruktdefinition und Beschreibung der Messmthode Univ.-Prof. Dr. Jost Adler

179 Items for Consumer Independet Judgement Making Univ.-Prof. Dr. Jost Adler 450 Items for Consumer Novelty Seeking Univ.-Prof. Dr. Jost Adler

180 Strukturgleichungsmodelle Bitte Kapitel im MVA- Fortgeschrittenen Buch lesen! Eigenschaften von Strukturgleichungsmodellen Strukturgleichungsmodelle sind: lineare Modelle, die die Kovarianz zwischen beobachtbaren Variablen beschreiben, Modelle, die latente Variable oder Faktoren beinhalten können, sowie Beziehungen zwischen diesen, Methoden für relativ große Stichproben, die versuchen, die beobachtete (empirische) Kovarianz- oder Korrelationsmatrix unter Verwendung iterativer Schätzverfahren der modelltheoretischen Kovarianz- oder Korrelationsmatrix möglichst gut anzupassen, Modelle zur Hypothesenprüfung (konfirmatorisch) Univ.-Prof. Dr. Jost Adler

181 Bestandteile eines Strukturgleichungsmodells ξ 1 : Kompetenz η 1 : Vertrauenswürdigkeit η : Kundenbindung Univ.-Prof. Dr. Jost Adler 474 Teilmodelle eines Strukturgleichungsmodells Strukturmodell: bildet die theoretischen Zusammenhänge zwischen den latenten Variablen ab. Dabei werden die endogenen Variablen durch die im Modell unterstellten kausalen Beziehungen erklärt, wobei die exogenen Variablen als erklärende Größen dienen, die selbst aber durch das Kausalmodell nicht erklärt werden. Messmodell der latenten exogenen Variablen: enthält empirische Indikatoren, die zur Operationalisierung der exogenen Variablen dienen und spiegelt die vermuteten Zusammenhänge zwischen diesen Indikatoren und den exogenen Größen wider. Messmodell der latenten endogenen Variablen: enthält empirische Indikatoren, die zur Operationalisierung der endogenen Variablen dienen und spiegelt die vermuteten Zusammenhänge zwischen diesen Indikatoren und den endogenen Größen wider. Univ.-Prof. Dr. Jost Adler

182 Kernaufgaben bei Strukturgleichungsmodellen 1. Identifikation der latent relevanten Variablen. Benennung der Variablen als exogen oder endogen 3. Anordnen der endogenen Variablen 4. Spezifikation der Strukturbeziehungen zwischen den latenten Variablen Univ.-Prof. Dr. Jost Adler 476 Ablaufschritte von Strukturgleichungsmodellen (1) Hypothesenbildung () Erstellung eines Pfaddiagramms und Spezifikation der Modellstruktur (3) Identifikation der Modellstruktur (4) Parameterschätzung (5) Beurteilung der Schätzergebnisse (6) Modifikation der Modellstruktur Univ.-Prof. Dr. Jost Adler

183 Konzeptualisierung von Strukturgleichungsmodellen Start Etablierte Theorien, Erfahrungswerte, explorative Forschung Ja Irrelevante Konstrukte vorhanden? Konstruktidentifikation (Latente Variablen, die in das Modell einbezogen werden) Relevante Konstrukte vergessen? Ja Nein Festlegung der endogenen und exogenen Variabeln Nein Nein Konzeption eines alternativen Modells Kann jede Variable eindeutig als exogen oder endogen festgelegt werden? Ja Anordnen der endogenen Variabeln Nein Ja Nein Irrelevante Beziehungen vorhanden? Anordnung eindeutig? Ja Spezifikation der Struktur- Beziehungen für jede endogene Variable Nein Ja Relevante Beziehungen vergessen? Nein Finales Testmodell Nein Univ.-Prof. Dr. Jost Adler 478 Ablaufschritte von Strukturgleichungsmodellen (1) Hypothesenbildung () Erstellung eines Pfaddiagramms und Spezifikation der Modellstruktur (3) Identifikation der Modellstruktur (4) Parameterschätzung (5) Beurteilung der Schätzergebnisse (6) Modifikation der Modellstruktur Univ.-Prof. Dr. Jost Adler

184 Hypothesenbildung Univ.-Prof. Dr. Jost Adler 480 Hypothesenbildung Voraussetzung für die Anwendung eines Strukturmodells sind explizite Hypothesen über die Beziehungen in einem empirischen Datensatz, die aufgrund sachlogischer Überlegungen aufgestellt werden müssen. Die Besonderheit von Strukturgleichungsmodellen ist darin zu sehen, dass theoretisch unterstellte Beziehungen zwischen latenten Variablen überprüft werden können. Die Vorüberlegungen richten sich sowohl auf Richtung und Stärke der Beziehungen, als auch auf die Zahl möglicher latenter Variablen. Beispiele für ein Hypothesensystem: H 1 : Je kompetenter ein Anbieter wahrgenommen wird, desto stärker ist die Kundenbindung. H : Je vertrauenswürdiger ein Anbieter wahrgenommen wird, desto stärker ist die Kundenbindung. H 3 : Je kompetenter ein Anbieter wahrgenommen wird, desto vertrauenswürdiger wird er wahrgenommen. Univ.-Prof. Dr. Jost Adler

185 Typische Fragestellungen von Strukturgleichungsmodellen Fragestellung Beeinflussen Einstellungen und Bezugsgruppen die Verhaltensintentionen gegenüber Zeitschriften? Erfolgsfaktoren bei Produktneueinführungen Welche Auswirkungen hat die Stressbelastung während der Schwangerschaft auf die Gesundheit des Kindes? Latente Variablen Einstellung Bezugsgruppe Verhaltensintention Kommunikationsaufwand Markenbekanntheit Distribution Einführungserfolg Stressbelastung Gesundheit des Kindes Beispielindikatoren Fishbein-Modell Einfluss von Kollegen/Freunden Wahrscheinlichkeit Zeitschrift zu lesen/zu kaufen Werbeausgaben, Anzahl POS- Aktivitäten Bekanntheitsgrad, Distributionsquote Wiederkaufrate, Umsatz, Marktanteil Finanzielle Sorgen Harmonie mit dem Partner Berufliche Belastung Größe und Gewicht bei der Geburt Anzahl der (Kinder-)Krankheiten im ersten Lebensjahr Univ.-Prof. Dr. Jost Adler 48 Ablaufschritte von Strukturgleichungsmodellen (1) Hypothesenbildung () Erstellung eines Pfaddiagramms und Spezifikation der Modellstruktur (3) Identifikation der Modellstruktur (4) Parameterschätzung (5) Beurteilung der Schätzergebnisse (6) Modifikation der Modellstruktur Univ.-Prof. Dr. Jost Adler

186 Variablen in einem vollständigen Strukturgleichungsmodell Abkürzung Sprechweise Bedeutung Eta latente endogene Variable, die im Modell erklärt wird Ksi latente exogene Variable, die im Modell nicht erklärt wird y -- Indikator-(Mess-) Variable für eine latente endogene Variable x -- Indikator-(Mess-) Variable für eine latente exogene Variable Epsilon Residualvariable für eine Indikatorvariable y Delta Residualvariable für eine Indikatorvariable x Zeta Residualvariable für eine latente endogene Variable Univ.-Prof. Dr. Jost Adler 484 Empfehlungen zur Erstellung eines Pfaddiagramms (1) Direkt beobachtbare (Mess-) Variable (x und y) werden in Kästchen () dargestellt, latente Variable und Messfehlervariable werden durch Kreise ( ) gekennzeichnet. () Eine kausale Beziehung zwischen zwei Variablen wird immer durch einen geraden Pfeil (=Pfad) dargestellt. (). (3) Die Endpunkte eines Pfeils bilden also immer zwei kausal verbundene Variable. Ein Pfeil hat seinen Ursprung immer bei der verursachenden (unabhängigen) Variablen und seinen Endpunkt immer bei der abhängigen Variablen. (4) Ein Pfeil hat immer nur eine Variable als Ursprung und eine Variable als Endpunkt. (5) Je-desto-Hypothesen beschreiben kausale Beziehungen zwischen latenten Variablen, wobei die zu Anfang genannte Größe immer die verursachende (, ) und die zuletzt genannte Größe immer die kausal abhängige () Größe darstellt. (6) Der Einfluss von Residualvariablen (Messfehlervariablen) wird ebenfalls durch Pfeile dargestellt, wobei der Ursprung eines Pfeils immer von der Residualvariablen ausgeht. (7) Nicht kausal interpretierte Beziehungen werden immer durch gekrümmte Doppelpfeile dargestellt und sind nur zwischen latenten exogenen Variablen (- Variable) oder zwischen den Messfehlervariablen (,, ) zulässig. ( ) (8) Ein vollständiges Strukturgleichungsmodell besteht immer aus zwei Messmodellen und einem Strukturmodell. (9) Ein Pfaddiagramm ist üblicherweise wie folgt aufgebaut: - Links steht das Messmodell der latenten exogenen Variablen. Es besteht aus x- und -Variablen und den Beziehungen zwischen diesen Variablen. - In der Mitte wird das Strukturmodell abgebildet. Es besteht aus - und - Variablen und den Beziehungen zwischen diesen Variablen. - Rechts steht das Messmodell der latenten endogenen Variablen. Es besteht aus y- und -Variablen und den Beziehungen zwischen diesen Variablen. Univ.-Prof. Dr. Jost Adler

187 Die acht Parametermatrizen eines vollständigen Strukturgleichungsmodells Abkürzung Sprechweise Bedeutung y Lambda-y ist eine (p x m)-matrix und repräsentiert die Koeffizienten der Pfade zwischen y und - Variablen x Lambda-x ist eine (q x n)-matrix und repräsentiert die Koeffizienten der Pfade zwischen x und - Variablen B Beta ist eine (m x m)-matrix und repräsentiert die postulierten kausalen Beziehungen zwischen -Variablen Gamma ist eine (m x n)-matrix und repräsentiert die postulierten Beziehungen zwischen den und -Variablen Phi ist eine (n x n)-matrix und enthält die Kovarianzen zwischen den -Variablen Psi ist eine (m x m)-matrix und enthält die Kovarianzen zwischen den -Variablen Theta- Epsilon ist eine (p x p)-matrix und enthält die Kovarianzen zwischen den -Variablen Theta- Delta ist eine (q x q)-matrix und enthält die Kovarianzen zwischen den -Variablen Univ.-Prof. Dr. Jost Adler 486 Beispielhaftes Pfaddiagramm Messmodell 1 1 X 1 Messmodell X Messmodell der latent exogenen Variablen Einstellung 1 Kaufverhalten 1 Zahl der Käufe Y 1 1 Messmodell der latent endogenen Variablen Strukturmodell Univ.-Prof. Dr. Jost Adler

188 Skalierung latenter Variablen Unbeobachtbare Variablen habe keine natürliche Maßeinheit Ein Weg der Skalierung ist die Standardisierung der latenten Variablen (d.h. Varianzen auf 1 setzen) Ein anderer Weg ist die Zuweisung der Variablen zur Messeinheit eines ihrer Indikatoren (z.b. 1 =1 im Pfadmodell) Die beiden Wege sind identisch und führen zu den gleichen statistischen Aussagen Univ.-Prof. Dr. Jost Adler 488 Ablaufschritte von Strukturgleichungsmodellen (1) Hypothesenbildung () Erstellung eines Pfaddiagramms und Spezifikation der Modellstruktur (3) Identifikation der Modellstruktur (4) Parameterschätzung (5) Beurteilung der Schätzergebnisse (6) Modifikation der Modellstruktur Univ.-Prof. Dr. Jost Adler

189 Minimalanforderung zur Modellidentifizierung Bedingung: t 1 (p q) (p q 1) mit: t: Zahl der zu schätzenden Parameter p: Zahl der y-variablen q: Zahl der x-variablen Merke: Die rechte Seite der Gleichung entspricht der Anzahl der Varianzen und Kovarianzen zwischen den beobachtbaren Variablen. Univ.-Prof. Dr. Jost Adler 490 Ablaufschritte von Strukturgleichungsmodellen (1) Hypothesenbildung () Erstellung eines Pfaddiagramms und Spezifikation der Modellstruktur (3) Identifikation der Modellstruktur (4) Parameterschätzung (5) Beurteilung der Schätzergebnisse (6) Modifikation der Modellstruktur Univ.-Prof. Dr. Jost Adler

190 Parameterschätzung Ziel: Minimierung der Differenz zwischen der modelltheoretischen Varianz-Kovarianz-Matrix () und der empirischen Korrelationsmatrix (R) bzw. der Varianz-Kovarianz-Matrix (S) Zur Abbildung dieser Differenz können unterschiedliche Diskrepanzfunktionen (F) verwendet werden. Die Maximum-Likelihood-Methode verwendet folgende Diskrepanzfunktion: F ML = log + tr(s -1 ) log S (p + q + t) F ML (N - 1) folgt einer Chi-Quadrat-Verteilung. Univ.-Prof. Dr. Jost Adler 49 Verfahren zur Schätzung der Modellparameter bei kovarianzbasierten Verfahren Kriterium ML GLS ULS SLS ADF Annahme einer Multinormalverteilung ja ja nein nein nein Skaleninvarianz ja ja nein ja ja Stichprobengröße >100 >100 >100 >100 1,5 r(r+1) Inferenzstatistiken (²) ja ja nein nein ja r: Anzahl der manifesten Variablen (p+q) Univ.-Prof. Dr. Jost Adler

191 Ablaufschritte von Strukturgleichungsmodellen (1) Hypothesenbildung () Erstellung eines Pfaddiagramms und Spezifikation der Modellstruktur (3) Identifikation der Modellstruktur (4) Parameterschätzung (5) Beurteilung der Schätzergebnisse (6) Modifikation der Modellstruktur Univ.-Prof. Dr. Jost Adler 496 Beurteilung der Gesamtgüte von Kovarianzstrukturmodellen (AMOS) Chi-Quadrat-Wert (χ ) Goodness-of-Fit-Index (GFI) Adjusted-Goodness-of-Fit-Index (AGFI) Normed Fit Index (NFI) Comparative Fit Index (CFI) Root-Mean-Square-Error of Approximation (RMSEA ) 0,05/0,08 Standardized Root Mean square Residual (SRMR) 0,1 Anpassungsmaß Anforderung /d.f.,5 GFI 0,9 AGFI 0,9 NFI 0,9 CFI 0,9 RMSEA 0,05 Univ.-Prof. Dr. Jost Adler

192 Ablaufschritte von Strukturgleichungsmodellen (1) Hypothesenbildung () Erstellung eines Pfaddiagramms und Spezifikation der Modellstruktur (3) Identifikation der Modellstruktur (4) Parameterschätzung (5) Beurteilung der Schätzergebnisse (6) Modifikation der Modellstruktur Univ.-Prof. Dr. Jost Adler 499 Ablaufschritte zur Modifikation einer gegebenen Modellstruktur Residuen Modifikationsindizes Parameter aufnehmen Einfacheres Modell Komplexeres Modell gegebenes Modell Parameter ausschließen Standardfehler der Schätzung Critical Ratio (C.R.) Univ.-Prof. Dr. Jost Adler

193 AMOS-Oberfläche Univ.-Prof. Dr. Jost Adler 501 Ausgewählte Zeichenwerkzeuge zur Erstellung des Pfaddiagramms manifeste Variable zeichnen latente Variable zeichnen Indikator mit Messfehler zeichnen Kausalpfeil zeichnen Kovarianz zeichnen Messfehler zeichnen ein Element markieren alle Elemente markieren Markierung löschen Kopieren Verschieben Löschen Form einer Variablen oder eines (Doppel-)Pfeils verändern Rotieren Zauberstab: Kausalpfeile und Kovariate an der manifesten oder latenten Variablen ausrichten Univ.-Prof. Dr. Jost Adler

194 Fallbeispiel in AMOS Fallbeispiel in AMOS - KFA Im Rahmen einer Marktforschungsstudie eines Unternehmens wurden 1130 Kunden zur Zufriedenheit bzw. zum Vertrauen befragt. Im anschließenden Analyseprozess sollte geprüft werden, welche Faktoren zur Einstellungsbildung maßgeblich sind und ob Zufriedenheit und Vertrauen der Kunden miteinander in Beziehung stehen. Dazu wurde ein schriftlicher Fragebogen mit einer 7-stufigen Likertskala zur empirischen Erhebung der kundenindividuellen Einstellung erstellt. Die nachfolgenden Folien zeigen den zugehörigen Analyseprozess mit AMOS und SPSS. Univ.-Prof. Dr. Jost Adler

195 Fallbeispiel in AMOS Struktur- und Messmodell Univ.-Prof. Dr. Jost Adler 505 Fallbeispiel in AMOS - Daten Univ.-Prof. Dr. Jost Adler

196 Fallbeispiel in AMOS - Output Univ.-Prof. Dr. Jost Adler 507 Fallbeispiel in AMOS - Report Univ.-Prof. Dr. Jost Adler

197 Fallbeispiel in AMOS - SEM Univ.-Prof. Dr. Jost Adler 509 Fallbeispiel in AMOS - Output Univ.-Prof. Dr. Jost Adler

198 Fallbeispiel in AMOS - Report Univ.-Prof. Dr. Jost Adler

Prof. Dr. Gabriele Helga Franke TESTTHEORIE UND TESTKONSTRUKTION

Prof. Dr. Gabriele Helga Franke TESTTHEORIE UND TESTKONSTRUKTION Prof. Dr. Gabriele Helga Franke TESTTHEORIE UND TESTKONSTRUKTION 2. FS Master Rehabilitationspsychologie, SoSe 2012 Faktorenanalyse/ faktorielle Validität 2 Einleitung Allgemeines zu Faktorenanalysen (FA)

Mehr

Abb. 30: Antwortprofil zum Statement Diese Kennzahl ist sinnvoll

Abb. 30: Antwortprofil zum Statement Diese Kennzahl ist sinnvoll Reklamationsquote Stornierungsquote Inkassoquote Customer-Lifetime-Value Hinsichtlich der obengenannten Kennzahlen bzw. Kontrollgrößen für die Neukundengewinnung wurden den befragten Unternehmen drei Statements

Mehr

Institut für Marketing und Handel Prof. Dr. W. Toporowski. SPSS Übung 5. Heutige Themen: Faktorenanalyse. Einführung in Amos

Institut für Marketing und Handel Prof. Dr. W. Toporowski. SPSS Übung 5. Heutige Themen: Faktorenanalyse. Einführung in Amos SPSS Übung 5 Heutige Themen: Faktorenanalyse Einführung in Amos 1 Faktorenanalyse Datei Öffnen V:/Lehre/Handelswissenschaft/Daten_Übung3/Preisimage_F_und_C.sav 2 Datensatz (I) v1 Wenn Produkte zu Sonderpreisen

Mehr

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Klausur, Multivariate Verfahren, SS 2006, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 08.08.2006 Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Gesamtpunkte: 39 Aufgabe

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

Faktorenanalyse. 1. Grundlegende Verfahren. Bacher, SoSe2007

Faktorenanalyse. 1. Grundlegende Verfahren. Bacher, SoSe2007 Faktorenanalyse Bacher, SoSe2007 1. Grundlegende Verfahren explorative FA (EXFA): Für eine Menge von Variablen/Items werden zugrunde liegende gemeinsame (latente) Dimensionen/Faktoren gesucht, die Faktorstruktur

Mehr

Zeichen bei Zahlen entschlüsseln

Zeichen bei Zahlen entschlüsseln Zeichen bei Zahlen entschlüsseln In diesem Kapitel... Verwendung des Zahlenstrahls Absolut richtige Bestimmung von absoluten Werten Operationen bei Zahlen mit Vorzeichen: Addieren, Subtrahieren, Multiplizieren

Mehr

Statistische Auswertung:

Statistische Auswertung: Statistische Auswertung: Die erhobenen Daten mittels der selbst erstellten Tests (Surfaufgaben) Statistics Punkte aus dem Punkte aus Surftheorietest Punkte aus dem dem und dem Surftheorietest max.14p.

Mehr

Marktforschung und Datenanalyse

Marktforschung und Datenanalyse Marktforschung und Datenanalyse Lehrstuhl für BWL, insb. Marketing von Prof. Dr. Reinhold Decker Dozentin: Anja Hörmeyer (M.Sc.) Universität Bielefeld, Lehrstuhl für BWL, insb. Marketing 1 Anja Hörmeyer

Mehr

Die Clusteranalyse 24.06.2009. Clusteranalyse. Grundidee Mögliche Anwendungsgebiete gg Vorgehensweise Beispiele. methodenlehre ll Clusteranalyse

Die Clusteranalyse 24.06.2009. Clusteranalyse. Grundidee Mögliche Anwendungsgebiete gg Vorgehensweise Beispiele. methodenlehre ll Clusteranalyse Clusteranalyse Thomas Schäfer SS 2009 1 Die Clusteranalyse Grundidee Mögliche Anwendungsgebiete gg Vorgehensweise Beispiele Thomas Schäfer SS 2009 2 1 Die Clusteranalyse Grundidee: Eine heterogene Gesamtheit

Mehr

Inhaltsverzeichnis. Abbildungsverzeichnis...III. 1 Management Summary... 1. 2 Einleitung... 5. 3 Vorgehensweise und Methodik... 6

Inhaltsverzeichnis. Abbildungsverzeichnis...III. 1 Management Summary... 1. 2 Einleitung... 5. 3 Vorgehensweise und Methodik... 6 I Inhaltsverzeichnis Abbildungsverzeichnis...III 1 Management Summary... 1 2 Einleitung... 5 3 Vorgehensweise und Methodik... 6 3.1 Sekundärerhebung...6 3.2 Primärerhebung...14 3.2.1 Design der empirischen

Mehr

Pfadanalyse. 1. Grundlegende Verfahren. Bacher, SoSe2007

Pfadanalyse. 1. Grundlegende Verfahren. Bacher, SoSe2007 Pfadanalyse Bacher, SoSe2007 1. Grundlegende Verfahren Explorative Pfadanalyse: Kausale Beziehungen zwischen Variablen werden aufgedeckt, erforderlich ist eine kausale Anordnung der Variablen. Konfirmatorische

Mehr

Korrelation (II) Korrelation und Kausalität

Korrelation (II) Korrelation und Kausalität Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen

Mehr

Direkter Verkauf von Produkten. 2.2.2.3.1. Antwortprofil

Direkter Verkauf von Produkten. 2.2.2.3.1. Antwortprofil 2.2.2.3. Direkter Verkauf von Produkten 2.2.2.3.1. Antwortprofil Bei der Zielsetzung direkter Verkauf von Produkten kristallisieren sich insbesondere zwei Methoden heraus, die mit dieser Zielsetzung zum

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

26. GIL Jahrestagung

26. GIL Jahrestagung GeorgAugustUniversität Göttingen 26. GIL Jahrestagung Einsatz von künstlichen Neuronalen Netzen im Informationsmanagement der Land und Ernährungswirtschaft: Ein empirischer Methodenvergleich Holger Schulze,

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren Lineargleichungssysteme: Additions-/ Subtraktionsverfahren W. Kippels 22. Februar 2014 Inhaltsverzeichnis 1 Einleitung 2 2 Lineargleichungssysteme zweiten Grades 2 3 Lineargleichungssysteme höheren als

Mehr

Grundlagen der Inferenzstatistik

Grundlagen der Inferenzstatistik Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,

Mehr

Hans-Friedrich Eckey SS 2004. Skript zur Lehrveranstaltung Multivariate Statistik

Hans-Friedrich Eckey SS 2004. Skript zur Lehrveranstaltung Multivariate Statistik Hans-Friedrich Eckey SS 2004 Skript zur Lehrveranstaltung Multivariate Statistik Vormerkungen I Vorbemerkungen Das Manuskript beinhaltet den gesamten Stoff, der Bestandteil der Lehrveranstaltung "Multivariate

Mehr

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro Auswerten mit Excel Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro 1. Pivot-Tabellen erstellen: In der Datenmaske in eine beliebige Zelle klicken Registerkarte Einfügen

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

QM: Prüfen -1- KN16.08.2010

QM: Prüfen -1- KN16.08.2010 QM: Prüfen -1- KN16.08.2010 2.4 Prüfen 2.4.1 Begriffe, Definitionen Ein wesentlicher Bestandteil der Qualitätssicherung ist das Prüfen. Sie wird aber nicht wie früher nach der Fertigung durch einen Prüfer,

Mehr

Einführung in die Algebra

Einführung in die Algebra Prof. Dr. H. Brenner Osnabrück SS 2009 Einführung in die Algebra Vorlesung 13 Einheiten Definition 13.1. Ein Element u in einem Ring R heißt Einheit, wenn es ein Element v R gibt mit uv = vu = 1. DasElementv

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 2 Multivariate Verfahren Musterlösung Aufgabe 1 (28 Punkte) Der Marketing-Leiter einer Lebensmittelherstellers möchte herausfinden, mit welchem Richtpreis eine neue Joghurt-Marke auf

Mehr

5 Zusammenhangsmaße, Korrelation und Regression

5 Zusammenhangsmaße, Korrelation und Regression 5 Zusammenhangsmaße, Korrelation und Regression 5.1 Zusammenhangsmaße und Korrelation Aufgabe 5.1 In einem Hauptstudiumsseminar des Lehrstuhls für Wirtschafts- und Sozialstatistik machten die Teilnehmer

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Aufgabe 1: Grundzüge der Wahrscheinlichkeitsrechnung 19 P. Als Manager eines großen

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt. Stock, Nordflügel R. 0-49 (Persike) R. 0- (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike [email protected] WS 008/009 Fachbereich

Mehr

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel Ausarbeitung zum Proseminar Finanzmathematische Modelle und Simulationen bei Raphael Kruse und Prof. Dr. Wolf-Jürgen Beyn zum Thema Simulation des Anlagenpreismodels von Simon Uphus im WS 09/10 Zusammenfassung

Mehr

Faktorenanalyse. Fakultät für Human und Sozialwissenschaften Professur für Forschungsmethodik und Evaluation in der Psychologie

Faktorenanalyse. Fakultät für Human und Sozialwissenschaften Professur für Forschungsmethodik und Evaluation in der Psychologie Faktorenanalyse Fakultät für Human und Sozialwissenschaften Professur für Forschungsmethodik und Evaluation in der Psychologie Seminar: Multivariate Analysemethoden Seminarleiter: Dr. Thomas Schäfer Referenten:

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Manche sagen: Ja, manche sagen: Nein Wie soll man das objektiv feststellen? Kann man Geschmack objektiv messen? - Geschmack ist subjektiv

Mehr

Florian Frötscher und Demet Özçetin

Florian Frötscher und Demet Özçetin Statistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen, Probleme. Florian Frötscher und Demet Özçetin [email protected] SFB 538 Mehrsprachigkeit Max-Brauer-Allee 60

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

Abb. 28: Antwortprofil zur Frage Zielsetzung beim Einsatz der Neukundengewinnung: Gewinnung von Interessenten

Abb. 28: Antwortprofil zur Frage Zielsetzung beim Einsatz der Neukundengewinnung: Gewinnung von Interessenten 2. Zielsetzungen beim Einsatz der Methoden der Neukundengewinnung: G ew innung von Interessenten 1 = trifft nicht zu 7 = trifft zu 1 2 3 4 5 6 7 Katalog Solo-Mailing Verbundmailing Beilagen Paketbeilage

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis Das komplette Material finden Sie hier: Download bei School-Scout.de

Mehr

Ergebnisse Kundenbefragung

Ergebnisse Kundenbefragung Ergebnisse Kundenbefragung MCP mein coach + partner Im Schollengarten 1d 76646 Bruchsal Ansprechpartner: Steffen Ansmann Projektleiter Innovations- und Marktforschung TÜV Rheinland Kraftfahrt GmbH Am Grauen

Mehr

Erfüllen wir Ihre Erwartungen?

Erfüllen wir Ihre Erwartungen? S Berliner Sparkasse Erfüllen wir Ihre Erwartungen? Loyalitäts- und Zufriedenheitsbefragung in der BusinessLine. Ergebnisse 2012. Vorwort Liebe Kundin, lieber Kunde, eine lebendige Kundenbeziehung entsteht

Mehr

Varianzanalyse (ANOVA: analysis of variance)

Varianzanalyse (ANOVA: analysis of variance) Varianzanalyse (AOVA: analysis of variance) Einfaktorielle VA Auf der Basis von zwei Stichproben wird bezüglich der Gleichheit der Mittelwerte getestet. Variablen müssen Variablen nur nominalskaliert sein.

Mehr

Was meinen die Leute eigentlich mit: Grexit?

Was meinen die Leute eigentlich mit: Grexit? Was meinen die Leute eigentlich mit: Grexit? Grexit sind eigentlich 2 Wörter. 1. Griechenland 2. Exit Exit ist ein englisches Wort. Es bedeutet: Ausgang. Aber was haben diese 2 Sachen mit-einander zu tun?

Mehr

Lineare Funktionen. 1 Proportionale Funktionen 3 1.1 Definition... 3 1.2 Eigenschaften... 3. 2 Steigungsdreieck 3

Lineare Funktionen. 1 Proportionale Funktionen 3 1.1 Definition... 3 1.2 Eigenschaften... 3. 2 Steigungsdreieck 3 Lineare Funktionen Inhaltsverzeichnis 1 Proportionale Funktionen 3 1.1 Definition............................... 3 1.2 Eigenschaften............................. 3 2 Steigungsdreieck 3 3 Lineare Funktionen

Mehr

Einfache Varianzanalyse für abhängige

Einfache Varianzanalyse für abhängige Einfache Varianzanalyse für abhängige Stichproben Wie beim t-test gibt es auch bei der VA eine Alternative für abhängige Stichproben. Anmerkung: Was man unter abhängigen Stichproben versteht und wie diese

Mehr

Hauptseminar am Fachgebiet für Quantitative Methoden der Wirtschaftswissenschaften

Hauptseminar am Fachgebiet für Quantitative Methoden der Wirtschaftswissenschaften Hauptseminar am Fachgebiet für Quantitative Methoden der Wirtschaftswissenschaften Fehlende Daten in der Multivariaten Statistik SS 2011 Allgemeines Das Seminar richtet sich in erster Linie an Studierende

Mehr

Einer Reihe von Merkmalen zugrunde liegende, gemeinsame Faktoren ermitteln.

Einer Reihe von Merkmalen zugrunde liegende, gemeinsame Faktoren ermitteln. Faktoranalysen Aufbau 1. Sinn und Zweck 2. Eigenschaften der Merkmale 3. Extraktion der Faktoren 4. Anzahl der Faktoren 5. Rotation der Faktoren 6. Interpretation der Faktoren Sinn und Zweck Einer Reihe

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift:

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift: 20-minütige Klausur zur Vorlesung Lineare Modelle im Sommersemester 20 PD Dr. Christian Heumann Ludwig-Maximilians-Universität München, Institut für Statistik 2. Oktober 20, 4:5 6:5 Uhr Überprüfen Sie

Mehr

Lineare Gleichungssysteme I (Matrixgleichungen)

Lineare Gleichungssysteme I (Matrixgleichungen) Lineare Gleichungssysteme I (Matrigleichungen) Eine lineare Gleichung mit einer Variable hat bei Zahlen a, b, die Form a b. Falls hierbei der Kehrwert von a gebildet werden darf (a 0), kann eindeutig aufgelöst

Mehr

Die Klimaforscher sind sich längst nicht sicher. Hans Mathias Kepplinger Senja Post

Die Klimaforscher sind sich längst nicht sicher. Hans Mathias Kepplinger Senja Post 1 Die Klimaforscher sind sich längst nicht sicher Hans Mathias Kepplinger Senja Post In: Die Welt, 25. September 2007 - Dokumentation der verwandten Daten - 2 Tabelle 1: Gefährlichkeit des Klimawandels

Mehr

Elternumfrage 2014. Kita und Reception. Campus Hamburg

Elternumfrage 2014. Kita und Reception. Campus Hamburg Elternumfrage 2014 Kita und Reception Campus Ergebnisse der Elternumfrage 2014 Um die Auswertung der Elternumfrage 2014 richtig lesen und interpretieren zu können, sollten folgende Punkte beachtet werden:

Mehr

Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER

Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER Abamsoft Finos in Verbindung mit der Webshopanbindung wurde speziell auf die Shop-Software shop to date von DATA BECKER abgestimmt. Mit

Mehr

Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test?

Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test? Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test? Auch wenn die Messungsmethoden ähnlich sind, ist das Ziel beider Systeme jedoch ein anderes. Gwenolé NEXER g.nexer@hearin gp

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

Ihr Mandant möchte einen neuen Gesellschafter aufnehmen. In welcher Höhe wäre eine Vergütung inklusive Tantieme steuerrechtlich zulässig?

Ihr Mandant möchte einen neuen Gesellschafter aufnehmen. In welcher Höhe wäre eine Vergütung inklusive Tantieme steuerrechtlich zulässig? Ihr Mandant möchte einen neuen Gesellschafter aufnehmen. In welcher Höhe wäre eine Vergütung inklusive Tantieme steuerrechtlich zulässig? Oft wirft die Aufnahme neuer Gesellschafter oder auch die Einstellung

Mehr

Messung von Veränderungen. Dr. Julia Kneer Universität des Saarlandes

Messung von Veränderungen. Dr. Julia Kneer Universität des Saarlandes von Veränderungen Dr. Julia Kneer Universität des Saarlandes Veränderungsmessung Veränderungsmessung kennzeichnet ein Teilgebiet der Methodenlehre, das direkt mit grundlegenden Fragestellungen der Psychologie

Mehr

Behörde für Bildung und Sport Abitur 2008 Lehrermaterialien zum Leistungskurs Mathematik

Behörde für Bildung und Sport Abitur 2008 Lehrermaterialien zum Leistungskurs Mathematik Abitur 8 II. Insektenpopulation LA/AG In den Tropen legen die Weibchen einer in Deutschland unbekannten Insektenpopulation jedes Jahr kurz vor Beginn der Regenzeit jeweils 9 Eier und sterben bald darauf.

Mehr

Primzahlen und RSA-Verschlüsselung

Primzahlen und RSA-Verschlüsselung Primzahlen und RSA-Verschlüsselung Michael Fütterer und Jonathan Zachhuber 1 Einiges zu Primzahlen Ein paar Definitionen: Wir bezeichnen mit Z die Menge der positiven und negativen ganzen Zahlen, also

Mehr

Grundlagen der Datenanalyse am Beispiel von SPSS

Grundlagen der Datenanalyse am Beispiel von SPSS Grundlagen der Datenanalyse am Beispiel von SPSS Einführung Dipl. - Psych. Fabian Hölzenbein [email protected] Einführung Organisatorisches Was ist Empirie? Was ist Statistik? Dateneingabe

Mehr

UNIVERSITÄT LEIPZIG WIRTSCHAFTSWISSENSCHAFTLICHE FAKULTÄT DIPLOM-PRÜFUNG

UNIVERSITÄT LEIPZIG WIRTSCHAFTSWISSENSCHAFTLICHE FAKULTÄT DIPLOM-PRÜFUNG UNIVERSITÄT LEIPZIG WIRTSCHAFTSWISSENSCHAFTLICHE FAKULTÄT DIPLOM-PRÜFUNG DATUM: 13. Juli 2009 FACH: TEILGEBIET: KLAUSURDAUER: Allgemeine Betriebswirtschaftslehre SL-Schein Marketing II 60 Minuten PRÜFER:

Mehr

Cross-Selling bei Versicherungen. Empirische Analyse zu Status quo, Trends und zukünftigen Anforderungen

Cross-Selling bei Versicherungen. Empirische Analyse zu Status quo, Trends und zukünftigen Anforderungen Georg Wittmann Christiane Früchtl Silke Weisheit Cross-Selling bei Versicherungen Empirische Analyse zu Status quo, Trends und zukünftigen Management Summary In der Studie Cross-Selling bei Versicherungen

Mehr

«Eine Person ist funktional gesund, wenn sie möglichst kompetent mit einem möglichst gesunden Körper an möglichst normalisierten Lebensbereichen

«Eine Person ist funktional gesund, wenn sie möglichst kompetent mit einem möglichst gesunden Körper an möglichst normalisierten Lebensbereichen 18 «Eine Person ist funktional gesund, wenn sie möglichst kompetent mit einem möglichst gesunden Körper an möglichst normalisierten Lebensbereichen teilnimmt und teilhat.» 3Das Konzept der Funktionalen

Mehr

Studiendesign/ Evaluierungsdesign

Studiendesign/ Evaluierungsdesign Jennifer Ziegert Studiendesign/ Evaluierungsdesign Praxisprojekt: Nutzerorientierte Evaluierung von Visualisierungen in Daffodil mittels Eyetracker Warum Studien /Evaluierungsdesign Das Design einer Untersuchung

Mehr

GRUPPENARBEIT MARKTFORSCHUNG. Marketing Management Seminar

GRUPPENARBEIT MARKTFORSCHUNG. Marketing Management Seminar GRUPPENARBEIT MARKTFORSCHUNG Marketing Management Seminar Agenda Aufgabenstellung Zielgruppe Testanordnung Fragebogen Auswertung Analyse Erkenntnisse Aufgabenstellung Marken-Fruchtsafthersteller Ein Marken

Mehr

Intrinsisch motivierte Mitarbeiter als Erfolgsfaktor für das Ideenmanagement: Eine empirische Untersuchung

Intrinsisch motivierte Mitarbeiter als Erfolgsfaktor für das Ideenmanagement: Eine empirische Untersuchung Intrinsisch motivierte Mitarbeiter als Erfolgsfaktor für das Ideenmanagement: Eine empirische Untersuchung Bearbeitet von Martina Sümnig Erstauflage 2015. Taschenbuch. 176 S. Paperback ISBN 978 3 95485

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Konfiguration einer Sparkassen-Chipkarte in StarMoney

Konfiguration einer Sparkassen-Chipkarte in StarMoney Konfiguration einer Sparkassen-Chipkarte in StarMoney In dieser Anleitung möchten wir Ihnen die Kontoeinrichtung in StarMoney anhand einer vorliegenden Sparkassen-Chipkarte erklären. Die Screenshots in

Mehr

OECD Programme for International Student Assessment PISA 2000. Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

OECD Programme for International Student Assessment PISA 2000. Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland OECD Programme for International Student Assessment Deutschland PISA 2000 Lösungen der Beispielaufgaben aus dem Mathematiktest Beispielaufgaben PISA-Hauptstudie 2000 Seite 3 UNIT ÄPFEL Beispielaufgaben

Mehr

WERKZEUG KUNDENGRUPPEN BILDEN

WERKZEUG KUNDENGRUPPEN BILDEN Integrierter MarketinXervice Dr. Rüdiger Alte Wilhelm-Busch-Straße 27 99099 Erfurt Tel.: 0361 / 55 45 84 38 WERKZEUG GRUPPEN BILDEN Die folgenden Fragen mögen Ihnen helfen, Kriterien aufzustellen, anhand

Mehr

Data Mining: Einige Grundlagen aus der Stochastik

Data Mining: Einige Grundlagen aus der Stochastik Data Mining: Einige Grundlagen aus der Stochastik Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 21. Oktober 2015 Vorwort Das vorliegende Skript enthält eine Zusammenfassung verschiedener

Mehr

AUTOMATISIERTE HANDELSSYSTEME

AUTOMATISIERTE HANDELSSYSTEME UweGresser Stefan Listing AUTOMATISIERTE HANDELSSYSTEME Erfolgreich investieren mit Gresser K9 FinanzBuch Verlag 1 Einsatz des automatisierten Handelssystems Gresser K9 im Portfoliomanagement Portfoliotheorie

Mehr

Übungen zur Vorlesung Induktive Statistik Bedingte Wahrscheinlichkeiten

Übungen zur Vorlesung Induktive Statistik Bedingte Wahrscheinlichkeiten Fachhochschule Köln Fakultät für Wirtschaftswissenschaften Prof. Dr. Arrenberg Raum 221, Tel. 39 14 [email protected] Aufgabe 3.1 Übungen zur Vorlesung Induktive Statistik Bedingte Wahrscheinlichkeiten

Mehr

Ein möglicher Unterrichtsgang

Ein möglicher Unterrichtsgang Ein möglicher Unterrichtsgang. Wiederholung: Bernoulli Experiment und Binomialverteilung Da der sichere Umgang mit der Binomialverteilung, auch der Umgang mit dem GTR und den Diagrammen, eine notwendige

Mehr

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln Beurteilung der biometrischen Verhältnisse in einem Bestand Dr. Richard Herrmann, Köln Beurteilung der biometrischen Verhältnisse in einem Bestand 1 Fragestellung Methoden.1 Vergleich der Anzahlen. Vergleich

Mehr

Prüfung eines Datenbestandes

Prüfung eines Datenbestandes Prüfung eines Datenbestandes auf Abweichungen einzelner Zahlen vom erwarteten mathematisch-statistischen Verhalten, die nicht mit einem Zufall erklärbar sind (Prüfung auf Manipulationen des Datenbestandes)

Mehr

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Vollständigkeit halber aufgeführt. Gehen wir einmal davon aus, dass die von uns angenommenen 70% im Beispiel exakt berechnet sind. Was würde

Mehr

Wie Projektziele gemessen werden können oder wie man Indikatoren entwickeln kann?

Wie Projektziele gemessen werden können oder wie man Indikatoren entwickeln kann? Innovationstransferund Forschungsinstitut für berufliche Aus-und Weiterbildung SCHWERIN Wie Projektziele gemessen werden können oder wie man Indikatoren entwickeln kann? von Dr. Walter Gürth Workshop der

Mehr

Einführung in statistische Analysen

Einführung in statistische Analysen Einführung in statistische Analysen Andreas Thams Econ Boot Camp 2008 Wozu braucht man Statistik? Statistik begegnet uns jeden Tag... Weihnachten macht Deutschen Einkaufslaune. Im Advent überkommt die

Mehr

Division Für diesen Abschnitt setzen wir voraus, dass der Koeffizientenring ein Körper ist. Betrachte das Schema

Division Für diesen Abschnitt setzen wir voraus, dass der Koeffizientenring ein Körper ist. Betrachte das Schema Division Für diesen Abschnitt setzen wir voraus, dass der Koeffizientenring ein Körper ist. Betrachte das Schema 2x 4 + x 3 + x + 3 div x 2 + x 1 = 2x 2 x + 3 (2x 4 + 2x 3 2x 2 ) x 3 + 2x 2 + x + 3 ( x

Mehr

PRÜFBERICHT ERSTELLT FÜR:

PRÜFBERICHT ERSTELLT FÜR: PRÜFBERICHT ERSTELLT FÜR: AOK PLUS Die Gesundheitskasse für Sachsen und Thüringen Zertifizierung im Bereich Kinder- und Familienfreundlichkeit Datum: 22. August 2012 KONTAKTDATEN Institut für angewandte

Mehr

Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen. Standardisierung von Daten

Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen. Standardisierung von Daten DAS THEMA: TABELLEN UND ABBILDUNGEN Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen Standardisierung von Daten z-standardisierung Standardnormalverteilung 1 DIE Z-STANDARDISIERUNG

Mehr

Access [basics] Rechnen in Berichten. Beispieldatenbank. Datensatzweise berechnen. Berechnung im Textfeld. Reporting in Berichten Rechnen in Berichten

Access [basics] Rechnen in Berichten. Beispieldatenbank. Datensatzweise berechnen. Berechnung im Textfeld. Reporting in Berichten Rechnen in Berichten Berichte bieten die gleichen Möglichkeit zur Berechnung von Werten wie Formulare und noch einige mehr. Im Gegensatz zu Formularen bieten Berichte die Möglichkeit, eine laufende Summe zu bilden oder Berechnungen

Mehr

Multivariate Analysemethoden

Multivariate Analysemethoden Multivariate Analysemethoden 30.04.2014 Günter Meinhardt Johannes Gutenberg Universität Mainz Einführung Was sind multivariate Analysemethoden? Vorlesung Übung/Tut Prüfung Verfahrensdarstellung in Überblick

Mehr

1.3 Die Beurteilung von Testleistungen

1.3 Die Beurteilung von Testleistungen 1.3 Die Beurteilung von Testleistungen Um das Testergebnis einer Vp zu interpretieren und daraus diagnostische Urteile ableiten zu können, benötigen wir einen Vergleichsmaßstab. Im Falle des klassischen

Mehr

Grundbegriffe der Informatik

Grundbegriffe der Informatik Grundbegriffe der Informatik Einheit 15: Reguläre Ausdrücke und rechtslineare Grammatiken Thomas Worsch Universität Karlsruhe, Fakultät für Informatik Wintersemester 2008/2009 1/25 Was kann man mit endlichen

Mehr

Mobile Umfragen Responsive Design (Smartphone & Tablet)

Mobile Umfragen Responsive Design (Smartphone & Tablet) Mobile Umfragen Responsive Design ( & Tablet) Umfragen und Umfragedesign für mobile Endgräte mit der Umfragesoftware von easyfeedback. Inhaltsübersicht Account anlegen... 3 Mobile Umfragen (Responsive

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr