Multidimensionale Skalierung TU CHEMNITZ SEMINAR MULTIVARIATE VERFAHREN REFERENTEN: ANJA FLIEGNER, THOMAS KRANEBURG, FREDERIK SCHENGEL DOZENT DR. THOMAS SCHÄFER Inhalt 1. Was ist MDS? 2. Ablauf einer MDS-Analyse Messmethoden Distanzmodelle Konfiguration Dimensionen Aggregation von Personen 3. Die Studie Datenbearbeitung Datenauswertung 4. Bewertung und Ausblick 1
Was ist MDS? Mehrdimensionaler Wahrnehmungsraum Beurteilung der relevanten & festgelegten Eigenschaften Beurteilung der subjektiven empfunden (Un)Ähnlichkeit Annahme Positionen im mehrdimensionalen Wahrnehmungsraum Mögliche Ableitung der relativen wahrgenommen Lage zueinander Ziel Exploration theoretischer Konstrukte zur Urteilsbildung Beispiele MDS Automarken Markenpositionen im Wahrnehmungsraum Geringe Distanz Relativ ähnlich Große Distanz Relative unähnlich Dimensionen Prestige Sportlichkeit Sicherheit Umweltverträglichkeit 2
Beispiele MDS Jugendkulturen Clusterbildung Dimensionen autoritär/ liberal aktiv / passiv Was ist MDS? Ähnlichkeiten Eigenschaften Multidimensionale Skalierung Unbekannte Eigenschaften Keine Beeinflussung durch Merkmalsauswahl Schwer zu interpretieren Subjektiver Schritt der Clusterung und Dimensionsbestimmung Faktorenanalyse Gut zu interpretieren Ökonomisch Bekannte Eigenschaften überprüfen Mögl. Beeinflussung durch Merkmalsauswahl 3
Ablauf In 5 Schritte gegliedert 1. Messung von Ähnlichkeiten 2. Wahl des Distanzmodells 3. Ermittlung der Konfiguration 4. Zahl und Interpretation der Dimensionen 5. Aggregation von Personen Ablauf 1. Messung von Ähnlichkeiten 2. Wahl des Distanzmodells 3. Ermittlung der Konfiguration 4. Zahl und Interpretation der Dimensionen 5. Aggregation von Personen 4
1. Messung von Ähnlichkeiten Erhebung von Rohdaten/(Un)Ähnlichkeiten durch Befragung von Personen ermitteln Dazu ist nur die Rangfolge der Ähnlichkeiten bekannt Ähnlichkeitsurteile nicht isoliert auf einzelne Objekte, sondern immer auf Paare von Objekten 3 wichtige Methoden zur Messung: Methode der Rangreihe Ankerpunktmethode Ratingverfahren 1. Methode der Rangreihung Objektpaare durch Person nach empfundener Ähnlichkeit zu ordnen Dazu: Kärtchen mit jeweils 1 Objektpaar vorgelegt Bei K Objekten = K(K-1)/2 Paare (Kärtchen) Zahl der Paare nimmt überproportional mit Zahl der Objekte zu Zur Erleichterung erst Grobunterteilung in ähnlich und unähnlich, h dann Untergruppen bilden usw. bis Rangreihe der Objekte entsteht Entsprechend ihre Rangfolge mit Zahlen versehen 5
1. Methode der Rangreihung Beispiel Butter/Margarine 11 Marken 11(11-1)/2= 55 Marken: Becel Du darfst Symmetrische Dreiecksmatrix: Becel - Rama Marke Marke Becel Delicado Sahnebutter 1 2 3 4 5 6 7 8 9 10 11 Becel Holländische Sahneb. 1 Becel Weihnachtsbutter 2 1 Becel Homa 3 48 43 Becel Flora Soft 4 29 24 37 Becel SB 5 49 44 38 2 Becel Sanella Becel Botteram 6 50 46 11 3 7 Du darfst Rama 7 35 30 6 18 25 55 Du darfst Delicado Sahneb. 8 36 47 15 53 20 27 8 Du darfst Holländische Sahneb. 9 40 45 12 54 31 28 16 22 Du darfst Weihnachtsbutter 10 41 51 4 39 26 32 9 23 13 Du darfst Homa 11 42 52 5 19 21 33 34 10 14 17 Du darfst Flora Soft Was ist eine MDS - Ablauf -Studie-Zusammenfassung 1. Ankerpunktmethode Jedes Objekt dient genau 1x als Vergleichsobjekt Gemäß ihrer Ähnlichkeit zum Ankerpunkt werden die Objekte in eine Rangfolge gebracht Problem: Ties Was ist eine MDS - Ablauf - Studie - Bewertung/Ausblick 6
1. Ratingverfahren Objektpaare werden jeweils auf Ähnlichkeits- oder Unähnlichkeitsskala eingestuft Vollkommen ähnlich ---- ---- ---- ---- ---- ---- Vollkommen unähnlich 1 2 3 4 5 6 7 Bei K Objekten = K(K-1)/2 Ähnlichkeitswerte Jeder Paar wird nur einmal beurteilt symmetrisches Konstrukt Ergibt auch eine symmetrische Dreiecksmatrix Problem bei dieser Methode: Ties Was sind Ties? Tritt auf, wenn mehrere Objekte (paare) die gleichen (Un)Ähnlichkeitswerte haben (=Ties) Verringerung der Stabilität der Lösungen (ungenau) Vermeidung von Ties: Erhöhung der Ratingskalen Verringerung der Objektanzahle Aggregation g über Personen durch Bildung von Mittelwerten oder Medianen Methoden zur Ähnlichkeitsmessung, bei der Ties auftreten können,vermeiden 7
Vergleich Rangreihung Hohe Stabilität in der Datenerhebung aufgrund keiner Ties Sehr aufwendig in der Datenerhebung mit zunehmenden Objektpaaren geeignet für Individualanalysen/ genauer Ratingverfahren Verringerte Stabilität in der Datenerhebung auf Grund von Ties Nicht sehr aufwendig in der Datenerhebung auch bei vielen Objektpaaren Geeignet bei vielen Beurteilungen und aggregierten Analysen Ablauf 1. Messung von Ähnlichkeiten 2. Wahl des Distanzmodells 3. Ermittlung der Konfiguration 4. Zahl und Interpretation der Dimensionen 5. Aggregation von Personen 8
2. Wahl des Distanzmodells Abbildung von Objekten in einem psychologischen Wahrnehmungsraum bedeutet die Darstellung von Ähnlichkeiten in Form von Distanzen Objekte dicht beieinander geringe Distanz Objekte weit auseinander hohe Distanz Methoden zur Bestimmung des Distanzmaßes (d kl ): Euklidische Metrik City Block-Metrik Minkowski-Metrik Ablauf 1. Messung von Ähnlichkeiten 2. Wahl des Distanzmodells 3. Ermittlung der Konfiguration 4. Zahl und Interpretation der Dimensionen 5. Aggregation von Personen 9
3. Ermittlung der Konfiguration Erhobene Unähnlichkeiten der Objekte (U kl) ) Eine Konfiguration in einem Raum mit möglichst geringen Dimensionen, deren Distanzen d kl möglichst die Monotoniebedingung erfüllen Monotoniebedingung: wenn u kl > u ij, dann d kl > d ij 3. Startkonfiguration & Berechnung der Distanzen Berechnung der Distanzen Vergleich zwischen berechneten Distanzen und Unähnlichkeitsreihenfolge 10
3. Güte der Übereinstimmung zwischen der Konfiguration und den erhobenen Unähnlichkeiten Shepard-Diagramm Wenn die Rangfolge der Distanzen der Rangfolge der Unähnlichkeiten entspricht entsteht ein monoton steigender Verlauf Hier: Nur für 1,2 und 3,4 erfüllt 3. Disparitäten Hilfsgrößen zur Quantifizierung der Abweichung von der Monotoniebedingung Müssen Monotoniebedingung erfüllen Schwach monotone Transformationen Sollen von Distanzen möglichst wenig abweichen (i.s. des Kriteriums der kleinsten Quadrate) 11
3. Stress-Maß Maß für die Güte der Konfiguration (je größer, desto schlechter erfüllt die Konfiguration die Monotoniebedingung) Badness of fit Zielkriterium Faktor dient der Normierung auf Werte zwischen 0 und 1 Die gefundene Konfiguration wird solange iterativ weiterverbessert bis ein minimaler Stress-Wert erreicht ist. 3. Stressmaßbeurteilung und verbesserte Konfiguration Vorsicht degenerierte Lösung S-Stress sehr niedrig (<0,01) Objekte klumpen um den Nullpunkt Zusätzlich: R²(RSQ) als Gütemaß Verschiebung der in vielen Statistik-Programmen Distanzen führt zu einer RSQ > 0,9 akzeptabel Verschiebung der Objekte Was ist eine MDS - Ablauf -Studie-Zusammenfassung 12
Ablauf 1. Messung von Ähnlichkeiten 2. Wahl des Distanzmodells 3. Ermittlung der Konfiguration 4. Zahl und Interpretation der Dimensionen 5. Aggregation von Personen 4. Zahl und Interpretation der Dimensionen Die Zahl der Dimensionen wird vom Anwender festgelegt Sollte der wahren Dimensionalität der Wahrnehmung entsprechen Meist 2 oder 3 Dimensionen Varimaxkriterium: Die Werte werden so rotiert, dass sich die Werte möglichst entlang der Achsen verteilen Bessere Interpretierbarkeit ti it der Achsen 13
4. Kriterien zur Bestimmung der Zahl der Dimensionen Stress-Maß: Bei nur geringfügiger Änderung des Stress-Maßes, sollte die niedrigere Anzahl an Dimensionen bevorzugt werden Datenverdichtungskoeffizient: Interpretierbarkeit Ablauf 1. Messung von Ähnlichkeiten 2. Wahl des Distanzmodells 3. Ermittlung der Konfiguration 4. Zahl und Interpretation der Dimensionen 5. Aggregation von Personen 14
5. Aggregation von Personen 3 Möglichkeiten: 1. vor der MDS Daten durch Mittelwerte oder Mediane aggregieren 2. MDS für jede Person durchführen und anschließend aggregieren 3. RMDS: Computerprogramme können Ähnlichkeitsdaten mehrerer Personen gemeinsam analysieren Studie (Un)Ähnlichkeiten von Musikrichtungen Zielsetzung Positionierung im Wahrnehmungsraum Exploration von Dimensionen und Clustern Nach welchen Merkmalen wird unterschieden? Musikrichtungen Rock Pop Techno/House HipHop/Rap Chillout Punk/Grunge Volksmusik Klassische Musik Jazz/Blues 15
Studie Fragebogen Alle neun Musikrichtungen einzeln miteinander vergleichen (zur Erinnerung K(K-1)/2 ); also hier 36 Objektpaare Ratingskala Die Musikrichtungen Rock und Pop sind sich Min. 9 Objekte Objekte den Befragen bekannt Vollkommen ähnlich 1 2 3 4 5 6 7 Vollkommen unähnlich Stichprobengröße abhängig ihrer Homogenität Hier n= 20 Skalenwertrichtung für die SPSS-Verarbeitung beachten Datenbearbeitung Dateneingaben Eine Matrix pro Vp Untersuchungsobjekte zur Matrix ordnen Dreiecksmatrix Skalierungsrichtung beachten Bei gleichen Objektpaaren (z.b. Rock & Rock) jeweils eine Null 16
Datenbearbeitung Datenanalyse Analysieren Skalierung Multidimensionale Skalierung (ALSCAL) Datenbearbeitung Haupteingabefeld Variablenauswahl für Vergleich Rohdaten liegen bereits als Dit Distanzen vor Distanzen müssen erst aus Rohdaten errechnet werden 17
Datenbearbeitung Matrixformen, oder in welcher Form liegen die Daten vor Ratingverfahren Ankerpunktmethode Idealpunktmethode, Multidimensionale Entfaltung (MDU) Studie Exkurs: Idealpunktmethode Bildung Rangreihen Vergleich der Daten zeilenweise Bildung VP Idealpunkte Hier ideale Zeitschrift der VP Rechteckmatrix 18
Studie Haupteingabefeld Model-Optionen Variablenauswahl für Vergleich Optionen für Output & Iterations-verfahren Rohdaten liegen bereits als Dit Distanzen vor Distanzen müssen erst aus Rohdaten errechnet werden Datenbearbeitung Model-Option Niveau der Rohdaten (Rangordnung der Ähnlichkeitsurteile) Matrix: Zeile: Unkonditional: z.b. Alle Daten der Dreiecksmatrix Zeilenweise Verarbeitung (MDU) Vergleich ver. Matrizen (Längsschnitt) Stetige Variable Alle Vp-Matrizen in eine Konfiguration Anzahl Dimensionen 1-3 Für jede Vp Matrix eine eigene Konfiguration erzeugen 19
Datenbearbeitung Optionen Darstellung der Ergebnisausgabe Kriterien für Abbruch Iteration Abbruch wenn S-Stress sich weniger als 0,001 ändert Abbruch wenn der S- Stress kleiner als 0,005 ist Begrenzung der Iterationsschritte auf 30 Studie?Fragen zur Dateneingabe & Einstellungen? Zur Datenanalyse weiter mit OK 20
Auswertung Iterationsverlauf Veränderung des S-Stress Iterationsschleifen Veränderung des S-Stress bis Einstellungswert erreicht ist Auswertung Interpretation der (Güte)Maße Eher eine Wert wie gut eine Konfiguration die Monotoniebedingung erfüllt Stress 1 < 0,1 hervorragend <0,2 akzeptabel RSQ R² Wie viel Varianz der Disparitäten wird von den Distanzen erklärt > 0,9 akzeptabel 21
Auswertung Zweidimensionaler Raum Vorsicht subjektiver Schritt Interpretation der möglichen Wahrnehmungs-/ Bewertungsdimensionen Dimension 1 Individuell/kollektiv Dimension 2 Geschwindigkeit Aktivierend/Beruhigend Explorativer Charakter Auswertung Rotation 45 0 Dimension 1 Lautstärke Monoton/vielfältig Dimension 2 Modern/Tradition Innovativ/Konservativ Klarheit/ Komplexität Künstlich/ Natürlich Was ist eine MDS - Ablauf - Studie - Bewertung/Ausblick 22
Auswertung Eindimensionaler Raum Übereinanderliegende Objekte Größte Unähnlichkeit Neue Gütemaße Stress=,37 ; RSQ=,55 Auswertung Dreidimensionaler Raum?Mögliche Eigenschaft? Stress=,16 ; RSQ=,67 23
Zusammenfassung I Verlauf Rohdatenmatrix erstellen Erhebung der Ähnlichkeitsurteile Methode beachten (Rangreihung, Ankerpunkt, Rating) Wahl des Distanzmodells Darstellung der Objekte im Wahrnehmungsraum (euklidische Metrik) Ermittlung der Konfiguration Iterativer Prozess bis Ende der Optimierung Rangfolge der Distanzen zwischen den einzelnen Objekten geben die Rangfolge der vorgegeben Unähnlichkeiten mögl. gut wieder (Annäherung an einen monotonem Funktionsverlauf) Mögl. Aggregation von Personen zu Gruppen Anzahl Dimensionen und Interpretation Zusammenfassung II Bewertung & Ausblick Kriterien für die Objekteigenschaftsbewertung bleiben im Dunklen mögliche Inter-Intraindividuelle Intraindividuelle Inkonsistenzen Mögl. geringes Skalenniveau Ordinale Ausgangssituation Ähnlichkeit von Objektpaaren Konstruktion eines niedrig dimensionierten Wahrnehmungsraums Gratwanderung bei der Interpretation 1-2 Dimensionen unbefriedigend, 2-3 schwer zu interpretieren Ausufernde Befragungen durch zu viele Objekte, fehlende Objekte Viele Anfangsinformationen für anschließende Analysen Keine Interpretation ohne Vorwissen Exploratives Verfahren, Gute Verständlichkeit Bereiche Marketing, Zielgruppenforschung, Marktsegmentierung 24
MDS in der Praxis: Literatur Altmann, G. (2000). Musikalische Formenlehre. Schott: Mainz. Backhaus, K., Erichson, ih B., Plinke, W. & Weiber, R. (2008). Multivariate li i Analysemethoden. Springer: Berlin. Bühl, A. (2009) SPSS 18. Einführung in die moderne Datenanalyse. Pearson Studium: München. http://kappelhoff.wiwi.uni- wuppertal.de/fileadmin/kappelhoff/downloads/vorlesung/mds.pdf 25
Vielen Dank für eure Aufmerksamkeit und Mitarbeit Tö i d höh Wö Töne sind höhere Wörter. Robert Schumann 26