Marketing Analytics. Diskriminanzanalyse

Größe: px
Ab Seite anzeigen:

Download "Marketing Analytics. Diskriminanzanalyse"

Transkript

1 Institut für Angewandtes Markt-Management Prof. Dr. Wolfgang Müller Reihe Studienmanuskript Band 11 Marketing Analytics Diskriminanzanalyse Dortmund, WS 2015/2016 Fachhochschule Dortmund University of Applied Sciences Fachbereich Wirtschaft Emil-Figge-Straße Dortmund Telefon 0231 / Telefax 0231/ marktmanagement@t-online.de

2 Inhaltsverzeichnis 1. Methodische Grundlagen der Diskriminanzanalyse Grundprinzip der Diskriminanzanalyse Die Struktur der Diskriminanzfunktion Das Diskriminanzkriterium Verfahrensablauf der Diskriminanzanalyse Fallbeispiel zur Diskriminanzanalyse im Innovationsmarketing Daten des Zweigruppen-Zweivariablen-Beispiels Schätzung der Diskriminanzfunktion Gütediagnose der Diskriminanzfunktion Diskriminanzprüfung der Merkmalsvariablen Klassifikationsanalysen Einfache Diskriminanzanalyse mit SPSS Datenmatrix und SPSS-Analysemethodik Schätzung der Diskriminanzfunktion Gütebeurteilung der Diskriminanzfunktion Diskriminanzprüfung der Merkmalsvariablen Klassifikation neuer Objekte Multiple Diskriminanzanalyse mit SPSS Datenmatrix und SPSS-Analysemethodik Schätzung der Diskriminanzfunktionen Gütediagnose der Diskriminanzfunktionen Diskriminanzprüfung der Merkmalsvariablen Klassifikation von neuen Objekten Excel-basierte Diskriminanzanalyse Excel-Formeln zur Ermittlung einer Diskriminanzfunktion Koeffizientenschätzung mit Excel-Funktionen Funktionsbestimmung durch Excel-Matrizenoperationen Excel-Solvereinsatz zur Optimierung eines Diskriminanzmodells Funktionsbeurteilung auf der Grundlage einer Excel-Diskriminanztafel Empirische Anwendungsbeispiele Literaturverzeichnis

3 1. Methodische Grundlagen der Diskriminanzanalyse 1.1 Grundprinzip der Diskriminanzanalyse Ausgangspunkt der Diskriminanzanalyse stellen gegebene Teilmengen bzw. Gruppen von Objekten dar, die sich hinsichtlich mehrerer, metrisch skalierter Merkmale voneinander unterscheiden. Bei Vorliegen einer derartigen Datenstruktur besteht die Aufgabenstellung der Diskriminanzanalyse darin, Gruppenunterschiede zu untersuchen, d.h. die Zugehörigkeit von ausgewählten Objekten (z.b. Personen, Produkte, Unternehmen) zu a-priori vorgegebenen Gruppen (z.b. Käufertypen, Produktgruppen) anhand ihrer Ausprägungen bei zwei oder mehr metrisch skalierten Merkmalen zu erklären sowie zu prognostizieren (vgl. Aaker/Kumar/Leone 2013, S. 429 ff.; Backhaus et al. 2011, S. 188ff.; Bortz/Schuster 2010, S. 464 ff.; Decker/Temme 1999; McDaniel/Gates, 2013, S. 551 ff.; Rudolf/ Müller 2012, S. 150 ff.; Schlittgen 2009; S. 342 ff.). Das methodische Grundprinzip der Diskriminanzanalyse lässt sich durch vier Verfahrensmerkmale charakterisieren (vgl. Abbildung 1): Dependenzanalyse: Die Diskriminanzanalyse bildet eine dependenzanalytische Methode der multivariaten Statistik, mit der die Abhängigkeit einer nominal skalierten Variablen von mehreren, metrisch skalierten unabhängigen Variablen untersucht wird. Die Ausprägungen der abhängigen Variablen repräsentieren die Zugehörigkeiten der Objekte zu zwei oder mehr alternativen vorgegebenen Teilgruppen. Daher wird die abhängige Variable in diesem Zusammenhang häufig auch als Gruppenvariable oder Gruppierungsvariable bezeichnet. Die metrisch skalierten unabhängigen Variablen stellen charakteristische Merkmale der verschiedenen Teilgruppen dar und werden deshalb auch Merkmalsvariablen genannt. Diskriminanzfunktion: Den mathematischen Kern der Diskriminanzanalyse bildet die Ermittlung einer Diskriminanzfunktion, die den quantitativen Zusammenhang zwischen Gruppenunterschieden und einer Linearkombination von unabhängigen Merkmalsvariablen beschreibt. Generell gilt, dass bei Vorliegen von K Gruppen (k = 1,, K), K-1 Diskriminanzfunktionen zu bestimmen sind. Bei einer einfachen Diskriminanzanalyse erfolgt die Trennung von zwei Gruppen daher mittels einer einzigen Diskriminanzfunktion (sog. Zwei- Gruppen-Fall). Sind dagegen mehr als zwei Gruppen vorgegeben, dann ist eine multiple Diskriminanzanalyse auf der Basis von mehreren Diskriminanzfunktionen durchzuführen (sog. Mehr-Gruppen-Fall). Diskriminationsziel: Mit Hilfe einer Diskriminanzfunktion sollen Gruppenunterschiede erklärt werden, d.h. es wird der Frage nachgegangen, mit welcher Linearkombination von Merkmalsvariablen (sog. Prädiktorvariablen) eine bestmögliche Diskrimination (Trennung) der vorgegebenen Gruppen erreicht wird und welche relative Trennstärke den einzelnen Merkmalen zukommt (Beispiel: Welche relative Trennstärke kommt den persönlichen Merkmalen Alter, Einkommen, Preisbereitschaft und Anzahl der Haushaltsmitglieder bei der Unterscheidung von Käufern und Nichtkäufern einer Marke zu?). 3

4 Klassifikationsziel: Eine zweite Zielsetzung der Diskriminanzanalyse betrifft die Prognose der Gruppenzugehörigkeit von Objekten. Auf der Grundlage einer geschätzten Diskriminanzfunktion lassen sich sog. Diskriminanzwerte einzelner Objekte ermitteln, anhand derer eine prognostische Gruppenzuordnung (Klassifikation) vorgenommen werden kann. Diese beantwortet die Frage, welcher der vorgegebenen Gruppen ein neues Objekt aufgrund seiner Merkmalsstruktur zuzuordnen ist (Beispiel: Ist eine bislang nicht betrachtete Person aufgrund ihrer Ausprägungen bei den Merkmalen Alter, Einkommen, Preisbereitschaft sowie Anzahl der Haushaltsmitglieder der Käufergruppe oder der Nichtkäufergruppe zugehörig?). Abbildung 1: Grundprinzip der Diskriminanzanalyse (Beispiel Nachfragergruppen) Gegenüber vergleichbaren Verfahren der multivariaten Statistik sind eine Reihe methodischer Unterschiede hervorzuheben. Im Rahmen einer metrischen Regressionsanalyse wird die Abhängigkeit einer metrisch skalierten Variablen von metrischen unabhängigen Variablen analysiert, während die Diskriminanzanalyse zwar gleichfalls auf metrisch skalierte unabhängige Variable zurückgreift, jedoch deren Einfluss auf eine nominalskalierte bzw. gruppierte abhängige Variable untersucht. Die logistische Regression untersucht den Zusammenhang zwischen der (nominal skalierten) Wahrscheinlichkeit bestimmter Ereignisse (z.b. Kauf einer Marke) und metrisch skalierten Einflussgrößen mit Hilfe einer Maximum- Likelihood-Schätzung und besitzt somit eine methodische Ähnlichkeit zur Diskriminanzanalyse (vgl. Backhaus et al. 2011, S. 250 ff). Eine Varianzanalyse unterscheidet sich hingegen von der Diskriminanzanalyse hinsichtlich des Datenniveaus von sowohl der abhängigen als auch der unabhängigen Variablen, denn diese analysiert den Einfluss von nominalskalierten unabhängigen Variablen auf eine oder mehrere metrisch skalierte abhängige Variablen (vgl. Müller 1998). Ferner besteht ein grundlegender Unterschied zur Clusteranalyse darin, dass diese ein gruppierendes (taxonomisches) Verfahren darstellt, welches auf der Grundlage ungruppierter Merkmalswerte eine bestimmte Menge von Objektgruppen erzeugt (vgl. Müller 2015b), während die Diskriminanzanalyse auf bereits vorgegebene Objektgruppen zurückgreift und diese mittels Merkmalsvariablen zu beschreiben und zu unterscheiden versucht. 4

5 1.2 Die Struktur der Diskriminanzfunktion Der analytische Ansatz der Diskriminanzanalyse besteht darin, die Koeffizienten einer linearen Diskriminanzfunktion so zu schätzen, dass die daraus resultierenden Diskriminanzwerte (Funktionswerte) der abhängigen Variable eine bestmögliche Trennung der vorgegebenen Gruppen herbeiführen. In allgemeiner Form weist die Diskriminanzfunktion die folgende Struktur auf (vgl. Backhaus et. al. 2011, S. 192; Rudolf/Müller 2012, S. 155 f.): Y = b * x b * x b * x (1.1) mit j j Y = Diskriminanzvariable (kanonische Variable) x j = Merkmalsvariable j (j = 1,2,,J) b j = Diskriminanzkoeffizient (Trenngewicht) für die Merkmalsvariable j. Die metrisch skalierten (möglichst gering korrelierten) Merkmalsvariablen bilden die unabhängigen Variablen der Diskriminanzfunktion. Die Schätzparameter der Diskriminanzfunktion b j werden als Diskriminanzkoeffizienten (Trenn-, Diskriminanzgewichte) bezeichnet. Sie zeigen die Bedeutung eines Merkmals zur Gruppentrennung an, wobei das Vorzeichen die Richtung der Gruppenzuordnung anzeigt (vgl. Eckey et al. 2002, S. 317; Hair et al. 2013, S. 272). An dieser Stelle ist darauf hinzuweisen, dass in statistischen Softwareprogrammen (z.b. in SPSS) die Diskriminanzfunktion zumeist um einen konstanten Parameter b 0 ergänzt wird. Dem Absolutglied kommt jedoch keine inhaltliche Bedeutung zu, sondern dieses bewirkt lediglich eine Skalenverschiebung der Diskriminanzfunktion, um den Gesamtmittelwert der Diskriminanzwerte auf den Wert Null zu normieren (vgl. Kapitel 3.2). Die nominal skalierte Gruppierungsvariable wird nicht unmittelbar als abhängige Variable in der Diskriminanzfunktion abgebildet, sondern als mittelbare Variable aus dieser abgeleitet. Denn als abhängige Variable der Diskriminanzfunktion dient eine neue, metrisch skalierte Diskriminanzvariable Y, deren Funktionswerte als Diskriminanzwerte (Scores) bezeichnet werden und die sich aus der Linearkombination der metrisch skalierten Ausprägungen der unabhängigen Variablen ergeben. Die Diskriminanzvariable Y wird deshalb auch kanonische Variable genannt und die Diskriminanzfunktion alternativ als kanonische Diskriminanzfunktion bezeichnet. Die Diskriminanzfunktion liefert für jedes einzelne Gruppenelement einen metrischen Diskriminanzwert, so dass die Unterschiedlichkeit zweier Gruppenelemente anhand der Differenzen ihrer Diskriminanzwerte erfasst werden kann. Zusätzlich lässt sich jede Gruppe durch den Mittelwert (Zentroid) ihrer Diskriminanzwerte kennzeichnen. Für die angestrebte Gruppentrennung folgt daraus, dass die Diskriminanzfunktion so zu schätzen ist, dass die Unterschiede zwischen den Gruppen-Mittelwerten der Diskriminanzwerte möglichst groß sind. Die Diskriminanzwerte liefern auf diese Weise einen abgeleiteten Trennwert für die nominal skalierte Gruppenvariable und einen Klassifikationswert für die Zuweisung eines neuen Objektes zu einer bestimmten Gruppe. 5

6 1.3 Das Diskriminanzkriterium Die Bestimmung der Diskriminanzkoeffizienten beruht auf der Grundüberlegung, dass eine bestmögliche Gruppentrennung dann gegeben ist, wenn einerseits die Gruppenmittelwerte der Diskriminanzwerte möglichst weit auseinander liegen und andererseits die gruppeninternen Diskriminanzwerte möglichst gering um ihren jeweiligen Gruppenmittelwert streuen (vgl. Backhaus et al. 2011, S. 194 ff; Eckey et al. 2002, S. 307 ff.; Rudolf/Müller 2012, S. 155 ff.). Mathematisch kann das angestrebte Ziel der Gruppentrennung durch ein spezielles Optimierungsmaß, das sog. Diskriminanzkriterium (λ) formuliert werden. Hiernach werden die Diskriminanzkoeffizienten so bestimmt, dass der Quotient aus der Streuung der Diskriminanzwerte zwischen den Gruppen (SQ Z ) und der Streuung der Diskriminanzwerte innerhalb der Gruppen (SQ F ) maximal wird: Streuung der Diskriminanzwerte zwischen den Gruppen λ = max! Streuung der Diskriminanzwerte in den Gruppen erklärte Streuung (SQ ) λ = nicht erklärte Streuung (SQ ) mit k = Gruppen i = Objekte k k ki K 2 n k (yk - y) Z k 1 K nk F 2 (yki - y k ) k 1 i 1 n = Anzahl der Objekte in der Gruppe k y = Gesamtmittelwert der Diskriminanzwerte y = Mittelwert der Diskriminanzwerte in der Gruppe k y = Diskriminanzwert des Objekts i in der Gruppe k max! (1.2) Die Streuung der Diskriminanzwerte zwischen den Gruppen (SQ Z ) wird durch die Summe der quadrierten Abweichungen der Gruppenmittelwerte vom Gesamtmittelwert der Diskriminanzwerte gemessen. Diese repräsentiert die erklärte Streuung der Diskriminanzwerte der Objekte. Um unterschiedliche Gruppengrößen zu berücksichtigen, werden die Abweichungsquadrate jeweils mit der Gruppengröße multipliziert. Die Streuung der Diskriminanzwerte innerhalb der Gruppen (SQ F ) gibt die nicht erklärte Streuung der Diskriminanzfunktion an und wird als Summe der quadrierten Abweichungen der objektspezifischen Diskriminanzwerte vom jeweiligen Gruppenmittelwert gemessen. Zusammenfassend fordert das Diskriminanzkriterium, dass einerseits die Distanz zwischen den mittleren Diskriminanzwerten der Gruppen maximiert und andererseits der Abstand zwischen den Diskriminanzwerten einzelner Gruppenobjekte und dem jeweiligen Gruppen-Mittelwert minimiert wird. Je größer demnach der Wert des Diskriminanzkriteriums ist, desto größer ist der Unterschied zwischen den Gruppen. 6

7 Die Ermittlung der Diskriminanzkoeffizienten hat große Ähnlichkeit mit der Bestimmung einer multiplen Regressionsfunktion. In Analogie zur Regressionsanalyse wird zunächst das Optimierungskriterium formuliert, welches jedoch im Gegensatz zur Regressionsanalyse nicht die Summe der quadrierten Abweichungen minimiert (Methode der kleinsten Quadrate), sondern das Verhältnis der Abweichungsquadratsumme der Diskriminanzwerte zwischen den Gruppen zur Abweichungsquadratsumme der Diskriminanzwerte innerhalb der Gruppen maximiert. Die Schätzung der Diskriminanzkoeffizienten lässt sich beispielsweise für den Zweigruppen-Zweivariablen-Fall in drei grundlegenden Rechenschritten vornehmen (vgl. detailliert bei Eckey et al. 2002, S. 307 ff.; Schulze/Porath 2012, S. 169 ff.): 1) Zunächst werden die unbekannten Diskriminanzwerte in der Zielfunktion λ durch die objektspezifischen Diskriminanzfunktionen der Linearkombinationen der beiden Merkmale (y = b 1 *x 1 + b 2 * x 2 ) ersetzt. 2) Zur Maximierung der Zielfunktion werden anschließend die partiellen Ableitungen nach den Diskriminanzkoeffizienten b gebildet und gleich Null gesetzt. Daraus erhält man: d = b *SQ +b *SQ d = b *SQ +b *SQ mit b = Diskriminanzkoeffizienten 1,2 d = Differenz der Gruppenmittelwerte bei Merkmal x und Merkmal x 1,2 1 2 SQ = Summe der gruppeninternen Abweichungsquadrate bei Merkmal x 11 1 SQ 22 = Summe der gruppeninternen Abweichungsquadrate bei Merkmal x 2 SQ = Summe der gruppeninternen Abweichungsprodukte von x und x (1.3) 3) Abschließend ist das Zwei-Gleichungssystem mit Hilfe eines geeigneten mathematischen Verfahrens der linearen Algebra nach den Diskriminanzkoeffizienten aufzulösen. Damit ergibt sich: d *SQ b b d *SQ SQ12 SQ 11 *SQ22 d *SQ d *SQ SQ12 SQ 11 *SQ22 (1.4) 7

8 1.4 Verfahrensablauf der Diskriminanzanalyse Der diskriminanzanalytische Untersuchungsprozess besteht aus fünf Teilschritten (vgl. Abbildung 2). Die Durchführung einer Diskriminanzanalyse beginnt mit der Erstellung bzw. Aufbereitung der zu untersuchenden Datenmatrix. Hierbei sind vom Anwender zwei bedeutsame Aufgaben zu erfüllen. Zum einen müssen die zu untersuchenden Objektgruppen definiert werden, d.h. es ist festzulegen, welche Gruppen analysiert werden sollen. Im Marketing sind diese Gruppen häufig vorgegeben (z.b. weibliche/männliche Käufer einer Marke), bilden das Ergebnis inhaltlicher Überlegungen (z.b. Unterscheidung in Verwender/Nichtverwender einer Produktart) oder sind durch eine vorgeschaltete Clusteranalyse (z.b. Abgrenzung von Käufersegmenten, Wettbewerbergruppen) ermittelt worden. Zum anderen bedarf es einer sorgfältigen, problemrelevanten Auswahl der zur Gruppenbildung herangezogenen Objektmerkmale, die möglichst gering miteinander korrelieren sollten. Aus rechentechnischen Gründen sowie dem Aspekt der vereinfachenden Ergebnisinterpretation ist ferner darauf zu achten, dass die Anzahl der zu analysierenden Gruppen nicht zu groß ausfällt bzw. nicht größer als die Anzahl der Merkmalsvariablen ist. Abbildung 2: Verfahrensablauf der Diskriminanzanalyse 8

9 2. Fallbeispiel zur Diskriminanzanalyse im Innovationsmarketing 2.1 Daten des Zweigruppen-Zweivariablen-Beispiels Zur Verdeutlichung der diskriminanzanalytischen Vorgehensweise soll ein Beispiel aus dem Innovationsmarketing betrachtet werden. In der Tabelle 1 sind die Werte von jeweils zwölf erfolglosen Neuprodukten (Gruppe A) und erfolgreichen Produktinnovationen (Gruppe B) hinsichtlich ihrer beiden Merkmalsvariablen Marketingbudget (in % vom Umsatz) und Wettbewerberanzahl bei der Markteinführung zusammengefasst. Mit Hilfe einer Diskriminanzanalyse soll der Frage nachgegangen werden, ob sich die Produktgruppen im Hinblick auf ihre zwei Marketingvariablen voneinander unterscheiden. Gesucht ist daher eine Diskriminanzfunktion, die mittels einer Linearkombination der beiden Merkmalsvariablen eine möglichst trennscharfe Gruppenunterscheidung herbeiführt und es ferner erlaubt, die Zugehörigkeit eines Neuproduktes zur Gruppe der erfolgreichen bzw. der erfolglosen Produktinnovationen mit hoher Genauigkeit vorherzusagen (vgl. Abbildung 2). Gruppe Produkt Marketingbudget Wettbewerberanzahl x (% vom Umsatz) x 1A 2A Gruppe A (Innovationsflop) Gruppe B (Innovationserfolg) Tabelle 1: Ausgangsdaten des Innovationsbeispiels

10 2.2 Schätzung der Diskriminanzfunktion Um für das vorliegende Beispiel die in den Formeln (1-3) und (1-4) enthaltenen Größen zu berechnen, bietet sich die Erstellung der nachfolgenden Auswertungstabelle 2 an. Hierbei ist zu berücksichtigen, dass im vorliegenden Beispiel die Anzahl der Objekte in beiden Gruppen gleich groß ist, so dass bei der Berechnung der Gesamtwerte der Merkmalsvariablen (Gesamtmittelwert, Summe der Abweichungsquadrate, Summe der Abweichungsprodukte) keine Gewichtung mit den jeweiligen Gruppengrößen notwendig ist (vgl. zur rechnerischen Vorgehensweise bei unterschiedlichen Gruppengrößen ein Beispiel bei Schulze/Porath 2012, S. 173 ff.). Tabelle 2: Auswertungstabelle zur einfachen Diskriminanzanalyse (Innovationsbeispiel) 10

11 Die Auswertungstabelle liefert für die zentralen Maßgrößen der Merkmalsvariablen die in der Tabelle 3 zusammengefassten Zahlenwerte. Gruppen-Mittelwerte der Merkmalsvariablen Distanz der Gruppen-Mittelwerte x1a x1b 13,33 17,5 x1 15, x2a x2b 8,58 5, 0 x2 6, d1 x1a x1b 13,33 17,5 4,17 d2 x2a x2b 8,58 5,0 3,58 Gruppeninterne Abweichungsquadrate na 2 SQ 11A (x1a x 1A ) 50,67 i 1 nb 2 SQ 11B (x1b x 1B) 41,00 i 1 SQ SQ SQ 91, A 11B na 2 SQ 22A (x2a x 2A) 44,92 i 1 nb 2 SQ 22B (x2b x 2B) 48,00 i 1 SQ SQ SQ 92, A 22B Gruppeninterne Abweichungsprodukte n A SQ 12A (x1a x 1A )*(x2a x 2A ) 5,67 i 1 n B SQ 12B (x1b x 1B)*(x 2B x 2B) 4,00 i 1 SQ12 SQ12A SQ12B 9,67 Tabelle 3: Maßgrößen der Merkmalsvariablen (Innovationsbeispiel) Setzt man die ermittelten Maßgrößen der Merkmalsvariablen in den Formelausdruck (1-3) ein, so erhält man zwei lineare Gleichungen mit jeweils zwei Variablen. Dieses Gleichungssystem kann mit Hilfe einer geeigneten Methode der linearen Algebra (z.b. Eliminationsverfahren, Matrizenoperationen) nach den Variablen b 1 und b 2 aufgelöst werden. Exemplarisch erfolgt an dieser Stelle die Verwendung des sog. Eliminationsverfahrens, bei dem die beiden Gleichungen solcherart addiert oder voneinander subtrahiert werden, dass eine Variable eliminiert wird. Im Beispiel soll die Variable b 2 dadurch eliminiert werden, dass zunächst die erste Ausgangsgleichung mit dem Wert -9,612 multipliziert und anschließend die daraus resultierende neue Gleichung von der zweiten Ausgangsgleichung subtrahiert wird (vgl. Tabelle 4). Hieraus erhält man für den Koeffizienten b 1 den Wert -0,0501. Setzt man den ermittelten b 1 -Wert in die zweite Ausgangsgleichung ein, so ergibt sich für den Koeffizienten b 2 der Wert 0,0438. Die gesuchte Diskriminanzfunktion lautet demzufolge: Y = -0,0501 * x 1 + 0,0438 * x 2. 11

12 d 1 = b 1 * SQ 11 + b 2 * SQ 12 d 2 = b 1 * SQ 12 + b 2 * SQ 22-4,17 = b 1 * 91,67 + b 2 * 9,67 3,58 = b 1 * 9,67 + b 2 * 92,92 40,05 = b 1 * -881,10 + b 2 * -92,92 3,58 = b 1 * 9,67 + b 2 * 92,92 43,63 = b 1 * -871,43 + b 2 * 0,00-0,0501 = b 1-4,17 = b 1 * 91,67 + b 2 * 9,67-4,17 = -0,0501* 91,67 + b 2 * 9,67 0,0438 = b 2 5. Diskriminanzfunktion Y = - 0,0501 * x 1 + 0,0438* x 2 Tabelle 4: Eliminationsverfahren für Diskriminanzgleichungen (Innovationsbeispiel) Alternativ erhält man die Diskriminanzfunktion nach Formel (1-4) als: d *SQ d *SQ 3,58*9, 67 ( 4,17)*92,92 b 0, 0501 SQ SQ *SQ 9, 67 91, 67*92, d *SQ d *SQ ( 4,17)*9, 67 3,58*91, 67 b 0, 0438 SQ SQ *SQ 9, 67 91, 67*92, Aus dem Vergleich der unstandardisierten Koeffizientenwerte wird ersichtlich, dass die Trennstärke beider Merkmale nahezu gleich groß ist. Zusätzlich zeigt ein positives (negatives) Vorzeichen des Koeffizienten an, dass eine zunehmende Merkmalsausprägung der betreffenden Variablen zu einem steigenden (sinkenden) Diskriminanzwert der Untersuchungseinheit führt und somit eine Zuordnung zur Gruppe 1 (Gruppe 2) wahrscheinlicher wird. Um die Werte der Diskriminanzfunktion für die einzelnen Objekte zu berechnen, sind die Ausprägungen der Merkmalsvariablen in diese einzusetzen (vgl. Tabelle 5). Hiernach ergibt sich beispielsweise der Diskriminanzwert für das erste Neuprodukt der Gruppe A: Y 1 0,0501 * 10 0,0438 * 9 0,107 Für die Mittelwertgrößen der Diskriminanzwerte erhält man (vgl. Tabelle 5): Y 0, 292 A Y 0, 658 B Y 0,

13 Produkt Gruppe Marketingbudget (% Umsatz) x 1A Wettbewerberanzahl x 2A Diskriminanzwert Y = - 0,0501 * x 1 + 0,0438 * x 2 1 A ,107 2 A ,288 3 A ,201 4 A ,163 5 A ,389 6 A ,257 7 A ,126 8 A ,395 9 A , A , A , A , B , B , B , B , B , B , B , B , B , B , B , B ,739 Gruppe A -0,292 Mittelwert der Gruppe B -0,658 Diskriminanzwerte Gesamt -0,475 Tabelle 5: Berechnung von Diskriminanzwerten (Innovationsbeispiel) 2.3 Gütediagnose der Diskriminanzfunktion Im Anschluss an die Ermittlung der Diskriminanzwerte besteht eine weiterführende Aufgabenstellung darin, die Güte des diskriminationsanalytischen Modells zu beurteilen (vgl. Abbildung 2). Diese bezieht sich zum einen auf die Bewertung der Trennfähigkeit der geschätzten Diskriminanzfunktion. Zum anderen sind die Diskriminanzbeiträge der einzelnen Merkmalsvariablen zu beurteilen (vgl. hierzu Kapitel 1.6). Die im Folgenden behandelte Gütediagnose der Diskriminanzfunktion kann generell anhand von speziellen Maßzahlen, Signifikanztests und Klassifikationsanalysen vorgenommen werden (vgl. ausführlich bei Backhaus et al. 2011, S. 207 ff.; Eckey et al. 2002, S. 323 ff.). 13

14 Für die Beurteilung der Trennstärke der Diskriminanzfunktion stehen mehrere Maßzahlen zur Verfügung. Die Ermittlung solcher Kennwerte setzt allerdings die Berechnung der Gesamtstreuung, der erklärten Streuung (= Zwischengruppen- Streuung) sowie der nicht erklärten Streuung (= Innergruppen-Streuung) der Diskriminanzwerte voraus. Dazu ist es zweckmäßig, die an sich komplexe Berechnung der Streuung zwischen den Gruppen (SQ Z ) dadurch zu vereinfachen, dass diese als Differenz zwischen der Gesamtstreuung (SQ) und der Innergruppen- Streuung (SQ F ) bestimmt wird. Somit lassen sich die relevanten Größen wie folgt berechnen (vgl. auch Formel 1.2): Gesamtstreuung (SQ) = K n k k=1 i=1 (y -y) ki K n 2 k Innergruppen-Streuung (SQ ) (y - y ) F ki k k 1 i 1 2 K 2 Z k k F k 1 Zwischengruppen-Streuung (SQ ) n (y - y) SQ SQ Im Beispiel erhält man aus der Tabelle 6 die Werte: SQ = 1,168 SG F = 0,366 SQ Z = 1,168 0,366 = 0,802. (2.1) Tabelle 6: Streuungsgrößen der Diskriminanzwerte (Innovationsbeispiel) 14

15 Auf der Grundlage der vorliegenden Streuungswerte können mehrere Gütemaße zur Beurteilung der Diskriminanzfunktion bestimmt werden (vgl. Tabelle 7): Maßzahlen Gruppe A Gruppe B Gesamt Fälle Gesamtstreuung 1,168 Streuung innerhalb der Gruppen 0,188 0,177 0,366 Streuung zwischen den Gruppen 0,802 Diskrimiminanzkriterium (Eigenwert) Kanonischer Korrelationskoeffizient Wilks' Lambda Empirischer χ2-prüfwert Gütediagnose der Diskriminanzfunktion Teststatistik (Gruppen-Mittelwertunterschiede der Diskriminanzwerte) Theoretischer Prüfwert (ɑ = 1%, 2 Freiheitsgade) 24,3796 9,2103 Tabelle 7: Gütemaße der Diskriminanzfunktion (Innovationsbeispiel) 2,193 0,8287 0,3132 Testentscheidung H1 annehmen Der Eigenwert (γ) bildet eine Maßgröße für die Trennstärke der Diskriminanzfunktion. Er entspricht dem durch die Diskriminanzfunktion maximal erreichbaren Wert der schätztechnischen Zielfunktion, d.h. dem Wert des Diskriminanzkriteriums (λ) für die ermittelten Diskriminanzkoeffizienten (vgl. Formel 1.2). Je höher der Eigenwert ist, desto größer ist die Trennkraft der Diskriminanzfunktion. Ein großer Eigenwert ergibt sich dann, wenn die erklärte Streuung erheblich größer ist als die nicht erklärte Streuung. In diesem Fall unterscheiden sich die Gruppen- Mittelwerte der Diskriminanzwerte voneinander, während Unterschiede zwischen den Diskriminanzwerten innerhalb der Gruppen vergleichsweise gering sind. Im Beispiel beträgt der Eigenwert: SQ SG (Beispiel) Z F erklärte Streuung nicht erklärte Streuung 0,802 2,193 0,366 (2.2) Der Eigenwert in Höhe von 2,193 signalisiert, dass die erklärte Streuung etwa das 2,2-fache der nicht erklärten Streuung beträgt. Demnach gewährleistet die geschätzte Diskriminanzfunktion eine hinreichende Unterscheidung der beiden Neuproduktgruppen. Die Aussagefähigkeit des Eigenwertes ist allerdings begrenzt, da dieser nicht auf den Bereich zwischen Null und Eins normiert ist. Aufgrund dessen werden weitere Maßzahlen zur Beurteilung der diskriminanzanalytischen Trennkraft verwendet. Eine auf den Wertebereich zwischen Null und Eins normierte Maßzahl stellt der kanonische Korrelationskoeffizient (c) dar. Dieser misst die Stärke des Zusammenhangs zwischen den Funktionswerten der Diskriminanzfunktion und 15

16 der abhängigen Gruppenvariable. Er errechnet sich aus der Quadratwurzel des Quotienten aus nicht erklärter Streuung und der Gesamtstreuung: erklärte Streuung 0,802 c = = 0,8287 Gesamtstreuung 1,168 alternativ Eigenwert 2,193 c = 0,8287 Eigenwert + 1 2,193 1 (2.3) Je größer der kanonische Korrelationskoeffizient ist, desto höher ist der Anteil der erklärten Streuung an der Gesamtstreuung der Diskriminanzwerte und desto größer ist folglich die Trennkraft der Diskriminanzfunktion. Im Beispiel nimmt der kanonische Korrelationskoeffizient den Wert 0,8287 an; die Diskriminanzfunktion erklärt somit ca. 83% der Gesamtstreuung der Diskriminanzwerte. Der kanonische Korrelationskoeffizient bildet eine Maßgröße, die auch in anderen statistischen Verfahren ihre Anwendung findet. Denn dieser entspricht zum einen dem in der Kontingenz- sowie in der Varianzanalyse gebräuchlichen sog. Eta- Koeffizienten für gemischt-skalierte Daten. Und zum anderen lässt sich ein Bezug zur bivariaten Regressionsanalyse herstellen, denn die kanonische Korrelation ist im Zweigruppen-Fall identisch mit der Produkt-Moment-Korrelation zwischen den Diskriminanzwerten und der Gruppenvariable (vgl. Backhaus et al. 2011, S. 210). Quadriert man daher den kanonischen Korrelationskoeffizienten, so erhält man die Beurteilungsgröße des Bestimmtheitsmaßes (r 2 ): r = c = 0,8287 0,686 alternativ 2 Eigenwert 2,193 r 0, 686 Eigenwert 1 3,193 (2.4) Eine zum kanonischen Korrelationskoeffizienten alternativ verwendbare Prüfgröße bildet das sog. Wilks Lambda (A), das sich als Quotient aus nicht erklärter Streuung zur Gesamtstreuung errechnet: nicht erklärte Streuung 0,366 Α = 0,3132 Gesamtstreuung 1,168 alternativ 1 1 Α = 0, γ 1 2, Α = 1 c 1 0,8287 0,3132 (2.5) Kleine (große) Werte des Wilks Lambda deuten auf eine hohe (geringe) Trennkraft der Diskriminanzkoeffizienten hin. Für das Beispiel ergibt sich ein Wert A in Höhe von 0,3132. Dieser zeigt an, dass ca. 31 % der Gesamtstreuung der Diskriminanzwerte nicht durch die Gruppentrennung erklärt werden. Generell gilt zudem, dass sich Wilks Lambda und der quadrierte kanonische Korrelationskoeffizient stets zu Eins summieren und daher komplementär zueinander sind. 16

17 Mittels Signifikanztests kann im Rahmen der diskriminanzanalytischen Gütebeurteilung überprüft werden, ob die Unterschiede zwischen den Gruppen- Mittelwerten der Diskriminanzwerte statistisch signifikant sind. Im Zweigruppen- Fall mit nur einer metrischen Merkmalsvariablen bieten sich hierzu etwa sog. Zwei- Stichprobentests für Mittelwertdifferenzen an. In vergleichbarer Weise kann sowohl im Zweigruppen- als auch im Mehrgruppen-Fall auf varianzanalytische Testverfahren zurückgegriffen werden. Darüber hinaus ist bei Signifikanztests auch die Verwendung von Wilks Lambda möglich, denn dieser Kennwert kann in eine Chi-Quadrat-verteilte Prüfgröße (χ 2 ) mit df = J * (K 1) Freiheitsgraden überführt werden (vgl. Eckey et. al 2002, S. 326 f.): 2 J + K χ = - N * ln (Α) 2 mit N = Anzahl der Fälle (Gesamtstichprobenumfang) J = Anzahl der Variablen K = Anzahl der Gruppen A = Wilks' Lambda ln = natürlicher Logarithmus (2.6) Mit Hilfe dieser Transformation lässt sich ein Test auf die Gleichheit der Gruppenmittelwerte der Diskriminanzwerte durchführen. Die relevante Nullhypothese H 0 trifft die Aussage, dass sich die durchschnittlichen Funktionswerte der Diskriminanzfunktion in beiden Gruppen nicht voneinander unterscheiden, während mit der Gegenhypothese H 1 ein Unterschied zwischen den Gruppen-Mittelwerten postuliert wird. Im Beispiel ergibt sich ein Wert der empirischen Prüfgröße gemäß der Formel (2.6) von χ = * ln (0,3132) = 24, (2.7) Bei einem vorgegebenen Signifikanzniveau von beispielsweise ɑ = 1% und df = J (G-1) = 2 Freiheitsgraden, erhält man aus einer tabellierten Chi-Quadrat-Verteilung den kritischen Testwert in Höhe von 9,2103. Da in diesem Fall der empirische Testwert größer ist als der kritische Testwert, kann die Nullhypothese abgelehnt bzw. die Alternativhypothese angenommen werden. Mit einer Irrtumswahrscheinlichkeit von 1% ist somit die Schlussfolgerung zulässig, dass sich die durchschnittlichen Diskriminanzwerte der beiden Neuproduktgruppen voneinander unterscheiden (vgl. auch Tabelle 7). 17

18 2.4 Diskriminanzprüfung der Merkmalsvariablen In einem weiteren Analyseschritt der Diskriminanzanalyse ist die diskriminatorische Bedeutung der Merkmalsvariablen anhand von unstandardisierten sowie von standardisierten Diskriminanzkoeffizienten zu untersuchen (vgl. Abbildung 2). Daneben kann es im Einzelfall zweckmäßig sein, Maßzahlen für den Zusammenhang zwischen Merkmalsvariablen und geschätzten Diskriminanzwerten (sog. Strukturkoeffizient) und für Beziehungen zwischen den Merkmalen (Multikollinearität) zu bestimmen (vgl. Tabelle 8). Diskriminanzkoeffizienten Relative Merkmalsdiskriminanz Strukturkoeffizient Diskriminanzprüfung der Merkmalsvariablen Merkmalskorrelation (Multikollinearität) b 1 b 2 unstandardisiert -0,0501 0,0438 standardisiert -0,1462 0,1191 Tabelle 8: Maßzahlen der Merkmalsprüfung (Innovationsbeispiel) 55,11% 44,89% -0,880 0,812-0,438 Die bislang betrachteten unstandardisierten Diskriminanzkoeffizienten zeigen den Einfluss der betreffenden Merkmalsvariablen auf die Gruppentrennung an, wobei das Vorzeichen für die diskriminatorische Beurteilung ohne Bedeutung ist. Im Beispiel geht die Merkmalsvariable Marketingbudget (b 1 ) mit einem Koeffizienten bzw. einem Diskriminanzgewicht von 0,0501 die Funktion ein, während das Merkmal Anzahl der Wettbewerber (b 2 ) ein Einflussgewicht von 0,0438 aufweist. Der daraus resultierende Verhältnisfaktor der unstandardisierten Koeffizienten (= b 1 /b 2 ) beträgt im Beispiel -1,144. Liegen die Ausgangsdaten der Merkmalsvariablen hingegen als standardisierte Daten vor, kann der relative Merkmalseinfluss auf die Gruppentrennung bereits unmittelbar aus der Größe der kanonischen Diskriminanzkoeffizienten abgeleitet werden. Unstandardisierte Koeffizienten sind gewöhnlich für eine Beurteilung der Trennstärke der Variablen ungeeignet, da Merkmalsvariablen mit unterschiedlichen Maßeinheiten (z.b. Marketingbudget in %, Anzahl der Wettbewerber) und Varianzen einen verzerrenden Einfluss auf die Größe der Diskriminanzkoeffizienten hervorrufen können. Um die relative Diskriminanzstärke der Merkmalsvariablen zu beurteilen, sind - analog zu den Beta-Koeffizienten einer multiplen Regressionsanalyse standardisierte Diskriminanzkoeffizienten (b j *) zu berechnen. Die Standardisierung einer Variablen erfolgt durch die Multiplikation des unstandardisierten Koeffizientenwertes mit der Standardabweichung (s j ) der Ausgangswerte der betreffenden Merkmalsvariablen. Diese Transformation führt dazu, dass jede Merkmalsvariable anschließend einen Mittelwert von 0 und eine Standardabweichung von 1 aufweist: * j j j b b *s * 1 b 0, 0501* 2,917 0,1462 (2.8) * 2 b = 0,0438 *2,718 = 0,

19 Ergänzend ist anzumerken, dass sich die Relationen zwischen den Koeffizienten durch die Standardisierung nur geringfügig verändert haben, wie etwa durch den Vergleich mit dem Verhältnisfaktor der standardisierten Koeffizienten (= -1,227) erkennbar ist. Die diskriminatorische Bedeutung eines Merkmals kann nun anhand der absoluten Größe des standardisierten Koeffizienten abgelesen werden, wobei dessen Vorzeichen ohne Bedeutung ist. Im Beispiel besitzt demnach das Merkmal Marketingbudget eine geringfügig größere Trennkraft als das Merkmal Anzahl der Wettbewerber. Die relative diskriminatorische Bedeutung eines Merkmals kann darüber hinaus durch einen prozentualen Wirkungskoeffizienten (b r ) zum Ausdruck gebracht werden. Dieser errechnet sich als Anteil eines Koeffizientenwertes an der Summe standardisierter Koffizientenwerte: * r 1 1 * * b1 b2 b 0,1462 b *100% *100% 55,11% 0,1462 0,1191 * r 2 2 * * b1 b2 b 0,1191 b *100% *100% 44,89% 0,1462 0,1191 (2.9) Bestehen korrelative Beziehungen zwischen den metrischen Merkmalsvariablen (Multikollinearität), so können diese dazu führen, dass standardisierte Diskriminanzkoeffizienten eine verzerrte Merkmalsdiskriminanz anzeigen. Um in einem solchen Fall zu unverfälschten Einflussgewichten der Merkmale zu gelangen, ist die Ermittlung von sog. Strukturkoeffizienten zweckmäßig. Diese messen die Korrelationen zwischen den Ausprägungen eines Merkmals und den Diskriminanzwerten (vgl. Eckey et al. 2002, S. 319). Ihre Berechnung kann in Form von sog. gepoolten Korrelationskoeffizienten erfolgen, bei denen der Mittelwert von gruppenspezifischen Korrelationswerten einer Variablen gebildet wird (so etwa von SPSS). Alternativ sind jedoch auch undifferenzierte Strukturkoeffizienten bestimmbar. Für die Merkmalsvariablen des Beispiels gilt zum einen, dass zwischen diesen eine lediglich mittelstarke Korrelation besteht (r = -0,438). Zum anderen werden für diese jeweils hohe (undifferenzierte) Strukturkoeffizienten ausgewiesen, deren Werte sich nur marginal voneinander unterscheiden (vgl. Tabelle 8). Zusammenfassend ist die nahezu gleich große Trennstärke beider Merkmalsvariablen als hinreichend zu beurteilen. 2.5 Klassifikationsanalysen Der abschließende Untersuchungsschritt der Diskriminanzanalyse befasst sich der Klassifikation von Objekten auf Basis ihrer geschätzten Diskriminanzwerte (vgl. Abbildung 2). Die Klassifikationsanalyse umfasst die vier Aufgabenstellungen: Gruppenklassifikation der Untersuchungsobjekte, Bewertung der Klassifikationsergebnisse, Gruppenzugehörigkeitsprognose eines neuen Objekts und grafische Veranschaulichung der Gruppentrennung. 19

20 Zur Gruppenklassifikation von Objekten steht eine Reihe verschiedenartiger Zuordnungskonzepte zur Verfügung (vgl. hierzu ausführlich Kapitel 3.5). Ein vergleichsweise einfaches sowie populäres Verfahren bildet das Konzept des kritischen Diskriminanzwertes. Hierbei vergleicht man zunächst für jedes einzelne Untersuchungsobjekt den individuellen Diskriminanzwert mit einem kritischen Diskriminanzwert (auch kritischer Trennwert genannt). Anschließend wird mit Hilfe einer Zuordnungsregel, die Zuweisung der Objekte zu den Gruppen vorgenommen. Der kritische Diskriminanzwert (Y c ) errechnet sich bei gleicher (ungleicher) Anzahl von Objekten in den Gruppen als das arithmetische Mittel (gewichtete arithmetische Mittel) der Diskriminanzwerte: Y Y c Y n 1* Y n 2* Y Yc n n Gemäß der Tabelle 5 betragen die Mittelwerte der Diskriminanzwerte: Y 0, 2921 A Y 0, 6578 B Y 0, 4749 c (2.10) Hieraus ergibt sich - bei gleicher Gruppengröße - ein kritischer Trennwert in Höhe von -0,4749, der somit dem Gesamtmittelwert der Diskriminanzwerte entspricht. Die Gruppenzuordnung eines Objektes erfolgt mit Hilfe einer Zuordnungsregel bei der zusätzlich die Beziehung zwischen den Gruppen-Mittelwerten zu beachten ist (vgl. Tabelle 9): Ist der Diskriminanzwert des betreffenden Objektes kleiner (größer) als der kritische Diskriminanzwert, dann wird es derjenigen Gruppe zugeordnet, dessen gruppenspezifischer Diskriminanzmittelwert ebenfalls kleiner (größer) als der kritische Diskriminanzwert ist. Gruppenzuordnung Vergleich des mittels kritischem Diskriminanzwert Y c Diskriminanzwertes Gruppenprognose Gruppenprognose des i-ten Objekts mit Y falls: < falls: > c Y i < Y c 1 2 Y i > y c 2 1 Y i = Y c keine eindeutige Zuordung möglich Tabelle 9: Prognose der Gruppenzugehörigkeit auf Basis des kritischen Diskriminanzwertes (Quelle: in Anlehnung an Eckey et. al. 2002, S. 345) Für das Beispiel gilt: Der Mittelwert der Gruppe A ist größer als der Mittelwert der Gruppe B. Daraus folgt gemäß Tabelle 9, dass ein Objekt, dessen Diskriminanzwert kleiner (größer) als der kritische Trennwert in Höhe von -0,4749 ist, wird der Gruppe B (Gruppe A) zugewiesen. Prognostiziert man die Gruppenzugehörigkeit der im Beispiel betrachteten Neuprodukte auf der Grundlage dieser Regel, so erhält man die in der nachstehenden Tabelle 10 durchgeführte Klassifikationsprognose. 20

21 Produkt Gruppe Diskriminanzwert Y = - 0,0501 * x 1 + 0,0438 * x 2 Klassifikationsprognose Klassifikationsgüte 1 A -0,107 A Treffer 2 A -0,288 A Treffer 3 A -0,201 A Treffer 4 A -0,163 A Treffer 5 A -0,389 A Treffer 6 A -0,257 A Treffer 7 A -0,126 A Treffer 8 A -0,395 A Treffer 9 A -0,357 A Treffer 10 A -0,270 A Treffer 11 A -0,539 B Fehler 12 A -0,414 A Treffer 13 B -0,482 B Treffer 14 B -0,664 B Treffer 15 B -0,626 B Treffer 16 B -0,451 A Fehler 17 B -0,589 B Treffer 18 B -0,814 B Treffer 19 B -0,727 B Treffer 20 B -0,551 B Treffer 21 B -0,733 B Treffer 22 B -0,645 B Treffer 23 B -0,871 B Treffer 24 B -0,739 B Treffer Tabelle 10: Diskriminanzanalytische Klassifikation (Innovationsbeispiel) Wenn man im Anwendungsbeispiel die Neuprodukte zufällig einer der beiden Gruppen zuweisen würde, so ergäbe sich eine Quote korrekter Zuordnungen bzw. eine Trefferquote von 50%. Der Tabelle 10 ist zu entnehmen, dass die Prognose zu lediglich zwei Fehklassifikationen geführt hat: Das der Gruppe A angehörige Produkt 12 wird der Gruppe B zugewiesen, während für das Produkt 16 die umgekehrte Situation zutrifft. Zur Beurteilung der Klassifikationsgüte werden demnach prognostizierte und empirisch beobachtete Gruppenzugehörigkeiten gegenübergestellt, deren Ergebnis in einer sog. Klassifikationsmatrix zusammengefasst wird (vgl. Tabelle 11). Für die Beispieldaten resultiert aus der geschätzten Diskriminanzfunktion eine Trefferquote von 91,67%, die daher deutlich höher ist als die Erfolgsquote bei zufälliger Objektzuweisung. Dieser Klassifikationswert bildet deshalb einen weiteren Beleg für die statistische Güte der ermittelten Diskriminanzfunktion. Um die Gruppenzugehörigkeit eines neuen Objekts zu prognostizieren, kann gleichfalls auf das Konzept des kritischen Diskriminanzwertes zurückgegriffen werden. Geht man etwas davon, dass ein neues Produkt ein Marketingbudget von 20% besitzt und in seiner Markteinführungsphase gegenüber 20 Wettbewerbern 21

22 behaupten muss, dann resultiert aus der Diskriminanzfunktion ein geschätzter Diskriminanzwert von: Y = -0,0501 * * 0,0438 = -0,783. Da dieser Wert kleiner als der kritische Trennwert ist, wird das Produkt der Gruppe B, d.h. der Gruppe erfolgreicher Produktinnovationen zugewiesen. Gruppen-Mittelwert der Diskriminanzwerte Kritischer Trennwert (Mittelwert der Diskriminanzwerte) Klassifikationsmatrix Klassifikationsanalyse Gruppe A Gruppe B -0,2921-0,6578 Anzahl -0,4749 Anteil Trefferquote 22 91,67% Fehlerquote 2 8,33% Gesamt ,00% Tabelle 11: Diskriminanzanalytische Klassifikationsdiagnose (Innovationsbeispiel) Die diskriminanzanalytische Methodik kann mit Hilfe von Klassifizierungsdiagrammen veranschaulicht werden (vgl. Backhaus et al. 2011, S. 202 ff.; Eckey et. al 2002, S. 294 ff.). So lässt sich im Zweivariablen-Fall die Diskriminanzfunktion grafisch in einem Streudiagramm abbilden (vgl. Abbildung 3). Die geschätzte Diskriminanzfunktion stellt eine Gerade der Merkmalsvariablen dar, die als Diskriminanzachse bezeichnet wird. Sie besitzt die Form: x 2 = b 2 /b 1 * x 1 und verläuft durch den Nullpunkt des Koordinatensystems, wobei ihre Steigung durch das Verhältnis der Diskriminanzkoeffizienten b 2 /b 1 bestimmt wird. Im Beispiel erhält man sie als: x 2 = 0,0438/-0,0501*x 1 x 2 = -0,87425*x 1. Die Diskriminanzwerte für die einzelnen Objekte entsprechen den Projektionen der Merkmalskoordinaten auf die Diskriminanzachse. Abbildung 3: Klassifizierungsdiagramm (Innovationsbeispiel) 22

23 Für den kritischen Diskriminanzwert lässt sich zusätzlich Trenngerade bestimmen, die die Lage des kritischen Trennwertes auf der Diskriminanzachse anzeigt. Diese ergibt sich formal als: Y c = Y 0,4749 = -0,0501*x 1 + 0,0438*x 2 x 2 = -10, ,1438 * x 1 Die Trenngerade verläuft senkrecht zur Diskriminanzachse und markiert den Trennbereich der Gruppenzugehörigkeit von Objekten. Liegt der Diskriminanzwert eines neuen Objektes im Bereich links (rechts) von der Trennlinie, dann wird das Objekt der Gruppe A (B) zugeordnet. Die Trennlinie vermittelt somit auch einen optischen Hinweis auf die Klassifikationsgüte bei der Zuordnung neuer Objekte. 23

24 3. Einfache Diskriminanzanalyse mit SPSS Für das im vorherigen Kapitel behandelte Beispiel zur Untersuchung zweier Gruppen von Neuprodukten soll im Folgenden eine SPSS-basierte Diskriminanzanalyse dargestellt werden. Bei der Ergebnisinterpretation der SPSS-Prozeduren wird das Hauptaugenmerk auf jene statistischen Konzepte gerichtet, die sich von den vorangegangenen Analysen des Kapitels 2 unterscheiden. 3.1 Datenmatrix und SPSS-Analysemethodik Zunächst ist die relevante Datenmatrix zu erstellen. Hierzu übertragen wir die in der Tabelle 1 angeführten Beispieldaten in den SPSS-Dateneditor und speichern die Datei, z.b. unter dem Namen Innovationserfolg (vgl. Abbildung 4). Zur Definition der drei Variablen im Registerfenster Variablenansicht des Dateneditors bieten sich die folgenden Kennzeichnungen an: Gruppenvariable Neuprodukterfolg: [Werte: 1 = Innovationsflop, 2 = Innovationserfolg; Maß = Nominal]. Merkmalsvariable Marketingintensität: [Beschriftung: Marketingbudget in % vom Umsatz; Maß = Skala]. Merkmalsvariable Wettbewerb: [Beschriftung = Wettbewerberanzahl; Maß = Skala]. Abbildung 4: SPSS-Datenmatrix ( Innovationserfolg ) 24

25 Zur Festlegung der diskriminanzanalytischen SPSS-Prozeduren gehen Sie wie folgt vor: (1) Nach Laden der Datei Innovationserfolg wählen Sie per Mausklick die Befehlsfolge Analysieren/Klassifizieren/Diskriminanzanalyse, worauf sich das Dialogfeld Diskriminanzanalyse öffnet (vgl. Abbildung 5). Abbildung 5: Dialogfeld Diskriminanzanalyse Im linken Teil des Dialogfeldes sind im sog. Quellverzeichnis die definierten Variablen enthalten. Übertragen Sie die Variable Neuprodukterfolg durch ein Anklicken des oberen Pfeils in das Feld Gruppierungsvariable. Definieren Sie deren Wertebereich durch ein Klicken auf die Schaltfläche Bereich definieren und tragen Sie die Werte 1 und 2 in die Eingabefelder Minimum sowie Maximum ein. Verschieben Sie die beiden Merkmalsvariablen Marketingbudget und Wettbewerberanzahl in das Feld Unabhängige Variable(n). Da beide Merkmalsvariablen die zu schätzende Diskriminanzfunktion determinieren sollen, belassen Sie die Voreinstellung Unabhängige Variablen zusammen aufnehmen. Bestätigen Sie die Eintragungen mit Weiter. (2) Klicken Sie auf die Schaltfläche Statistik, um die Dialogbox Diskriminanzanalyse: Statistiken zu öffnen (vgl. Abbildung 6). Abbildung 6: Dialogfeld Diskriminanzanalyse: Statistik 25

26 Im Eingabefeld Deskriptive Statistik wählen Sie die Optionen Mittelwert und Univariate ANOVA, um für jede unabhängige Merkmalsvariable gruppenspezifische Kennwerte anzufordern. Im Feld Funktionskoeffizienten wählen Sie zum einen die Option Nicht standardisiert, die zur Schätzung der kanonischen Diskriminanzkoeffizienten führt. Zusätzlich ist die Alternative Fisher anzukreuzen, um die Koeffizienten einer linearen Klassifizierungsfunktion zu erhalten. Das Feld Matrizen stellt zusätzliche Kenngrößen zur Variablenbeurteilung bereit, die bei unserer Untersuchung unberücksichtigt bleiben sollen. Es lassen sich spezielle Korrelationskoeffizienten sowie Kovarianzen der Variablen berechnen und in Matrizenform ausweisen. Bestätigen Sie Ihre Eingaben mit Weiter. (3) Öffnen Sie Dialogbox Diskriminanzanalyse: Klassifizieren (vgl. Abbildung 7). Abbildung 7: Dialogfeld Diskriminanzanalyse: Klassifizieren Bei der im Eingabefeld A-Priori-Wahrscheinlichkeit voreingestellten Option Alle Gruppen gleich wird angenommen, dass für alle Gruppen a- priori die gleiche Eintrittswahrscheinlichkeit vorliegt. Da in unserem Beispiel beide Gruppen gleich groß sind bzw. jeweils zwölf Gruppenelemente enthalten, beträgt die Eintrittswahrscheinlichkeit für jede Gruppe 0,5. Insofern belassen Sie die Voreinstellung. Liegen hingegen unterschiedliche Gruppengrößen vor, so ist die Eintrittswahrscheinlichkeit auf der Grundlage der betreffenden Gruppenhäufigkeiten zu berechnen. Im Feld Kovarianzmatrix belassen Sie die Voreinstellung Innerhalb der Gruppen, mit der die gemeinsamen (gepoolten) Varianzen der Gruppen zur Klassifikation der Fälle herangezogen werden. Die im Feld Anzeige zu auszuwählende Option Fallweise Ergebnisse erzeugt eine Liste der einzelnen Fälle, für die jeweils die tatsächliche Gruppenzugehörigkeit sowie die prognostizierte Klassifikation ausgewiesen werden. Zusätzlich wird mit der Option Zusammenfassungstabelle die sog. Klassifikationsmatrix angefordert. 26

27 Die im Feld Diagramme zur Auswahl stehenden grafischen Darstellungen der Klassifikationsergebnisse sind für multiple Diskriminanzanalysen von Bedeutung und bleiben demzufolge im vorliegenden Zwei-Gruppen-Fall unberücksichtigt. Bestätigen Sie Ihre Angaben mit Weiter. (4) Klicken Sie auf die Schaltfläche Speichern. In der betreffenden Dialogbox können statistische Ergebnisse ausgewählt werden, die sich der Datendatei als jeweils eigenständige Variable für jeden Fall hinzufügen lassen. Wählen Sie die folgenden Optionen(vgl. Abbildung 8): Abbildung 8: Dialogfeld Diskriminanzanalyse: Speichern Vorhergesagte Gruppenzugehörigkeit Scorces der Diskriminanzfunktion. Wahrscheinlichkeiten der Gruppenzugehörigkeit. Bestätigen Sie Ihre Angaben mit Weiter und abschließend mit OK. 3.2 Schätzung der Diskriminanzfunktion Die diskriminanzanalytische Schätzmethodik führt zu drei Teilergebnissen (vgl. auch Abbildung 2): kanonische Diskriminanzkoeffizienten, fallweise Diskriminanzwerte und Gruppenmittelwerte der Diskriminanzwerte. In SPSS wird die geschätzte Diskriminanzfunktion um einen konstanten Parameter b 0 ergänzt und in der sog. normierten Diskriminanzfunktion erfasst: Y b b * x b * x (3.1) Von SPSS wird im ersten Schritt der Funktionsschätzung eine Normierung der Diskriminanzkoeffizienten derart vorgenommen, dass die Varianz (Summe der Abweichungsquadrate dividiert durch die Anzahl der Freiheitsgrade) innerhalb der Gruppen den Wert 1annimmt, um die Interpretierbarkeit der Koeffizienten zu unterstützen (vgl. Backhaus et. al 2011, S. 204 f.; Eckey et al. 2002, S. 312 ff). Im zweiten Schritt wird die Konstante so bestimmt, dass der Gesamtmittelwert der Diskriminanzwerte gleich Null wird. Das konstante Glied b 0 besitzt allerdings jedoch keine inhaltliche Bedeutung; sondern dieser Funktionsparameter führt dazu, dass der kritische Diskriminanzwert der Gruppentrennung auf den Wert Null normiert wird (graphisch entspricht diesem eine Skalenverschiebung der Diskriminanzachse). 27

28 Für das Beispiel liefert SPSS die in der Tabelle 12 angezeigten Koeffizientenwerte: Die geschätzte Diskriminanzfunktion zur Trennung der beiden Neuproduktgruppen besitzt die Form Y = -3, ,38847 * Marketingbudget 0,33962 * Wettbewerberanzahl. Die Werte der unstandardisierten bzw. kanonischen Diskriminanzkoeffizienten verweisen (vorläufig) darauf, dass die Trennstärke beider Merkmalsvariablen nahezu gleich groß ist. Bildet man den Verhältnisfaktor der unstandardisierten Koeffizienten (= b 1 /b 2 ), so erhält man den Wert -1,144. Dieser Wert ist identisch mit dem im Kapitel 2 ermittelten Verhältnisfaktor, der auf der Grundlage der geschätzten Diskriminanzfunktion ohne Berücksichtigung einer Konstanten berechnet wurde (vgl. S. 18). Tabelle 12: Kanonische Diskriminanzkoeffizienten Um die fallweisen Diskriminanzwerte anzuzeigen, fügt SPSS eine neue Variable Dis1_1 in die Datendatei ein. Es empfiehlt sich, diese Variable für weiterführende Analysen zu definieren, z.b. mittels der Bezeichnung Diskriminanzscore (vgl. Tabelle 13). So erhält man beispielsweise den Diskriminanzwert für das Objekt 1 der ersten Gruppe als: Y = -3, ,38847 *10 0,33962 * 9 = - 2,854. Tabelle 13: Fallweise Diskriminanzwerte (Ausschnitt) Ergänzend wird von SPSS standardmäßig eine Tabelle der durchschnittlichen Diskriminanzwerte (Gruppenzentroide) in beiden Produktgruppen ausgewiesen (vgl. Tabelle 14). Diese bilden die Datengrundlage für die im nächsten Kapitel dargestellte diskriminanzanalytische Gütediagnose, d.h. der Signifikanzüberprüfung von Gruppenunterschieden sowie der Klassifikationsbeurteilung mittels des Konzepts des kritischen Diskriminanzwertes. Generell gilt, dass je enger die 28

29 Gruppen-Mittelwerte beieinander liegen, desto geringer ist die herbeigeführte Gruppentrennung durch die geschätzte Diskriminanzfunktion. Tabelle 14: Gruppenzentroide 3.3 Gütebeurteilung der Diskriminanzfunktion Für die Beurteilung der Trennfähigkeit der geschätzten Diskriminanzfunktion stehen mehrere Konzepte zur Verfügung (vgl. auch Abbildung 2): Maßzahlen der Gruppendiskriminanz, Signifikanzprüfung der Diskriminanzfunktion, Klassifikationsgüte. Maßzahlen der Gruppendiskriminanz sollen Auskunft über die Trennstärke der Diskriminanzfunktion gewähren. Die Berechnung solcher Kennwerte setzt allerdings die Kenntnis der Gesamtstreuung, der erklärten Streuung (= Zwischengruppen- Streuung) sowie der nicht erklärten Streuung (= Innergruppen-Streuung) der Diskriminanzwerte voraus. Da die erforderlichen Streuungsmaße keinen Output der diskriminanzanalytischen SPSS-Prozeduren bilden, bietet es sich aus didaktischen Gründen an, diese mit Hilfe einer einfaktoriellen Varianzanalyse zu ermitteln. Die nachfolgende Tabelle 15 zeigt die entsprechenden SPSS-Anweisungen ((abhängige Variable: Diskriminanzwert; Faktor: Neuprodukterfolg) sowie die ermittelten Streuungswerte (Spalte Quadratsumme ): Tabelle 15: ANOVA-Einstellungen und Ergebnis (Streuungsanalyse: Diskriminanzwerte) 29

30 Auf der Grundlage der Streuungswerte in der Tabelle 15 können nun die von SPSS ausgewiesenen relevanten Maßzahlen der Gruppendiskriminanz beurteilt werden (vgl. Tabelle 16): Der Eigenwert (γ) bildet eine Maßgröße für die Trennstärke der Diskriminanzfunktion. Er entspricht dem durch die Diskriminanzfunktion maximal erreichbaren Wert der schätztechnischen Zielfunktion, d.h. dem Wert des Diskriminanzkriteriums (λ) für die ermittelten Diskriminanzkoeffizienten (vgl. Formel 1.2). Der Eigenwert ergibt sich aus dem Quotienten der Quadratsumme zwischen den Gruppen und der Quadratsumme innerhalb der Gruppen (vgl. Formel 2.2). Im Beispiel erhält man demzufolge: 48,244 2, Der Eigenwert in Höhe von 2,193 signalisiert, dass die erklärte Streuung etwa das 2,2-fache der nicht erklärten Streuung beträgt. Demnach gewährleistet die geschätzte Diskriminanzfunktion eine hinreichende Unterscheidung der beiden Neuproduktgruppen. Eine auf den Wertebereich zwischen Null und Eins normierte Maßzahl stellt der kanonische Korrelationskoeffizient (c) dar. Dieser misst die Stärke des Zusammenhangs zwischen den Funktionswerten der Diskriminanzfunktion und der abhängigen Gruppenvariable. Er errechnet sich aus der Quadratwurzel des Quotienten aus nicht erklärter Streuung und der Gesamtstreuung (vgl. Formel 2.3): 48, 244 c = 0, ,244 Im Beispiel beträgt der kanonische Korrelationskoeffizient 0,8287; die Diskriminanzfunktion erklärt somit hinreichende 83% der Gesamtstreuung der Diskriminanzwerte. Tabelle 16: Maßzahlen der Gruppendiskriminanz Eine zum kanonischen Korrelationskoeffizienten komplementäre Prüfgröße bildet das sog. Wilks Lambda (A), das sich als Quotient aus nicht erklärter Streuung zur Gesamtstreuung errechnet (vgl. Formel 2.5). Kleine (große) Werte des Wilks Lambda deuten auf eine hohe (geringe) Trennkraft der Diskriminanzkoeffizienten hin. Für das Beispiel erhält man (vgl. Tabelle 17): nicht erklärte Streuung 22 Α = 0,3132 Gesamtstreuung 70,

31 Der Wert A in Höhe von 0,3132 zeigt an, dass ca. 31 % der Gesamtstreuung der Diskriminanzwerte nicht durch die Gruppentrennung erklärt werden. Zur Signifikanzprüfung der Diskriminanzfunktion kann ein Test auf die Gleichheit der Gruppenmittelwerte der Diskriminanzwerte durchgeführt werden. Die relevante Nullhypothese H 0 trifft die Aussage, dass sich die durchschnittlichen Funktionswerte der Diskriminanzfunktion in beiden Gruppen nicht voneinander unterscheiden, während mit der Gegenhypothese H 1 ein Unterschied zwischen den Gruppen-Mittelwerten postuliert wird. Im Beispiel ergibt sich ein Wert der empirischen χ 2 -Prüfgröße gemäß der Formel (2.7) von 24,380, der in der Tabelle 17 ausgewiesen wird. Unter Vorgabe einer Irrtumswahrscheinlichkeit von beispielsweise 1% ist somit die Schlussfolgerung zulässig, dass sich die durchschnittlichen Diskriminanzwerte der beiden Neuproduktgruppen voneinander unterscheiden. Tabelle 17: Wilks Lambda und χ2-test auf Gleichheit der Gruppen-Mittelwerte der Diskriminanzwerte Zur Beurteilung der Klassifikationsgüte der Diskriminanzfunktion greift SPSS auf das vergleichsweise einfache Konzept des kritischen Diskriminanzwertes zurück. Hierbei vergleicht man zunächst für jedes einzelne Untersuchungsobjekt den individuellen Diskriminanzwert mit einem kritischen Diskriminanzwert (auch kritischer Trennwert genannt). Anschließend wird mit Hilfe einer Zuordnungsregel die Zuweisung der Objekte zu den Gruppen vorgenommen (vgl. auch Tabelle 9). Der kritische Diskriminanzwert errechnet sich bei gleicher Anzahl von Objekten in den Gruppen als das arithmetische Mittel der Diskriminanzwerte (vgl. Formel 2.10). Für das Beispiel ergibt sich hieraus die nachstehende Klassifikationsanalyse: Bei einer normierten Diskriminanzfunktion beträgt der Gesamtmittelwert bzw. der kritische Trennwert der Diskriminanzwerte Null. Gemäß der Tabelle 14 betragen die Gruppen-Mittelwert der Diskriminanzwerte -1,418 (Gruppe 1) sowie 1,418 (Gruppe 2). Folglich ergibt sich ein kritischer Diskriminanzwert von Null. Auf Basis des kritischen Trennwertes gilt für die Klassifikation der Fälle (hier Neuprodukte) die Zuordnungsregel: Wenn der Diskriminanzwert eines Objektes kleiner (größer) Null ist, wird das betreffende Objekt der Gruppe 1 (Gruppe 2) zugeordnet. Beispielsweise besitzt das erste Produkt der Gruppe 1 einen Diskriminanzwert in Höhe von -2,854 und wird deshalb der Gruppe 1 zugeordnet. Das Klassifikationsergebnis für alle Objekte wird von SPSS durch eine neue Variable Dis_1 (vorhergesagte Gruppe) in der Datendatei eingefügt. Aus Gründen der sprachlichen Abgrenzung versehen wir diese Variable mit der Bezeichnung Klassifikation (vgl. Tabelle 18). 31

32 Tabelle 18: Variable Klassifikation (vorhergesagte Gruppe) in der SPSS-Datendatei Zur Beurteilung der Klassifikationsgüte wird von SPSS die Klassifikationsmatrix ausgewiesen (vgl. Tabelle 19). In dieser erfolgt eine Gegenüberstellung der vorhergesagten Gruppenzuweisung und der empirischen bzw. tatsächlichen Gruppenzugehörigkeit der Fälle. Im Beispiel werden jeweils 11 Fälle beider Gruppen korrekt zugeordnet, d.h. es wird eine Trefferquote von 91,7% (= 22/24 * 100%) erzielt bzw. eine Fehlerrate von 9,3% erreicht. Gemäß der Tabelle 18 betreffen die Fehlklassifikationen einerseits das Objekt 11 und andererseits das Objekt 16. Tabelle 19: Klassifikationsmatrix Als rechnerischer Beurteilungsmaßstab der Klassifikationsgüte wird gewöhnlich dasjenige Klassifikationsergebnis herangezogen, das sich bei einer zufälligen Gruppenzuordnung der Objekte ergibt. Wenn man im Beispiel die Produkte zufällig einer der beiden Gruppen zuordnen würde, ergäbe sich eine Trefferquote von 50% (vgl. Tabelle 20). Die durch die geschätzte Diskriminanzfunktion 32

33 erzielte Trefferquote liegt jedoch deutlich über der Zufallsquote, so dass dieser eine hohe Klassifikationsgüte zu attestieren ist. Tabelle 20: Klassifikationsmatrix bei zufälliger Objektzuordnung 3.4 Diskriminanzprüfung der Merkmalsvariablen Die Diskriminanzprüfung der Merkmalsvariablen soll die diskriminatorische Bedeutung der erklärenden Variablen aufdecken (vgl. auch Abbildung 2). Hierzu stellt SPSS die folgenden Auswertungen zur Verfügung: Deskriptive Gruppenstatistiken, Signifikanztest der Merkmalsdiskriminanz, Standardisierte Diskriminanzkoeffizienten, Strukturkoeffizienten. Einen ersten Hinweis zum Beitrag der Merkmalsvariablen zur Gruppentrennung liefert die Tabelle der deskriptiven Gruppenstatistiken (vgl. Tabelle 21). So erschließt ein Vergleich der merkmalsspezifischen Gruppen-Mittelwerte, dass die Gruppe der nicht-erfolgreichen (erfolgreichen) Neuprodukte dadurch gekennzeichnet ist, dass diese einerseits mit einem unterdurchschnittlichen (überdurchschnittlichen) Marketingbudget vermarktet werden und sich andererseits einer überdurchschnittlich hohen (geringen) Anzahl von Wettbewerberprodukten gegenübersehen. Tabelle 21: Deskriptive Gruppenstatistiken für die Merkmalsvariablen Der Mittelwertwertvergleich lässt sich durch die Erstellung eines sog. Fehlerbalkendiagramms unterstützen. Für unser Beispiel fordert man mittels der SPSS- Befehlsfolge Grafik/Alte Dialogfelder/Fehlerbalken/Gruppiert/Auswertung über verschiedene Variablen, das im oberen Teil der Abbildung 9 dargestellte Dialogfeld an, in dem die gewünschten Grafikeinstellungen zu definieren sind. Fehlerbalken 33

34 beschreiben die Lage des beobachteten Mittelwertes einer Stichprobe sowie deren Ausprägungen in der Grundgesamtheit bei Gültigkeit eines bestimmten Konfidenzintervalls (Voreinstellung: 95%). Im Beispiel markieren die zusätzlich eingezeichneten Symbole die jeweiligen Mittelwerte der Variablen in den Gruppen und veranschaulichen den zuvor beschriebenen Mittelwertvergleich. Abbildung 9: Einstellungen und Darstellung eines Fehlerbalkendiagramms Ein zusätzlicher Mittelwertvergleich stellt auf die Beantwortung der Frage ab, ob die Mittelwerteunterschiede in den Gruppen statistisch signifikant sind, d.h. ob diese auf einen zufälligen Einfluss bei der Stichprobenziehung (= Nullhypothese) oder aber auf einen systematischen Gruppenunterschied in der Grundgesamtheit (= Gegenhypothese) zurückzuführen sind. Der betreffende Signifikanztest der Merkmalsdiskriminanz wurde mit der SPSS-Option ANOVA im Dialogfeld Statistik angefordert (vgl. Abbildung 6). Für jede der beiden metrischen Variablen wird ein varianzanalytischer F-Test auf Gleichheit der Mittelwerte für die Gruppen durchgeführt. Dabei entspricht die Testgröße (F) dem Quotienten aus der Streuung 34

35 zwischen den Gruppen und der Streuung innerhalb der Gruppen. Die Quadratsummen werden zusätzlich durch die jeweilige Anzahl der Freiheitsgrade (df) dividiert. Diese betragen k-1 für die Streuung zwischen den Gruppen sowie n-k für die Streuung innerhalb der Gruppen (k = Anzahl der Gruppen; n = Anzahl der Fälle). Für das vorliegende Beispiel verdeutlicht die Tabelle 19, dass die Mittelwertunterschiede in den Gruppen bei beiden Merkmalsvariablen jeweils hoch-signifikant sind. Tabelle 22: Test (ANOVA) auf signifikante Mittelwertunterschiede in den Gruppen Die bislang betrachteten unstandardisierten Diskriminanzkoeffizienten sind für eine Beurteilung der Trennstärke der Variablen nur bedingt geeignet, da die Merkmalsvariablen in unterschiedlichen Maßeinheiten vorliegen und daher einen verzerrenden Einfluss auf die Größe der Diskriminanzkoeffizienten hervorrufen können. Um die relative Diskriminanzstärke der Merkmalsvariablen zu beurteilen, sind standardisierte Diskriminanzkoeffizienten (b j *) zu berechnen Diese erhält man, indem die unstandardisierten Koeffizienten (b j ) mit der betreffenden Standardabweichung (s j ) der Variablen multipliziert werden (vgl. Formel 2.8): Da die betreffenden Standardabweichungen keinen Output einer SPSS-basierten Diskriminanzanalyse bilden, ermitteln wir diese aus didaktischen Gründen mit Hilfe des SPSS-Menüs Einfaktorielle ANOVA und den Einstellungen Faktor: Neuprodukterfolg; Abhängige Variablen: Marketingbudget, Wettbewerberanzahl). Die In der daraus resultierenden Tabelle 23 sind die benötigten Standardabweichungen innerhalb der Gruppen in der Spalte Quadratsumme enthalten. Tabelle 23: Einfaktorielle ANOVA zur Ermittlung von Standardabweichungen 35

36 Die standardisierten Diskriminanzkoeffizienten bestimmen sich somit als (vgl. die SPSS-Ergebnisse in Tabelle 24): * 1 b 0,388* 4,167 0, 793 * 2 b = -0,340* 4, 223 = -0,698 Tabelle 24: Standardisierte Diskriminanzkoeffizienten Die diskriminatorische Bedeutung eines Merkmals kann nun anhand der absoluten Größe des standardisierten Koeffizienten abgelesen werden, wobei dessen Vorzeichen ohne Bedeutung ist. Im Beispiel besitzt demnach das Merkmal Marketingbudget eine geringfügig größere Trennkraft als das Merkmal Anzahl der Wettbewerber. Die relative diskriminatorische Bedeutung eines Merkmals kann darüber hinaus durch einen prozentualen Wirkungskoeffizienten (b r ) zum Ausdruck gebracht werden Dieser errechnet sich als Anteil eines Koeffizientenwertes an der Summe standardisierter Koffizientenwerte (vgl. Formel 2.9): r 0,793 b 1 *100% 53, 2% 0,793 0,698 r 0,698 b 2 *100% 46,8% 0,793 0,698 Bestehen korrelative Beziehungen zwischen den metrischen Merkmalsvariablen (Multikollinearität), so können diese dazu führen, dass standardisierte Diskriminanzkoeffizienten eine verzerrte Merkmalsdiskriminanz anzeigen. Um in einem solchen Fall zu unverfälschten Diskriminanzgewichten der Merkmale zu gelangen, ist die Ermittlung von sog. Strukturkoeffizienten zweckmäßig. Diese messen den Zusammenhang zwischen den einzelnen Merkmalsvariablen und den geschätzten Diskriminanzwerten und werden von SPSS in der sog. Strukturmatrix angezeigt (vgl. Tabelle 25). Es ist ersichtlich, dass die Merkmalswerte beider Variablen eine jeweils starke Korrelation mit den Diskriminanzwerten aufweisen. Tabelle 25: Strukturmatrix 36

37 3.5 Klassifikation neuer Objekte Die vorangegangenen Betrachtungen haben zusammenfassend den Befund erbracht, dass sowohl die Diskriminanzfunktion als auch die beiden Merkmals-variablen einen signifikanten, hinreichend starken Erklärungsbeitrag zur Gruppentrennung leisten. Daher kann abschließend die Prognoseaufgabe der Diskriminanzanalyse beleuchtet werden. Diese beinhaltet die Zuordnung eines neuen Untersuchungs-objektes zu einer der vorgegebenen Gruppen anhand dessen metrischen Merkmals-ausprägungen (vgl. auch Abbildung 2). Hierbei kann auf eine Reihe alternativ verwendbarer Klassifikationsansätze zurückgegriffen werden (vgl. ausführlich bei Backhaus et. al. 2011, S. 215 ff.; Eckey et. al. 2002, S. 229 ff.): Konzept des kritischen Diskriminanzwertes, Distanzkonzept, Wahrscheinlichkeitskonzept, Klassifizierungsfunktion, Klassifikationsdiagramm. Die methodisch einfachste Vorgehensweise zur Klassifikation eines neuen Objektes besteht in der Verwendung des Konzepts des kritischen Diskriminanzwertes: Gemäß der dabei gültigen Zuordnungsregel wird geprüft, ob der geschätzte Diskriminanzwert des neuen Objektes oberhalb oder unterhalb des kritischen Trennwertes liegt (vgl. Tabelle 9). Ist der Diskriminanzwert des betreffenden Objektes kleiner (größer) als der kritische Trennwert, dann wird es derjenigen Gruppe zugeordnet, dessen gruppenspezifischer Diskriminanzwert ebenfalls kleiner (größer) als der kritische Trennwert ist. Im vorliegenden Beispiel wurde eine normierte Diskriminanzfunktion geschätzt, deren kritischer Trennwert gleich Null ist. Demzufolge wird ein neues Objekt dann der ersten Gruppe (zweiten Gruppe) zugewiesen, wenn der geschätzte Diskriminanzwert des Objektes kleiner (größer) Null ist. Für ein neues Produkt i, das beispielsweise mit einem Marketingbudget von 20% (vom Umsatz) vermarktet wird und sich 5 Wettbewerbern gegenübersieht, gilt demzufolge: Diskrimminanzwert y i = -3,682 * 0,388 * 20 0,340 * 5 = 2,378. Da der geschätzte Diskriminanzwert größer ist als kritische Trennwert, wird das neue Produkt der Gruppe 2 (Gruppe der erfolgreichen Produktinnovationen) zugeordnet. Das Distanzkonzept beruht auf der Messung der Ähnlichkeit zwischen einem neuen Objekt und den Merkmalsprofilen der vorgegebenen Gruppen. Als Bezugsgröße zur Quantifizierung der Ähnlichkeit zwischen den Objekten wird gewöhnlich die sog. quadrierte euklidische Distanz verwendet oder, sofern die Merkmalswerte in unterschiedlichen Maßeinheiten vorliegen, die sog. Mahalanobis-Distanz herangezogen. Der Klassifikationsprozess nach dem Distanzkonzept umfasst die folgenden Teilschritte: Zunächst wird mit Hilfe der Diskriminanzfunktion der Diskriminanzwert des neuen Objektes geschätzt. Sodann werden die Distanzen des neuen Objektes zu den Mittelwerten der Diskriminanzwerte in den Gruppen (sog. Gruppenzentroide) berechnet. 37

38 Abschließend wird das betreffende Objekt jener Gruppe zugewiesen, zu der die Distanz minimal ist. Für das vorliegende Beispiel kann das Distanzkonzept mit Hilfe des SPSS-Outputs der Tabelle 26 verdeutlicht werden. Objekt 1 (Spalte Fallnummer) besitzt einen Diskriminanzwert in Höhe von -2,854 (Spalte Scorces der Diskriminanzfunktion). Die Distanz des Objektes 1 zur Gruppe 1 (Spalte Höchstwertige Gruppe) beträgt (Spalte Quadrierte Mahalanobis-Distanz zu Zentroid), während diese zu Gruppe 2 einen Wert von 18,250 (Spalte Zweitwertige Gruppe) aufweist. Demzufolge ist das betreffende Objekt der Gruppe 1 (Spalte Vorher-gesagte Gruppe) zuzuweisen. Tabelle 26: Klassifizierungsstatistiken der Diskriminanzanalyse Das Wahrscheinlichkeitskonzept beruht auf dem Distanzkonzept und bildet eine vergleichsweise komplexe und flexible Methode zur Klassifikation neuer Objekte: Ausgangspunkt der wahrscheinlichkeitsbasierten Klassifikation bildet die Ermittlung einer bedingten Wahrscheinlichkeit durch eine Transformation der quadrierten Maholanobis-Distanzen, wobei normalverteilte Diskriminanzwerte in jeder Gruppe unterstellt werden. Als bedingte Wahrscheinlichkeit P (D G i ) bezeichnet man hiernach diejenige Wahrscheinlichkeit (sog. a-posteriori- Wahrscheinlichkeit, Zuordnungswahrscheinlichkeit), mit der sich ein bestimmter 38

39 Diskriminanzwert D ergibt, wenn das betreffende Objekt i der Gruppe G zugehörig ist. Für die damit verbundene wahrscheinlichkeitsbasierte Klassifikationsregel gilt: Ein Objekt i wird jener Gruppe g zugeordnet, für welche die bedingte Wahrscheinlichkeit P (D G i ) am größten ist. Für das vorliegende Beispiel werden die bedingten Wahrscheinlichkeiten der einzelnen Neuprodukte in den Spalten P (G = g D = d) der Tabelle 26 ausgewiesen. Beispielsweise wird für das zweite Produkt der ersten Gruppe (Fallnummer 2) eine Zuordnungswahrscheinlichkeit zur ersten Gruppe in Höhe von 98,4 % angezeigt, während diese für die zweite Gruppe 1,6 % beträgt. Folglich wird das Produkt der ersten Gruppe zugewiesen. Die Zuordnungswahrscheinlichkeiten werden von SPSS zusätzlich als Variablen Dis1_2 bzw. Dis2_2, die wir mit der Bezeichnung Gruppenwahrscheinlichkeit versehen, in die Datendatei eingefügt (vgl. Tabelle 27). Tabelle 27: Dateivariablen Zuordnungswahrscheinlichkeiten Eine populäre, vergleichsweise einfach zu handhabende Methodik stellt das Konzept der Klassifizierungsfunktionen nach Fisher dar. Hierbei wird für jede Gruppe eine gesonderte Klassifizierungsfunktion als Linearkombination der Ausgangsvariablen berechnet, deren Koeffizienten für das Beispiel in der Tabelle 28 angezeigt sind. Um ein neues Objekt zu klassifizieren, werden zunächst gruppenspezifische Klassifikationswerte berechnet. Anschließend wird das betreffende Objekt jener Gruppe zugeordnet, für die der Klassifikationswert am größten ist. Tabelle 28: Koeffizienten der Klassifizierungsfunktionen Für ein neues Produkt, das beispielsweise mit einem Marketingbudget von 20% (vom Umsatz) vermarktet wird und sich 5 Wettbewerbern gegenübersieht, erhält man: Klassifikationswert Gruppe 1: -28, ,019 * ,718 * 5 = 40,78 Klassifikationswert Gruppe 2: -38, ,120 * ,755 * 5 = 47,54 Demzufolge wird das Produkt der Gruppe 2 zugeordnet. 39

40 Zur grafischen Darstellung der Gruppentrennung bietet sich im Beispiel die Erstellung eines Klassifizierungsdiagramms in Form eines zweidimensionalen Streudiagramms an (vgl. dazu auch Abbildung 3). Wählen Sie hierzu im SPSS- Grafikmenü die nachstehenden Einstellungen: Abbildung 10: SPSS-Grafikeinstellungen (Streudiagramm) Für den kritischen Diskriminanzwert lässt sich zusätzlich Trenngerade bestimmen, die die Lage des kritischen Trennwertes auf der Diskriminanzachse anzeigt. Diese ergibt sich formal als: Y c = Y 0 = -3, ,388 x 1-0,340 x 2 x 2 = -10, ,144 x 1 und wird im Dialogfeld Benutzerdefinierte Gleichung der Grafikoption Eigenschaften/Bezugslinie spezifiziert. Die Trenngerade markiert den Trennbereich der Gruppenzugehörigkeit von Objekten (vgl. Abbildung 11). Liegt der Diskriminanzwert eines Objektes im Bereich links (rechts) von der Trennlinie, dann wird das Objekt der Gruppe erfolgloses Neuprodukt (erfolgreiches Neuprodukt) zugeordnet. Die Trennlinie vermittelt somit auch einen optischen Hinweis auf die Klassifikationsgüte bei der Zuordnung neuer Objekte. Abbildung 11: Streudiagramm der Objektklassifizierung 40

41 4. Multiple Diskriminanzanalyse mit SPSS 4.1 Datenmatrix und SPSS-Analysemethodik Eine multiple Diskriminanzanalyse ist dann zu verwenden, wenn die Untersuchungsfälle in mehr als zwei Gruppen unterteilt sind. Das methodische Vorgehen ist derjenigen im Zwei-Gruppen-Fall ähnlich; im Mehr-Gruppen-Fall sind jedoch mehrere Diskriminanzfunktionen zu schätzen, mit denen eine etwas komplexere Berechnung von Diskriminanzwerten, Bestimmung von Gütekriterien und Klassifikation von Fällen verbunden ist. Die diskriminanzanalytische Vorgehensweise im Mehr- Gruppen-Fall soll im Folgenden anhand der in der Abbildung 12 angeführten Beispieldaten verdeutlicht werden. Preis (DM) Länge (mm) Breite (mm) Höhe (mm) Gewicht (kg) PS Hubraum (ccm) Geschwindigkeit (km/h) Beschleunigung (Sek. Für 0-100km/h) Verbrauch (l pro 100 km) Audi ,5 8,9 BMW ,7 9,5 Citroen GSX ,8 8,4 Fiat ,8 9,2 Ford Taunus ,3 9,5 Mercedes ,2 11,1 Opel Rekord ,2 Peugeot ,8 10,5 Renault ,7 10,2 Simca ,9 9,7 VW Passat ,8 Volvo ,5 Abbildung 12: SPSS-Datenmatrix ( Pkwcluster ) und Clusterkennzeichnung 41

42 Ausgangspunkt der Untersuchung bildet eine vorgeschaltete Clusterzentrenanalyse, mit der zwölf Pkw-Modelle (z.b. Audi 80) anhand von neun technischen Leistungsmerkmalen (z.b. Hubraum) zu drei Modellklassen (z.b. Sportlichkeitsklasse) mit jeweils vier Pkw-Modellen zusammengefasst wurden (vgl. dazu ausführlich Müller 2015b). Eine Diskriminanzanalyse soll nun einerseits Aufschluss darüber vermitteln, welche diskriminatorische Bedeutung den Leistungsmerkmalen der betrachteten Pkw-Modelle beizumessen ist, d.h. ob die Leistungsmerkmale der Pkw-Modelle eine trennfähige Beschreibung der identifizierten Markengruppen gestatten. Daneben soll die Frage beantwortet werden, welcher Modellklasse ein neues Pkw-Modell auf der Basis seiner technischen Leistungsstruktur zuzuordnen ist. In SPSS gehen Sie dazu wie folgt vor: (1) Geben Sie die im oberen Teil der in Abbildung 12 angezeigten Beispieldaten in eine Datendatei ein und speichern Sie diese (z.b. unter der Bezeichnung Pkwcluster ). Definieren Sie die Clustervariable (QCL_1) und vergeben Sie die drei Wertebezeichnungen (z.b. 1 ) gemäß der im unteren rechten Teil der Abbildung 12 angezeigten Darstellung Anzahl der Fälle in jedem Cluster. Die daraus resultierende SPSS-Datenmatrix besitzt nun die im mittleren Teil der Abbildung 12 angezeigte Struktur. (2) Nach Laden der Datei wählen Sie per Mausklick die Befehlsfolge Analysieren/ Klassifizieren/Diskriminanzanalyse, worauf sich das Dialogfeld Diskriminanzanalyse öffnet (vgl. Abbildung 13 ). Abbildung 13: Dialogfeld Diskriminanzanalyse Übertragen Sie die Clustervariable (QCL_1) in das Feld Gruppierungsvariable. Definieren Sie deren Wertebereich durch ein Klicken auf die Schaltfläche Bereich definieren und tragen Sie die Werte 1 und 3 in die Eingabefelder Minimum sowie Maximum ein. In das Feld Unabhängige Variable(n) übertragen Sie die neun technischen Leistungsmerkmale. (3) Per Voreinstellung werden sämtliche neun Leistungsmerkmale als erklärenden Variablen in das multiple Diskriminanzmodell aufgenommen. Demgegenüber bietet die Option schrittweise Methode verwenden die Möglichkeit, Variablen gemäß ihrer Erklärungsbeiträge sukzessive in das Modell aufzunehmen und dabei einzelne Variable von der Analyse auszuschließen. Belassen Sie die Voreinstellung. 42

43 (4) Klicken Sie anschließend auf die Schaltfläche Statistik, um die Dialogbox Diskriminanzanalyse: Statistiken zu öffnen. Aktivieren Sie hier die Optionen Deskriptive Statistik: Mittelwert Univariate ANOVA Funktionskoeffizienten: Fisher Nicht standardisiert Bestätigen Sie mit Weiter. (5) Öffnen Sie Dialogbox Diskriminanzanalyse: Klassifizieren. Wählen Sie dort die Optionen A-Priori-Wahrscheinlichkeit: Alle Gruppen gleich Kovarianzmatrix: Innerhalb der Gruppen Anzeige: Fallweise Ergebnisse Zusammenfassungstabelle Diagramme: Kombinierte Gruppen Bestätigen Sie Ihre Angaben mit Weiter. (6) Klicken Sie auf die Dialogbox Speichern und aktivieren Sie die Optionen Vorhergesagte Gruppenzugehörigkeit Scores der Gruppenzugehörigkeit. (7) Bestätigen Sie Ihre Angaben mit Weiter abschließend mit OK. Die nachfolgende Darstellung der SPSS-Befunde, bei der auf zentrale Unterschiede zum Zwei-Gruppen-Fall abgestellt wird, folgt dem in der Abbildung 2 dargestellten Verfahrensablauf. 4.2 Schätzung der Diskriminanzfunktionen Eine grundlegende Besonderheit des Mehr-Gruppen-Falls besteht darin, dass mehr als eine Diskriminanzfunktion berechnet wird. Liegen k Gruppen vor, so werden k-1 Diskriminanzfunktionen bestimmt, die orthogonal zueinander stehen, d.h. die Diskriminanzachsen sind zueinander rechtwinklig. Im vorliegenden Drei-Gruppen- Fall wird daher eine zweite Diskriminanzfunktion solcherart bestimmt, dass diese einen maximalen Anteil derjenigen Streuung erklärt, die nach der Schätzung der ersten Diskriminanzfunktion als Rest verbleibt (vgl. hierzu ausführlich bei Eckey et. al. 2002, S. 255 ff; Schlittgen 2009, S. 350 ff.). Die Werte der unstandardisierten Diskriminanzkoeffizienten beider Funktionen, die vornehmlich zur Klassifikation der Objekte benötigt werden, sind in der Tabelle 29 zusammengefasst. Es wird deutlich, dass die erste Diskriminanzfunktion wesentlich von den Variablen Verbrauch und PS beeinflusst wird. Demgegenüber die zweite Diskriminanzfunktion primär durch die Variablen Verbrauch und Beschleunigung determiniert. Ferner zeigt ein positives (negatives) Vorzeichen des Koeffizienten an, dass eine zunehmende Merkmalsausprägung der betreffenden Variablen zu einem steigenden (sinkenden) Diskriminanzwert des Objektes führt. 43

44 Tabelle 29: Nicht-standardisierte Diskriminanzkoeffizienten Um die aus den Diskriminanzfunktionen resultierenden Funktionswerte der einzelnen Pkw-Modelle zu ermitteln, sind die fallspezifischen Ausprägungen der neun erklärenden Merkmalsvariablen in beide Funktionen einzusetzen. Diese Methodik zur Ermittlung von Diskriminanzwerten wird in der Tabelle 30 exemplarisch anhand des Audi 80 verdeutlicht. Merkmalsvariablen Diskriminanzfunktion 1 Diskriminanzfunktion 2 Merkmalswerte Audi 80 Diskriminanzwert - Funktion 1 Audi 80 Diskriminanzwert - Funktion 2 Audi 80 Länge (mm) -0,012 0, ,596 26,298 Breite (mm) 0,049 0, ,418 53,824 Höhe (mm) 0,056-0, ,44-31,395 Gewicht (kg) -0,077-0, ,07-2,73 PS 0,861-0, ,355-1,815 Hubraum (ccm) -0,055-0, ,015-16,549 Geschwindigkeit (km/h) -0,516 0, ,82 58,58 Beschleunigung 0,154 0,710 17,5 (Sek. für 0-100km/h) 2,695 12,425 Verbrauch (l pro 100 km) 9,190 2,762 8,9 81,791 24,5818 Konstante -13, ,806-13, ,806 Summe 10,114 1,4138 Tabelle 30: Berechnung der Funktionswerte Audi 80 Per Voreinstellung werden die Funktionswerte im SPSS-Output nicht ausgewiesen; diese wurden für die Beispieldaten mit der Option Fallweise Ergebnisse (Dialogfeld: Klassifizieren) angefordert. Infolgedessen fügt SPSS der Datendatei zwei neue Variable Dis1_1 bzw. Dis2_1 an. Dort werden für den Audi 80 die Funktionswerte von 10,85278 bzw. 1,25394 ausgewiesen (vgl. Abbildung 14). 44

45 Darüber hinaus werden von SPSS die durchschnittlichen Funktionswerte in den drei Gruppen bei beiden Funktionen tabellarisch angezeigt (vgl. Abbildung 14). Abbildung 14: Funktionsvariablen (Diskriminanzwerte) und Gruppenmittelwerte 4.3 Gütediagnose der Diskriminanzfunktionen Die Trennkraft einer Diskriminanzfunktion kann anhand zweier Aspekte beurteilt werden. Ein erster Prüfungsaspekt knüpft an der Untersuchung der Diskriminanz bzw. der in den Diskriminanzwerten zum Ausdruck kommenden Unterschiedlichkeit der Gruppen an. Ein zweiter Beurteilungsaspekt bezieht sich auf die Untersuchung der durch eine Diskriminanzfunktion herbeigeführten Klassifizierung der Objekte. Die Maßzahlen der Diskriminanzprüfung vermitteln einen Aufschluss über die Trennschärfe der geschätzten Diskriminanzfunktionen. Hierzu gehören: der Eigenwert, der kanonische Korrelationskoeffizient sowie das sog. Wilks Lambda: Eigenwert (ɣ): Die Diskriminanzanalyse unterliegt, wie bereits angesprochen, dem Ziel, die Diskriminanzkoeffizienten derart zu ermitteln, dass der Quotient aus der Streuung zwischen den Gruppen und der Varianz innerhalb der Gruppen maximal wird (vgl. Formel 2.2). Hierbei verkörpert die Varianz zwischen den Gruppen die durch die Diskriminanzfunktion erklärte Streuung, während die Varianz innerhalb der Gruppen als nicht-erklärte Streuung zu interpretieren ist. Demzufolge beinhaltet das Diskriminanzkriterium das Verhältnis von erklärter und nicht-erklärter Streuung, das begrifflich auch als Eigenwert umschrieben wird. In der Tabelle 31 werden die ermittelten funktionsspezifischen Eigenwerte ausgewiesen, wobei die Fußnote a darauf hinweist, dass beide Funktionen berücksichtigt werden. Der Eigenwert der ersten Funktion beträgt 101,42, während dieser mit 3,197 für die zweite Funktion deutlich geringer ausfällt. 45

46 Tabelle 31: Eigenwerte der Diskriminanzfunktionen Die Streuung der Funktionswerte zwischen den Gruppen ist im Verhältnis zur Streuung innerhalb der Gruppen bei der ersten Diskriminanzfunktion deutlich höher als in der zweiten Funktion. Dieser Sachverhalt kommt gleichfalls in der Spalte % der Varianz zum Ausdruck, die das relative Verhältnis der Eigenwerte anzeigt (vgl. Tabelle 31). Für die Funktion 1 berechnet sich ein Varianzanteil von 96,9 % (= 101,402 / 101, ,197). Hiermit einher geht die Schlussfolgerung, dass die erste Funktion einen erheblich größeren Beitrag zur Unterscheidung zwischen Gruppen leistet als dies für die zweite Funktion der Fall ist. Kanonischer Korrelationskoeffizient (c): Dieser errechnet sich aus der Quadratwurzel des Quotienten aus nicht-erklärter Streuung und der Gesamtstreuung (vgl. Formel 2.3). Er bildet ein Maß für die Korrelation zwischen den geschätzten Diskriminanzwerten und der Gruppenzugehörigkeit von Untersuchungseinheiten: Eigenwert 101, 42 c Funktion1 = 0,995 Eigenwert ,42 1 3,197 c 2 = 0,873 3,197+1 Funktion Für die Funktion 1 beträgt der kanonische Korrelationskoeffizient 0,995 und signalisiert demzufolge eine überaus hohe Trennkraft der Diskriminanzfunktion. Ein Gleiches gilt für die Korrelationskoeffizienten der Funktion 2, wenngleich dieser mit einem Wert von 0,873 etwas geringer ist (vgl. Tabelle 31). Wilks Lambda (ƛ): Bei der Ermittlung von Wilks Lambda ist im Mehr- Gruppen-Fall die Anzahl der dabei erfassten Diskriminanzfunktionen zu berücksichtigen. Aufgrund dessen sind zwei verschiedenartige Maßzahlen verwendbar: Mit Hilfe des sog. multivariaten Wilks Lambda kann geprüft werden, ob generell eine Trennung der Gruppen auf Basis aller geschätzten Diskriminanzfunktionen möglich ist, während das sog. Wilks Lambda für die residuelle Diskriminanz die Trennkraft der verbleibenden Diskriminanzfunktionen ausdrückt (vgl. Eckey et. al. 2002, S. 365 f.; Backhaus et al. 2011, S. 210 ff.). Generell gilt, dass kleine (große) Werte des Wilks Lambda eine hohe (geringe) Trennkraft der Diskriminanzkoeffizienten anzeigen. In der Tabelle 32 wird in der ersten Zeile das multivariate Wilks Lambda ausgewiesen. Dieses erhält man aus der Multiplikation der univariaten Wilks Lambda, die für das vorliegende Beispiel in der Tabelle 31 angeführt sind: K A * 0, , ,187 1 k 1 k 46

47 Der Wert des multivariaten Wilks Lambda in Höhe von 0,002 zeigt an, dass der Anteil der nicht erklärten Streuung an der Gesamtstreuung der Diskriminanzwerte sehr gering ist bzw. dass das geschätzte Diskriminanzmodell unter Berücksichtigung beider Funktionen eine große Trennstärke besitzt. Demgegenüber gibt die zweite Zeile in Tabelle 32 den Wert von Wilks Lamba für die residuelle Diskriminanz an, d.h. die Trennkraft des Modells, wenn lediglich die zweite Diskriminanzfunktion berücksichtigt wird: 1 1 Ak 0, ,187 1 k Hiernach ist die Trennkraft des Diskriminanzmodells bei einer ausschließlichen Berücksichtigung der zweiten Diskriminanzfunktion als sehr gering zu beurteilen. Tabelle 32: Wilks Lambda-Werte und Chi-Quadrat-Tests χ 2 -Test: Zur Signifikanzprüfung der Diskriminanzfunktionen wird ein Test auf die Gleichheit der Gruppenmittelwerte der Diskriminanzwerte durchgeführt. Die statistische Prüfung erfolgt dabei analog zu dem in Formel 2.7 dargestellten χ 2 - Test (vgl. Eckey et al. 2002, S. 368). Der Spalte Sig der Tabelle 32 kann entnommen werden, dass bei einer Berücksichtigung beider Diskriminanzfunktionen eine hoch signifikante Gruppentrennung erzielt wird [df = J * (G - 1) = 9 * (3-1) = 18 Freiheitsgrade]. Wird dagegen das Diskriminanzmodell nur durch die zweite Funktion gebildet, dann wird keine signifikante Gruppentrennung erreicht [df = (J - 1) = (9-1) = 8 Freiheitsgrade]. Angesichts der geringen Erklärungsbeitrages der zweiten Diskriminanzfunktion wäre mithin zu prüfen, ob auf diese nicht gänzlich verzichtet werden kann oder eine alternative, schrittweise Diskriminanzmethodik zu anderen Ergebnissen führt. Klassifikationsgüte: Im Hinblick auf die Klassifikationsgüte ist zu prüfen, ob die geschätzten Diskriminanzfunktionen eine korrekte Zuordnung von Untersuchungseinheiten zu den drei Pkw-Clustern gewährleisten. Bei einer zufälligen Gruppenzuordnung wäre in unserem Beispiel eine Trefferquote von 33,3% zu erwarten. Aus der in der Tabelle 34 angezeigten Klassifikationsmatrix, die auf der Berechnung von kritischen Diskriminanzwerten beruht (vgl. S. 231), ist ersichtlich, dass die ermittelten Diskriminanzfunktionen alle zwölf Pkw-Modelle bzw. 100% aller Fälle korrekt zuordnen und damit eine exzellente Trefferquote sicherstellen. 47

48 Tabelle 33: Klassifikationstabelle im Drei-Gruppen-Fall Das Klassifikationsergebnis für alle Objekte wird von SPSS durch eine neue Variable Dis_1 (vorhergesagte Gruppe) in der Datendatei eingefügt. 4.4 Diskriminanzprüfung der Merkmalsvariablen Die Analyse der Diskriminanzprüfung von Merkmalsvariablen hat zum Ziel, zum einen die diskriminatorische Bedeutung der Variablen zu ermitteln und zum anderen Hinweise auf jene Merkmale zu erhalten, die unwichtig sind und daher möglicherweise von der Diskriminanzanalyse ausgeschlossen werden können. Signifikanztest der Merkmalsdiskriminanz: Für jede der metrischen Variablen kann ein varianzanalytischer F-Test auf Gleichheit der Mittelwerte für die Gruppen durchgeführt geführt werden. Die in der Tabelle 34 angeführten Befunde zeigen, dass sämtliche Merkmalsvariablen in jeweils signifikantem Maße zur Gruppentrennung beitragen und somit grundsätzlich geeignet sind, Gruppenunterschiede zu erklären. Tabelle 34: Test (ANOVA) auf signifikante Mittelwertunterschiede in den Gruppen Standardisierte Diskriminanzkoffizienten: Neben der grundsätzlichen Trenneignung von Merkmalen ist auch ihre Trennstärke von Belang. Um die diskriminatorische Bedeutung der einzelnen Merkmalsvariablen zu beurteilen, ist es sinnvoll, standardisierte Diskriminanzkoeffizienten zu bestimmen. Diese Vorgehensweise bietet sich deshalb an, weil die unterschiedlichen Maßeinheiten der Merkmalsvariablen (z.b. Pkw-Gewicht in kg, -Länge in Millimeter, Verbrauch in l pro 100 km) einen beträchtlichen Einfluss auf die Größe der Diskriminanzkoeffizienten nehmen und daher Verzerrungseffekte hervorrufen können. 48

49 Der standardisierte Diskriminanzkoeffizient (b i * ) einer Variablen ergibt sich durch die Multiplikation des unstandardisierten Koeffizienten mit der Standardabweichung der betreffenden Merkmalsvariablen innerhalb der Gruppen (s i innerhalb ), wie am Beispiel der Variablen Länge nun exemplarisch verdeutlicht werden soll: 1. Zunächst bestimmt man die Standardabweichung der Variablen Länge. Diese erhält man u.a. im Zuge einer separat durchgeführten, einfaktoriellen Varianzanalyse auf der Grundlage der Ausgangsdaten (vgl. Spalte Mittel der Quadrate in der Tabelle 35). Für die Variable Länge gilt somit: innerhalb si 17116, , 83. Tabelle 35: Einfaktorielle Varianzanalyse (Auszug) 2. Der unstandardisierte Koeffizient der Variablen Länge beträgt 0,012 (vgl. Tabelle 29). 3. Somit erhält man den standardisierten Koeffizienten des Merkmals Länge als b i *. si innerhalb bzw. als 1,569 = -0, ,83. Dieser Wert entspricht in etwa jenem Wert, der von SPSS in der nachstehenden Tabelle 36 ausgewiesen wird. Tabelle 36: Standardisierte Diskriminanzkoeffizienten Die diskriminatorische Bedeutung eines Merkmals kann nun anhand der absoluten Größe des standardisierten Koeffizienten abgelesen werden, wobei das Koeffizienten-Vorzeichen keine Rolle spielt. Mit Blick auf die Funktion 1 ist demnach die Aussage zu treffen, dass die diskriminantorische Bedeutung der Merkmalsvariablen PS-Zahl am größten, hingegen jene des Merkmals Beschleunigung am geringsten ist. Gewichtete Diskriminanzkoeffizienten: Im Mehr-Gruppen-Fall ist die Beurteilung der Merkmalsdiskriminanz anhand von standardisierten Koeffizienten jedoch lückenhaft, denn diese lässt unberücksichtigt, dass die Gruppentrennung auf der Grundlage von zwei Funktionen beruht. Um daher zu einem Gesamturteil 49

50 zu gelangen, sind die funktionsspezifischen standardisierten Koeffizienten mit der jeweiligen Trennkraft der beiden Funktionen zu gewichten. Als Gewichtungsfaktoren dienen dabei die Eigenwertanteile der Funktionen. Die Ermittlung von gewichteten Diskriminanzkoeffizienten bildet keinen Bestandteil der SPSS-Ausgabe, so dass wir hierzu eine Excel-Tabelle erstellen (vgl. Tabelle 37): In den Spalten 2 und 3 der Tabelle sind die standardisierten Diskriminanzkoeffizienten der Merkmalsvariablen für beide Funktionen eingetragen. Der relative Eigenwertanteil beträgt nach Tabelle 31 für Funktion 1 0,969 und weist für Funktion 2 den Wert 0,031 auf. Demzufolge ergibt sich z.b. für das Merkmal Länge ein gewichteter Diskriminanzwert von 1,033 = (- 1,532 * 0,969) + (0,786 * 0,031). In analoger Weise lassen sich die gewichteten Koeffizientenwerte für die anderen Merkmalsvariablen bestimmen. Um zusätzlich zu einem Kennwert für die relative, gewichtete Trennstärke von Merkmalen zu gelangen, werden die gewichteten Koeffizienten ins Verhältnis zur absoluten Summe der gewichteten Koeffizienten, d.h. der Summe ohne Berücksichtigung der Vorzeichen gesetzt. Der vierten Spalte in der Tabelle 37 ist somit entnehmbar, dass die Variable Länge eine relative, gewichtete Trennkraft von 3,26 % besitzt. Diese ist deutlich geringer, als die Trennstärke des bedeutsamsten Merkmals, der PS-Zahl, deren Trennungsanteil 31,04 % beiträgt. Merkmalsvariablen Länge (mm) Breite (mm) Höhe (mm) Gewicht (kg) PS Standardisierte Koeffizienten Funktion 1 (Varianzanteil: 96,9%) Standardisierte Koeffizienten Funktion 2 (Varianzanteil: 3,1%) Gewichteter Koeffizient Gewichteter Koeffizient (absolut) Relative Trennkraft (%) -1,532 0,786-1, ,460 3,29% 1,832 1,201 1, ,812 4,09% 1,544-0,640 1, ,476 3,33% -7,852-0,276-7, ,617 17,17% 14,244-0,550 13, ,785 31,07% Hubraum (ccm) -7,565-1,850-7, ,388 16,65% Geschwindigkeit (km/h) -4,757 3,723-4, ,494 10,13% Beschleunigung (Sek. für 0-0,361 1,662 0, ,401 0,90% Verbrauch (l pro 100 km) 6,063 1,822 5, ,932 13,37% Tabelle 37: Berechnung von gewichteten Diskriminanzkoeffizienten Summe 44, ,00% 50

51 4.5 Klassifikation von neuen Objekten Im Mehr-Gruppen-Fall bietet es sich an, zur Klassifizierung neuer Objekte auf das das einfach zu handhabende Konzept der Klassifizierungsfunktionen zurückzugreifen. Hierbei wird für jede Gruppe eine gesonderte Klassifizierungsfunktion als Linearkombination der Ausgangsvariablen berechnet, deren Koeffizienten für das Beispiel in der Tabelle 38 angezeigt sind. Tabelle 38: Klassifizierungsfunktionskoeffizienten Um ein neues Objekt zu klassifizieren, sind zunächst gruppenspezifische Klassifikationswerte zu berechnen. Daraufhin wird das betreffende Objekt jener Gruppe zugeordnet, für die der Klassifikationswert am größten ist. Zur Ermittlung der Klassifikationswerte bietet sich eine Excel-Tabelle oder die SPSS-basierte Definition von neuen Variablen an. In der nachstehenden Excel-Tabelle, die man durch den Export von Tabelle 39 aus SPSS nach Excel erhält, sind in der ersten Spalte die Merkmalsausprägungen eines neuen, fiktiven Pkw-Modells X2 eingetragen. Die merkmalspezifischen Klassifikationswerte für die Gruppe 1, die in der zweiten Spalte angeführt sind, ergeben sich aus der Multiplikation der Merkmalswerte mit den gruppenspezifischen Funktionskoeffizienten der betreffenden Gruppe, die wir der Spalte 1 der Tabelle 38 entnehmen können. Aus der anschließenden Summation der merkmalspezifischen Klassifikationswerte resultiert der gesuchte objektbezogene Klassifikationswert, der für die Gruppe 1 einen Wert von aufweist. Demgegenüber beträgt der Klassifikationswert für die zweite Gruppe bzw. für die dritte Gruppe Gemäß der Klassifikationsregel, nach welcher ein Objekt jener Gruppe zuzuordnen ist, für welche der Klassifikationswert am höchsten ist, muss das Modell X somit der dritten Gruppe bzw. der Leistungsarmen Modellklasse zugeordnet werden. 51

52 Tabelle 39: Berechnung von Klassifikationswerten für ein neues Pkw-Modell X Eine alternative, gleichwohl mühsamere Vorgehensweise besteht darin, mit Hilfe des SPSS-Menüs Transformieren/Variablen berechnen eine neue Variable für jede Klassifizierungsfunktion zu definieren und der betreffenden Datendatei anzufügen (vgl. Tabelle 40). Anzumerken ist, dass zunächst die Merkmalswerte des zu klassifizierenden Objektes in der SPSS-Datei einzutragen sind, damit die anschließend zu formulierenden Klassifizierungsfunktionen die Klassifikationswerte für diesen Fall ermitteln können. Tabelle 40: Formulierung von Klassifizierungsfunktionen in SPSS 52

53 Einen abschließenden, anschaulichen Eindruck der Klassifikationsstruktur im Mehr- Gruppen-Fall vermittelt überdies ein Streudiagramm der Gruppenzugehörigkeiten (vgl. Abbildung 15). Bei diesem werden auf der horizontalen Achse die Werte der ersten Diskriminanzfunktion, auf der vertikalen Achse die Diskriminanzwerte der zweiten Funktion abgetragen. Jeder Untersuchungsfall (hier: Pkw-Modell) wird durch einen einzelnen Punkt abgebildet, der die fallweisen Funktionswerte widerspiegelt. Es ist ersichtlich, dass die Gruppenzentroide bezüglich der ersten Funktion relativ weit auseinander liegen und damit deutliche Gruppenunterschiede vorliegen, während die Unterschiede in den Gruppen-Mittelwerten bezüglich der zweiten Funktion deutlich geringer ausfallen. Dies bildet einen weiteren Beleg dafür, dass die Trennstärke der ersten Funktion größer als jene der zweiten Funktion ist. Abbildung 15: Streudiagramm der Gruppenzugehörigkeiten 53

54 5. Excel-basierte Diskriminanzanalyse Im Folgenden sollen anhand des in Kapitel 2 erläuterten Innovationsbeispiels die Alternativen einer Excel-basierten Diskriminanzanalyse umrissen werden. Excel bietet keine eigenständige Analyseprozedur für die Diskriminanzanalyse an, so dass der Anwender statistische Umwege einschlagen muss. Hierzu können Excel-Formeln formuliert, Excel-Tabellenfunktionen verwendet, Excel-Matrizenoperationen definiert, der Excel-Solver eingesetzt und eine Diskriminanztafel erstellt werden, wobei die ersten vier Ansätze der Funktionsschätzung dienen, während eine Diskriminanztafel auf die diskriminanzanalytische Gütebeurteilung ausgerichtet ist. 5.1 Excel-Formeln zur Ermittlung einer Diskriminanzfunktion Ein vergleichsweise einfacher Ansatz zur Excel-basierten Schätzung einer Diskriminanzfunktion besteht darin, mit Hilfe von Excel-Formeln (Berechnungsanweisungen) zunächst eine diskriminanzanalytische Auswertungstabelle zu erzeugen und daran anschließend die Diskriminanzkoeffizienten unter Rückgriff auf die jeweiligen Normalgleichungen zu berechnen. Dabei gilt es zu beachten, dass die in Excel-Formeln zu verknüpfenden Zahlenwerte und Operatoren (z.b. Additionszeichen) zweckmäßigerweise durch die Angabe von Zellbezügen mit Hilfe des Mauszeigers (sog. Methode des Mauszeigens) vorgenommen werden, um einerseits Fehleintragungen zu vermeiden und andererseits automatisch anpassende Formelergebnisse nach Datenänderungen zu erzeugen. Für das Innovationsbeispiel kann demgemäß in der folgenden Weise verfahren werden: 1) Definition der Auswertungstabelle: Konzipiert man die relevante Auswertungstabelle (vgl. Tabelle 2) in einem Excel-Tabellenblatt, so kann diese exemplarisch im Zellbereich A1:H40 erfasst werden (vgl. Tabelle 41). 2) Kennwerte der Gruppe A: Die relevanten Größen bestimmen sich als Mittelwert Variable x 1 : B15=MITTELWERT(B3:B14) [Ergebnis: 13,33] Mittelwert Variable x 2 : C15=MITTELWERT(C3:C14) [Ergebnis: 8,58] Abweichungsquadrate Variable x 1 : E15=SUMME(E3:E14) [Ergebnis: 50,67] Abweichungsquadrate Variable x 2 : G15 =SUMME(G3:G14) [Ergebnis: 44,92] Abweichungsprodukte: H15 =SUMME(H3:H14) [Ergebnis: 5,67] In analoger Weise erhält man die entsprechenden Größen der Gruppe B. 54

55 Tabelle 41: Excel-Formeln zur Schätzung einer Diskriminanzfunktion 3) Gesamtwerte der Merkmalsvariablen: Die merkmalsspezifischen Gesamtwerte errechnen sich als Gesamtmittelwert Variable x 1 : B36=(B15+B32)/2 [Ergebnis: 15,42] Gesamtmittelwert Variable x 2: C36=(C15+C32)/2 [Ergebnis: 6,79] Gesamtabweichungsquadrate x 1 : E36=E15+E32 [Ergebnis: 91,67] Gesamtabweichungsquadrate x 2 : G36=G15+G32 [Ergebnis: 92,92] Gesamtabweichungsprodukte: H36=H15+H32 [Ergebnis: 9,67] Distanz der Gruppen-Mittelwerte Variable x 1 : B39=B15-B32 [Ergebnis: -4,17] Distanz der Gruppen-Mittelwerte Variable x 2 : C39=C15-C32 [Ergebnis: 3,58] 55

56 4) Diskriminanzkoeffizienten: Abschließend erhält man die beiden Diskriminanzkoeffizienten unter Zuhilfenahme der Normalgleichungen als b 1 : M2=(C39*H36-B39*G36)/(H36^2-E36*G36) [Ergebnis: -0,0501] b 2 : M3=(B39*H36-C39*E36)/(H36^2-E36*G36) [Ergebnis: 0,0438] 5.2 Koeffizientenschätzung mit Excel-Funktionen Die formelbasierte Excel-Methodik zur Schätzung einer Diskriminanzfunktion ist in jenen Fällen umständlich bzw. unzweckmäßig, in denen sehr viele Objekte, mehrere Merkmalsvariablen und/oder mehrere Gruppen vorliegen. Stattdessen bietet sich die Erstellung einer diskriminanzanalytischen Wertetabelle mit Hilfe von Excel- Tabellenfunktionen an. Die Tabelle 42 verdeutlicht diesen Excel-Ansatz für das Innovationsbeispiel. Tabelle 42: Excel-Funktionen zur Schätzung einer Diskriminanzfunktion 1) Definition der Wertetabelle: Die benötigten statistischen Größen zur Ermittlung der Diskriminanzkoeffizienten werden in einer Wertetabelle des Zellbereichs F8:J8 erfasst. 2) Mittelwerte Variable x 1 : Gruppe A: G4=MITTELWERT(C2:C13) [Ergebnis: 13,33] Gruppe B: H4=MITTELWERT(C14:C25) [Ergebnis: 17,50] Gesamt: I4=MITTELWERT(C2:C25) [Ergebnis: 15,42] In analoger Weise erhält man die betreffenden Mittelwerte für Variable x 2. 3) Abweichungsquadrate Variable x 1 : Gruppe A: G6=SUMQUADABW(C2:C13) [Ergebnis: 50,67] 56

57 Gruppe B: H6=SUMQUADABW(C14:C25) [Ergebnis: 41,00] Gesamt: I6=SUMME(G6:H6) [Ergebnis: 91,67] In analoger Weise erhält man die betreffenden Werte für Variable x2. 4) Abweichungsprodukte: Gruppe A: G8=KOVARIANZ.P(C2:C13;D2:D13)*G3[Ergebnis: 5,67] Gruppe B: H8=KOVARIANZ.P(C14:C25;D14:D25)*H3[Ergebnis: 4,00] Gesamt: I=G8+H8 [Ergebnis: 9,67] 5) Distanz der Gruppen-Mittelwerte: Variable x 1 : J4=G4-H4 [Ergebnis: -4,17] Variable x 2 : J5=G5-H5 [Ergebnis: 3,58] 6) Diskriminanzkoeffizienten: Abschließend erhält man die beiden Diskriminanzkoeffizienten mittels der Normalgleichungen als b1: G11:G12=((J5*I8-(J4*I7))/(I8^2-I6*I7)) [Ergebnis: -0,0501] b2: G13:G14=(J4*I8-J5*I6)/(I8^2-I6*I7) [Ergebnis: 0,0438] Ergänzend kann an dieser Stelle angemerkt werden, dass es im Zwei-Gruppen-Zwei- Variablen-Fall auch möglich ist, die Diskriminanzkoeffizienten mittels einer Excelbasierten Regressionsanalyse zu schätzen, bei der die abhängige Variable als binäre Gruppenvariable mit den Ausprägungen 0 (= Gruppe 1) und 1 (= Gruppe 2) gebildet wird. 5.3 Funktionsbestimmung durch Excel-Matrizenoperationen Eine weitere Excel-Methodik zur Schätzung von Diskriminanzkoeffizienten besteht darin, das diskriminanzanalytische Normalgleichungssystem mit Hilfe der Matrizenrechnung zu lösen. Ein wesentlicher Vorteil der Matrizenrechnung gegenüber dem Einsetzungs- oder dem Eliminationsverfahren (vgl. das Beispiel in der Tabelle 4) besteht darin, dass ein umfangreiches lineares Gleichungssystem in einer Art Kurzschrift übersichtlich dargestellt und mittels einfacher Rechenprozeduren gelöst werden kann. Der Einsatz der Matrizenrechnung zur Lösung linearer Gleichungssysteme setzt allerdings voraus, dass die Anzahl der Variablen gleich der Anzahl der Gleichungen ist. 57

58 Tabelle 43: Excel-Matrizenoperationen zur Schätzung einer Diskriminanzfunktion Die Schätzung einer Diskriminanzfunktion mit Hilfe von Excel-Matrizenoperationen vollzieht sich in fünf Rechenschritten (vgl. Tabelle 43): 1) Formulierung des linearen Normalgleichungssystems: Den rechentechnischen Ausgangspunkt der Matrizenrechnung bildet die Formulierung eines linearen Gleichungssystems. Für die diskriminanzanalytische Aufgabenstellung ist das allgemeine Normalgleichungssystem im Zellbereich G11:H12 der Tabelle 41 definiert. Die betreffenden Gleichungen für das Innovationsbeispiel sind im Zellbereich I11:J12 formuliert, wobei die gleichungsspezifischen Werte, wie z.b. die Abweichungsquadrate, der Wertetabelle des Zellbereichs F8:J8 entstammen (vgl. hierzu auch die Ausführungen zu Tabelle 13). 2) Matrizendarstellung des Gleichungssystems: Die beiden Gleichungen sind im zweiten Rechenschritt in eine Matrizenstruktur zu überführen. Als eine Matrix bezeichnet man in der Algebra ein aus Zeilen und Spalten zusammengesetztes, rechteckiges Zahlenschema, für das bestimmte Rechenregeln gelten. Sind in einer Matrix die Zeilen- und Spaltenzahl gleich, so spricht man von einer quadratischen Matrix. Eine Matrix, die nur aus einer Spalte (einer Zeile) besteht, wird auch als Spaltenvektor (Zeilenvektor) bezeichnet. In der Matrix-Schreibweise kann die Normalform eines Gleichungssystem allgemein formuliert werden als: A * x = b (vgl. Schwarze 2011, S. 41 ff.). Dabei bezeichnet die Matrix A die Koeffizienten- 58

59 matrix des linearen Gleichungssystems, x den Vektor der Variablen und b den Vektor der absoluten Glieder (Konstantenmatrix). Im Innovationsbeispiel sind die Werte der quadratischen Koeffizientenmatrix im Zellbereich F15:G16 ausgewiesen, der Spaltenvektor der Variablen (Diskriminanzkoeffizienten) ist im Zellbereich H15:H16 enthalten und die Konstantenmatrix (Distanz der Gruppen-Mittelwerte) umfasst den Zellbereich J15:J16. 3) Formulierung des Lösungsansatzes: Gesucht sind in unserem Beispiel die Werte für den Spaltenvektor der Diskriminanzkoeffizienten (x). Hierzu ermittelt man die inverse Koeffizientenmatrix (A -1 ) und multipliziert mit dieser beide Seiten des Gleichungssystems (A*x = b). Daraus resultiert die Lösung x = A -1 * b. Da eine quadratische Matrix nur dann invertierbar ist, wenn ihre Determinante ungleich Null ist, ist es zweckmäßig, vorab zu überprüfen, ob ein lineares Gleichungssystem überhaupt lösbar ist. Hierzu kann mittels der Excel-Funktion MDET() die Determinante für die Koeffizientenmatrix A berechnet werden. Ist die Determinante ungleich Null, so besteht eine eindeutige Lösung, die mit Hilfe der Inversen Matrix bestimmt werden kann. 4) Bestimmung der inversen Koeffizientenmatrix (A -1 ): Im dritten Rechenschritt ist gemäß des zuvor formulierten Lösungsansatzes die inverse Matrix zu berechnen. Eine quadratische Matrix A -1 bezeichnet man als inverse Matrix (auch Inverse oder Kehrmatrix genannt) einer quadratischen Matrix A, wenn das Produkt beider Matrizen eine Einheitsmatrix bildet, bei der alle Diagonalelemente den Wert Eins und alle anderen Feldern Nullen aufweisen. In Excel lässt sich die Inverse einer Matrix recht einfach mittels der sog. Matrixfunktion MINV(Matrix) ermitteln. Diese kann als sog. Matrixformel direkt in der Bearbeitungsleiste entwickelt oder als Tabellenfunktion aus der Funktionsbibliothek [Mathematik & Trigonometrie] eingefügt werden. Das grundlegende Kennzeichen einer Excel-Matrixformel besteht darin, dass bei diesen ein Zellbereich als Argument einzugeben ist, wobei die einzelnen Matrixzellen als nicht veränderliche Einheit behandelt werden, d.h. die nicht gesondert bearbeitet (z.b. korrigiert) werden können. Zu erkennen sind Matrixfunktionen an den geschweiften Klammern {} vor und nach der eigentlichen Funktion; diese Klammern dürfen nicht manuell eingegeben werden, sondern müssen durch die Tastenkombination Strg+Umschalt+Eingabe (bzw. Ctrl+Shift+Return) erzeugt werden. In unserem Beispiel gehen wir dazu wie folgt vor (vgl. Tabelle 41): Zunächst wird der relevante Zellbereich der inversen Koffizientenmatrix F19:G20 markiert und anschließend in der Bearbeitungsleiste die Matrixformel direkt eingegeben als: {=MINV(F15:G16)}. 59

60 5) Multiplikation der invertierten Matrix mit der Konstantenmatrix (b): Im abschließenden Rechenschritt erhält man die gesuchten Diskriminanzkoeffizienten durch die Multiplikation der invertierten Koeffizientenmatrix mit dem Spaltenvektor der Distanz der Gruppen-Mittelwerte. Mathematisch bedeutet dies, das Produkt zweier Matrizen zu bilden, wozu wir die Excel-Funktion MMULT (Array1; Array2) verwenden. Diese kann entweder als Formel direkt in der Bearbeitungsleiste eingegeben oder mit Hilfe der Tabellenfunktion MMULTV(Array1;Array2) aus der Excel-Funktionsbibliothek [Mathematik & Trigonometrie] eingefügt werden. Bei einer formelbasierten Vorgehensweise sind zunächst die Zielzellen der Ergebnismatrix zu markieren; in unserem Beispiel der Zellbereich J19:J20. Anschließend ist die Matrixformel =MMULT(F19:G19;H19:H20) einzugeben und durch gleichzeitiges Drücken von Umschalt-, Steuerungs- und Eingabetaste abzuschließen: {=MMULT(F19:G19;H19:H20)}. Als Ergebnis erhält man die gesuchten Werte der beiden Diskriminanzkoeffizienten: b 1 = -0,0501; b 2 = 0,

61 5.5 Excel-Solvereinsatz zur Optimierung eines Diskriminanzmodells Mathematisch gesehen lassen sich mit dem Excel-Solver spezielle Optimierungsprobleme des Operations Research lösen, die sich als Gleichungssysteme mit mehreren Unbekannten formulieren lassen. Der Solver ist ein sog. Excel-Add-In, dass man unter Datei/Optionen/Add-Ins aktivieren muss und das sich daraufhin in die Symbolleiste Daten einfügt. Um für das Innovationsbeispiel eine Solverlösung zur Schätzung von Diskriminanzkoeffizienten zu gewinnen, sind drei Teilschritte durchzuführen: Transformation des Diskriminanzmodells in ein Excel-Modell, Formulierung eines Solver-Gleichungssystems und Gütebeurteilung der Solver-Lösung (vgl. Kapitel 5.5). Transformation des Diskriminanzmodells in ein Excel-Modell Das diskriminanzanalytische Excel-Modell setzt sich aus den drei Bausteinen des Datenmodells, des Auswertungsmodells sowie der Testwerte zusammen: Das Datenmodell umfasst die Eingabe der Beispieldaten sowie eine Spalte Diskriminanzwert (hier: Spalte E), in welcher die fallweisen Funktionswerte der zu schätzenden Diskriminanzfunktion aufgenommen werden sollen (vgl. Tabelle 44). Tabelle 44: Diskriminanzanalytisches Excel-Datenmodell 61

62 Im Auswertungsmodell (vgl. Tabelle 45) ist zum einen der Zellbereich für die zu schätzenden unstandardisierten Diskriminanzkoeffizienten festzulegen (hier: K15:L15). Daneben sind die erforderlichen Streuungsgrößen zur Ermittlung des zu maximierenden Diskriminanzkriteriums (hier: Zellbereich I2:L7) zu bestimmen. Zusätzlich ergänzen wir das Auswertungsmodell um die beiden Beurteilungsgrößen des kanonischen Korrelationskoeffizienten (hier: L8) und Wilks Lambda (hier: L9). Tabelle 45: Diskriminanzanalytisches Excel-Auswertungsmodell Für die beiden unbekannten Diskriminanzkoeffizienten sind beliebige Vorgabewerte bzw. Testwerte einzugeben, mit Hilfe derer die Diskriminanzwerte geschätzt und der daraus resultierende Wert des Diskriminanzkriteriums berechnet werden kann. Hierzu bietet es sich generell an, für beide Koeffizienten jeweils den Testwert 1 einzugeben. Das Auswertungsmodell liefert daraufhin die folgenden Startgrößen: Diskriminanzwerte: z.b. E2=1*C2+1*D2 [Ergebnis: 0,0438] Gesamtstreuung: =SUMQUADABW(E2:E25) [Ergebnis: 205,980] Streuung innerhalb der Gruppen (Gruppe A): J5=SUMQUADABW(E2:E13) Streuung innerhalb der Gruppen (Gruppe B): K5=SUMQUADABW(E14:E25) Streuung innerhalb der Gruppen (Gesamt): L5=J5+K5 [Ergebnis: 203,917] Streuung zwischen den Gruppen: L6=L4-L5 [Ergebnis: 2,042] Diskriminanzkriterium: L7=L6/L5 [Ergebnis: 0,010] Formulierung eines Solver-Gleichungssystems Im folgenden Analyseschritt sind die im Auswertungsmodell definierten Formeln zur Definition des Solver-Gleichungssystems heranzuziehen. Hierzu gehen Sie wie folgt vor (vgl. Abbildung 16): 62

63 Abbildung 16: Diskriminanzanalytische Solver-Eintragungen Setzen Sie den Cursor in die Zelle des Diskriminanzkriteriums, d.h. in L7. Wählen Sie Daten/Analyse/Solver. In der Zielzelle wird L7 als absoluter Bezug vorgeschlagen, den Sie übernehmen. Klicken Sie unter Bis: auf die Option Max. Setzen Sie den Cursor in das Eingabefeld Durch Ändern von Variablenzellen, um den Zellbereich der gesuchten Diskriminanzkoeffizienten festzulegen. Im vorliegenden Beispiel markieren Sie dazu den Zellbereich K15:L15. In dem Feld Unterliegt den Nebenbedingungen werden über die Schaltfläche Hinzufügen die zusätzlich zu erfüllenden Restriktionen eingetragen. Im Beispiel besteht auch die Möglichkeit, auf die Eingabe von Nebenbedingungen zu verzichten. Als Solverlösung würde man dann die Werte 11,673 für den Koeffizienten b 1 bzw. -11,953 für den Koeffizienten b 2 erhalten. Der daraus resultierende Eigenwert von 2,193 entspräche ebenso der Optimallösung wie die die korrespondierenden Gütemaße. An dieser Stelle berücksichtigen wir jedoch die in den vorangegangen Kapiteln gewonnenen Koeffizientenlösungen und legen daher für diese jeweils einen einzuhaltenden Wertebereich fest: $K$15<=1; $K$15<=-1; $L$15>=1; $L$15>=1. Bestätigen Sie die Eingaben mit OK. Wählen Sie unter Unter Lösungsmethode auswählen die Option EA(Evolutionärer Algorithmus), mit der schrittweise, rechenintensive Lösungsverbesserungen generiert werden können (vgl. zur Einsatzweise der unterschiedlichen Lösungsalgorithmen Vonhoegen 2013, S. 708 ff.). Der Solver meldet nun in dem Dialog Solver-Ergebnisse, dass er eine Lösung gefunden hat und zeigt sie im Tabellenblatt an. Mit der Option Solver-Lösung akzeptieren wird diese Lösung übernommen und man erhält die Koeffizientenwerte: b 1 = 0,5194; b 2 = -0,

64 5.5 Funktionsbeurteilung auf der Grundlage einer Excel-Diskriminanztafel Zur Gütebeurteilung einer Excel-basierten Schätzung von Diskriminanzfunktionen ist es zweckmäßig, die im im zweiten Kapitel dargelegten statistischen Konzepte zu verwenden und diese in einer Excel-Diskriminanztafel zu berechnen sowie zusammenzufassen. Als Diskriminanztafel bezeichnen wir eine tabellarische Zusammenstellung von Gütekriterien zur Beurteilung einer geschätzten Diskriminanzfunktion. Eine Diskriminanztafel lässt sich generell mit den zuvor erläuterten alternativen Excel-Methoden zur Schätzung der Diskriminanzkoeffizienten verbinden und beispielsweise in einem gemeinsamen Excel-Tabellenblatt darstellen. Die Verknüpfung einer Funktionsschätzung mit der gütebeurteilenden Diskriminanztafel wird nachfolgend anhand der im vorstehenden Abschnitt gewonnenen Solver-Koeffizientenlösung erläutert (vgl. Tabelle 46). Tabelle 46: Excel-Diskriminanztafel 64

65 Bei einer Excel-basierten Diskriminanzprüfung sind vier Zellbereiche voneinander abzugrenzen, in denen jeweils spezifische Berechnungen durchzuführen sind: Datenmodell: Im Datenmodell sind neben den Merkmalswerten der erklärenden Variablen die geschätzten Diskriminanzwerte auf der Grundlage der ermittelten Koeffizientenwerte zu berechnen (vgl. auch Tabelle 44). Für das Innovationsbeispiel ist das Datenmodell in der nachstehenden Tabelle 47 angeführt. Die Diskriminanzwerte der Neuprodukte ergeben sich aus der Multiplikation der geschätzten Koeffizientenwerte (vgl. Tabelle 46) mit den betreffenden Merkmalsausprägungen der beiden Variablen. Für das erste Neuprodukt in der Gruppe A errechnet sich dessen Diskriminanzwert daher als: E2=$K$15*C2+$L$15*D2 [Ergebnis: 1,107] Die geschätzten Diskriminanzwerte bilden einen wesentlichen Dateninput zur Berechnung der Gütekriterien in der Diskriminanztafel. Tabelle 47: Diskriminanzwerte und Gruppenzugehörigkeiten der Neuprodukte 65

66 Gütediagnose der Diskriminanzfunktion: Im ersten Teilbereich der Diskriminanztafel sind die Gütekriterien zur Beurteilung der Diskriminanzfunktion enthalten. Die in der Tabelle 46 ausgewiesenen Gütewerte erhält man als: Gesamtstreuung: =SUMQUADABW(E2:E25) Streuung innerhalb der Gruppen (Gruppe A): J5=SUMQUADABW(E2:E13) Streuung innerhalb der Gruppen (Gruppe B): K5=SUMQUADABW(E14:E25) Streuung innerhalb der Gruppen (Gesamt): L5=J5+K5 Streuung zwischen den Gruppen: L6=L4-L5 Diskriminanzkriterium (vgl. Formel 2.2): L7=L6/L5 Kanonischer Korrelationskoeffizient (vgl. Formel 2.3): L8=WURZEL(L6/L4) Wilks Lambda (vgl. Formel 2.5): L9=1-(L8)^2 Empirischer Prüfwert der Teststatik: I12=-(L3-(2+2)/2-1)*LN(L9) Theoretischer Prüfwert der χ 2 -Teststatik: J12=CHIQU.INV.RE(0,01;2) Testentscheidung: K12:l12 =WENN(I12>J12;"H1 annehmen";"ho annehmen") (Anmerkung: Die in der Diskriminanztafel ermittelten Beurteilungswerte stimmen den in Kapitel 2.3 berechneten Gütewerten überein). Diskriminanzprüfung der Merkmalsvariablen: Im zweiten Teilbereich der Diskriminanztafel sind die Gütemaße zur Diskriminanzbewertung der erklärenden Variablen zusammengefasst (vgl. Tabelle 46): Standardisierter Koeffizient b 1 : K16=K15*STABW.S(C2:C25) Standardisierter Koeffizient b 2 : L16=L15*STABW.S(D2:D25) Relative Merkmalsdiskriminanz b 1 : K17=ABS(K16)/(ABS(K16)+ABS(L16)) Relative Merkmalsdiskriminanz b 2 : L17=ABS(L16)/(ABS(K16)+ABS(L16)) Strukturkoeffizient b 1 : K18=KORREL(C2:C25;E2:E25) Strukturkoeffizient b 2 : L19=KORREL(D2:D25;E2:E25) Merkmalskorrelation: K19:L19=KORREL(C2:C25;D2:D25) Koeffizienten-Proportionalitätsfaktor: K20:L20=K15/L15 (Anmerkung: Die in der Diskriminanztafel berechneten variablenbezogenen Bewertungsmaßzahlen stimmen mit den in Kapitel 2.4 ermittelten Gütewerten überein). Klasssifkationsanalyse: Der dritte Teilbereich der Diskriminanztafel enthält die Werte der Klassifikationsmatrix (vgl. Tabelle 46), die in einer dreistufigen Analyse ermittelt werden: 1) Zunächst ist der kritische Diskriminanzwert bzw. der durchschnittliche Diskriminanzwert aus den Werten der Tabelle 47 zu ermitteln: L24 =MITTELWERT(E2:E25) [Ergebnis: 4,923] 66

67 2) Anschließend ist in der Tabelle 47 mit Hilfe der relevanten Klassifikationsregel (vgl. Tabelle 9) eine Gruppenzuweisung der Neuprodukte vorzunehmen. Hierzu formulieren wir eine sog. Excel-Wenn-Funktion. Diese lautet z.b. für das erste Produkt der Gruppe A F2=WENN(E2<$L$24;"A";"B") [Ergebnis: A] 3) Im dritten Schritt erfolgt eine Überprüfung der Klassifikationsgüte. Dazu erfolgt in der Tabelle 47 zunächst ein fallweiser Vergleich der prognostizierten mit der tatsächlichen Gruppenzugehörigkeit. Für das erste Produkt der Gruppe A gilt demzufolge: F2=WENN(F2=B2;"Treffer";"Fehler") [Ergebnis: Treffer] Abschließend sind die fallweisen Treffer bzw. Fehler zu zählen: Trefferquote (Anzahl): K26=ZÄHLENWENN(G2:G25;"Treffer") Trefferquote (Anteil): L26=K26/K28 Fehlerquote (Anzahl): K27=ZÄHLENWENN(G2:G25;"Fehler") Fehlerquote (Anteil): L27=K27/K28 (Anmerkung: Die in der Diskriminanztafel berechneten Klassifikationsmaßzahlen stimmen gleichfalls mit den in Kapitel 2.5 ermittelten Werten überein). 67

68 6. Empirische Anwendungsbeispiele Das Einsatzpotential der Diskriminanzanalyse soll im Folgenden anhand von zwei empirischen Fallbeispielen illustriert werden. Im Rahmen einer umfassenden Analyse zu den Zukunftsperspektiven des regionalen Großhandels im Kammerbezirk Dortmund war dem Verfasser u.a. die Aufgabe gestellt, auf der Grundlage der Konzeption der strategischen Erfolgsfaktorenforschung strategische Wettbewerbergruppen zu identifizieren, voneinander abzugrenzen und die relevanten Erfolgsfaktoren herauszuschälen. Die Erfassung und Abgrenzung von Wettbewerbergruppen wurde mittels einer Clusteranalyse vorgenommen, bei welcher die verschiedenen strategischen Unternehmensziele von Großhandelsbetrieben als Gruppierungskriterien dienten (vgl. Abbildung 17). Abbildung 17: Abgrenzung strategischer Wettbewerbergruppen im Großhandel Das Ziel der hieran anschließenden Diskriminanzanalyse bestand darin zu untersuchen, ob sich die beiden Wettbewerbergruppen auch im Hinblick auf die von ihnen verfolgten strategischen und operativen Unternehmensaktivitäten voneinander unterscheiden lassen. Die folgenden Ausführungen beschränken sich angesichts der umfangreichen Ergebnisse auf eine Skizzierung der strategischen Marktaktivitäten (vgl. ausführlicher bei Müller 2004). Um den Katalog strategischer Erfolgsfaktoren herauszuarbeiten, wurde den untersuchten Unternehmen ein Spektrum von insgesamt 48 strategischen Unternehmensaktivitäten aus dem Bereich des Marketing-, des Beschaffungs-, des Personal- sowie des Ressourcenmanagements vorgelegt und 68

69 gebeten, diese im Hinblick auf die jeweils verfolgte Einsatzintensität zu bewerten. Mittels einer schrittweisen Diskriminanzanalyse wurden sodann jene strategischen Aktivitäten identifiziert, die eine besonders trennscharfe und signifikante Gruppentrennung gestatten. Im ersten Analyseschritt konnten neun strategische Erfolgsfaktoren ermittelt werden (vgl. Abbildung 18). Abbildung 18: Strategische Erfolgsfaktoren im Großhandel Hieran anschließend stellt sich im zweiten Analyseschritt die Frage nach der Trennstärke der Erfolgsfaktoren. Die diskriminatorische Bedeutung einer Unternehmensaktivität kann anhand der absoluten Größe des standardisierten Diskriminanzkoeffizienten abgelesen werden. Den Befunden der nachfolgenden Tabelle 48 zufolge, besitzt die Flexibilisierung des Personaleinsatzes den größten Einfluss auf die Gruppentrennung, gefolgt von der Strategie der Qualitätsführerschaft und der Verstärkung der Kundenbindung. Kanonische Diskriminanzfunktionskoeffizienten Verstärkung der Stammkundenbindung Erschließung neuer Kundengruppen Marktstrategie der Qualitätsführerschaf t Einsatz neuer Controllingkonzepte Einsatz neuer Logistikkonzepte Verbesserung der Mitarbeiterqualifikation Flexibilisierung des Personaleinsatzes (Konstant) Funktion 1,369 -,028,426 -,173,308,181,448-5,981 Güteinformationen: Wilks' Lambda: 0,45; Anzahl korrekt klassifizierter Fälle (n= 111): 74%; Signifikanz:5% Tabelle 48: Diskriminanzkoeffizienten strategischer Erfolgsfaktoren Im Rahmen einer weiteren Marktstudie für einen Reiseveranstalter, wurde auf der Grundlage einer geschichteten Zufallsstichprobe von 4888 Privatreisenden des 69

70 betrachteten Reisezeitraumes (Grundgesamtheit N = Reisende) u.a. der Frage nachgegangen, welche Leistungselemente des Dienstleistungsangebotes das Zufriedenheitsurteil (Messinstrument: standardisierter Fragebogen; Ratingskalierung: 1 = sehr zufrieden,...,5 = sehr unzufrieden) der Reisekunden determinieren (vgl. zu angewandten Zufriedenheitsforschung auch Müller 1996). Auf der Grundlage der durchschnittlichen Zufriedenheitswerte wurde über alle Leistungsmerkmale hinweg eine Clusteranalyse durchgeführt, die zur Abgrenzung von zwei Kundengruppen führte. Kundengruppe 1 setzt sich aus solchen Nachfragern zusammen, die überdurchschnittlich zufrieden ist und besitzt einen Stichprobenanteil von 70%. Demgegenüber gehören Kundengruppe 2 solche Nachfrager an, die überdurchschnittlich unzufrieden sind (vgl. Abbildung 19). Aspekte der Servicequalität regelmäßiger und partnerschaftlicher Kontakt zum Betreuer Mittelwerte Cluster 1 68% 1,52 Cluster 2 32% 2,66 sehr zufrieden sehr unzufrieden freundliche und zuvorkommende Bedienung Einhaltung und Umsetzung mündlicher Zusagen und Vereinbarungen Betreuung durch gleichbleibenden Ansprechpartner Beratungsqualität bei Kapitalanlagen Qualität der Finanzierungs- und Investitionsberatung Know -how im Auslandsgeschäft aktive und aktuelle Information über Marktund Zinsentw icklungen Beratung zu unternehmerischen/ betriebswirtschaftlichen Problemen aktive Information über effiziente Zahlungsverkehrstechniken Kenntnis der besonderen Gegebenheiten und Probleme Ihrer Branche individuelle und maßgeschneiderte Problemlösungskonzepte unbürokratische Lösung Ihrer Anliegen 1,38 1,41 1,55 2,20 2,01 2,32 2,28 2,37 2,25 2,31 2,28 1,63 1,98 2,33 2,43 3,18 3,15 3,00 3,57 3,36 3,07 3,25 3,21 3,13 Schnelligkeit der Kreditentscheidung Unterstützung in w irtschaftlich schw ierigen Phasen schnelle Abw icklung des Zahlungsverkehrs 1,85 2,09 1,92 3,25 3,21 2,61 fehlerfreie Abw icklung des Zahlungsverkehrs 1,80 2,54 Gebührenstruktur im Zahlungsverkehr 2,55 3,41 angemessene Kreditzinsen 2,29 3,36 Weitergabe von Zinssenkungen an die Kunden 2,43 3,64 Cluster 1 Cluster 2 Abbildung 19: Clusteranalytische Abgrenzung von Kundenzufriedenheitsgruppen Im Zuge einer anschließenden Diskrimninanzanalyse war die Frage zu beantworten, welche Leistungsmerkmale des Diensteangebotes ins besonderem Maße zur signifikanten Gruppentrennung beitragen. Gemäß den in der Tabelle 49 angezeigten Ergebnissen, üben die Leistungsmerkmale vertrauter Ansprechpartner und 70

71 persönliche Beratung hinsichtlich individueller Reisewünsche die höchste Trennkraft aus. Wilks` Lambda beträgt im vorliegenden Beispiel 0,348. Dieser Werte verweist darauf, dass die Diskriminanzfunktion ca. 65% (= 1-0,348) der Varianz erklärt und somit eine hinreichend hohe Trennkraft besitzt. Tabelle 49: Diskriminanzanalytische Trennung von Kundenzufriedenheitssegmenten im Reiseveranstaltermarkt ( n = 4888) 71

Diskriminanzanalyse Beispiel

Diskriminanzanalyse Beispiel Diskriminanzanalyse Ziel bei der Diskriminanzanalyse ist die Analyse von Gruppenunterschieden, d. h. der Untersuchung von zwei oder mehr Gruppen hinsichtlich einer Vielzahl von Variablen. Diese Methode

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Zeichen bei Zahlen entschlüsseln

Zeichen bei Zahlen entschlüsseln Zeichen bei Zahlen entschlüsseln In diesem Kapitel... Verwendung des Zahlenstrahls Absolut richtige Bestimmung von absoluten Werten Operationen bei Zahlen mit Vorzeichen: Addieren, Subtrahieren, Multiplizieren

Mehr

Die Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung.

Die Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung. Lineare Gleichungen mit einer Unbekannten Die Grundform der linearen Gleichung mit einer Unbekannten x lautet A x = a Dabei sind A, a reelle Zahlen. Die Gleichung lösen heißt, alle reellen Zahlen anzugeben,

Mehr

Korrelation. Übungsbeispiel 1. Übungsbeispiel 4. Übungsbeispiel 2. Übungsbeispiel 3. Korrel.dtp Seite 1

Korrelation. Übungsbeispiel 1. Übungsbeispiel 4. Übungsbeispiel 2. Übungsbeispiel 3. Korrel.dtp Seite 1 Korrelation Die Korrelationsanalyse zeigt Zusammenhänge auf und macht Vorhersagen möglich Was ist Korrelation? Was sagt die Korrelationszahl aus? Wie geht man vor? Korrelation ist eine eindeutige Beziehung

Mehr

Korrelation (II) Korrelation und Kausalität

Korrelation (II) Korrelation und Kausalität Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen

Mehr

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse 11 13. 501322 Lösung 10 Punkte

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse 11 13. 501322 Lösung 10 Punkte 50. Mathematik-Olympiade. Stufe (Regionalrunde) Klasse 3 Lösungen c 00 Aufgabenausschuss des Mathematik-Olympiaden e.v. www.mathematik-olympiaden.de. Alle Rechte vorbehalten. 503 Lösung 0 Punkte Es seien

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Anwendungshinweise zur Anwendung der Soziometrie

Anwendungshinweise zur Anwendung der Soziometrie Anwendungshinweise zur Anwendung der Soziometrie Einführung Die Soziometrie ist ein Verfahren, welches sich besonders gut dafür eignet, Beziehungen zwischen Mitgliedern einer Gruppe darzustellen. Das Verfahren

Mehr

Proseminar Verarbeitung geographischer Daten (Quant II) Sommersemester 2001 Daniel Braunschweiger Achim Schmidt Tobias Spaltenberger

Proseminar Verarbeitung geographischer Daten (Quant II) Sommersemester 2001 Daniel Braunschweiger Achim Schmidt Tobias Spaltenberger Proseminar Verarbeitung geographischer Daten (Quant II) Sommersemester 2001 Daniel Braunschweiger Achim Schmidt Tobias Spaltenberger Diskriminanzanalyse am Fallbeispiel von 23 Klimastationen in Tunesien

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Excel Pivot-Tabellen 2010 effektiv

Excel Pivot-Tabellen 2010 effektiv 7.2 Berechnete Felder Falls in der Datenquelle die Zahlen nicht in der Form vorliegen wie Sie diese benötigen, können Sie die gewünschten Ergebnisse mit Formeln berechnen. Dazu erzeugen Sie ein berechnetes

Mehr

AUTOMATISIERTE HANDELSSYSTEME

AUTOMATISIERTE HANDELSSYSTEME UweGresser Stefan Listing AUTOMATISIERTE HANDELSSYSTEME Erfolgreich investieren mit Gresser K9 FinanzBuch Verlag 1 Einsatz des automatisierten Handelssystems Gresser K9 im Portfoliomanagement Portfoliotheorie

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren Lineargleichungssysteme: Additions-/ Subtraktionsverfahren W. Kippels 22. Februar 2014 Inhaltsverzeichnis 1 Einleitung 2 2 Lineargleichungssysteme zweiten Grades 2 3 Lineargleichungssysteme höheren als

Mehr

1 Mathematische Grundlagen

1 Mathematische Grundlagen Mathematische Grundlagen - 1-1 Mathematische Grundlagen Der Begriff der Menge ist einer der grundlegenden Begriffe in der Mathematik. Mengen dienen dazu, Dinge oder Objekte zu einer Einheit zusammenzufassen.

Mehr

Multivariate Verfahren

Multivariate Verfahren Multivariate Verfahren Lineare Reression Zweck: Vorhersae Dimensionsreduktion Klassifizierun Hauptkomponentenanalyse Korrespondenzanalyse Clusteranalyse Diskriminanzanalyse Eienschaften: nicht-linear verteilunsfrei

Mehr

DIFFERENTIALGLEICHUNGEN

DIFFERENTIALGLEICHUNGEN DIFFERENTIALGLEICHUNGEN GRUNDBEGRIFFE Differentialgleichung Eine Gleichung, in der Ableitungen einer unbekannten Funktion y = y(x) bis zur n-ten Ordnung auftreten, heisst gewöhnliche Differentialgleichung

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Lineare Funktionen. 1 Proportionale Funktionen 3 1.1 Definition... 3 1.2 Eigenschaften... 3. 2 Steigungsdreieck 3

Lineare Funktionen. 1 Proportionale Funktionen 3 1.1 Definition... 3 1.2 Eigenschaften... 3. 2 Steigungsdreieck 3 Lineare Funktionen Inhaltsverzeichnis 1 Proportionale Funktionen 3 1.1 Definition............................... 3 1.2 Eigenschaften............................. 3 2 Steigungsdreieck 3 3 Lineare Funktionen

Mehr

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen Austausch- bzw. Übergangsrozesse und Gleichgewichtsverteilungen Wir betrachten ein System mit verschiedenen Zuständen, zwischen denen ein Austausch stattfinden kann. Etwa soziale Schichten in einer Gesellschaft:

Mehr

QM: Prüfen -1- KN16.08.2010

QM: Prüfen -1- KN16.08.2010 QM: Prüfen -1- KN16.08.2010 2.4 Prüfen 2.4.1 Begriffe, Definitionen Ein wesentlicher Bestandteil der Qualitätssicherung ist das Prüfen. Sie wird aber nicht wie früher nach der Fertigung durch einen Prüfer,

Mehr

Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test?

Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test? Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test? Auch wenn die Messungsmethoden ähnlich sind, ist das Ziel beider Systeme jedoch ein anderes. Gwenolé NEXER g.nexer@hearin gp

Mehr

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Klausur, Multivariate Verfahren, SS 2006, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 08.08.2006 Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Gesamtpunkte: 39 Aufgabe

Mehr

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip Sommersemester 2010 KLAUSUR Statistik B Hinweise zur Bearbeitung: Bei allen Teilaufgaben

Mehr

Planen mit mathematischen Modellen 00844: Computergestützte Optimierung. Autor: Dr. Heinz Peter Reidmacher

Planen mit mathematischen Modellen 00844: Computergestützte Optimierung. Autor: Dr. Heinz Peter Reidmacher Planen mit mathematischen Modellen 00844: Computergestützte Optimierung Leseprobe Autor: Dr. Heinz Peter Reidmacher 11 - Portefeuilleanalyse 61 11 Portefeuilleanalyse 11.1 Das Markowitz Modell Die Portefeuilleanalyse

Mehr

einfache Rendite 0 145 85 1 160 90 2 135 100 3 165 105 4 190 95 5 210 110

einfache Rendite 0 145 85 1 160 90 2 135 100 3 165 105 4 190 95 5 210 110 Übungsbeispiele 1/6 1) Vervollständigen Sie folgende Tabelle: Nr. Aktie A Aktie B Schlusskurs in Schlusskurs in 0 145 85 1 160 90 2 135 100 3 165 105 4 190 95 5 210 110 Arithmetisches Mittel Standardabweichung

Mehr

5 Zusammenhangsmaße, Korrelation und Regression

5 Zusammenhangsmaße, Korrelation und Regression 5 Zusammenhangsmaße, Korrelation und Regression 5.1 Zusammenhangsmaße und Korrelation Aufgabe 5.1 In einem Hauptstudiumsseminar des Lehrstuhls für Wirtschafts- und Sozialstatistik machten die Teilnehmer

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln Beurteilung der biometrischen Verhältnisse in einem Bestand Dr. Richard Herrmann, Köln Beurteilung der biometrischen Verhältnisse in einem Bestand 1 Fragestellung Methoden.1 Vergleich der Anzahlen. Vergleich

Mehr

Einführung in statistische Analysen

Einführung in statistische Analysen Einführung in statistische Analysen Andreas Thams Econ Boot Camp 2008 Wozu braucht man Statistik? Statistik begegnet uns jeden Tag... Weihnachten macht Deutschen Einkaufslaune. Im Advent überkommt die

Mehr

V 2 B, C, D Drinks. Möglicher Lösungsweg a) Gleichungssystem: 300x + 400 y = 520 300x + 500y = 597,5 2x3 Matrix: Energydrink 0,7 Mineralwasser 0,775,

V 2 B, C, D Drinks. Möglicher Lösungsweg a) Gleichungssystem: 300x + 400 y = 520 300x + 500y = 597,5 2x3 Matrix: Energydrink 0,7 Mineralwasser 0,775, Aufgabenpool für angewandte Mathematik / 1. Jahrgang V B, C, D Drinks Ein gastronomischer Betrieb kauft 300 Dosen Energydrinks (0,3 l) und 400 Liter Flaschen Mineralwasser und zahlt dafür 50, Euro. Einen

Mehr

Lineare Gleichungssysteme

Lineare Gleichungssysteme Lineare Gleichungssysteme 1 Zwei Gleichungen mit zwei Unbekannten Es kommt häufig vor, dass man nicht mit einer Variablen alleine auskommt, um ein Problem zu lösen. Das folgende Beispiel soll dies verdeutlichen

Mehr

Welche Lagen können zwei Geraden (im Raum) zueinander haben? Welche Lagen kann eine Gerade bezüglich einer Ebene im Raum einnehmen?

Welche Lagen können zwei Geraden (im Raum) zueinander haben? Welche Lagen kann eine Gerade bezüglich einer Ebene im Raum einnehmen? Welche Lagen können zwei Geraden (im Raum) zueinander haben? Welche Lagen können zwei Ebenen (im Raum) zueinander haben? Welche Lagen kann eine Gerade bezüglich einer Ebene im Raum einnehmen? Wie heiÿt

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis Das komplette Material finden Sie hier: Download bei School-Scout.de

Mehr

Gleichungen Lösen. Ein graphischer Blick auf Gleichungen

Gleichungen Lösen. Ein graphischer Blick auf Gleichungen Gleichungen Lösen Was bedeutet es, eine Gleichung zu lösen? Was ist überhaupt eine Gleichung? Eine Gleichung ist, grundsätzlich eine Aussage über zwei mathematische Terme, dass sie gleich sind. Ein Term

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Einführung in die Algebra

Einführung in die Algebra Prof. Dr. H. Brenner Osnabrück SS 2009 Einführung in die Algebra Vorlesung 13 Einheiten Definition 13.1. Ein Element u in einem Ring R heißt Einheit, wenn es ein Element v R gibt mit uv = vu = 1. DasElementv

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

4. Erstellen von Klassen

4. Erstellen von Klassen Statistik mit Tabellenkalkulation 4. Erstellen von Klassen Mit einem einfachen Befehl lässt sich eine Liste von Zahlen auf die Häufigkeit der einzelnen Werte untersuchen. Verwenden Sie dazu den Befehl

Mehr

Aufgabe 1. Zunächst wird die allgemeine Tangentengleichung in Abhängigkeit von a aufgestellt:

Aufgabe 1. Zunächst wird die allgemeine Tangentengleichung in Abhängigkeit von a aufgestellt: Aufgabe 1 1.1. Bestimmung von D max : 1. Bedingung: x >0 ; da ln(x) nur für x > 0 definiert ist. 2. Bedingung: Somit ist die Funktion f a nur für x > 0 definiert und sie besitzt eine Definitionslücke an

Mehr

Grundlagen der Inferenzstatistik

Grundlagen der Inferenzstatistik Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 3A Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit den Berechnungsfunktionen LG10(?) und SQRT(?) in "Transformieren", "Berechnen" können logarithmierte Werte sowie die Quadratwurzel

Mehr

Theoretische Grundlagen der Informatik WS 09/10

Theoretische Grundlagen der Informatik WS 09/10 Theoretische Grundlagen der Informatik WS 09/10 - Tutorium 6 - Michael Kirsten und Kai Wallisch Sitzung 13 02.02.2010 Inhaltsverzeichnis 1 Formeln zur Berechnung Aufgabe 1 2 Hamming-Distanz Aufgabe 2 3

Mehr

Lineare Gleichungssysteme I (Matrixgleichungen)

Lineare Gleichungssysteme I (Matrixgleichungen) Lineare Gleichungssysteme I (Matrigleichungen) Eine lineare Gleichung mit einer Variable hat bei Zahlen a, b, die Form a b. Falls hierbei der Kehrwert von a gebildet werden darf (a 0), kann eindeutig aufgelöst

Mehr

Darstellungsformen einer Funktion

Darstellungsformen einer Funktion http://www.flickr.com/photos/sigfrid/348144517/ Darstellungsformen einer Funktion 9 Analytische Darstellung: Eplizite Darstellung Funktionen werden nach Möglichkeit eplizit dargestellt, das heißt, die

Mehr

32.4 Anpassen von Menüs und Symbolleisten 795i

32.4 Anpassen von Menüs und Symbolleisten 795i 32.4 Anpassen von Menüs und Symbolleisten 795i Fortsetzung der Seiten in der 8. Auflage 32.4 Anpassen von Menüs und Symbolleisten 32.4.1 Anpassen von Menüs Die Menüs können um folgende Typen von Optionen

Mehr

Faktura. IT.S FAIR Faktura. Handbuch. Dauner Str.12, D-41236 Mönchengladbach, Hotline: 0900/1 296 607 (1,30 /Min)

Faktura. IT.S FAIR Faktura. Handbuch. Dauner Str.12, D-41236 Mönchengladbach, Hotline: 0900/1 296 607 (1,30 /Min) IT.S FAIR Faktura Handbuch Dauner Str.12, D-41236 Mönchengladbach, Hotline: 0900/1 296 607 (1,30 /Min) 1. Inhalt 1. Inhalt... 2 2. Wie lege ich einen Kontakt an?... 3 3. Wie erstelle ich eine Aktion für

Mehr

Lösungsmethoden gewöhnlicher Differentialgleichungen (Dgl.)

Lösungsmethoden gewöhnlicher Differentialgleichungen (Dgl.) Lösungsmethoden gewöhnlicher Dierentialgleichungen Dgl) Allgemeine und partikuläre Lösung einer gewöhnlichen Dierentialgleichung Eine Dierentialgleichung ist eine Gleichung! Zum Unterschied von den gewöhnlichen

Mehr

Dokumentation. estat Version 2.0

Dokumentation. estat Version 2.0 Dokumentation estat Version 2.0 Installation Die Datei estat.xla in beliebiges Verzeichnis speichern. Im Menü Extras AddIns... Durchsuchen die Datei estat.xla auswählen. Danach das Auswahlhäkchen beim

Mehr

Doing Economics with the Computer Sommersemester 2002. Excel Solver 1

Doing Economics with the Computer Sommersemester 2002. Excel Solver 1 Universität Bern Kurt Schmidheiny / Manuel Wälti Doing Economics with the Computer Sommersemester 2002 Excel Solver 1 Mit dem Solver unterstützt Excel eine Funktion, mit der u.a. komplex verschachtelte

Mehr

Dossier: Rechnungen und Lieferscheine in Word

Dossier: Rechnungen und Lieferscheine in Word www.sekretaerinnen-service.de Dossier: Rechnungen und Lieferscheine in Word Es muss nicht immer Excel sein Wenn Sie eine Vorlage für eine Rechnung oder einen Lieferschein erstellen möchten, brauchen Sie

Mehr

Datenerfassung (mehrere Merkmale) 1/5

Datenerfassung (mehrere Merkmale) 1/5 Datenerfassung (mehrere Merkmale) 1/5 Ziel: Ziel dieser Aufgabe ist es, die Möglichkeiten der linearen Transformation, der Merkmalsverknüpfung und des Erstellens zusätzlicher Merkmale kennen zu lernen.

Mehr

Professionelle Seminare im Bereich MS-Office

Professionelle Seminare im Bereich MS-Office Der Name BEREICH.VERSCHIEBEN() ist etwas unglücklich gewählt. Man kann mit der Funktion Bereiche zwar verschieben, man kann Bereiche aber auch verkleinern oder vergrößern. Besser wäre es, die Funktion

Mehr

1. Mathematik-Schularbeit 6. Klasse AHS

1. Mathematik-Schularbeit 6. Klasse AHS . Mathematik-Schularbeit 6. Klasse AHS Arbeitszeit: 50 Minuten Lernstoff: Mathematische Grundkompetenzen: (Un-)Gleichungen und Gleichungssysteme: AG. Einfache Terme und Formeln aufstellen, umformen und

Mehr

1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de

1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de 1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de Man sollte eine Excel-Tabelle immer so übersichtlich wie möglich halten. Dazu empfiehlt es sich, alle benötigten Daten, Konstanten und Messwerte

Mehr

Rekursionen. Georg Anegg 25. November 2009. Methoden und Techniken an Beispielen erklärt

Rekursionen. Georg Anegg 25. November 2009. Methoden und Techniken an Beispielen erklärt Methoden und Techniken an Beispielen erklärt Georg Anegg 5. November 009 Beispiel. Die Folge {a n } sei wie folgt definiert (a, d, q R, q ): a 0 a, a n+ a n q + d (n 0) Man bestimme eine explizite Darstellung

Mehr

11.3 Komplexe Potenzreihen und weitere komplexe Funktionen

11.3 Komplexe Potenzreihen und weitere komplexe Funktionen .3 Komplexe Potenzreihen und weitere komplexe Funktionen Definition.) komplexe Folgen: z n = x n + j. y n mit zwei reellen Folgen x n und y n.) Konvergenz: Eine komplexe Folge z n = x n + j. y n heißt

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Lineare Gleichungssysteme

Lineare Gleichungssysteme Brückenkurs Mathematik TU Dresden 2015 Lineare Gleichungssysteme Schwerpunkte: Modellbildung geometrische Interpretation Lösungsmethoden Prof. Dr. F. Schuricht TU Dresden, Fachbereich Mathematik auf der

Mehr

Varianzanalyse (ANOVA: analysis of variance)

Varianzanalyse (ANOVA: analysis of variance) Varianzanalyse (AOVA: analysis of variance) Einfaktorielle VA Auf der Basis von zwei Stichproben wird bezüglich der Gleichheit der Mittelwerte getestet. Variablen müssen Variablen nur nominalskaliert sein.

Mehr

Grundlagen der höheren Mathematik Einige Hinweise zum Lösen von Gleichungen

Grundlagen der höheren Mathematik Einige Hinweise zum Lösen von Gleichungen Grundlagen der höheren Mathematik Einige Hinweise zum Lösen von Gleichungen 1. Quadratische Gleichungen Quadratische Gleichungen lassen sich immer auf die sog. normierte Form x 2 + px + = 0 bringen, in

Mehr

LSF-Anleitung für Studierende

LSF-Anleitung für Studierende LSF-Anleitung für Studierende 1. Veranstaltungen Beim Anklicken der Option Veranstaltung finden Sie unter der Navigationsleiste: Vorlesungsverzeichnis Suche nach Veranstaltungen Stundenpläne Stundenpläne

Mehr

Um zusammenfassende Berichte zu erstellen, gehen Sie folgendermaßen vor:

Um zusammenfassende Berichte zu erstellen, gehen Sie folgendermaßen vor: Ergebnisreport: mehrere Lehrveranstaltungen zusammenfassen 1 1. Ordner anlegen In der Rolle des Berichterstellers (siehe EvaSys-Editor links oben) können zusammenfassende Ergebnisberichte über mehrere

Mehr

Folgeanleitung für Fachlehrer

Folgeanleitung für Fachlehrer 1. Das richtige Halbjahr einstellen Folgeanleitung für Fachlehrer Stellen sie bitte zunächst das richtige Schul- und Halbjahr ein. Ist das korrekte Schul- und Halbjahr eingestellt, leuchtet die Fläche

Mehr

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift:

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift: 20-minütige Klausur zur Vorlesung Lineare Modelle im Sommersemester 20 PD Dr. Christian Heumann Ludwig-Maximilians-Universität München, Institut für Statistik 2. Oktober 20, 4:5 6:5 Uhr Überprüfen Sie

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 9B a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Man kann erwarten, dass der Absatz mit steigendem Preis abnimmt, mit höherer Anzahl der Außendienstmitarbeiter sowie mit erhöhten

Mehr

Leseprobe. Wilhelm Kleppmann. Versuchsplanung. Produkte und Prozesse optimieren ISBN: 978-3-446-42033-5. Weitere Informationen oder Bestellungen unter

Leseprobe. Wilhelm Kleppmann. Versuchsplanung. Produkte und Prozesse optimieren ISBN: 978-3-446-42033-5. Weitere Informationen oder Bestellungen unter Leseprobe Wilhelm Kleppmann Versuchsplanung Produkte und Prozesse optimieren ISBN: -3-44-4033-5 Weitere Informationen oder Bestellungen unter http://www.hanser.de/-3-44-4033-5 sowie im Buchhandel. Carl

Mehr

Lineare Gleichungssysteme

Lineare Gleichungssysteme Lineare Gleichungssysteme Eines der am häufigsten auftretenden Standardprobleme der angewandten Mathematik ist das Lösen linearer Gleichungssysteme, etwa zur Netzwerkberechnung in der Elektrotechnik oder

Mehr

Das Vermögen der privaten Haushalte in Nordrhein-Westfalen ein Überblick auf der Basis der Einkommens- und Verbrauchsstichprobe

Das Vermögen der privaten Haushalte in Nordrhein-Westfalen ein Überblick auf der Basis der Einkommens- und Verbrauchsstichprobe Sozialberichterstattung NRW. Kurzanalyse 02/2010 09.07.2010 12.07.2010 Das Vermögen der privaten Haushalte in Nordrhein-Westfalen ein Überblick auf der Basis der Einkommens- und Verbrauchsstichprobe 2008

Mehr

3.1. Die komplexen Zahlen

3.1. Die komplexen Zahlen 3.1. Die komplexen Zahlen Es gibt viele Wege, um komplexe Zahlen einzuführen. Wir gehen hier den wohl einfachsten, indem wir C R als komplexe Zahlenebene und die Punkte dieser Ebene als komplexe Zahlen

Mehr

Berechnung der Erhöhung der Durchschnittsprämien

Berechnung der Erhöhung der Durchschnittsprämien Wolfram Fischer Berechnung der Erhöhung der Durchschnittsprämien Oktober 2004 1 Zusammenfassung Zur Berechnung der Durchschnittsprämien wird das gesamte gemeldete Prämienvolumen Zusammenfassung durch die

Mehr

Werbemittelverwaltung

Werbemittelverwaltung Werbemittelverwaltung 1 Inhaltsverzeichnis Werbemittelverwaltung...1 Ihr Nutzen...3 Notwendige Stammdateneinstellungen...4 Das Anlegen einer Gruppe:... 4 Das Anlegen der Gruppeneinträge (Auswahl):... 4

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt

Mehr

Excel 2013. Fortgeschrittene Techniken. Peter Wies. 1. Ausgabe, März 2013 EX2013F

Excel 2013. Fortgeschrittene Techniken. Peter Wies. 1. Ausgabe, März 2013 EX2013F Excel 2013 Peter Wies 1. Ausgabe, März 2013 Fortgeschrittene Techniken EX2013F 15 Excel 2013 - Fortgeschrittene Techniken 15 Spezielle Diagrammbearbeitung In diesem Kapitel erfahren Sie wie Sie die Wert-

Mehr

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster Es gibt in Excel unter anderem die so genannten Suchfunktionen / Matrixfunktionen Damit können Sie Werte innerhalb eines bestimmten Bereichs suchen. Als Beispiel möchte ich die Funktion Sverweis zeigen.

Mehr

Plotten von Linien ( nach Jack Bresenham, 1962 )

Plotten von Linien ( nach Jack Bresenham, 1962 ) Plotten von Linien ( nach Jack Bresenham, 1962 ) Ac Eine auf dem Bildschirm darzustellende Linie sieht treppenförmig aus, weil der Computer Linien aus einzelnen (meist quadratischen) Bildpunkten, Pixels

Mehr

Hilfe zur Urlaubsplanung und Zeiterfassung

Hilfe zur Urlaubsplanung und Zeiterfassung Hilfe zur Urlaubsplanung und Zeiterfassung Urlaubs- und Arbeitsplanung: Mit der Urlaubs- und Arbeitsplanung kann jeder Mitarbeiter in Coffee seine Zeiten eintragen. Die Eintragung kann mit dem Status anfragen,

Mehr

Prüfung eines Datenbestandes

Prüfung eines Datenbestandes Prüfung eines Datenbestandes auf Abweichungen einzelner Zahlen vom erwarteten mathematisch-statistischen Verhalten, die nicht mit einem Zufall erklärbar sind (Prüfung auf Manipulationen des Datenbestandes)

Mehr

Standard-Kontaktformular

Standard-Kontaktformular Online-Tutorials Referat VI.5 Internetdienste Standard-Kontaktformular Legen Sie ein neues Dokument an Klicken Sie die Datei an, unter der Sie das Kontaktformular anlegen möchten Legen Sie über Datei >

Mehr

Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER

Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER Abamsoft Finos in Verbindung mit der Webshopanbindung wurde speziell auf die Shop-Software shop to date von DATA BECKER abgestimmt. Mit

Mehr

Quantitative Methoden der Bildungsforschung

Quantitative Methoden der Bildungsforschung Glieung Wieholung Korrelationen Grundlagen lineare Regression Lineare Regression in SPSS Übung Wieholung Korrelationen Standardisiertes Zusammenhangsmaß (unstandardisiert: Kovarianz) linearer Zusammenhang

Mehr

Lavid-F.I.S. Ablaufbeschreibung für. Arbeitszeiterfassung. Lavid-F.I.S.

Lavid-F.I.S. Ablaufbeschreibung für. Arbeitszeiterfassung. Lavid-F.I.S. Lavid-F.I.S. Ablaufbeschreibung für Dauner Str. 12, D-41236 Mönchengladbach, Tel. 02166-97022-0, Fax -15, Email: info@lavid-software.net 1. Inhalt 1. Inhalt... 2 2. Verwendbar für... 3 3. Aufgabe... 3

Mehr

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel Ausarbeitung zum Proseminar Finanzmathematische Modelle und Simulationen bei Raphael Kruse und Prof. Dr. Wolf-Jürgen Beyn zum Thema Simulation des Anlagenpreismodels von Simon Uphus im WS 09/10 Zusammenfassung

Mehr

Kapitalerhöhung - Verbuchung

Kapitalerhöhung - Verbuchung Kapitalerhöhung - Verbuchung Beschreibung Eine Kapitalerhöhung ist eine Erhöhung des Aktienkapitals einer Aktiengesellschaft durch Emission von en Aktien. Es gibt unterschiedliche Formen von Kapitalerhöhung.

Mehr

3. LINEARE GLEICHUNGSSYSTEME

3. LINEARE GLEICHUNGSSYSTEME 176 3. LINEARE GLEICHUNGSSYSTEME 90 Vitamin-C-Gehalt verschiedener Säfte 18,0 mg 35,0 mg 12,5 mg 1. a) 100 ml + 50 ml + 50 ml = 41,75 mg 100 ml 100 ml 100 ml b) : Menge an Kirschsaft in ml y: Menge an

Mehr

Berichte über Stammdaten Klassen

Berichte über Stammdaten Klassen Das Softwarehaus für Schulen Berichte über Stammdaten Klassen Stand: 04 / 2012 Lehrer der Klasse Stundenwünsche Tageswünsche Unbestimmte zusätzliche Tageswünsche Zeitwünsche: Lehrer der Klasse PEDAV :

Mehr

teischl.com Software Design & Services e.u. office@teischl.com www.teischl.com/booknkeep www.facebook.com/booknkeep

teischl.com Software Design & Services e.u. office@teischl.com www.teischl.com/booknkeep www.facebook.com/booknkeep teischl.com Software Design & Services e.u. office@teischl.com www.teischl.com/booknkeep www.facebook.com/booknkeep 1. Erstellen Sie ein neues Rechnungsformular Mit book n keep können Sie nun Ihre eigenen

Mehr

3. GLIEDERUNG. Aufgabe:

3. GLIEDERUNG. Aufgabe: 3. GLIEDERUNG Aufgabe: In der Praxis ist es für einen Ausdruck, der nicht alle Detaildaten enthält, häufig notwendig, Zeilen oder Spalten einer Tabelle auszublenden. Auch eine übersichtlichere Darstellung

Mehr

LinguLab GmbH. Bedienungsanleitung Allgemeine Definition

LinguLab GmbH. Bedienungsanleitung Allgemeine Definition LinguLab GmbH Bedienungsanleitung Allgemeine Definition LinguLab GmbH T: +49.711.49030.370 Maybachstr. 50 F: +49.711.49030.22.370 70469 Stuttgart E: mba@lingulab.de I: www.lingulab.de Inhaltsverzeichnis

Mehr