Empirischer Vergleich alternativer Ansätze zur Verbundanalyse im Marketing. 1. Verbundproblematik und Entscheidungsunterstützung



Ähnliche Dokumente
Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Lineare Gleichungssysteme

Verkürzungsfaktor bei Antennen und Koax-Leitungen

Informationsblatt Induktionsbeweis

4. BEZIEHUNGEN ZWISCHEN TABELLEN

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Professionelle Seminare im Bereich MS-Office

DNotI. Fax - Abfrage. GrEStG 1 Abs. 3 Anteilsvereinigung bei Treuhandverhältnissen. I. Sachverhalt:

Berechnung der Erhöhung der Durchschnittsprämien

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

13. Lineare DGL höherer Ordnung. Eine DGL heißt von n-ter Ordnung, wenn Ableitungen y, y, y,... bis zur n-ten Ableitung y (n) darin vorkommen.

DAS PARETO PRINZIP DER SCHLÜSSEL ZUM ERFOLG

Leistungskurs Physik (Bayern): Abiturprüfung 2002 Aufgabe III Atomphysik

OECD Programme for International Student Assessment PISA Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

2.1 Präsentieren wozu eigentlich?

Mean Time Between Failures (MTBF)

Pädagogik. Melanie Schewtschenko. Eingewöhnung und Übergang in die Kinderkrippe. Warum ist die Beteiligung der Eltern so wichtig?

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Charakteristikum des Gutachtenstils: Es wird mit einer Frage begonnen, sodann werden die Voraussetzungen Schritt für Schritt aufgezeigt und erörtert.

Anwendungshinweise zur Anwendung der Soziometrie

Physik. Lichtgeschwindigkeit

Info zum Zusammenhang von Auflösung und Genauigkeit

Politikverständnis und Wahlalter. Ergebnisse einer Studie mit Schülern und Studienanfängern

Änderung des IFRS 2 Anteilsbasierte Vergütung

Erstellen von x-y-diagrammen in OpenOffice.calc

Portfolio zur Analyse der Personalqualität

Erfahrungen mit Hartz IV- Empfängern

Neun Strategien der Partnerarbeit

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Alle Schlüssel-Karten (blaue Rückseite) werden den Schlüssel-Farben nach sortiert und in vier getrennte Stapel mit der Bildseite nach oben gelegt.

Software- und Druckerzuweisung Selbstlernmaterialien

Was sind Jahres- und Zielvereinbarungsgespräche?

Gleichungen Lösen. Ein graphischer Blick auf Gleichungen

Glaube an die Existenz von Regeln für Vergleiche und Kenntnis der Regeln

Höhenmessung mittels Seeinterferometer unter Ausnutzung der solaren Radiostrahlung

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse Lösung 10 Punkte

Klausuraufgaben, Prüfungsleistung 06/08, Wirtschaftsmathematik, Betriebswirtschaft

Energetische Klassen von Gebäuden

Prozentrechnung. Wir können nun eine Formel für die Berechnung des Prozentwertes aufstellen:

1 Einleitung. 1.1 Motivation und Zielsetzung der Untersuchung

Persönliche Zukunftsplanung mit Menschen, denen nicht zugetraut wird, dass sie für sich selbst sprechen können Von Susanne Göbel und Josef Ströbl

Verband der TÜV e. V. STUDIE ZUM IMAGE DER MPU

Wir machen uns stark! Parlament der Ausgegrenzten

So funktioniert das online-bestellsystem GIMA-direkt

SUDOKU - Strategien zur Lösung

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Portfolio: "Kabale und Liebe" von Friedrich von Schiller

Lange Nacht der Wissenschaft. Ein Klassiker. Die Mathematik der Kürzesten Wege

Behörde für Bildung und Sport Abitur 2008 Lehrermaterialien zum Leistungskurs Mathematik

Repetitionsaufgaben Wurzelgleichungen

1. Einführung Erstellung einer Teillieferung Erstellung einer Teilrechnung 6

1 Mathematische Grundlagen

Übungsaufgaben Tilgungsrechnung

Die Bedeutung der Kinder für ihre alkoholabhängigen Mütter

Wichtiges Thema: Ihre private Rente und der viel zu wenig beachtete - Rentenfaktor

Wachstum 2. Michael Dröttboom 1 LernWerkstatt-Selm.de

Mobile Intranet in Unternehmen

[Customer Service by KCS.net] KEEPING CUSTOMERS SUCCESSFUL

Anzeige von eingescannten Rechnungen

Grundlagen der Theoretischen Informatik, SoSe 2008

L10N-Manager 3. Netzwerktreffen der Hochschulübersetzer/i nnen Mannheim 10. Mai 2016

Kreativ visualisieren

Gutes Leben was ist das?

Primzahlen und RSA-Verschlüsselung

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Abi-Retter-Strategien: Texterörterung. Das komplette Material finden Sie hier:

Approximation durch Taylorpolynome

Straf-Taten sind kriminelle Handlungen und Gewalt-Taten.

Lineare Funktionen. 1 Proportionale Funktionen Definition Eigenschaften Steigungsdreieck 3

1 topologisches Sortieren

Bedienungsanleitung Anlassteilnehmer (Vereinslisten)

Grundlagen der Kostenbestimmung

Widerrufsbelehrung der Free-Linked GmbH. Stand: Juni 2014

Teamentwicklung. Psychologische Unternehmensberatung Volker Rudat

2.5.2 Primärschlüssel

Algorithmen und Datenstrukturen. Große Übung vom Nils Schweer

Buchhaltung mit WISO EÜR & Kasse 2011

Trainingsplan 16-wöchiger Trainingsplan für einen Triathlon (Volkstriathlon), Einsteiger

Anleitung über den Umgang mit Schildern

Anleitung Postfachsystem Inhalt

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Lösungsmethoden gewöhnlicher Differentialgleichungen (Dgl.)

Was ist das Budget für Arbeit?

Konzentration auf das. Wesentliche.

Lineare Algebra und Lösung linearer zeitinvarianter Differentialgleichungssysteme

Business Page auf Facebook

1 MIO ÖSTERREICHISCHE SKIFAHRER SCHÜTZEN SICH BEREITS MIT HELM - UM MEHR ALS IM VORJAHR

Die nächste Übung ist vom auf den verlegt worden.

Daten sammeln, darstellen, auswerten

Qualitätsbereich. Mahlzeiten und Essen

Im Jahr t = 0 hat eine Stadt Einwohner. Nach 15 Jahren hat sich die Einwohnerzahl verdoppelt. z(t) = at + b

Anleitung Scharbefragung

Widerrufrecht bei außerhalb von Geschäftsräumen geschlossenen Verträgen

QM: Prüfen -1- KN

Kurzanleitung für eine erfüllte Partnerschaft

TESTEN SIE IHR KÖNNEN UND GEWINNEN SIE!

Projekt- Management. Landesverband der Mütterzentren NRW. oder warum Horst bei uns Helga heißt

Was taugt der Wertpapierprospekt für die Anlegerinformation?

RMeasy das SAP IS U Add On für Versorgungsunternehmen. Optimieren Sie Ihre Prozesse in Kundengewinnung und Kundenbindung.

Tipp III: Leiten Sie eine immer direkt anwendbare Formel her zur Berechnung der sogenannten "bedingten Wahrscheinlichkeit".

Spielanleitung. Art.-Nr.: Spieleautoren: Arno Steinwender und Christoph Puhl

Projektmanagement in der Spieleentwicklung

Transkript:

Emirisher Vergleih alternativer Ansätze zur Verbundanalyse im Marketing 99 Emirisher Vergleih alternativer Ansätze zur Verbundanalyse im Marketing Reinhold Deker Lehrstuhl für BWL und Marketing, Universität Bielefeld, 33501 Bielefeld E-Mail: rdeker@wiwi.uni-bielefeld.de Abstrat Der vorliegende Beitrag beshäftigt sih mit alternativen Ansätzen zur Analyse des Kaufverbundes. Kern der Arbeit ist die emirishe Überrüfung der Eignung der in SAS imlementierten Ansätze für die raktishe Entsheidungsunterstützung im Einzelhandelsmarketing auf Basis realer POS- Sannerdaten. Im Einzelnen rihten sih die Betrahtungen auf das seit vielen Jahren etablierte Konzet der Assoziationskoeffizienten (inklusive bedingter Wahrsheinlihkeiten, auf die aus der aktuellen Data Mining-Diskussion bekannten Assoziationsregeln und auf einen neuen Ansatz auf Basis von Self-organizing MasText 1. Verbundroblematik und Entsheidungsunterstützung Kaufverbund bezeihnet ein aufgrund bereits realisierter Kaufakte entstandenes und bei entsrehender Datenverfügbarkeit auh identifizierbares Beziehungsgefleht zwishen einzelnen Teilen eines Warensortiments. Die Relevanz dieser Thematik für das Marketing resultiert aus ihrem besonderen Stellenwert für die im Einzelhandel alltäglih zu treffenden Sortiments- und Platzierungsentsheidungen, ihrer Affinität zur Preisfestsetzung und der Tatsahe, dass ein gezieltes Category Management ohne fundierte Verbundkenntnisse niht wirklih sinnvoll zu betreiben ist. Die hieraus abzuleitenden Anforderungen an die Verbundanalyse bzw. -modellierung umfassen zum einen die grundsätzlihe Fähigkeit zur Aufdekung der relevanten Sortimentsbeziehungen und zum anderen die Möglihkeit der geeigneten Dokumentation bzw. Visualisierung derselben als Grundlage für eine raxisnahe Entsheidungsvorbereitung. Ein zentrales und bis dato noh niht zur Gänze gelöstes Problem besteht allerdings im zuverlässigen Nahweis entsrehender Beziehungen. Um diesem Ansruh gereht werden zu können, bedarf es zunähst einmal geeigneter Datengrundlagen. Zum gegenwärtigen Zeitunkt sind das in erster Linie die heute shon fast in allen größeren Einzelhandelsgeshäften uasi als Nebenrodukt des Kassiervorganges anfallenden Point-of-Sales (POS-Sannerdaten (im folgenden kurz als Sannerdaten bezeihnet. Aber auh das beste Datenmaterial ist für die Entsheidungsunterstützung im Hinblik auf die oben genannten Asekte ohne geeignete Auswertungswerkzeuge nahezu wertlos. Insoweit ersheint es auh niht überrashend, dass sih die Marketingforshung in der Vergangenheit shwerunktmäßig auf die Modifikation bzw. Erweiterung des verfügbaren Instrumentariums konzentriert hat. Dennoh besteht in der einshlägigen Literatur bis heute weitgehend Uneinigkeit bzw. Ungewissheit im Hinblik auf die vielzitierte Best Pratie. Umfassende emirishe Gegenüberstellungen unter Einbeziehung der neueren Ansätze sind bis dato noh so gut wie niht verfügbar. Erwähnenswert sheinen in diesem Zusammenhang allenfalls die entsrehenden Ausführungen bei Shmalen et al. (1996. In jüngster Vergangenheit ist die uantitative Verbundforshung durh vershiedene Arbeiten zum Data Mining und zum Knowledge Disovery in Databases, die den Kaufverbund gerne als Paradebeisiel für eine entsrehende raktishe Problemstellung heranziehen, erneut in den Mittelunkt des Interesses gerükt. Tabelle 1 gibt einen ersten Eindruk von der Breite des zwishenzeitlih verfügbaren Instrumentensektrums.

100 5. KSFE 001 in Hohenheim - Vorträge Setzt man sih intensiver mit der einshlägigen Literatur zur Verbundanalyse auseinander, so erkennt man shnell, dass das Gros der bisher ershienenen Publikationen aus dem deutshsrahigen Raum stammt. Autoren wie Böker (1975, 1978 und Merkle (1981, die sih rimär mit dem Konzet der Verbundkoeffizienten beshäftigten, sowie Hrushka (1991 und Lukanowiz, Buhta (199, deren einshlägige Forshungsbemühungen sih auf entsrehende Anwendungen des multivariaten Logitmodells konzentrierten, aber auh Agrawal, Imielinski, Swami (1993, deren Augenmerk auf der Nutzung von Assoziationsregeln lag, haben durh ihre Arbeiten maßgeblih zum heutigen Stand der Entwiklung beigetragen. Modellierung der Verbundbeziehung: Visualisierung der Verbundbeziehung: Sehziger/Siebziger Jahre Ahtziger Jahre Neunziger Jahre Kreuzelastizitäten Lineare Programmierung Modell der bedingten Wahrsheinlihkeiten Assoziationskoeffizienten Korrelationsmodelle Lineare Regression Multidimensionale Skalierung Clusteranalyse Faktorenanalyse Polynomial-Lag- Regression Logistishe Regression Multivariate Logitmodelle Neuronale Netze Binomialverteilungsmodell Assoziationsregeln Self-organizing mas Hyergrahen Tabelle 1: Instrumente der uantitativen Verbundanalyse. Verwendete Datengrundlage Um sih bei der Gegenüberstellung der Ansätze niht auf theoretishe Asekte beshränken zu müssen, wurde für die nahfolgenden emirishen Betrahtungen ein eigens aufbereiteter Datensatz herangezogen. Hierbei handelt es sih um reale Sannerdaten aus dem Konsumgüterbereih, die sih wie in Tabelle dargestellt harakterisieren lassen. Lf. Nr. Warengrue (WG WG-Nr. 1 Haarshamoos 6 Haarsülungen 9 3 Haarkuren 1 4 Tamons 30 5 Damenbinden 33 6 Katzennahrung 69 7 Belohnungen (für Hund/Katze 70 8 Säfte (für Kleinkinder 183 9 Desserts (für Kleinkinder 186 10 Gemüse (für Kleinkinder 189 11 Juniorkost 195 1 Kindermenüs 198 Lf. Nr. Warengrue (WG WG-Nr. 13 Gebissreiniger 14 Gebisshaftmittel 5 15 Sonnenshutzmittel 40 16 After Sun Lotions 41 17 Nassrasiermittel 36 18 Klingen für Nassrasierer 39 19 Shlankheitskost 356 0 Fitnesskost 36 1 Hustenbonbons 364 Kaugummi 366 3 Herz- und Nerventonikum 368 4 Augenmakeu 56 5 Lienflege 563 Tabelle : Sannerdaten aus dem bundesdeutshen Einzelhandel Die in insgesamt mehr als 7.500 Warenkörben resektive Einkäufen beobahteten (und vom Verfasser gezielt ausgewählten 5 Warengruen lassen individuelle Kaufverbünde wahrsheinlih ersheinen. So ist z.b. zu vermuten, dass die Nahrungsmittel für Kleinkinder, d.h. die Warengruen 183 bis 189, aufgrund ihrer Zielgruensezifität und ihres mutmaßlih komlementären Charakters durhaus häufiger gemeinsam in einem Warenkorb auftreten werden. Als Käufer dürften hier wohl vorwiegend jüngere Konsumenten und Konsumentinnen in Frage kommen. In analoger Weise srehen die Gebissflegemittel, d.h. die Warengruen und 5, wohl eher eine ältere Klientel an. Eine ausgerägte

Emirisher Vergleih alternativer Ansätze zur Verbundanalyse im Marketing 101 Verbundbeziehung zu dem zuvor genannten Kindernahrungsmittelsortiment sheint hier eher unwahrsheinlih. Die Warengruen 364 (Hustenbonbons und 366 (Kaugummi shließlih stellen tyishe Mitnahmerodukte dar, die an der Kasse häufig sontan in den Warenkorb wandern. Eine starke Verbundbeziehung zu den anderen, in der Tabelle aufgelisteten Warengruen ist hier wohl niht zu vermuten. 3. Vergleihende Darstellung alternativer Analyseansätze Bevor wir uns dem ersten der drei zu betrahtenden Messkonzete zuwenden, sollen zunähst noh einige wihtige Bezeihner eingeführt werden. Es sei I { i 1, Κ, i k, Κ, i n } eine Menge von Items (im vorliegenden Fall Warengruen, die auf Verbundbeziehungen hin untersuht werden sollen. Die Menge der betrahteten Transaktionen resektive Warenkörbe T j I ( j 1, Κ, m wird mit W und ein damit korresondierender Transaktionsvektor mit t t, Κ, t, Κ, t ρ bezeihnet, wobei gilt: j ( j1 jk jn 1, falls ik T j t jk j, k 0, sonst Ergänzend sei noh angemerkt, dass die Menge I nur jene Items enthält, die in mindestens einer der betrahteten Transaktionen vorkommen und dass auh Transaktionen mit nur einem Item Berüksihtigung finden. 3.1 Verbundmessung auf Basis von Assoziationskoeffizienten Die seit a. 30 Jahren bekannte Verbundmessung mittels Assoziationskoeffizienten stellt wahrsheinlih das in der Vergangenheit am intensivsten (wissenshaftlih diskutierte Konzet dieser Art dar. Ausgangsunkt ist hierbei die Annahme symmetrisher Verbundbeziehungen 1. Als Basis für die Modellierung der Verbundbeziehungen wird hier die sogenannte Freuenzmatrix m F ( f kl k, l 1, Κ n mit t t falls k l f j jk jl, 1 kl 0, sonst herangezogen, mit der die Häufigkeit des gemeinsamen Auftretens zweier untershiedliher Items in den Transaktionen erfasst wird. Aus der Freuenzmatrix können aarweise Vierfeldertafeln (sogenannte Plasmoden generiert werden, die ihrerseits die Grundlage für die sih anshließende Gruenbildung darstellen. Die im Folgenden zugrunde gelegte Struktur dieser Tafeln wird durh Abbildung 1 veranshauliht. 1 Eine ausführlihe Diskussion der Symmetrieroblematik in der Verbundanalyse findet sih bereits bei Böker (1978. Der neueren Literatur folgend beshränken sih die weiteren Betrahtungen auf die ungewihtete Einzählung.

10 5. KSFE 001 in Hohenheim - Vorträge Item i l Item i k 1 0 1 a b a + b 0 d + d a + b + d a + b + + d Legende: Feld a: Anzahl der Transaktionen, die Item i k und Item i l enthalten Feld b: Feld : Feld d:... Item i l, aber niht Item i k enthalten... Item i k, aber niht Item i l enthalten... weder Item i k noh Item i l enthalten Abbildung 1: Allgemeiner Aufbau einer Vierfeldertafel Entsheidend für die hieraus generierbare Verbundaussage ist allerdings die Wahl des die aarweisen Verbundintensitäten zum Ausdruk bringenden Verbundmaßes. Der für die weiteren Berehnungen herangezogene Tanimoto-Koeffizient v a kl a + b + mit 0 v kl 1 k, l gilt als eines der für die vorliegende Problemstellung am besten geeigneten Maße 3. Die in der resultierenden Ähnlihkeitsmatrix verborgenen Verbundbeziehungen können sodann mittels hierarhisher Clusteranalyse sihtbar gemaht werden. Die bei diesem Ansatz unterstellte Symmetrie der Verbundbeziehungen muss allerdings keineswegs immer angemessen sein. Eine naheliegende Möglihkeit der exliziten Modellierung asymmetrishen Verbundes stellt die ebenfalls bereits in den siebziger Jahren in die Diskussion eingebrahte Verwendung bedingter Wahrsheinlihkeiten dar. Die Wahrsheinlihkeit eines Kaufes von Item i k in Abhängigkeit von einem Kauf des Items i l lässt sih direkt aus der bereits erwähnten Vierfeldermatrix bestimmen. Es gilt nämlih a a P( ik il mit 0 P ( i k il 1 und P( il ik mit 0 P ( i l ik 1 a + b a + Aus dem analog zu erhaltenden Erwartungswert für Feld a 4 : E( a P( il P( ik ( a + b + + d a + b a + ( a + b( a + ( a + b + + d a + b + + d a + b + + d a + b + + d lassen sih Aussagen über die Art einer mögliherweise bestehenden Verbundbeziehung ableiten. Für komlementären Verbund muss gelten: ad b a > E( a ad > b > 1 ( odds ratio d > b a während im Falle von a E(a von einem zufälligen Mitnahmeeffekt auszugehen ist. Der Tatbestand der zufälligen Mitnahme kann dabei, Böker (1978 folgend, als die stohastishe Unabhängigkeit zweier Ereignisse resektive zweier Kaufhandlungen verstanden werden. Man erkennt den sih hieraus ergebenden Skaleneffekt irrelevanter Sortimentsteile. Aufgrund der in aller Regel starken Dominanz des Feldes d, d.h. der Anzahl an beobahteten Nihtkäufen des gerade betrahteten Item-Paares, sheidet im 3 Vgl. hierzu auh Bordemann (1985, S. 6. 4 Vgl. hierzu auh Shmalen et al. (1996, S. 16 f..

Emirisher Vergleih alternativer Ansätze zur Verbundanalyse im Marketing 103 vorliegenden Fall der nahe liegende Chi-Quadrat-Test auf Unabhängigkeit als Instrument zur Quantifizierung bestehender Verbundbeziehungen aus. Wendet man die skizzierte Vorgehensweise auf die eingangs vorgestellten Sannerdaten an, so kommt man, wie Abbildung zu entnehmen ist, je nah gewähltem Clusteralgorithmus, zu auf den ersten Blik reht untershiedlih anmutenden Dendrogrammen. Die in den Grahiken verwendeten Nummerierungen entsrehen denen aus obiger Datenbeshreibung. Bei genauerem Hinsehen erkennt man allerdings die nahezu völlige Übereinstimmung der berehneten Gruierungen. Aufgrund der ausgerägteren Hierarhiestruktur ist die Ward-Lösung allerdings einer inhaltlihen Interretation leihter zugänglih. So erkennt man dort z.b. sehr shön das Kindernahrungsmittelluster (laufende Nr. 8 bis 1 im unteren Bereih des Dendrogramms. Ebenfalls sehr gut zu erkennen ist das Senioren-Zahnflegeluster (laufende Nr. 13 und 14, das in durhaus nahvollziehbarer Weise auh noh die Warengrue Herz- und Nerventonikum (laufende Nr. 3 enthält. Insgesamt liegt eine sehr gute Reroduktion der a riori vermuteten Verbundbeziehungen innerhalb der jeweiligen Gruen vor. Dennoh verbleiben einige niht zu vernahlässigende Probleme. So ermögliht das skizzierte Verfahren z.b. noh niht die Herausrehnung zufälliger Mitnahmeeffekte 5. Darüber hinaus hat natürlih auh die Wahl des Verbundkoeffizienten und die einshlägige Literatur geizt hier niht gerade mit Vorshlägen einen direkten Einfluss auf die resultierende Verbundaussage. Des Weiteren können stark untershiedlih besetzte Warengruen u.u. zu Ergebnisverzerrungen führen. Gleihzeitig ist die Vorgehensweise aber intuitiv lausibel und einsihtig. Alles in allem stellt das Konzet der Assoziationskoeffizienten in Verbindung mit der hierarhishen Clusteranalyse ein durhaus brauhbares, in der hier dargestellten traditionellen Form allerdings noh keinesfalls otimales Instrument zur Verbundmodellierung dar. 5 Ein mögliher Ansatz zur Identifikation zufälliger Mitnahmeeffekte auf Basis des Tanimoto- Koeffizienten wird in einer vom Verfasser gemeinsam mit H. Shimmelfennig zur Veröffentlihung eingereihten Arbeit dargestellt.

104 5. KSFE 001 in Hohenheim - Vorträge Abbildung : Dendrogramme einer Average Linkage- (links und einer Ward-Lösung (rehts für die vorliegenden Sannerdaten 3. Verbundmessung mittels Assoziationsregeln Eine wahre Renaissane hat die Verbundforshung Mitte der neunziger Jahre im Zusammenhang mit anwendungsorientierten Publikationen zum Data Mining mittels Assoziationsregeln erfahren. Bei diesem Ansatz bedarf es keiner exliziten Annahme über die Symmetrieeigenshaften der betrahteten Verbundbeziehungen. Mit A, B I können in bekannter Weise der Suort 6 { T W ( A B T} su( A B W und die Konfidenz { T W ( A B T} onf ( A B { T W A T} einer Regel A B angegeben werden. Eine Verbundbeziehung zwishen A und B wird genau dann als möglih erahtet, wenn beide Größen vorzugebende Mindestniveaus übershreiten. Allgemein gilt: onf ( A B su( A B 6 Vgl. hierzu auh Agrawal, Srikant (1994 und Bollinger (1996. Der Übersihtlihkeit halber wird im Folgenden auf eine Indizierung von T verzihtet.

Emirisher Vergleih alternativer Ansätze zur Verbundanalyse im Marketing 105 Wie sih leiht zeigen lässt, handelt es sih beim Suort um ein symmetrishes, bei der Konfidenz hingegen um ein asymmetrishes Verbundmaß, was letzteres im Verbundkontext auh interessanter ersheinen lässt. Es gilt nämlih: aber su( A B su( B A onf( A B onf( B A, falls { T W A T} { T W B T} Ein besonderes Problem bei der Anwendung des Konzets der Assoziationsregeln stellt die Bestimmung der unter Verbundgesihtsunkten tatsählih interessanten Regeln dar. Erste Anhaltsunkte in dieser Rihtung liefern vershiedene in der Literatur vorgestellte Maße. Der sogenannte Lift onf ( A B lift( A B su( B beisielsweise gibt an, um wie viel häufiger bzw. seltener der Regelkof B unter der Voraussetzung des Eintretens von A eintritt als dies in der Grundgesamtheit der Fall ist. Von einer Verbundbeziehung wird ausgegangen, wenn der Lift größer als 1 ist. Die sogenannte Convition su( A su( B onv( A B su( A B liefert darüber hinaus Hinweise auf die Rihtung der zwishen A und B bestehenden Abhängigkeit, wobei der Suort von B den Anteil der Transaktionen an allen Transaktionen angibt, die die Item-Menge B niht enthalten. Die statistishe Signifikanz einer Regel shließlih kann mit einem Chi-Quadrat-Test auf Basis der Nullhyothese H 0 : A und B sind voneinander unabhängig. und der Teststatistik mit χ ( A B W A A, A A B B und B B 1, 1 ( su( A B su( A su( B t u t u 1 t 1 su( At su( Bu bei einem Freiheitsgrad überrüft werden. Setzt man den Mindest-Suort der Struktur des vorliegenden Datensatzes entsrehend mit einem Wert von 0,5 % und die Mindest-Konfidenz mit 10 % an, so können auf dieser Basis z.b. mit Hilfe des SAS Enterrise Miner eine Reihe interessanter Regeln generiert werden. Die gefundenen und in Tabelle 3 wiedergegebenen Regeln waren größtenteils aufgrund der vorausgegangenen Betrahtungen auh zu erwarten und bestätigen die Leistungsfähigkeit dieses Datenauswertungskonzetes im Verbundkontext. Die in der Tabelle aufgeführte Regelmenge zeigt keine allzu ausgerägte Asymmetrie in den einzelnen Verbundbeziehungen, was zumindest teilweise die guten Resultate der Verbundmessung auf Basis von Tanimoto-Koeffizient und Clusteranalyse zu erklären sheint. Aber auh die aufgetretenen Asymmetrien, z.b. die Warengruen 6 (Haarshamoos und 1 (Haarkuren betreffend sind unter Kaufverhaltensgesihtsunkten nahvollziehbar. Mit Blik auf die angegebenen Lift-Werte lassen sih einige besonders interessante Konstellationen identifizieren. Regeln, wie etwa die für die relativ hohreisige Warengruenkombination 41 und 40, erweisen sih trotz eines vergleihsweise geringen Suorts als sehr interessant. Offensihtlih entsheiden sih die Käufer von After Sun Lotions (Warengrue 41 auh regelmäßig für den Kauf von Sonnenshutzmitteln (Warengrue 40. Das Umgekehrte sheint jedoh niht der Fall zu sein, was aus Anwendersiht auh durhaus lausibel ist. Hier liegt also ganz offensihtlih eine gewisse Verbundasymmetrie vor, was hingegen aufgrund des vergleihsweise geringen Lift-Wertes bei der zuvor genannten Kombination 1 und 6 niht mit letzter Siherheit gesagt werden kann. Leider werden aber auh einige vom koeffizientenbasierten Ansatz mehr oder weniger deutlih aufgedekte Beziehungen im vorliegenden Fall niht zutage gefördert. Ein offensihtlihes Beisiel hierfür u

106 5. KSFE 001 in Hohenheim - Vorträge sind die bereits zitierten Gebissflegemittel aus den Warengruen und 5. Bemerkenswert ist shließlih noh die Tatsahe, dass bei den vorgegebenen Mindestniveaus für Suort und Konfidenz keine Regeln mit mehr als zwei Elementen generiert werden. Regel onf(. lift(. Regel onf(. lift(. 6 9 1,01,38 186 198 11,54 5,48 9 6 47,66,38 198 186 31,88 5,48 1 6 4,50 1, 1 9 11,39,5 39 36 16,96 3,67 9 1 11,98,5 36 39 4,50 3,67 195 198 8,69 13,63 186 189 18,10 8,04 198 195 1,88 13,63 189 186 46,78 8,04 189 183 19,88 5,10 195 186 57,38 9,86 36 356 11,07 7,6 186 195 15,84 9,86 183 189 11,49 5,10 186 183 15,38 3,95 356 36 9,31 7,6 183 186,97 3,95 195 183 15,57 4,00 563 56 17,85,65 195 189 11,48 5,10 56 563 1,33,65 41 9 11,76,33 69 70 11,55 3,17 41 30 11,76 1,9 70 69 0,94 3,17 41 40 11,76 18,63 41 39 11,76 1,76 Tabelle 3: Regeln und deren Wertigkeit (Suort 0,5 % und Konfidenz 10 % Senkt man den Mindest-Suort indes auf 0, % und erhöht man gleihzeitig die Mindest- Konfidenz auf 0 % (letzteres dient hier nur der Begrenzung der generierten Regelmenge, so erhält man ein deutlih gewandeltes Bild. Die in Tabelle 4 dargestellte Lösung zeigt nun eine doh reht ausgerägte Asymmetrie in einzelnen Verbundbeziehungen. Auffällig ist, dass die Warengrue 186 (Desserts für Kleinkinder bei den zweielementigen Regeln ausshließlih im Regelkof auftauht. Offensihtlih sind die anderen Kindernahrungsmittel im vorliegenden Fall Auslöser für den Kauf von Kinderdesserts. Das Umgekehrte sheint hingegen niht der Fall zu sein. Ein Blik auf die Regeln mit drei Warengruen legt sogar die Vermutung nahe, dass sih die in Abbildung so gut erkennbare Gruierung der Kindernahrungsmittel (resektive die Warengruen 183 bis 198 sehr wahrsheinlih im Wesentlihen aufgrund der Beziehungen zur Warengrue 186 gebildet hat. Regel onf(. lift(. Regel onf(. lift(. 9 6 47,66,38 9, 1 6 63,04 3,14 1 6 4,75 1, 6, 1 9 9,00 5,7 36 39 4,50 3,67 195, 198 186 57,14 9,80 189 186 46,78 8,04 186, 198 195 39, 4,36 195 186 57,38 9,86 186, 195 198 8,57 13,53 183 186,97 3,95 183, 189 186 47,06 8,07 70 69 0,94 3,17 183, 186 189 3,53 10,43 198 186 31,88 5,48 186, 189 183 0,00 5,1 195 198 8,69 13,63 198 195 1,88 13,63 356 36 9,31 7,6 Tabelle 4: Regeln und deren Wertigkeit (Suort 0, % und Konfidenz 0 % Abshließend kann festgehalten werden, dass sih das Konzet der Assoziationsregeln neben der Möglihkeit der Berehnung von Verbundbeziehungen zwishen mehr als zwei Items (auh untershiedliher Taxonomieebenen vor allem durh seine Anwendbarkeit auf

Emirisher Vergleih alternativer Ansätze zur Verbundanalyse im Marketing 107 große Datenmengen und die Differenzierbarkeit zwishen symmetrishem und asymmetrishem Verbund auszeihnet. Darüber hinaus ermögliht es die imlizite, d.h. über die Interessantheitsmaße gesteuerte Isolation zufälliger Mitnahmeeffekte. Als roblematish erweist sih hingegen wie auh die Gegenüberstellung der Inhalte von Tabelle 3 und 4 zeigt die zum Teil reht subjektive Festlegung der Mindestniveaus für Suort und Konfidenz. Alles in allem hat man es aber mit einem für die exloratorishe Analyse kleiner bis mittlerer Sortimente zweifellos sehr nützlihen Instrument zu tun, das die Entsheidungsbasis des Einzelhandelsmanagements zukünftig deutlih zu verbessern vermag. 3.3 Verbundmodellierung mittels Self-organizing Mas Abshließend soll noh kurz auf einen neuen Ansatz zur Modellierung von Verbundbeziehungen mittels sogenannter Self-organizing Mas (Kohonen-Netze, im folgenden mit SOM abgekürzt, eingegangen werden. Ausgangsunkt hierfür ist u.a. die Annahme, dass Verbundbeziehungen in ähnlihen Warenkorbmustern zum Ausdruk kommen und nur auf der Multi-Item-Ebene sinnvoll messbar sind. Die grundsätzlihe Idee dieser Form der Modellierung von Verbundbeziehungen bringt Abbildung 3 zum Ausdruk. 1 1 3 u 13 3 η 13 n i1 i ρ i k i n 1 t ( t11, t1, Κ, t1 Μ Μ ρ t t, t, Κ, t 1 n m ( m1 m mn Abbildung 3: Struktureller Aufbau eines 3x3-SOM-Modells Die Modellarameter η k der einzelnen SOM-Units werden dabei so bestimmt, dass sie die beobahteten Transaktionen resektive Warenkörbe bei gegebener Unit-Zahl im vorliegenden Fall wurde exemlarish von einem 3x3-Layer ausgegangen bestmöglih reräsentieren. D.h. jede Grue von sih ähnelnden Warenkörben wird nah Möglihkeit durh ein Tuel von Parametern (man sriht in diesem Zusammenhang auh von einem Prototyen reräsentiert. Die simultane Minimierung der die Clusterbildung ( Bestimmung des otimalen Prototyen-Systems { ρ η } und die toologishe Anordnung der Cluster ( Bestimmung der otimalen Anassung betreffenden Zielfunktionen 7 mit Min m ρ ρ m ρ ρ { } d( t j j, η min d( t 1 j 1 j, η,! 7 Zur generellen Methodik von SOM-Ansätzen siehe auh Reutterer (1997.

108 5. KSFE 001 in Hohenheim - Vorträge und mit Min ρ ρ ρ ρ d( t, η t η ( t η j j n k 1 ρ ρ n ρ ρ ( d ( η, η~ ~ ( η k η~ ~ k,,, ~ k ρ ρ ρ ρ ( η, η~ ~ η η~ d ~, ~ ~ jk ~ 1 k (Nahbarshaftsdistanz für Unit u! N ~ ~ ermögliht eine intuitiv lausible Interretation der resultierenden Karten unter Verbundgesihtsunkten. Hierbei kommen den einzelnen Bezeihnern die folgenden Bedeutungen zu: Das Tuel u 11, Κ, u, Κ, upq kennzeihnet die SOM-Units einer P Q - ρ Reräsentation. Der Vektor η η, η, Κ, η ' reräsentiert entsrehend die Kantengewihte für Unit u steht. u, während ( 1 n N für die Nahbarshaftsmenge von Winning-Unit Zwei Items stehen demnah in einer gegenseitigen Verbundbeziehung, wenn die betreffenden Kantengewihte einer Unit einen Wert nahe 1 aufweisen. In der vorliegenden Untersuhung wurde die Untergrenze für die Kantengewihte exemlarish auf 0,8 festgelegt. Darüber hinaus können aber auh Items benahbarter Units (mit entsrehend großen Parameterwerten als miteinander im Verbund stehend interretiert werden, da aufgrund der für die toologishe Struktur formulierten Otimierungsaufgabe zu erwarten ist, dass ähnlihe Prototyen durh benahbarte Units reräsentiert werden. Als Maß für die Güte der erzielten Reräsentation kann die Heterogenität ρ 1 m ρ ρ het { η } j d ( t 1 j, η m des Prototyen-Systems und die Einfahheit ρ ρ ρ siml η d ( η, η ~ ~ { }, der Toologie herangezogen werden. Beide Kenngrößen sollten möglihst klein sein. Wendet man den skizzierten SOM-Ansatz auf die Sannerdaten an, so liefert dies interessante Einblike in die bestehenden Verbundbeziehungen. Die größte Shwierigkeit stellt hierbei allerdings die geeignete Festlegung der relevanten Steuergrößen 8 und insbesondere die der Unit-Anzahl dar. Eine hinsihtlih beider Gütemaße (Heterogenität und Einfahheit zufriedenstellende und in Abbildung 4 dargestellte 8x8-Lösung liefert auh eine unter inhaltlihen Gesihtsunkten einsihtige Verbundstruktur. Dies lässt sih z.b. wieder an der geblokten Lage der Kindernahrungsmittel (Warengrue 183 bis 198 ebenso festmahen wie an der Gruierung der Tiernahrungsmittel (Warengrue 69 und 70 oder den Produkten für die Rasur (Warengrue 36 und 39. Als sehr lausibel kann auh die vergleihsweise breite Streuung der Mitnahmerodukte aus den Warengruen 364 (Hustenbonbons und 366 (Kaugummi bezeihnet werden. Der traditionelle Clusteransatz in der hier vorgestellten Form liefert in dieser Hinsiht hingegen keine tieferen Erkenntnisse. Die näherungsweise Zweiteilung der Zuordnung der Warengrue 56 (Augenmakeu zum einen, in Verbindung mit Warengrue 563 (Lienflege, zu den Haarflegemitteln und zum anderen zu den Kindernahrungsmitteln ist shließlih ebenso nahvollziehbar wie die wohl verwendungsbedingte Trennung der Hygienewarengruen 30 und 33. Letzteres sheint im übrigen ein gutes Beisiel für eine substitutive Beziehung zwishen zwei Warengruen zu sein. 8 Siehe hierzu auh die entsrehenden Angaben in Abbildung 4.

Emirisher Vergleih alternativer Ansätze zur Verbundanalyse im Marketing 109 Der SOM-Ansatz stellt somit gewissermaßen eine interretationserleihternde Erweiterung des traditionellen Clusteransatzes auf den mehrdimensionalen Fall dar. Die Identifikation zufälliger Mitnahmeeffekte sheint zumindest imlizit möglih. Leider stehen der inhaltlihen Plausibilität der SOM-Resultate unter raktishen Gesihtsunkten einige noh niht zur Gänze gelöste methodishe Probleme gegenüber. Hierzu zählen z.b. die Shwierigkeiten im Zusammenhang mit der statistishen Überrüfung der erzielten Resultate. Ein Asekt, dem gerade unter dem Blikwinkel einer möglihst zuverlässigen Entsheidungsunterstützung in Zukunft auf jeden Fall besondere Aufmerksamkeit zu shenken ist. Alles in allem stellt der SOM-Ansatz aber eine zweifellos interessante und ausbaufähige Alternative für die exloratorishe Verbundmodellierung dar. a/b 1 3 4 5 6 7 8 1 366 33 366 33 6 33 6 6 6 36 6 1 366 56 33 36 33 364 6 364 6 56 6 9 1 3 56 36 56 36 36 368 6 366 6 563 9 56 6 9 4 195 198 356 368 563 9 563 9 5 186 195 186 183 40 5 30 366 9 366 6 186 364 189 183 189 1 41 30 33 30 6 30 7 364 56 364 366 69 366 1 69 70 36 30 36 6 39 8 364 69 364 69 69 69 70 36 36 39 39 Ekdaten der Otimierung: Anzahl Iterationen: 1.000.000 Anteil zuordenbarer Warengruen: 100 % Startwert der Lernrate: 0,7 Heterogenität: 0,656 Nahbarshaftsarameter: 3 Einfahheit: 1,861 4. Fazit und Ausblik Abbildung 4: Verbundreräsentation mittels 8x8-Karte Die Verbundanalyse war in den letzten Jahrzehnten gekennzeihnet von einem steten Wandel des eingesetzten Instrumentariums. Fokussiert man hierbei auf den Stellenwert der einzelnen Ansätze für die raktishe Entsheidungsunterstützung im Einzelhandelsmarketing, so kann zumindest in der vorliegenden Untersuhung eine in jeder Hinsiht eindeutige Überlegenheit eines der betrahteten Instrumente niht festgestellt werden. Der Stringenz klassifizierender Ansätze steht die inhaltlihe Aussagekraft kausaler Modelle gegenüber. Für die Zukunft bleibt anzumerken, dass nah Ansiht des Verfassers vor allem ein dringender Bedarf an objektiven Qualitätskriterien für die Verbundmodellierung besteht. Darüber hinaus stellt die zuverlässige und möglihst vollständige Isolation zufälliger Mitnahmeeffekte aufgrund ihrer besonderen Relevanz für die Entsheidungsunterstützung auh weiterhin eine zentrale Herausforderung an die uantitative Verbundforshung dar. Literatur Agrawal, R.; T. Imielinski; A. Swami (1993: Mining Assoiation Rules between Sets of Items in Large Databases, in: Proeedings of the 1993 ACM SIGMOD International Conferene on Management of Data, Washington. Agrawal, R.; R. Srikant (1994: Fast Algorithms for Mining Assoiation Rules, in: Proeedings of the 0th International Conferene on Very Large Databases, Santiago, 487 499. Böker, F. (1975: Die Analyse des Kaufverbunds Ein Ansatz zur bedarfsorientierten Warentyologie, Zeitshrift für betriebswirtshaftlihe Forshung, Jg. 7, Heft 5, 90 306.

110 5. KSFE 001 in Hohenheim - Vorträge Böker, F. (1978: Die Bestimmung der Kaufverbundenheit von Produkten, Berlin. Bollinger, T. (1996: Assoziationsregeln Analyse eines Data Mining Verfahrens, Informatik-Sektrum, Jg. 19, Heft 5, 57 61. Bordemann, H.-G. (1985: Analyse von Verbundbeziehungen zwishen Sortimentsteilen im Einzelhandel, Duisburg. Hrushka, H. (1991: Bestimmung der Kaufverbundenheit mit Hilfe eines robabilistishen Messmodells, Zeitshrift für betriebswirtshaftlihe Forshung, Jg. 43, Heft 5, 418 434. Lukanowiz, M.; C. Buhta (199: Auswirkungen von absatzolitishen Maßnahmen auf den Sortimentsverbund, Forshungsberiht Nr. 96, Institut für höhere Studien, Wien. Merkle, E. (1981: Die Erfassung und Nutzung von Informationen über den Sortimentsverbund in Handelsbetrieben, Berlin. Reutterer, T. (1997: Analyse von Wettbewerbsstrukturen mit neuronalen Netzen: Ein Ansatz zur Kundensegmentierung auf Basis von Haushaltsaneldaten, Wien. Shmalen, H.; H. Pehtl; W. Shweitzer (1996: Sonderangebotsolitik im Lebensmittel- Einzelhandel, Stuttgart.