Kundensegmentierung und Zielgruppendefinitin im Database Marketing am Beispiel vn Di rektvertriebsprd u kten Marc Plni, Martin Nelke Für die effiziente Durchführung vn Marketing-Aktinen ist es vn grßer Bedeutung, dass im Rahmen einer slchen Aktin nur die Kunden angesprchen werden, für die das betreffende prdukt vn Relevanz ist. Je spezifischer die Kunden ausgewählt werden' dest höher ist die Respnsequte und damit der Erflg der Marketing-Aktin. Um eine entsprechende Selektin geeigneter Kunden durchführen zu können, müssen die charakteristischen Eigenschafien ("Kundenprfile") typischer Nutzer des bewrbenen Prduktes bekannt sein. Dabei sind swhl demgrafische Daten als auch Daten über die Nutzung anderer Prdukte Teil des Kundenprfils. Gegenstan der hier vrgestellten Anwendung ist die Analyse vn Kunden des Hmebanking prduktes (Girknt) der Stadt-Sparkasse Düsseldrf mit dem Ziel Kundenprfile herauszuarbeiten. 1 Aufgabenstellung Mit dem Einsatz vn Data Mining im Bereich Direktmarketing werden verschiedene Ziele verfblgt. Neben der clirekt messbaren Erhöhung der Respnsequte können die überflüssigen Marketingksten reduziert werden. Dies geschieht durch das Ansprechen allein slcher kunden, die eine sehr hhe Affinität für das betreffende Prdukt haben, welche durch ein Mdell zu bestimmen ist. S wird eine clirekte Auswahl der Kunden aufgrund eines Affinitätswertes gewährleistet. Ermöglicht wird dies durch das Finden typischer Klassen bzw' Gruppen im vrhanclen Kundendatenbestand eines Prduktes, swie das Ermitteln vn prdukispezifischen und entscheidungsrelevanten Kundenmerkmalen' Des Weiteren ist anzustreben, dass die gefundenen Mdelle mit einer nur geringfügigen Anpassung auf andere Aufgabenstellungen übertragen werden können' Die Entscheidung fi1r den Einsatz vn Data Mining im Bereich Direktmarketing wird wesentlich clurch dä geschäftsplitischen Nutzen bestimmt. Durch die Betrachtung der Kundenprfile ist eine gezieltere Ansprache vn Kundengruppen in Teilmärkten für ganz bestimmte (aber auch neue) prdukte erreichbar. Eine Reduktin der Ksten bei Marketingaktinen wird clurch clas reduzierte Kntaktieren vn wahrscheinlichen Nicht-Reagierern erzielt (Verminderung vn Streuverlusten). Das Identifizieren der relevanten Merkmale er- 643
Marc Plni, Martirt Nelke Kundettst,: lalrbt eine verbesserte Datenhaltung unter Vermeidung vn redundanten und i,iberflüssigen Infbrmatinen. Der Lösungsansatz ermöglicht bei seiner Anwendung auch die Berticksichtigung unterschiedlicher Geschäftsplitiken. S wird das angestrebte Ergebnis bei einer hclhen Respnsequte, einem maximalen Deckungsbeitrag der einer hhen Anzahl der ptenziellen Reagierer liegen (vgl. Schaubild l). Bei der Anwendung des Klassifikatrsll dann z. B. ein maximales Mailingbudget, eine zu erreichende Respnsequte der auch eine Deckungsbeitragsmaximierung vrgegeben werden, je nach geschäftsplitischer Ausrichtung. vrhergesagte Anzahl der Reagierer Optimierungsptential Deckungsbeitrag in DM Respnsequte in % Deckungsbeitrag Anzahl ptentieller Reagierer Respnsequte Anzahl Kntakte Schaubild I : Optimierungsptenziale beim Direktmarketing Flgendes Vrgehen wurde in dem Prjekt angewendet: im ersten Schritt flndet die Vrverarbeitung und Analyse der Kundendaten statt. Es wird untersucht, welche Merkmale einen Kunden der betrachteten Prdukte auszeichnen und welche Ausprägungen dieser Merkmale charakteristisch für die entsprechende Kundengruppe sind. Typische Merkmale sind zum Beispiel Alter, Einkmmen, Familienstand, etc. Ergebnis dieses Schrittes ist einerseits eine Spezifikatin der Kundenprfile und andererseits ein Klassifikatr, der in der Lage ist, eine Selektin vn ptenziellen Käufern der betrachteten Prdukte durchzuführen. Der zweite Schritt umf'asst die Darstellung der Ergebnisse der ersten Phase und die Erstellung einer Applikatin zur Nutzung des Klassifikatrs für den fachlichen Endanwender. Die Applikatin ermöglicht die Anwendung des Klassifikatrs und die Durchführung der Selektin vn Kunden für eine Marketingaktin. Die Nutzung der Sftware kann dabei hne Verständnis der zugrundeliegenden Technlgie erflgen. Die Auswahl ptenzieller Nutzer der ber Rahmen eine: F Zusätzlich eri eine Verbesse fung dieser D.rr 2 Vrg Die Mdellbild Mining Przer r Du bar D.r \le eig Su Frr r"h Err Er.,l-- ul I Die beschrieb angewendet Lr l99lb, MIT I 9 2.1 Daten Nachdem im e wurden, knnte O CA ci.. ce. für die Mdelii reißern stand I Merkmale zur Vrdergmnd. L 644
Kuntlensegntentierung und Zielgruppendefinitin im Datcthase Murketing m Beispiel... Nutzer der betrachteten Prdukte aus der Gesamtkundenmenge wurde abschließencl im Rahrnen eines Feldtests anhand der Ergebnisseiner Marketingaktin überprüft. Zusdtzlich erflgte nch eine Analyse, b sich durch die Berücksichtigung vn Gedaten eine Verbesserung des Ergebnisses erzielen lässt, die den erhöhten Aufwancl zur Beschaf'- fung dieser Daten rechtf-ertigt. 2 Vrgehen bei der Mdellierung Die Mdellbildung für die vrliegende Aufgabenstellungemäß dem Vrgehen beim Data Mining Przess lässt sich in die fblgenden Schritte aufteilen: r Datenbereitstellung ("Nutzer&" Nichtnutzer des Prduktes") in einer Datenbank Datenaufbereitung (Bereinigung, Merkmalsgenerierung, Datenselektin) Merkmalsauswahl (Ermittlung der signifikanten Merkmale für die Prdukteignung ) Suchen vn Klassen bzw. Gruppen typischer "Nutzer des Prduktes" Finden der charakteristischen Eigenschatten, die diese Gruppen beschreiben ("Kundenprfile") ErstelleneinesDV-gestütztenRespnsemdells Evaluierung des Mdells und Anwendung auf "neue" Daten mit Identifikatin der ptenziellen Nutzer Die beschriebene Vrgehensweise wurde auf die Daten der Stadt-Sparkasse Düsselclrf angewendet unter Nutzung des PC Sftwarewerkzeuges DataEngine@ (Angstenberger 1997b, MIT 1998a) für den Prdukttyp "Hmebanking"(Girkntverwaltung). 2.1 Datenvrverarbeitung Nachdem im ersten Schritt die Daten aus der vrhandenen Kundendatenbank selektiert wurden, knnten die vrhandenen Datensätze ca. 3700 Hmebanking Nutzer, ca.4000 Bankkunden, ca. l-50 Neukunden mit Hmebanking Nutzung (als Vergleichsgruppe) für die Mdellierung aufbereitet werden. Neben der Behandlung vn Fehlstellen und Ausreif3ern stand bei der Datenvrverarbeitung die Mdellierung der kategriell skalierten Merkmale zur Verwendung in Verfirhren, die auf kardinalen Zahlenskalen arbeiten. im Vrdergrund. Unter anderem wurden dabei die Merkmale 645
Murc Plni, Martin Nelke Kuttclertr, Alter, Geschlecht, Familienstand, Habenumsatz, Kreditrahmen Kr... annymisiert verwendet und auch ge-demgraphische Infrmatinen genutzt:... Whngebietstyp, Knkurrenzsituatin. Zusätzlich wurden weitere Merkmale generiert, die das Kundenverhalten in Bezug auf die Nutzung verschiedener Prdukte beschreiben (Girknt, Sparbuch,...): r... Anzahl Prdukte Nutzunssdauer Der Datenbestand (Prduktnutzer und Bankkunden) wurde in einen Training- und einen Testbestand geteilt. Als Validierungsmenge wurde die Vergleichsgruppe der Neukunden benutzt. 2.2 Kundenprfilbestimmung Im ersten Schritt zur Bestimmung der Nutzerprfile wurde eine Clusteranalyse auf Basis des Fuzzy C-Means Algrithmus (Bezdek l98l ) durchgeführt. Als Ergebnis erhält man die Anzahl der Klassen (die Fuzzy C-Means Implementatin in DataEngine kann die ptimale Anzahl vn Klassen ermitteln) und ihre zugehörigen Klassenprttypen, die die typischen Nutzerprfile darstellen. Jedes zu klassifizierende Objekt (,,2u beurteilender Kunde") erhält durch die Anwendung des Algrithmus einen Zugehörigkeitswert zu den Klassen zwischen 0und L In den bisherigen Nutzern des Prduktes,,Hme-Banking" finden sich typische Nutzerklassen, die sich in den charakterisierenden Eigenschaften unterscheiden. Diese unterschiedlichen Merkmalsausprägungen stellen die typischen Nutzerprfile dar. Es wurde datenbasiert ein Klassifikatr erstellt, der für jeden bestehenden und ptenziellen Kunden eine,,unscharf-e" graduelle Zugehörigkeit zu einer der gefundenen typischen Nutzerklassen ermittelt. Im Schaubild 2 ist ein Klassifikatinsbeispiel für drei Kunden zu den 5 (annymisierten) Klassen gegeben. S Hat ein zu ki". pretiert mitn t:. Mit den 5 K., ist es jetzt rr.. zern auf-trun; 2.3 Resp Basierend alrf typischer \ur, dungsbaunri er Affinität bezu vllziehbar in l An der \\'urze merkmal die (Kundenrnerk zweigen bede ßer als 68.-i h, das Prduktni Bei der Ann e banking Nurzu Beim vrlieg zusätzlichen s 646
Kundensegmentierung und Zielgruppendefinitin im Database Marketing am Beispiel... Klassifik ati nser ebnis Kunde 1 Kunde 2 Kunde 3 NN ffin D lc Ne Schaubild 2: Darstellung (annymisiert) der Kundenklassifikatin Hat ein zu klassifizierender Kunde keine hhe Zugehörigkeit zu einer dieser Klassen, interpretiert man ihn als.,kein typischer Nutzer". Mit den 5 Klassen,,typischer Nutzer" und der abgeleiteten Klasse,,kein typischer Nutzer" ist es jetzt möglich ein Rcspnsemdell zu erstellen, das zwischen Nutzern und Nichtnutzern aufgrund der Merkmalsausprägungen der genannten Klassen unterscheiden kann. 2.3 Respnsemdell Basierend auf den ermittelten Prfilen (5 Klassen vn,,typischer Nutzer", eine Klasse,,kein typischer Nutzer") wurde dann ein Respnsemdell unter Verwendung eines Entscheidungsbaumverfahrens (MIT 1998b) entwickelt, das ptenzielle Kunden htnsichtlich ihrer Affinität bezüglich des Prduktes "Hmebanking" beurteilt und seine Entscheidung nachvllziehbar in Frm vn Regeln dkumentiert. An der Wurzel des Entscheidungsbaummdells steht die Einflussgröße, welche als Einzelmerkmal die größtmögliche Trennung zwischen Nutzern und Nichtnutzern ermöglicht (Kundenmerkmal I irn vrliegenden Fall). Im Schaubild würden die Zahlen an den Baumzweigen bedeuten: Falls beim vrliegenden Objekt das Kundenmerkmal I einen Wert größer als 68,5 hat. wird das Objekt als,,kein typischer Nutzer" klassifiziert; falls nicht, wird das Prduktmerkmal I untersucht usw. Bei der Anwendung des Verfahrens auf die Validierungsgruppe (Neukunden mit Hmebanking Nutzung) wurde eine ldentifikatinsrate der Neukunden vn über 80/ erreicht. Beim vrliegenden Fall knnte ermittelt werden, dass durch die Berücksichtigung vn zusätzlichen gedemgraphischen Infrmatinen (Whngebietstyp, Knkurrenzsituatin) 641
Mttn' Pttlrmi, Murlirr Nclkc Kurttlt,n ', keine signifikante Verbesserung desklassifikatinsergebni sseserreicht wird. Diese Aussaeiner anderen Aufsabenstel- ge liisst sich allerdings nicht generell treff-en. sndern rnuss bei lung erneut untersucht werden. Quell- $ystem Kundendate Umsatzdaten r ö:1,.i_. "Wurzelknten" Transaktine Prduktinfc mätinen "innerer Knten" Externe Dater - szidemcgraphische Daten - Wirtschaftsin{rmatjne - Wettbewetsinfrmatrne "Blatt" 4 Zus Schaubild 3: Struktur des Entscheidungsbaumes (annymisierter Ausschnitt) für das Respnsemdell 3 Integratin in eine Data-Warehuse lnfrastruktur Die Data Mining Applikatin wird in eine Data-Warehuse Infiastruktur integriert. die in Schaubild 4 dargestellt ist. Die Entwicklungsumgebr.rng basiert auf dem Tl DataEngine und arbeitet rnit Stichprben des Data Warehuse. In dieser Umgebung entwickelte Mdelle können direkt vn Systernen für Endanwender genutzt werden. Die Verwendung der DataEngine Mdelle (Neurnale Netze, Fuzzy Regelbasen, Entscheidungsbäume) wird durch eine eingebettete Kmpnente (DataEngine Applicatin Develpment Library) ermöglicht. Die Anwendung kann die Daten des Data Warehuse direkt verarbeiten, um z. B.: r regelmäßig für jeden Kunden einen,,aftinitätswert" zu berechnen, Auswertungen über den Kundenstamm durchzuführen, Kundenlisten für Marketinsaktinen vrzubereiten. Die gezieli Erhöhung j; licht r.rtrd J. len") aus D, Dienstleist affinität ftir : Dieses Verf. schiedlich p. Das beschr grf3er u irt., weniger Stre Der Data \l: weise ein.' k lassifl katitr Die Mö-elic Data Wareh Aufgaben:r Die Übertr.r mentan u irc 648
Kunden'segmentienntg und Ziel,qrttppentlefinitin im l)rfiul.tuse Murketing unt ßeispiel... Quellsystema Kundendaten Urnsatzdaten Transaktinen Data Engineering PrduktinfÖrmatinen --{> rr{> Externe Daten - sridemgraphische Daten - Wirlschaftsinfrmatinen - Wettbewerbsinfrmatinen - Extraktin - Qualitätssicherung - Bereinigung - Transfrmatin - Integratin - Laden Data Repsitries Data Warehuse Data Mining Bestand rul t-7l I r-! rrr>,nälafnplrp ril 1) \APPikatin Data Mining Anwendungen Analyse- Umgebung Endanwender Schaubi ld 4: IT-lnfiasrrlrkrur 4 Zusammenfassung und Ausblick Die gezielte Ansprache vn KLrnden in Rahmen vn Marketingkarnpagnen trägt zu einer Erhöhung der Respnseqltte bei uncl clarnit zu clem Erfblg einer Marketing-Akti.n. Errnöglicht wird dies durch das Ermitteln vn charakteristischen Eigenschaften (,,Kundenprfilen") aus Daten vn bekannten typischen Nr,rtzern des bewrbenen prduktes bzw. cler Dienstleistung und die Entwicklung eines Respnsemdells zur Bewertung der prcl,ktaftinität für einen ptenziellen Kunclen. Das beschriebene Prjekt zeig, dass durch clen Einsatz vn Dätä Mining Anwenclungen grf'3er wirtschafilicher Nutzen erzielt wircl (bessere Iclentifikatin ptenzieller Kunden, weniger Streuverluste, bessere RespnseqLrte). Dieses Vertahren kann je nach Geschäfisplitik, wie in cler E,inleitung dargestellt, untersch iedl ich parametri siert ei n gesetzt werclen. Der Data Mining Przess wird clabei s abgebilclet, class eine stanclarclisierte Vrgehensweise eine datenbasierte Mclellbilch.rng ermöglicht r-rncl ein interpretierbares K,nclenklassifi katinsmdel I I ief-ert. Die Möglichkeit einer unkmplizierten Einbinclung cles Kunclenmclells in die besrehencle Data Warehuse Infiastruktur uncl clie Übertragbarkeit des Knzeptes auf vergleichbare Aufgabenstellungen hat wesentlich zlrm Erfblg ctes Prjektes beigetragen. Die Übertragung der Ergebnisse äuf andere Institute beflnclet sich in der piltphase. Mmentan wird die Vrgehensweise auf anclere Aufgabenstellungen angewenclet, um eine 649
Marc Plni, Murtin Nelke kmplette Database Marketing-lnfrastruk tur zu schafren, die verschiedene Sparkassen-Organ lnstitute der i satin unterstützen wird. Literaturhinweise Angstenberger, J' (1997a): Data Mining in Business Anwendungen - Tagungsband psium Anwendungen Sym- vn Fuzzy Technlgien und Neurnalen Netzen. IggT,Aachen. Angstenberger, J' (1997b): using DataEngine as an Extendible sfi cmputing fr Data Framewrk Analysis Applicatins. Prceedings EUFIT 97 - Fifth Eurpean cngress ligent Techniques n Intel- ancl sft cmputing. Aachen, Germany. Angstenberger, J'; Plni. M.; weber, R. (1998): Data warehuse supprt t A Database Data Mining: Marketing Perspective. [n: Jurnal f Data warehusing,vl. 3, N. l. s. 2- I l. Bezdek' J' c' ( l98l ): Pattern Recgnitin with Fuzzy bjective Funcrin Algrithms. pienum Press, New yrk. MIT GmbH ( 1998a) Handbuch zu DataEngine 3.0. MIT GmbH, Aachen, Germany. MIT GmbH ( 1998b): DataEneineEntscheidungsbaum plug-in. MIT GmbH, many. Aachen. Ger_ Scheer' A'-w' (1996): Data warehuse und Data Mining: Knzepte cler unterstützung. Entscheidungs- [n: [nfrmatin Management, l, 5. 74_]5. Zitnmermann, H'-J' (Hrsg.)(1995): Datenanalyse - Anwendung vn DataEngine Technlgien mitfuzzy und Neurnaren Netzen. vdi - Verrag, Düsserdrf. Anw 650
Anwendungen des Data Mining - Kundenklassifikatin -