Verborgene Schätze heben Data Mining mit dem Microsoft SQL Server Martin Oesterer Leiter Vertrieb HMS Analytical Software GmbH
Data Mining. Was ist eigentlich wichtig? Data Mining ist: die Extraktion von Wissen, das gültig (im statistischen Sinne), bisher unbekannt und potentiell nützlich ist zur Bestimmung bestimmter Regelmäßigkeiten, Gesetzmäßigkeiten und verborgener Zusammenhänge. Problem erkennen Lösung formulieren DATA MINING Lösung verfügbar machen Lösung einsetzen 2
(1) Klassifikationsverfahren Zielwahrscheinlichkeit Klassifikationsverfahren im Einsatz v1 Ziel- Zustand Hoch v5 v4 v1 v4 v5 Datensatz 1 V7 Ziel- Zustand v2 v2 v9 v6 v3 V7 v3 v6 Datensatz 2 Gering v9 3
(1) Klassifikationsverfahren Klassifikationsverfahren im Einsatz Kündigungen treffen uns unerwartet. Maschinenausfälle verursachen hohe Maintenance-Kosten. Wir wollen den Umsatz durch Wartungsverträge erhalten/erhöhen. Kündigungswahrscheinlichkeit wird prognostiziert. Der wahrscheinliche Zeitpunkt eines Ausfalls wird bestimmt. Der Vertrieb bekommt eine Kontaktliste priorisiert nach Erfolgsaussicht. 4
(2) Clusterverfahren Clusterverfahren im Einsatz v1 v2 v3 V4 v5 v1 v2 v3 V4 v5 v14 1 2 v6 v14 1 2 v6 v13 v12 5 6 v11 4 7 3 v10 v7 v8 v9 v13 v12 5 6 v11 4 7 3 v10 v7 v8 v9 5
(2) Clusterverfahren Clusterverfahren im Einsatz Wie bewerbe ich ein Neuprodukt? Die Kombination aus Erfahrung und Clustering gestaltet das Mailing. Wie segmentiere ich meinen Kundenbestand? Online-Bank Cluster ermöglichen eine inhaltliche Beschreibung von Segmenten. 6
(3) Assoziationsverfahren Assoziationsverfahren im Einsatz v1 v2 v3 V4 v5 v14 v13 v12 5 6 1 v11 4 7 2 3 v10 v6 v8 v9 v7 10% aller Warenkörbe enthalten eine Zahnbürste. Support: 5% aller Warenkörbe enthalten Zahnbürste und Zahnpasta. Konfidenz: 20% aller Zahnbürstenkäufer haben auch Zahnpasta gekauft. 7
(3) Assoziationsverfahren Assoziationsverfahren im Einsatz Wie schnüre ich erfolgreiche Produktbundles? Die Erkenntnis über beliebte Verbundkäufe ermöglicht attraktive Bundles. Next-best-Offer: Welches Produkt fehlt dem Kunden? Online-Handel Kunden die diesen Artikel gekauft haben, haben auch... 8
(4) Forecasting Forecasting im Einsatz 9
(4) Forecasting Forecasting im Einsatz Wir müssen den Teilebedarf kennen, um Lagerkosten zu reduzieren. Wir prognostizieren den zukünftigen Bedarf an Einzelteilen. Wir wollen den Gasverbrauch unserer Großkunden vorhersagen... EVU... um Gas preisgünstig einkaufen zu können. 10
Der Weg ist das Ziel. Data Mining als Prozess DATA MINING Vorbereitung Exploration Modifikation Modellierung Bewertung Datenmanagement Training&Test Zieldefinition Visuelle Überprüfung der Daten Datenqualität sichern Variablen modifizieren Variablen ausschließen Anwendung der Verfahren Selektion des besten Modells Veröffentlichung der Ergebnisse Test des Modells 11
Jetzt geht s in die Praxis. Data Mining live Optimierung einer Direktmarketing-Aktion im Versandhandel. Kostensenkung: Selektion der Kunden mit hoher Reaktionswahrscheinlichkeit. Umsatzsteigerung: Optimierung des Mailings durch individuelle Formate. Umsatzsteigerung: Individualisiertes Vorschlagswesen im Webshop. Planungssicherheit: Umsatzprognose steuert Budgetallokation. 12
L I V E 13