Erinnerungen an die Zukunft Das erfolgreiche Konzept des Business-Intelligence Marktführers Wolfgang Schwab Marketing Executive SAS Deutschland, Heidelberg Rechenzentrum SAS? 1969: der erste Großrechner bildet die Grundlage für die Existenz des URZ: Modell 44 der IBM/360-Reihe für 3 Mio DM. 128 kb Hauptspeicher, zwei weitere Wechselplatten mit jeweils 7 MB. Jobeingabe mit Lochkarten. Start mit fünfzehn Mitarbeitern
Rechenzentrum SAS 1975/76: Beschaffung einer neuen Rechenanlage für ca. 18 Mio DM, die über eine 15-fach höhere Leistung verfügte ( 2MB Hauptspeicher, 1,6 GB Plattenspeicher) und Dialogbetrieb ermöglichte. Heidelberg wird zum regionalen Rechenzentrum 40 Mitarbeiter, jetzt im Neuenheimer Feld 1976: Gründung von SAS in Cary/ North Carolina und Auslieferung von Base SAS 1977: Sieben Mitarbeiter sind beschäftigt 1978: 600 Kunden 1980: SAS/Graph und SAS ETS werden ausgeliefert. Verkaufsrate: 150 Produkte/Monat. Rund 3000 Kunden
Rechenzentrum SAS 1983: Ablösung der Anlage durch ein neues IBM System. 1986: Beschaffung einer neuen Anlage mit nun 64 MB Hauptspeicher und bis zu 63 GB Plattenspeicher. Erweiterung der ang. Dialogterminals auf 800. Vermehrter Einzug von Arbeitsplatz-PCs und Computerpools. 1981: SAS/FSP wird entwickelt. Eröffnung des Training-Centers und des Video Studios. DB-Direktzugriff via SAS/IMS-DL/1 1982: Europäisches HQ in Heidelberg. 1983: Eröffnung in Australien, New Zealand, Singapore, Dänemark, Frankreich. Development Center mit 54.000 qm. 1985: Auslieferung von SAS AF und SAS IML. Rechenzentrum 1987: Aufbau eines universitätsweiten Netzes, das die Einzelrechner verbindet. Anschluss an das Internet über Belwue 1992: Ablösung des Universalrechners durch einen Unix-Cluster SAS 1986: SAS QC für Mainframe SAS IML u. SAS STAT für PC DOS 1987: 65% der SAS Installationen liegen auf einer IBM mainframe (1000 DOS-Sites). Schnittstellen zu DB2 und SQL/DS SAS System Code wird in C übertragen 1988: MultiVendor Architecture MVA. SAS/ACCESS software kommt auf den Markt. SAS unterstützt jetzt UNIX-Server SAS/ASSIST wird ausgeliefert
Rechenzentrum SAS 1992: Erstes SAS Benutzertreffen am Rechenzentrum 1989: SAS is Best company to work for. Erste MIS/EIS Projekte in BRD 1990: Release 6.06 für MVS, CMS, und OpenVMS wird ausgeliefert 1991: SAS/Insight Auslieferung 1992: SAS/CALC, SAS/TOOLKIT, SAS/PH-Clinical und SAS/LAB Version 6.09 1993: SAS/EIS, Release 6.08 für MVS, CMS, VMS, VSE, OS/2 und Windows ersetzt 6.07 Rechenzentrum SAS 1994: SAS/SPECTRAVIEW, SAS/SHARE*NET(ODBC) wird geliefert. 1995: DWH Lösung mit Rapid-WH. SAS Software für Macintosh (Release 6.10) wird eingeführt. Release 6.11 jetzt für Windows 95, Windows NT, and UNIX erhältlich. 1996: FDDI-Ring als Backbone installiert 1996: Erstes Produkt der SAS Lösungen: CFO Vision. Scalable Performance Data Server
Rechenzentrum SAS 1997: Warehouse Administrator erreicht Marktreife 1998: SAS Enterprise Miner setzt neue Maßstäbe in der Data Mining- Technologie. ERP Access interface zu SAP/R/3. 1. Anbieter von OLE- DB für OLAP,HOLAP Lösung. Lösung für Balanced Scorecard Systems. Enterprise Reporter und HR Vision 1999: SAS und Dun&Braedstreet: SRM-Lösung. Risk-Dimensions und Churn-Mgmt. Lösung für Telcos Rechenzentrum SAS 2000: SAS bringt den Enterprise Guide auf den Markt. Außerdem wird SAS für Linux adaptiert. SAS Version 8.1 2001: Version 8.2 wird ausgeliefert 2002: SAS führt die java-basierte Version 9.0 in Europa ein 2003: Release 9.1 im Q4
SAS Oberfläche heute in Version 8.2e Wachstum Rechenzentrum Mitarbeiterentwicklung Mitarbeiter 100 90 80 70 60 50 40 30 20 10 0 '69 '72 '75 '78 '81 '84 '87 '90 '93 '96 '99
Wachstum SAS Deutschland Mitarbeiterentwicklung 500 400 Mitarbeiter 300 200 100 0 '82 '84 '86 '88 '90 '92 '94 '96 '98 '00 Datenflut - Informationsüberflutung?!? Informationsüberflutung ergibt sich nicht aus der absoluten Menge der Informationen, sondern aus der Kluft zwischen Informationsvolumen und der Qualität der Sinn erzeugenden Werkzeuge. Paul Saffo, Director, Institute for the Future, Menlo Park, USA
Listen Information als nicht erkanntes Problem Entwicklungsstufen der Informationsversorgung Berichts- & Analysetools Information als ungelöstes Problem. Do it yourself Data Warehouse Information als Vorteil. Qualität der Information. Konsistenz, Metadaten. Information Supply Chain Information und Wissen als Teil der Unternehmensstrategie. Qualität der Informationsversorgung durch Information Process (Re-) Engineering. Reaktiv Individuum Aktiv Bereich Proaktiv Unternehmen Vorstand Controlling Finanzen Debitoren Kreditoren... Vertrieb Produktmgmt. Regionen Einkauf IT Rechenzentrum AE... Informationsverarbeitung Buchhaltung Disposition Lagerverwaltung Einkaufsabwicklung Bestandsführung Verkaufsabwicklung Rechnungsstellung Produktionssteuerung Mitarbeiterverwaltung Gehaltsabrechnung etc....... operative Aufgaben
Vorstand Controlling Finanzen Debitoren Kreditoren... Vertrieb Produktmgmt. Regionen Einkauf IT Rechenzentrum AE... Informationsgewinnung Div. Listen, Statistiken Div. Listen, Statistiken Applikation A Applikation B Applikation C Div. Listen, Statistiken Div. Listen, Statistiken... Kunden Konten Finanzen Bestände Anlagen Personal... Informationsgewinnung Vorstand Controlling Finanzen Debitoren Div. Listen, Statistiken Div. Listen, Statistiken Kunden Konten Kreditoren... Applikation A DWH Finanzen Vertrieb Applikation B Bestände Produktmgmt. Regionen Einkauf IT Rechenzentrum AE... Applikation C Div. Listen, Statistiken Div. Listen, Statistiken Informations & Applikationsraum Organisation Anlagen Personal...
Informationsgewinnung Vorstand Kunden Controlling Finanzen Debitoren Kreditoren... Vertrieb Produktmgmt. Regionen Einkauf IT Integration über......metadaten... Schnittstellen...Prozesse Konten Finanzen Bestände Anlagen Personal Rechenzentrum AE... Informations & Applikationsraum Organisation... Business Intelligence - Architektur Query & Reporting BI Portale Wissensverteilung Analytische Intelligenz Data Warehousing Datenmanagement ETL Metadaten Integration Offenheit Skalierbarkeit ERP- Systeme Datenbanken Operative Systeme e - Daten Externe Daten
SAS Information Delivery Portal Enterprise Performance Management Supplier Relationship Management e Business BPM Performance ABC/M Management Supply Chain e Informations-Infrastruktur e
SAS Enterprise Intelligence - Lösungen Supplier Intelligence Supplier Relationship Management Einkaufscontrolling Einsparpotentiale realisieren Strategische Beschaffung Global koordinierte Beschaffung über das ganze Unternehmen Spend Analysis, Supplier Ranking, Portfolio Optimisation Organisational Intelligence Financial Management: Konsolidierung, Planung, Budgetierung, Prozesskostenrechnung Vertriebscontrolling Risk Management Human Capital Management IT Management Process Intelligence Betrugserkennung Intelligence Architecture Intelligence Data Management: ETL, Data Warehouse,... Analysis & Reporting: Business Intelligence, Analytical Intelligence Intelligence Application Integration Enterprise Performance Management Balanced Scorecard für das Unternehmen & für Bereiche Managementinformationssysteme & KPI-Reporting Gesamtheitliche Unternehmenssteuerung Customer Intelligence Marketing Automation, Kampagnen- & Multi-Channel- Management Analytical CRM: Kundenprofitablität Response Optimierung, Stornovermeidung, Cross-& Up-Selling, Anlassmanagement Credit Scoring, Bon-Daten- & Warenkorbanalyse, Standortanalyse, Web Mining Enterprise Intelligence: SAS Strategic Performance Management
Kernelement einer Scorecard sind Ziele, nicht Kenngrößen Vision & Strategie als Ausgangspunkt Finanzielle Perspektive: Was wollen wir unseren Kapitalgebern bieten? Personalbeschaffungskosten Fluktuationskosten Kundenperspektive: Wie sollen uns unsere Kunden wahrnehmen? Auswahlprozeß Vergütung Mitarbeiterzufriedenheit Prozessperspektive: Was müssen wir bei unseren Prozessen hervorragend gestalten, um unsere Strategie zu erfüllen? Bewerberqualität DLZ Bewerbungsprozeß Effektivität Potentialperspektive: Wie gewährleisten wir langfristig unseren Erfolg? Internationalisierung Know how Transfer Karrieremöglichkeiten Strategische Ziele als Ergebnis SAS Strategic Performance Management: Balanced Scorecard Finanzen Kunden Prozesse Mitarbeiter
Erfinder der BSC Robert S. Kaplan David P. Norton Aus Daten entsteht e-wissen Log Files Kundendaten Externe Daten Daten einlesen, transformieren, aggregieren, schedulen, weitere Daten einbinden... Reporting Web Mining off-line Scoring on-line Scoring
Die drei Dimensionen des e-crm Angebotsnutzung Verweildauer Ein- und Ausstieg Besucherpfade Konversionsrate Verfügbarkeit Antwortzeiten Service-Level Verhaltensprofile Kundensegmente Personalisierung Die drei Dimensionen des e-crm SAS WebHound SAS IT Management Solutions SAS CRM Solutions Web Mining Cross-/Up-Selling Fraud Detection Response Optimierung
Business und IT im Informationszeitalter Wissen Beitrag der IT zur Produktivitätssteigerung Information Wissen integrieren, verteilen und anwenden Daten Wissen generieren Information sammeln & bereit stellen Integrierte Prozesse Transaktionen Operative Systeme Industriezeitalter Informationszeitalter Plattformen Intelligenz- Systeme Business-Fokus Extrovertiert Ertrag Wissen Introvertiert Kosten Prozesse Produktivitätssteigerung Data Mining (Credit Scoring) 1963 IBM 7090: 0.5 MHz, 0.2 MB RAM, 3000 Punch Cards Aufgrund beschränkter Speicherplatzkapazität konnten wir unsere Analyse nur für 600 Kreditanträge mit 25 Variablen durchführen. J. Myers and E. Forgy, Journal of American Statistical Association, 9/63
Datenvolumina in DWH-Projekten Kilobyte Megabyte Gigabyte Terabyte Pentabyte Bytes 2 10 2 20 2 30 2 40 2 50 Paper ½ Blatt 1 Schublade 80 Meter 32 Meilen 32,000 Meilen Text-Mining: Ausgangspunkt Relevante Informationen eines Unternehmens sind in Textdokumenten enthalten wie z. B. Briefe, E-Mails, Strategiepapieren, juristische Unterlagen, Marktstudien, Patentenschriften, Produktbewertungen Herkömmliche Data Mining Verfahren können den größte Teil dieser unstrukturierten Informationen nicht analysieren. Der SAS Text Miner bietet eine wertvolle Chance, bislang nicht analysierte Datenquellen abzugreifen, um ein tatsächlich vollständiges Bild vom Unternehmen zu gewinnen.
Was ist Text Mining? Entdeckung von neuem, nicht trivialem, interessantem und wirtschaftlich verwertbarem Wissen in großen Textbeständen. Wissen Aufdecken von Mustern in der Sammlung Klassifizierung von Dokumenten auf Basis der Häufigkeit der Wörter und Wortkombinationen Verbinden von Free-Form Dokumenten und quantitativen Variablen, um Informationen abzuleiten
Ein Frühwarnsystem für Wertpapierhändler mit Data Warehousing und Text Mining Kursrelevante wertpapierspezifische Mitteilungen werden von der Deutschen Gesellschaft für Ad-hoc Publizität verfaßt und über Newsfeeds (Reuters,Nightridder, Bloomberg, DataStream etc.) verteilt. Der Wertpapierhändler hat Zugang zu diesen Mitteilungen. Er muß sie auf dem Bildschirm anzeigen, lesen und bewerten. Welche Auswirkungen ergeben sich daraus für den Kurs des Wertpapiers? Verkürzung der Reaktionszeit durch Text-Mining basierendes Frühwarnsystem. Beispiel: Ad-hoc Mitteilung
Text Mining ist nicht Natürliche Spracherkennung/Sprachverarbeitung Information Retrieval Suchen von Informationen oder Zeichenketten aus einzelnen Dokumenten Text Mining: Einsatzmöglichkeiten Segmentierung und Klassifikation Verbesserung von CRM Scoring Modellen durch zusätzliche Auswertung schriftlich aufgezeichneter Kommunikation Betrugserkennung Aufstellen und Abgleichen von Dokumentprofilen (Beispiel Topic Scoring Engine, Jobvermittlung...) Automatisches Filtern von E-mails Einstufung von Dokumenten in verschiedene Kategorien (Help Desk Routing)
Text Mining: Einsatzmöglichkeiten Clusterung Erkennen von komplexen Zusammenhängen in großen Dokument-Sammlungen, z.b. Medline Lernen aus Krankheitsverläufen durch Analyse von Behandlungsakten in Krankenhäusern Text Mining: Einsatzmöglichkeiten Clusterung Handelsregistereinträge Call Center Logs. Vorhersage Kostenprognose basierend auf Call Center Logs Aktienkurs aus gegenwärtigen Geschäftsberichten Betrugserkennung
SAS Text Mining EM 4.1 Early Adopter COMPAQ Computer Corporation Kategorisierung und Zuordnung von Kundenzufriedenheit bzw. unzufriedenheit bei eingehenden Call Center-Daten, Verbesserung der CRM-Scoring Modelle. University of Louisville Medical Center - Mining medizinischer Datenbanken wie z. B. Medline und Analyse von patientenbezogenen Diagnose-Codes Science Applications International Corp Jobzufriedenheits- Studie zur Verringerung der Kündigungen bei den US Marines Data Mining - SAS Mining Challenge die Studenten schon in ihrer Ausbildung mit businessrelevanten Fragestellungen, reellen Daten und der leistungsfähigen Software zu kontaktieren, => einen konkreten Praxisbezug schaffen!
Aufgabe Daten Optimierung einer tatsächlich durchgeführten Mailingaktion durch eine Responseoptimierung auf historischen Daten Anwenden der Modellierung auf einen neuen Kundendatensatz für eine weitere Werbeaktion SAS Datei Analyse SAS Datei Score Vielen Dank an: (147705 Beob. u. 164 Var.) (102286 Beob.) Der Status Die SAS Datei Score enthält 102286 Objekte. Darunter 11529 (11,27%) tatsächliche Reagierer
Preise Vielen Dank an: Teilnehmerherkunft
Die besten Ergebnisse Die zu erzeugende Datei mit den 10000 besten Kunden (9,8% der Score-Datei ) enthielt im besten Ergebnis 2170 tatsächliche Reagierer, d.h. 18,8%! Durch Data Mining wurde die Anzahl der Reagierer nahezu verdoppelt! (11,27%=>18,8%) Die Gewinner Vielen Dank an: Platzierung Name Vorname Reagierer Uni 1 Krogel Mark Andre 2170 Uni Magdeburg 2 Feist Joachim 2148 Uni Konstanz 1. Platz: 3 Lohmeier Eva 2125 Uni St. Gallen 4 Seifert Christin 2114 TU Chemnitz Mark-Andre 5 Bentlage Krogel, Jan Otto-von-Guericke 2089 Uni Bielefeld Universität 6 Kühne Daniel 2046 Uni Jena Magdeburg, 7 Kähne mit 2170 Florian erkannten 2041 Uni Magdeburg Reagierern (18,8%) 8 Zachen Uwe 2041 Uni Dortmund 9 Grabner Rene 2035 TU Chemnitz 10 Wadiak Monika 2028 FH Mannheim 11 Waly Hussein 1987 Uni Heidelberg 12 Wissuwa Stefan 1964 HS Wismar 2. Platz: Jochen Feist, 13 Marquardt Universität Steffen Konstanz, 1942 FH Fulda mit 2148 14 Kaiser Elisabeth 1936 Uni Trier erkannten 15Reagierern Metzner Michael (18,6%) 1923 Uni Heidelberg 16 Drautz Markus 1904 Uni Frankfurt 17 Degenhardt Thomas 1886 FH Schmalkaden 18 Parey Matthias 1866 Uni Bonn 3. Platz: 19 Marx Anja 1860 FH Mannheim Eva Lohmeier, Hochschule St.Gallen, mit 2125 20 Niedling Eric 1859 TU Ilmenau 21 Neukirch Thomas 1807 Uni Frankfurt korrekt erkannten Reagierern (18,4%) 22 Kaiser Marc-Andre 1710 Uni Hannover 23 Jorzik Nathalie 1686 Uni Hamburg 24 Friedrich Johan 1300 Uni Heidelberg 25 Pohl S. 1070 FH Mittweida
Feedback Aussagen Sehr gut hat mir gefallen, dass man mit einem realen Datensatz und entsprechender Größe arbeiten konnte. Sehr gefallen hat mir die Idee der Challenge überhaupt. Wann befasst man sich schon eigenständig mit einer derartigen Software in so einem selbständigen Masse. Auch die Betreuung im Q&A fand ich super. Wäre toll, wenn sich derartige Events wiederholen würden. Sehr komplexe Software mit sehr vielen Möglichkeiten das Ergebnis zu beeinflussen. Mächtiges Instrument, doch Spezialisierung von Nöten, um volle Effizienz zu erreichen. Die Möglichkeit praktische Erfahrungen im Datamining zu sammeln. Die Praxisnähe der Aufgabenstellung (große Datenmengen,die so für eine Katalogselektion verwandt worden). SAS Version 9
Was gibt es Neues in Version 9? Usability Scalability Manageability Interoperability V9.0 Mehrwert für den Kunden Usability Verbesserter ODS - Output (mit Markup und Document ) Java Oberflächen Manageability SAS Management Konsole Interoperability (within SAS and with 3 rd party) Volle XML Unterstützung Zentral geschalteter, offener Metadatenserver Scalability Parallelzugang zu DB (DB2, Oracle, Sybase) Prallele (threaded) Prozeduren (SORT, SUMMARY, REG, DMREG)
Usability V9 SAS Web Report Center Usability - Enterprise Miner 5.0 Die neue Java- (Swing-) Oberfläche bietet erhöhte Anwenderfreundlichkeit hinsichtlich Bedienung und Visualisierung von Prozessen und Ergebnissen Das vom Enterprise Guide bekannte Konzept der Ergebnisveröffentlichung ( Publish and Subscribe ) ermöglicht zielgenaue Informationsverbreitung
Manageability - Die SAS Management Konsole Zentrale Komponente des integrierten Metadatenkonzepts: Java-Oberfläche zum parallelen Metadaten-Server SMC Zentraler Leitstand für die Administration der SAS Umgebung. Monitor Wartung Lizenzmanager Installationsinformationen Umgebung Metadaten Server Applikation User Manager Sicherheitsrichtlinien Autorisierung Zugriffskontrolle Quelle SAS Prozesse Scalability - mehrere Threads möglich Berechnung Mittlere Code monatliche der für das Konfidenzbänder Druckdifferenz LOESS- Modell ist zwischen ist der (bisher) Flaschenhals Darwin nicht und und wird multithreaded. Easter multithreaded! Island NIST (1998), Statistical Reference Data Sets