Überblick Vorhandene Listen/Analysen in ENTERBRAIN Die Daten in ENTERBRAIN Das Fundament des BI - Hauses Details zur ENTERBRAIN Staging Area Reports und Cubes auf Basis der Staging Area Data Mining mit der Staging Area
Vorhanden in ENTERBRAIN Reports, Auswertungen Variable Listen Analysen (ABC, Pareto, etc.) Toolbox Aktionsauswertung
Daten in ENTERBRAIN Transaktionsorientiert Veränderlich Datensatzsperren Performance Tausende Tabellen Komplexe Relationen Steigende Tendenz
Operative und dispositive Daten Ziel Ausrichtung Zeitlicher Bezug Zustand Merkmale operativer Daten Geschäftsprozesse abwickeln Tagesaktuelle Geschäftsdaten Aktuell, Zeitpunktbezogen Redundant, Inkonsistent Merkmale dispositiver Daten Management-Unterstützung, Entscheidungsfindung Verdichtete, transformierte Daten Zeitraumbezogen Bereinigt, konsistent Update Laufend Fortschreibend
Weitergehende Anforderungen Einbeziehung externer Daten Automatische Berichtserstellung Einheitliche Strukturierung Graphische Auswertungen Berichtsdesigner Unterschiedliche Nutzergruppen
Wie kommen wir dahin? Neue Datenbank Sinnvoll geordnete Zusammenstellung der Daten Automatischer Prozess zur Aktualisierung ENTERBRAIN Staging Area: Das Fundament des BI-Hauses
Beispiele für BI-Plattformen Kommerziell: Microsoft SQL-Server Business Intelligence Edition Open Source: JasperReports Server Community Edition
Die Struktur der ENTERBRAIN Staging Area Multidimensionales Datenmodell: Zahlen, Mengen (Fakten) stehen im Mittelpunkt Beschreibende Daten (Dimensionen) sternförmig angeordnet
Das Stern - Schema Beispiel:
Der Clou: Hierarchisierung Innerhalb der Dimensionen findet man häufig hierarchische Beziehungen Tag Woche Monat Quartal Jahr Werbecode Aktion Aktionsgruppe
Welcher Umsatz wurde mit Aktion 1 (1.Dimension) in Region Ost (2.Dimension) im Jahr 2010 (3. Dimension) gemacht?
Das Galaxy - Schema Integriert mehrere Stern-Schemata Mehrere Faktentabellen Dimensionen mehrfach verknüpft
Und wie füllen wir die Staging Area? JAVA basiertes Framework Unabhängig vom DB-System Einsetzbar auch für nicht ENTERBRAIN-Quelldatenbanken Aufbau und Pflege des Galaxy-Schemas >> Fundament für Reports und BI-Analysen
Bleibt noch ein Problem: Abbildung von Dimensionsänderungen Beispiel: Umzug eines Mitglieds in 2013 von Hamburg nach München Wie viele Mitglieder hatten wir 2013 in Hamburg?
Lösung: Slowly Changing Dimensions (SCD) Verfahren von Kimball, 2002 vorgeschlagen Historisierung der Einträge per Gültigkeitsintervall
Überwachung der Staging Area Aktualität Dauer Fehler
Überwachung der Staging Area Fehlerkontrolle
Reports auf Basis der Staging Area Reports im Browser
Reports auf Basis der Staging Area Diagramme im Browser
Cubes auf Basis der Staging Area
Ausblick: Data Mining mit der Staging Area Unbekannte Zusammenhänge finden Statistik Maschinelles Lernen Mustererkennung
Vielen Dank Fragen?