Gliederung 1. Einführung 2. Arbeitsaufgaben und -prozesse der Fach- und Führungskräfte 3. Klassische Ausprägungen der Management Support Systeme 4. Business Intelligence 5. Datenbereitstellung: Data Warehousing 6. Datenanalyse: On-Line Analytical Processing und Data Mining 7. Betriebliches Berichtswesen 8. Gestaltung und Betrieb von BI-Lösungen 9. Aktuelle Tendenzen bei Business Intelligence-Systemen Folie 97
Berichtsspezifikation Berichtsinhalt Gegenstand Detaillierung Breite Genauigkeit Berichtszeit Berichtsintervall Berichtszeitraum Berichtszweck Dokumentation Entscheidungsvorbereitung Auslösen Bearbeitungsvorgang Kontrolle Berichtsform Darstellungsart Struktur Präsentationsmedium Übertragungsweg Berichtsinstanz Empfänger Verantwortlicher Ersteller Folie 98
Einfache Abfragegeneratoren Folie 99
Abfrage- und Berichtsgeneratoren Folie 100
Berechnungsfunktionen Folie 101
Report-Generierung Folie 102
Reporting-Tools Folie 103
WWW-Browser Nahtlose Integration in die vertraute WWW-Umgebung Transparenter Durchgriff für den Endanwender Erweiterung von HTML um multidimensionale Komponenten Folie 104
BI-Portallösung Folie 105
Portaltechnologien Folie 106
Exkurs: Jasper Reporting JasperSoft (www.jaspersoft.com): 2001 Gründung der Firma Panscopic, 2005 Umbenennung in JasperSoft - Einer der führenden Anbieter im Bereich OSBI - OS-Entwicklungsportal (www.jasperforge.org) - Erstellung und Organisation Jasper-spezifischer Projekte - Veröffentlichung von News - Kommunikation von Hilfe und Problemen - über 2,5 Millionen Downloads - 7.000 Geschäftskunden - Über 60.000 registrierte Entwickler - Parallele Professional-Versionen, Folie 107 verschiedene Supportmodelle
Exkurs: Jasper Reporting Folie 108
Exkurs: Jasper Reporting / ireport - Open Source Tool zur Erzeugung komplexer JasperReports (Designer für JasperReports) - 100% Support der JasperReports XML tags - 100% Java, GNU General Public Licence - WYSIWYG-Editor, drag and drop - Unicode und non-latin Languages (Russisch, Chinesisch, Japanisch, Koreanisch, etc.) - Browser für Dokumenten-Struktur - Unterstützt alle via JDBC zugänglichen Datenbanken - Wizard zur automatischen Berichtserzeugung - Unterstützt Subreports - Backup-Features - Erweiterbar durch plug-ins (z.b. für JasperServer) - Scriptlets - Charts - Styles-Bibliohek Folie 109
Exkurs: Jasper Reporting Folie 110
Exkurs: Jasper Reporting Datenquellen (die Wichtigsten) - JDBC connection - (Spring) Hibernate Verbindung - XMLA Server Verbindung - XML Datei - Java Beans Datenquelle - EJBQL Verbindung - CSV Datei - Mondrian OLAP Verbindung - JRDataSourceProvider Datenabfrage (aktive Verbindung) - SQL - EJBQL - Xpath - HQL (Hibernate Query Language) - MDX - XMLA-MDX Folie 111
Exkurs: Jasper Reporting Berichtselemente $F{Feldname}, $V{Variablenname}, $ P{Parametername} Linien, Rechtecke, Ellipsen, Text/ -felder, Grafiken, Barcodes, Rahmen, Diagramme Variable: - vordefinierte ((Gesamt-)Seitenzahl, Datum, Prozent, Gesamt) - individuell definierbare (manuelle Eingabe oder mit Expression-Editor) - Kalkulationsarten z.b.: Summe, Anzahl (verschiedene Werte), Durchschnitt, Niedrigster, Standardabweichung) Diagramme: - Kuchen-/Kreisdiagramm (2D/3D) - Balkendiagramm (2D/3D) - Flächendiagramme - Stapel-Balken-Diagramme (2D/3D) - Liniendiagramme - Streuungs-Diagramme - Blasen-Diagramme - Zeit-Reihen-Diagramm - High-Low-Diagramme - Kerzendiagramme - Tacho - Thermometer Folie 112
Exkurs: Jasper Reporting SQL-Generator Query-Designer Folie 113
Exkurs: Jasper Reporting Bearbeitung von Eigenschaften -- Seiten-, Spalten-, Abschnittsformatierungen - Name, Typ, Beschreibung -- Vorgehen falls keine/doppelte Daten - Druckoptionen -- Ausgabezeitpunkte - Sonst. Formatierungen ( z.b. Währung) -- Hyperlinks, Datenzuordnungen, etc. - Teilbarkeitsdefinitionen -Berichtsausrichtung - Manuell über Raster oder automatisch (Position, Tabellen verbinden, Größe, Zwischenräume) - Objekte/Elemente in den Vordergrund/ Hintergrund bringen Berichtsvoransicht PDF, HTML, Excel, CSV, Text, RTF, ODF, JRViewer Unterstützende Features - Report-Wizard und Expression-Editor - Ausdrücke (z.b.: Formeln/Funktionen) - Definierte Ausdrücke speicherbar als.txt-datei - Meldungen (semantische/syntaktische Fehler) Folie 114
Exkurs: Jasper Reporting Berichtsspeicherung PDF, HTML, XLS, CSV, RTF, ODF, XML Funktionen unter Verwendung von JasperServer und JasperAnalysis - ireport verfügt über eine Schnittstelle zum JasperServer - Scheduling (Intervall, Formate, Speicherort, Verwaltung, Benachrichtigungen, etc.) - Report-Export durch User (PDF, Excel, RTF, CSV) - User-/ Rollenkonzepte - Ressourcen- und Berichtsverwaltung Folie 115
Exkurs: Jasper Reporting Funktionen unter Verwendung JasperAnalysis - Individuelle Betrachtung der Analysis Views entsprechend JPivot-OLAP Funktionalitäten - Cube-Zeilen, -Spalten, -Filter per OlapNavigator (zusammenklicken) oder die MDX-Query manuell definieren - Diagramme integrieren und konfigurieren (Typ, Titel, Größe, Farbe, Legende) Folie 116
Gliederung 1. Einführung 2. Arbeitsaufgaben und -prozesse der Fach- und Führungskräfte 3. Klassische Ausprägungen der Management Support Systeme 4. Business Intelligence 5. Datenbereitstellung: Data Warehousing 6. Datenanalyse: On-Line Analytical Processing und Data Mining 7. Betriebliches Berichtswesen 8. Gestaltung und Betrieb von BI-Lösungen 9. Aktuelle Tendenzen bei Business Intelligence-Systemen Folie 117
Vorgehensmodell zur BI-Gestaltung BI-Strategie BI-Projektdefinition BI-Analyse BI-Qualitätsmanagement BI-Design BI-Implementierung BI-Produktivsetzung BI-Projektmanagement Folie 118 BI-Betrieb und -Wartung
Theoretische Vorbetrachtung Vision, Mission und Ziele Quelle: Zirkel, Trost: BI-Strategie Der Weg zum maximalen Return-on-BI-Invest, 5. Europäische TDWI-Konferenz, München 11.06.07 Folie 119
Theoretische Vorbetrachtung Definition Vision Quelle: Zirkel, Trost: BI-Strategie Der Weg zum maximalen Return-on-BI-Invest, 5. Europäische TDWI-Konferenz, München 11.06.07 Folie 120
Vision - Beispiele Quelle: Zirkel, Trost: BI-Strategie Der Weg zum maximalen Return-on-BI-Invest, 5. Europäische TDWI-Konferenz, München 11.06.07 Folie 121
Theoretische Vorbetrachtung Definition Mission Quelle: Zirkel, Trost: BI-Strategie Der Weg zum maximalen Return-on-BI-Invest, 5. Europäische TDWI-Konferenz, München 11.06.07 Folie 122
Mission Beispiel VW-BI Quelle: Zirkel, Trost: BI-Strategie Der Weg zum maximalen Return-on-BI-Invest, 5. Europäische TDWI-Konferenz, München 11.06.07 Folie 123
Zielhierarchie Quelle: Zirkel, Trost: BI-Strategie Der Weg zum maximalen Return-on-BI-Invest, 5. Europäische TDWI-Konferenz, München 11.06.07 Folie 124
Zielabhängigkeiten Quelle: Zirkel, Trost: BI-Strategie Der Weg zum maximalen Return-on-BI-Invest, 5. Europäische TDWI-Konferenz, München 11.06.07 Folie 125
Ordnungsrahmen für strategische Maßnahmen Quelle: Zirkel, Trost: BI-Strategie Der Weg zum maximalen Return-on-BI-Invest, 5. Europäische TDWI-Konferenz, München 11.06.07 Folie 126
Exkurs: BI-Strategie bei ausgewählten deutschen Großunternehmen 1. DAK 2. Volkswagen AG Folie 127
BI-Organisation bei der DAK Das CC DWH/BI ist zentraler Ansprechpartner für Business Intelligence, es bietet seine Dienste allen Bereichen der DAK an: Berücksichtigung einer übergreifenden Unternehmenssicht Beratung der Fachbereiche bei allen dispositiven Fragestellungen Bereitstellung von integrierten und bereinigten Daten aus unterschiedlichen operativen und externen Systemen von historischen Daten für Zeitreihen von geeigneten Auswertungswerkzeugen von Management-Reporting-Systemen Koordination der Anforderungen aus den Fachbereichen an die entscheidungsunterstützenden Informationssysteme Schulung und Betreuung der Anwender Folie 128
BI-CC-Organisation Folie 129
Vision: Data Warehouse Prozesse unter einem Dach Folie 130
Aufgabenverteilung im Data Warehouse- Prozess Folie 131
BI-Organisation bei Volkswagen Business Strategy IT-Strategy Business Processes Landscape External PP KAP SPK Partner, Supplier, Dealer, Customers SUP Business Process Specific IT-Solutions PP - Produktprozess Fahrzeug KAP - Kundenauftragsprozess Fahrzeug SPK - Kundengewinnung SUP - Steuerungs- / Unterstützungsprozesse Self Developed Solutions Self Developed Solutions Self Developed Solutions Self Developed Solutions Standard Solutions Standard Solutions Standard Solutions Standard Solutions IT Security Principles and Policies Basic Solutions Middleware & Data Management Network MAIL Messaging Calendar Output Mgmt Archive DBMS EAI Carrier Portal Components Process-Workflow CMS DMS Colab. Search Enterprise Content Management Master Data Mgmt. Protocols BI-Services BI-Services OFFICE Basic WEB Tech-nologies Telecommunication Services System Platforms & Data Storage Operating Systems Hardware Storage Solutions BI BI BI DWH BI DWH Tech AIM SSO Directory SOA Principles and Policies Frameworks Development Methods Processes Standards Technology WEB Services Tools Quelle: Gehrke, Wendlandt, Sommer: SOA und BI im Volkswagen Konzern, TDWI-Information Days BI meets SOA, Stuttgart 29. November 2006 Folie 132
Ergebnisse der Ist-Aufnahme entlang der Hauptdimensionen S m i Fachlichkeit Technik Reporting / Analyse Si Planen ST m ul. AQUA (Quasi-FI, Servbase) Repor ting COIN FVuPS Planen BM BY61 PPC UM Info (PAMIS) STAR-TI OPUS Versuchs bau FPL BDW ipad STAR LANIS MIS-V PWL KBM LISON HIFA Report DWH VWT GLOBE FIS View WANDA GF BW ET2000 BW ET2000 BWP EWP HIFA QS LOAD TAF INEAS MA INEAS Versand BW ET2000 KUBA Fleet Analysis FleetCom DWH Verona VW Immobilien TIVOLI PP KAP SPvK SUP I. EVP BM Report KASKO ecrm Profis New ada Reporting KPMM-BW ServoDWHVC CER HR-C Erfolgs Quadrat (Auto5000) BWKT VOLKSWAGEN DB2 VWT AMS ISCO Inhaltlich redundante Systeme, die nicht alle Prozessabschnitte unterstützen. Kein KPI-Referenzmodell im Einsatz. Keine Integrationslösung vorhanden. Organisation Überlappende/kaskadierende Datenflussbeziehungen. Isolierte Datensilos. Heterogenität in Architekturen und Produkten. Ana lyse Logistik Logistik Plan LOGINkosten DB Controll An/Abwesen Kenn FEDIS VISON zahlen P ZENTA Stück liste VOPON / FBT GIDEON Unterbeliste standsvilog ZAÜ TEVON QTSSchicht- Schicht- LANISLOGIS Maximo Report buch buch IN NSUFIS-Reporting Projekt EIS- ETF Plan AKL BA Planer EM e-wfm Fehlteile LOG FEZ PG1 Rep ortin Unbekannt g P P Meilen Steine B6 AQSP Report KAP INTACT Q-Kosten VK- BW STF Migration MAT HC SSM Q-WHReport STF GVO SPv K Zebra Verona SARA AUDI Geschäfts wagen Reporting IT Report GEMINI FI GEMINI CO-OM GEMINI GEMINI Navis PS SL FI SUP SEKT FP GIP ITc. Projekt- statt Portfolio-getriebene Entwicklung der Systemlandschaft. Keine übergreifenden Architekturstandards und Leitfäden im Einsatz, zum Beispiel SOA. Unterschiedliche Betreibermodelle für BI-Systeme im Betrieb. Quelle: Gehrke, Wendlandt, Sommer: SOA und BI im Volkswagen Konzern, TDWI-Information Days BI meets SOA, Stuttgart 29. November 2006 Folie 133
Herausforderungen an BI im Volkswagen Konzern Problematischer Ist-Zustand Individualisierte BI-Projektentwicklung ohne bereichsübergreifende Einbindung in den Gesamtkontext (Strategie) hat in der Vergangenheit zu einer kostenintensiven, von Heterogenität (Systeme, Produkte) geprägten BI-Landschaft geführt, deren Weiterentwicklung nicht sinnvoll ist. BI Strategie Maximaler Return on BI Invest Fachliche und technologische Treiber innerhalb des Marktes kennzeichnen BI als eine innovative Technologie. BI kann innerhalb des VW-Konzerns unter Verwendung einer standardisierten BI-Landschaft Beiträge zur Wertsteigerung des Unternehmens leisten. Nutzung des Innovationspotentials von BI. Prozessabdeckung erhöhen. Prozessübergreifende Auswertung ermöglichen. Neue fachliche Möglichkeiten erschließen (z. B. EDW-Reporting, Integrierte Planung). Hebung der Kosteneinsparpotentiale auf den Hauptebenen Entwicklungsprozess, Betrieb, Produkte, Support. Ungenutztes Potential Quelle: Gehrke, Wendlandt, Sommer: SOA und BI im Volkswagen Konzern, TDWI-Information Days BI meets SOA, Stuttgart 29. November 2006 Folie 134
BI-Strategielandkarte Wertorientierung Business Use ausweiten Kosten optimieren Fix- und Fertigungskosten. Kunde&Markt Prozessunterstützung verbessern Prozessabdeckung erhöhen Enterprise Reporting ermöglichen Transparenz im Konzern erreichen Marktgerechtes Portfolio. Produktivität Agilität erhöhen Bebauungsplanung steuern Entwicklung standardisieren Betrieb organisieren Produktivität des Wissens Prozessqualität und -sicherheit, effizienter Ressourceneinsatz. Innovation Komplexität reduzieren Konsolidierung durchführen Qualitätsmanagement anwenden Voraussetzungen für Innovation schaffen, konzernweite Lösungen ermöglichen. Attraktiver Arbeitsplatz BI-Know-How stärken Personalentwicklung, Mitarbeiterzufriedenheit. Quelle: Gehrke, Wendlandt, Sommer: SOA und BI im Volkswagen Konzern, TDWI-Information Days BI meets SOA, Stuttgart 29. November 2006 Folie 135
Strategische Maßnahmen: Überblick BI-Vision BI-Strategie- Ziele Innovativität von BI BI erhöhen Standardisierung von BI BI erhöhen Qualität von BI BI erhöhen Kosten pro BI-System senken Strategische Maß ßnahmen Fachlichkeit Organisation Technik BI-Governance Architekturelemente Unterstützung operativer Prozesse BI-Competence Center Konsolidierung BI-ITIL Betriebskonzept Hostingund Sourcing Kommunikation Masterplan Quelle: Gehrke, Wendlandt, Sommer: SOA und BI im Volkswagen Konzern, TDWI-Information Days BI meets SOA, Stuttgart 29. November 2006 Folie 136
Elemente der Roadmap 2006-2007 2008-2011 2012-2015 Unterstützung Operative Prozess Business Activity Monitoring BPM CPM BI der Weg zum Wissensvorsprung des Volkswagen Konzerns Konsolidierung Architekturelemente Hosting/ Sourcing 2005 BI-ITIL BI-CC BI-Governance Kommunikation Quelle: Gehrke, Wendlandt, Sommer: SOA und BI im Volkswagen Konzern, TDWI-Information Days BI meets SOA, Stuttgart 29. November 2006 Folie 137
Vorgehensmodell zur BI-Gestaltung BI-Strategie BI-Projektdefinition BI-Analyse BI-Qualitätsmanagement BI-Design BI-Implementierung BI-Produktivsetzung BI-Projektmanagement Folie 138 BI-Betrieb und -Wartung
BI-Projektdefinition Definition der Projektziele Projektaufbauorganisation Grober Projektplan Grundlegende Entscheidungen zur Infrastruktur Werkzeugevaluationen (Proof of Concept, PoC) Folie 139
Vorgehensmodell zur BI-Gestaltung BI-Strategie BI-Projektdefinition BI-Analyse BI-Qualitätsmanagement BI-Design BI-Implementierung BI-Produktivsetzung BI-Projektmanagement Folie 140 BI-Betrieb und -Wartung
BI-Analyse Ist-Analyse einschl. Schwachstellenanalyse Technische Informationen in Bezug auf den aktuellen System- bzw. Prozesszustand (Hard- und Softwarearchitektur, Netz-Infrastruktur, operative Quellsysteme und ihrer Datenmodelle, vorhandene Systemschnittstellen, Endbenutzersysteme) Requirements Engineering Quelldatenanalyse Semantische Modellierung Folie 141
Requirements Engineering Induktive Verfahren Dokumentenanalyse Interviews Fragebogenaktion Informationsbedarfs-Berichte Direkte Beobachtung am Arbeitsplatz Deduktive Verfahren Informationskatalog mit Zuordnungen von Informationsinhalten zu Aufgaben Folie 142
Semantische Modellierung -Bausteine multidimensionaler Datenmodelle 1. Betriebswirtschaftliche Variablen (Messgrößen, Kennzahlen, Fakten) 2. Dimensionen 3. Dimensionshierarchien 4. Regeln Folie 143
Semantische Modellierung Betriebswirtschaftliche Variablen (Kennzahlen) Kennzahlendefinition Zahl, die betriebliche und außerbetriebliche Informationen in aussagekräftiger, komprimierter Form wiedergibt Abgrenzungsmerkmale Gegenstand (Mengen / Werte, Zeitpunkt / Zeitraum) Objektbereich (Gesamtwirtschaftlich, Konzern, Teilbetrieb) Absolute Kennzahlen (z.b. Beschäftigte, Umsatz, Bilanzsumme) Folie 144 Relative Kennzahlen Gliederungszahlen Teil-/Gesamtgröße (z.b. EK / GK) Beziehungszahlen Ursache/Wirkung (z.b. Gewinn / EK) Indexzahlen zeitliche Entwicklung im Verhältnis zum Basiswert 100% Statistische Kennzahlen (z.b. Varianz, Arithmetisches Mittel)
Semantische Modellierung - Kennzahlensysteme geordnete Anzahl von Kennzahlen, die in einer Beziehung zueinander stehen und als Gesamtheit über einen Sachverhalt vollständig informieren Spitzenkennzahl liefert die betriebswirtschaftlich wichtigste Aussage des Systems in komprimierter Form DuPont-Kennzahlensystem RL-Kennzahlensystem ZVEI-Kennzahlensystem Balanced Scorecard Finanzen Kunden Geschäftsprozesse Lernen/Wachstum RoI x Gewinn : Umsatz Umsatz : Kapital./. Fixe Kosten Umsatz./. Variable Kosten Umsatzrendite Kapitalumschlag Deckungsbeitrag Umlaufvermögen + Anlagevermögen liquide Mittel + Forderungen + Vorräte Folie 145
Semantische Modellierung -Kennzahlen als Bestandteile multidimensionaler Datenstrukturen Betrachtung von Einzelkennzahlen Zeit 100 120 140 Absatzmenge Region 135 5 4 450 600 560 Betrachtung mehrerer Kennzahlen Zeit Artikel Folie 146 Kennzahlendimension Erlös - Stückkosten = DB1 100 200 140 80 120 40 20 80 100 Artikel
Semantische Modellierung -Bausteine multidimensionaler Datenmodelle 1. Betriebswirtschaftliche Variablen (Messgrößen, Kennzahlen, Fakten) 2. Dimensionen 3. Dimensionshierarchien 4. Regeln Folie 147
Semantische Modellierung - Dimensionen Aufgabe: Aufgliederung / Konkretisierung von Kennzahlen bzw. Zahlenwerten Inhalt: Sachlogisch zusammengehörige Umweltobjekte, gleichen Geschäftsaspekt betreffend Folie 148 Ausprägungen: Einzelobjektdimensionen wenige, aufzählbare Dimensionselemente (z.b. Szenario- oder Kennzahlendimension) Mengendimensionen viele bis sehr viele Dimensionselemente (z.b. Kunden- oder Artikeldimension) Beschreibung nur über Objektmengen
Semantische Modellierung - Dimensionskomponenten Abgeleitet bzw. verdichtete Elemente Dimensionselemente Hierarchiestufe bzw. Konsolidierungsebene (Level) Basiselemente bzw. unabhängige Elemente Standarddimensionen (z.b. Artikel, Kunden, Regionen) Kennzahlendimension (Measure Dimension) Szenario- bzw. Wertartdimension (Plan, Ist, Soll, ) Zeitdimension (vorbestimmte Struktur) Granularität Folie 149
Semantische Modellierung -Bausteine multidimensionaler Datenmodelle 1. Betriebswirtschaftliche Variablen (Messgrößen, Kennzahlen, Fakten) 2. Dimensionen 3. Dimensionshierarchien 4. Regeln Folie 150
Semantische Modellierung - Dimensionshierarchien Relevante Konsolidierungspfade für Drill-Down / Roll-Up Kunden Total Einzelkunden Kundengruppen Einfache Hierarchien: Jedes Element hat höchstens ein übergeordnetes Element Folie 153
Semantische Modellierung - Dimensionshierarchien Kunden Total Sonderfall: Parallele Hierarchien Kundengruppen logisch Kundengruppen regional Einzelkunden Folie 154
Semantische Modellierung - Dimensionshierarchien Januar 2010 Mögliches Problem: Inkonsistenz durch fehlerhafte Konsolidierung Februar 2010 Quartal 1 / 2010 März 2010 März 2010 Vorsommer / 2010 April 2010 Frühjahr / 2010 Mai 2010 Folie 155
Semantische Modellierung - Dimensionshierarchien Kunden Total Problematisch: Keine sauberen 1:N-Strukturen Kundengruppen logisch Einzelkunden Folie 156
Semantische Modellierung - Dimensionshierarchien Konzern Total Sonderfall: Anteilige Verrechnung Tochtergesellschaft Muttergesellschaft 60% 40% Folie 157
Semantische Modellierung - Dimensionshierarchien Gesamt Problematisch: Unausgeglichene Bäume Jahre Monate Folie 158
Semantische Modellierung - Dimensionshierarchien Konzern Total Dramatisch: Häufige Strukturänderungen (Strukturbrüche) Tochtergesellschaft Muttergesellschaft neu! Folie 161
Lösungsalternativen bei Strukturbrüchen Anpassung des historischen Datenmaterials an neue Strukturen Vorteile: Keine Aufblähung des Datenbestandes; Datenstrukturen bleiben überschaubar Nachteile: Alte Strukturen sind verloren; Anwender wollen u.u. Berichte mit alten Strukturen Separate Speicherung des historischen Datenbestandes zusätzlich zum Komplettbestand mit neuen Strukturen Vorteile: Alte Auswertungen können abgerufen werden Nachteile: Datenvolumen; aufwendige Aktualisierung, wenn Anwender auch neue Zahlen in den alten Strukturen sehen wollen; verwirrend für Endbenutzer Aufbau paralleler Hierarchien mit alten/neuen Strukturen Vorteile: Alle Zahlen können mit beliebigen Strukturen angezeigt werden Nachteile: Dimensionsstruktur kaum überschaubar Temporale Datenbanken - Gültigkeitsstempel Vorteile: Alle Zahlen können mit beliebigen Strukturen angezeigt werden Nachteile: Performance; Konzepte noch nicht ausgereift Folie 162
Semantische Modellierung - Regeln Verknüpfungs- und Ableitungsregeln für Dimensionselemente Hyperion Essbase MIS Alea Folie 163
Semantische Modellierung - Regeln Dimensionsübergreifende Berechnungsregeln z.b. Jahresdurchschnitt Mitarbeiterzahl als (Jahresendbestand Mitarbeiter - Vorjahresendbestand Mitarbeiter) / 2 Folie 164
Semantische Modellierung - Regeln Ausnahmeregeln für nicht-additive Kennzahlen z.b. Preis, Lagerendbestand Einzelartikel Artikelgruppen 600?? 100 300 200 Artikelpreise Gegebenenfalls sinnvoll: Durchschnittsberechnung oder letzter Wert Zu beachten: Semi-additive Größen (Lagerendbestände lassen sich zwar sinnvoll über alle Lagerorte addieren, nicht jedoch über die Zeit) Folie 165
ER-Modellierung multidimensionaler Datenstrukturen Lieferant Artikel Mitarbeiter Einkaufspreis Absatzmenge Vertrieb 1 n Preis 1 n n 1 1 n 1 n n Erlös n 1 1 Periode Kunde Folie 166
Clusterbildung zur Darstellung von Dimensionshierarchien Periode 1 Jahr n Woche 1 n 1 n 1 n Monat Tag Folie 167
ER-Modellierung multidimensionaler Datenstrukturen: Beispiel Artikel v für verdichtet zu Gesamt ISA Vertriebsweg v Sondermodellgruppe Gesamt Jahr Reihenfolge Region v Kennzahlen Szenario v v Marke ISA ISA Quartal Reihenfolge Land v Bruttoerlös Erlösschmä lerungen Variable Kosten Plan Ist v v Gruppe Nettoerlös Deckungsbeitrag I Abweichung Monat Reihenfolge Gebiet v v v Einzel Quelle: Totok, A., Semantische Modellierung von multidimensionalen Datenstrukturen - Vortragsunterlagen, Workshop des GI-Arbeitskreises MDDB, 27.4.98, Darmstadt Tag Reihenfolge Filiale Folie 168
Grenzen der ER-Notation Unzulängliche Möglichkeiten zur Abbildung von Einzelobjekten (Kennzahlen, Scenario); Konzentration auf Objektklassen Verknüpfungen zwischen Einzelobjekten (z.b. relative Kennzahlen) wird nicht unterstützt Folie 169
Application Design for Analytical Processing Technologies (ADAPT) Kernelemente Dimensionselemente Würfel (Hypercube) Dimension1 Dimension2 Dimension (Dimension) Berechnungsformel (Model) Hierarchie { } Hierarchiestufe (Hierarchy Level) { } Dimensionselement (Dimension Member) { } Dimensionsausschnitt (Dimension Scope) Dimensionsattribut (Dimension Attribute) Quelle: Bulos, Dan: A New Dimension: OLAP Database Design. In: Database Programming & Design, 9 (1996) 6, S. 33-37. Folie 170
Application Design for Analytical Processing Technologies (ADAPT) Beziehungstypen Fully Exclusive teilt die gesamte Grundmenge in disjunkte Teilmengen. Fully Overlapping teilt die gesamte Grundmenge in nicht-disjunkte, d.h. sich überlappende, Teilmengen. Partially Exclusive stellt wieder disjunkte Teilmengen dar, sie decken aber nicht die Grundgesamtheit ab. Selbiges gilt für Partially Overlapping. Hier wird eine Teilmenge der Grundgesamtheit in nicht-disjunkte Teilmengen untergliedert. Quelle: Bulos, Dan: A New Dimension: OLAP Database Design. In: Database Programming & Design, 9 (1996) 6, S. 33-37. Folie 171
Application Design for Analytical Processing Technologies (ADAPT) Folie 172
ADAPT-Beispiel: Attribute Kunden Bezeichnung Kundenhierarchie { } Gesamt { } KGruppe Key-Accounter { } Kunde Adresse Folie 173
ADAPT-Beispiel: Dimensionsausschnitte { } Linienmitarbeiter { } Projektmitarbeiter { } Mitarbeiter { } Sachbearbeiter { } Abteilungsleiter Folie 174
ADAPT-Beispiel Vertriebsergebnis Artikel Kennzahlen Szenario Vertriebsweg Zeit Artikel Kennzahlen Szenario Vertriebsweg Zeit Artikelhierarchie { } Bruttoerlös { } Plan Vertriebsweghierarchie Zeithierarchie { } Gesamt { } Erlösschmälerungen { } Ist { } Gesamt { } Jahr { } Marke { } Nettoerlös { } Abweichung { } Region { } Quartal { } Gruppe Bruttoerlös -Erlösschmälerungen Plan-Ist { } Land { } Monat { } Einzel { } Variable Kosten { } Gebiet { } Deckungsbeitrag I { } Filiale Nettoerlös -Variable Kosten Folie 175
Vorgehensmodell zur BI-Gestaltung BI-Strategie BI-Projektdefinition BI-Analyse BI-Qualitätsmanagement BI-Design BI-Implementierung BI-Produktivsetzung BI-Projektmanagement Folie 176 BI-Betrieb und -Wartung
DV-Speicherungskonzept mit multidimensionalen Datenbanken Spezifische Ausrichtung auf multidimensionale Datenstrukturen ermöglicht i.d.r. 1:1-Umsetzung des semantischen Konzeptes Hypercube- vs. Multicube-Ansätze Keine Standards (ggf. durch die Microsoft-API OLE DB for OLAP) Keine einheitlichen Schema-Vorgaben Folie 177
Würfel-und Dimensionsübersicht in Delta Alea Folie 178
Dimensionsstrukturen in Delta Alea Folie 179
Dimensionsstrukturen in Delta Alea Folie 180
Dimensionsstrukturen in Hyperion Essbase Folie 181
Folie 182 A-0197 1000 2000 Artikel-ID 0001 0001 0001 0001 0001 0001 0001 0001 0001 0001 0002 0002 Region-ID 00 01 02 03 04 05 06 07 08 09 00 01 A-0297 1100 2200 A-Q197 A-97 A-0198 Faktentabelle Weitere Denormalisierungsschritte DV-Speicherungskonzept mit relationalen Datenbanken
DV-Speicherungskonzept mit relationalen Datenbanken Aufbau von Kennzahlendimensionen Kennz-ID 00 01 Bez. Absatz Umsatz Formel Dimensionstabelle Warenpreis * Absatz Region-ID 00 01 02 03 04 05 06 07 08 09 00 01 Artikel-ID 0001 0001 0001 0001 0001 0001 0001 0001 0001 0001 0002 0002 Kennz-ID 00 01 00 01 Wert Folie 183 Quelle: Ehrenberg/Heine: Konzept zur Datenintegration für MSS auf der Basis uniformer Datenstrukturen, in: Wirtschaftsinformatik 40 (1998) 6, S. 503-512 Faktentabelle
Begründungen für Star-Schema- Modellierung Wenige Tabellen Wenige und einfache Beziehungen zwischen Tabellen Leicht nachvollziehbar Auswertungs- und nicht erfassungsorientiert Informationen sollen entsprechend der Geschäftssicht des Anwenders organisiert sein, um sie optimal nutzen zu können Folie 184
Vergleich von relationalem und multidimensionalem Speicherkonzept Relationales Speicherkonzept Skalierbarkeit Häufig Read-Only-Lösungen Beliebige Datenmengen Zahlreiche Attribute in jeder Dimension möglich Mäßige Performance Zusatzoptionen (Spezielle Indextechniken) Multidimensionales Speicherkonzept Plattformabhängig Datenmodifikation möglich (What If) Aufblähung des Datenbestandes Eingeschränkte Attributanzahl je Dimension Gute Performance Black Box Folie 185
Freiheitsgrade beim Design Beispiel Farbe 1.) Farbe als Attribut Artikel Artikel-ID Bezeichnung Farbe Region Region-ID Bezeichnung Fläche in qkm Bevölkerung 1 1 n n Werbedetail Artikel-ID Perioden-ID Region-ID Absatzmenge n Periode Perioden-ID Bezeichnung Folie 186
Freiheitsgrade beim Design Beispiel Farbe 2.) Farbe als Hierarchie Artikel Artikel-ID Bezeichnung Farbe Region Region-ID Bezeichnung Fläche in qkm Bevölkerung 1 1 n n Werbedetail Artikel-ID Perioden-ID Region-ID Absatzmenge n 1 Periode Perioden-ID Bezeichnung Folie 187
Freiheitsgrade beim Design Beispiel Farbe 3.) Farbe als Teil der Artikel-ID Artikel FarbArt-ID Artikel-ID Farbe-ID Bezeichnung Region Region-ID Bezeichnung Fläche in qkm Bevölkerung 1 1 n n Werbedetail FarbArt-ID Perioden-ID Region-ID Absatzmenge n 1 Periode Perioden-ID Bezeichnung Folie 188
Freiheitsgrade beim Design Beispiel Farbe 4.) Farbe als Dimension Artikel Artikel-ID Bezeichnung 1 n Werbedetail n 1 Farbe Farb-ID Spez.Gewicht Eink.-Preis n Artikel-ID Farb-ID Perioden-ID Region-ID Absatzmenge n 1 Periode Perioden-ID Bezeichnung 1 Region Region-ID Bezeichnung Fläche in qkm Bevölkerung Folie 189
Historisierung Zeitabhängigkeit: Strukturelle Veränderungen in Dimensionen PG X PG Y Strukturveränderungen PG X PG Y P A P B P C P D P B verändert P E hinzugefügt P A P B P C P D P E Mögliche Anforderungen: Berichte nach aktueller Struktur Berichte nach definierter historischer Struktur Berichte gemäß historischer Wahrheit (Transaktionsorientierte Sicht der Bewegungsdaten) Bericht vergleichbarer Resultate Folie 190
Historisierung Beispiel für Slowly Changing Dimensions Produktdimension in 2009-04 Produkt P A P B P C P D Produkt P A P B P C P D P E Produktgruppe PG X PG X PG Y PG Y Produktdimension in 2009-05 Produktgruppe PG X PG Y (geändert) PG Y PG Y PG Y (neu) Produkt Periode Umsatz P A P B P C P D P A P B P C P D P E Fakten-Tabelle 2009-04 2009-04 2009-04 2009-04 2009-05 2009-05 2009-05 2009-05 2009-05 100 100 100 100 100 100 100 100 100 Folie 191
Szenario I : Aktuelle Struktur Produktdimension in 2009-05 Fakten-Tabelle Produkt P A P B P C P D P E Produktgruppe PG X PG Y (geändert) PG Y PG Y PG Y (neu) Produkt Periode Umsatz P A P B P C P D P A P B P C P D P E 2009-04 2009-04 2009-04 2009-04 2009-05 2009-05 2009-05 2009-05 2009-05 100 100 100 100 100 100 100 100 100 Produktgruppe Umsatz 2009-04 Umsatz 2009-05 PG X PG Y 100 300 100 400 Folie 192
Szenario II : Alte Struktur Fakten-Tabelle Produktdimension in 2009-04 Produkt Periode Umsatz Produkt P A P B P C P D Produktgruppe PG X PG X PG Y PG Y P A P B P C P D P A P B P C P D P E 2009-04 2009-04 2009-04 2009-04 2009-05 2009-05 2009-05 2009-05 2009-05 100 100 100 100 100 100 100 100 100 Produktgruppe Umsatz 2009-04 Umsatz 2009-05 PG X PG Y 200 200 200 200 Folie 193
Szenario III : Historische Wahrheit Produktdimension in 2009-04 Produkt P A P B P C P D Produkt P A P B P C P D P E Produktgruppe PG X PG X PG Y PG Y Produktdimension in 2009-05 Produktgruppe PG X PG Y (geändert) PG Y PG Y PG Y (neu) Fakten-Tabelle Produkt Periode Umsatz P A P B P C P D P A P B P C P D P E 2009-04 2009-04 2009-04 2009-04 2009-05 2009-05 2009-05 2009-05 2009-05 100 100 100 100 100 100 100 100 100 Produktgruppe Umsatz 2009-04 Umsatz 2009-05 PG X PG Y 200 200 100 400 Folie 194
Szenario IV: Vergleichbare Resultate Produktdimension in 2009-04 Produkt P A P B P C P D Produkt P A P B P C P D P E Produktgruppe PG X PG X PG Y PG Y Produktdimension in 2009-05 Produktgruppe PG X PG Y (geändert) PG Y PG Y PG Y (neu) Fakten-Tabelle Produkt Periode Umsatz P A P B P C P D P A P B P C P D P E 2009-04 2009-04 2009-04 2009-04 2009-05 2009-05 2009-05 2009-05 2009-05 100 100 100 100 100 100 100 100 100 Produktgruppe Umsatz 2009-04 Umsatz 2009-05 PG X PG Y 100 200 100 200 Folie 195
Zusammenfassung - Szenarien Berichtsszenario aktuelle Struktur Berichtsszenario historische Wahrheit Produktgruppe Umsatz 2009-04 Umsatz 2009-05 PG X PG Y 100 300 100 400 Produktgruppe Umsatz 2009-04 Umsatz 2009-05 PG X PG Y 200 200 100 400 Berichtsszenario alte Struktur Berichtsszenario vergleichbare Resultate Produktgruppe Umsatz 2009-04 Umsatz 2009-05 PG X PG Y 200 200 200 200 Produktgruppe Umsatz 2009-04 Umsatz 2009-05 PG X PG Y 100 200 100 200 Folie 196
Historisierung von Dimensionsstrukturen 1. Lösungsalternative: Ein Datensatz je Periode in der Dimensionstabelle Produkt Monat Produktgruppe P A P B P A P B 2009_04 2009_04 2009_05 2009_05 PG X PG X PG X PG Y Probleme: Dimensionstabelle wird u.u. sehr lang Jeder Zugriff erfolgt mit Angabe des Gültigkeitszeitraumes (Zeitspalte) Folie 197
Historisierung von Dimensionsstrukturen 2. Lösungsalternative: Speicherung von aktuellem und vorherigem Zustand Produkt Ab Monat Produktgruppe Produktgruppe davor P A P B P C P D P E 2009_04 2009_05 2009_04 2009_04 2009_05 PG X PG Y PG Y PG Y PG Y PG X Probleme: Strukturhistorie kann nur teilweise nachvollzogen werden Folie 198
Historisierung von Dimensionsstrukturen 3. Lösungsalternative: Angabe von Gültigkeitsspannen Produkt Monat von Monat bis Produktgruppe P A P B P B P C P D P E 2009_01 2009_01 2009_05 2009_01 2009_01 2009_05 9999_12 2009_04 9999_12 9999_12 9999_12 9999_12 PG X PG X PG Y PG Y PG Y PG Y Probleme: Jede Abfrage mit >, < oder Between Probleme mit Indexzugriffen (Abfragezeit) Offene Fragen: Fachliche Gültigkeit Historisierung von Faktentabellen Folie 199
Vorgehensmodell zur BI-Gestaltung BI-Strategie BI-Projektdefinition BI-Analyse BI-Qualitätsmanagement BI-Design BI-Implementierung BI-Produktivsetzung BI-Projektmanagement Folie 200 BI-Betrieb und -Wartung
Ziele bei der Implementierung von Speicherkonzepten schlechter Performance besser besser schlechter Aktualisierungszeiten, Speicherplatzbedarf Folie 201
Performancegewinn durch physikalische Aggregatspeicherung Vorteile: Verdichtungen müssen nicht dynamisch errechnet werden, sondern sind sofort abrufbar Nachteile: Längere Aktualisierungsläufe durch Berechnung und I/O-Zugriffe Aufwendigere Administration Richtige Verdichtungsstufen für physikalische Ablage Problematisch für End-User-Tools Datenvolumen kann explodieren (bis Faktor 100 bei vollständiger Vorkalkulation durch multidimensionale Datenbanken) Lösung: Zusatzprodukte (ROLAP-Engines), Analyse des Benutzerverhaltens Folie 202
Theoretische Betrachtung Erlöse Artikel XY Erlöse Artikel XY Nord Ost Süd West Januar 20 15 40 Februar 10 15 März 30 10 15 40 April 40 Mai 15 Juni 40 15 Juli 20 50 August 30 20 15 September 30 Oktober 15 November 30 10 Dezember 10 15 24 Werte Nord Ost Süd West Gesamt Januar 20 15 40 75 Februar 10 15 25 März 30 10 15 40 95 April 40 40 Mai 15 15 Juni 40 15 55 Juli 20 50 70 August 30 20 15 65 September 30 30 Oktober 15 15 November 30 10 40 Dezember 10 15 25 Quartal 1 50 20 45 80 195 Quartal 2 40 15 15 40 110 Quartal 3 30 40 15 80 165 Quartal 4 30 25 15 10 80 Jahr 150 100 90 210 550 61 Werte Folie 203
Herkömmlicher B*-Baum-Index. 030. 120... Index...... 002 005 0221 012 028......... 0121 012 024 7051 3456 Kunden-ID 050. 060... 028 032 4263 3666 Row-Identifier (RID) Tabelle Kun- Kunden- Bundes- Status Ein- Ein- Geden# name land kommenschlecht schlecht 002 Weber BAY BAY Aktiv Aktiv Hoch Hoch W 005 Müller NRW Aktiv Mittel M M 012 Springer BRE Passiv Hoch Hoch M 024 Maurer BRA Aktiv Niedrig M M 028 Müller HAM Passiv Niedrig W 032 Sänger BAY BAY Aktiv Aktiv Mittel Mittel W Folie 204
Bitmap-Index Einkommen hoch 1 0 1 0 0 0 mittel 0 1 0 0 0 1 niedrig 0 0 0 1 1 0 Geschlecht W 1 0 0 0 1 1 M 0 1 1 1 0 0 Bundesland BAY 1 0 0 0 0 1 NRW 0 1 0 0 0 0 BRE 0 0 1 0 0 0 Status Aktiv 1 1 0 1 0 1 Passiv 0 0 1 0 1 0 Folie 205
Operationen mit dem Bitmap-Index Select * from Kunden where (Einkommen = niedrig or Einkommen = mittel ) and Geschlecht = W and Bundesland = BAY or and and Einkommen = niedrig 0 0 0 1 1 0 mittel 0 1 0 0 0 1 0 1 0 1 1 1 Geschlecht = W 1 0 0 0 1 1 0 0 0 0 1 1 Bundesland = BAY 1 0 0 0 0 1 0 0 0 0 0 1 Kun- Kunden- Bundes- Status Ein- Ein- Geden# Ge- name land kommen schlecht 002 Weber BAY BAY Aktiv Aktiv Hoch Hoch W 005 Müller NRW Aktiv Mittel MM 012 Springer BRE Passiv Hoch Hoch MM 024 Maurer BRA Aktiv Niedrig MM 028 Müller HAM Passiv Niedrig W 032 Sänger BAY BAY Aktiv Mittel W Folie 206
Zusammenfassung Physikalisches Design eröffnet vielfältige Gestaltungsoption -> anspruchsvolle Aufgabe Ziel: Vernünftiges Verhältnis zwischen Abfrage- Performance und Administrierbarkeit/Aktualisierbarkeit/Speicherplatzbedarf Folie 207
BI-Implementierung im Front-End-Bereich Benutzerprofile und Zielgruppen Analyse Benutzerfunktionalität und -flexibilität hoch Analysten Ad Hoc Query Informations- Verwender 5-10% hoch Erforderliche Trainingsinvestition und Kosten 15-25% Reporting niedrig Parametergesteuerte Berichte Informations- Konsumenten Statisches Reporting, einschließlich OLAP Reports niedrig 65-80% Folie 208
Vorgehensmodell zur BI-Gestaltung BI-Strategie BI-Projektdefinition BI-Analyse BI-Qualitätsmanagement BI-Design BI-Implementierung BI-Produktivsetzung BI-Projektmanagement Folie 209 BI-Betrieb und -Wartung
BI-Produktivsetzung System in Produktivumgebung überführen Initialbefüllung (Urladen) Anwender- und Administratoren-Schulung Benutzersupport aufbauen Folie 210
Vorgehensmodell zur BI-Gestaltung BI-Strategie BI-Projektdefinition BI-Analyse BI-Qualitätsmanagement BI-Design BI-Implementierung BI-Produktivsetzung BI-Projektmanagement Folie 211 BI-Betrieb und -Wartung
BI-Betrieb und Wartung Aufbau Betriebskonzept mit den Komponenten (exemplarisch): Anforderungsmanagement (Requirement Management), Versionsmanagement (Release Management), Vorfall- bzw. Störungsmanagement (Incident Management), Problemmanagement (Problem Management), Kapazitätsmanagement (Capacity Management), Management der Leistungsfähigkeit (Performance Management) und Management der Service Level Agreements Folie 212