Hetero-Homogene Data Warehouses TDWI München 2011 Christoph Schütz http://hh-dw.dke.uni-linz.ac.at/ Institut für Wirtschaftsinformatik Data & Knowledge Engineering Juni 2011
1 Data-Warehouse-Modellierung 2 Hetero-Homogene Data Warehouses 3 Prototyp-Implementierung in Oracle Christoph Schütz (WIN-DKE) Hetero-Homogene Data Warehouses Juni 2011 2 / 17
Data-Warehouse-Modellierung Begriffe Dimension (Aggregations-)Ebene (Level) OLAP-Würfel (Cube) / Würfelregion (Cube region) Fakt Kennzahl (Measure) Beispiel (a) Dimensional Fact Model (b) Star-Schema Christoph Schütz (WIN-DKE) Hetero-Homogene Data Warehouses Juni 2011 3 / 17
1 Data-Warehouse-Modellierung 2 Hetero-Homogene Data Warehouses 3 Prototyp-Implementierung in Oracle Christoph Schütz (WIN-DKE) Hetero-Homogene Data Warehouses Juni 2011 4 / 17
Heterogenitäten in Data-Warehouse-Modellen Heterogenitäten Verschiedene Abteilungen und lokale Niederlassungen haben unterschiedliche Anforderungen an die Datenerfassung. Optionale Aggregationsstufen, z.b. Kanton in der Schweiz. Optionale Attribute, z.b. Länge der Bildschirmdiagonale für Fernseher. Zusätzliche Kennzahlen Erfassung der Kennzahlen auf unterschiedlichen Granularitäten Dimensional Fact Model Christoph Schütz (WIN-DKE) Hetero-Homogene Data Warehouses Juni 2011 5 / 17
Hetero-Homogene Data Warehouses Prinzip Grundsätzlich homogenes Schema Einzelne Teildimensionen und Würfelregionen können jedoch zusätzliche Informationen erfassen. Für jede Teildimension und Würfelregion existiert trotz aller Heterogenitäten ein kleinstes gemeinsames Schema. Modellierung Definition zusätzlicher Aggregationsstufen und Attribute in wohl definierten Teildimensionen. Definition zusätzlicher Kennzahlen für einzelne Würfelregionen. Genauere Datenerfassung in einzelnen Würfelregionen. Der hetero-homogene Modellierungsansatz wurde von Neumayr et al. [NST10] vorgeschlagen. Christoph Schütz (WIN-DKE) Hetero-Homogene Data Warehouses Juni 2011 6 / 17
Beispiel: Hetero-Homogene Dimensionen (a) Schema (b) Ausprägung Christoph Schütz (WIN-DKE) Hetero-Homogene Data Warehouses Juni 2011 7 / 17
Beispiel: Hetero-Homogene Dimensionen (a) Schema (b) Ausprägung Christoph Schütz (WIN-DKE) Hetero-Homogene Data Warehouses Juni 2011 8 / 17
Beispiel: Hetero-Homogene Dimensionen Christoph Schütz (WIN-DKE) Hetero-Homogene Data Warehouses Juni 2011 9 / 17
Beispiel: Hetero-Homogene OLAP-Würfel Christoph Schütz (WIN-DKE) Hetero-Homogene Data Warehouses Juni 2011 10 / 17
1 Data-Warehouse-Modellierung 2 Hetero-Homogene Data Warehouses 3 Prototyp-Implementierung in Oracle Christoph Schütz (WIN-DKE) Hetero-Homogene Data Warehouses Juni 2011 11 / 17
Prototyp-Implementierung in Oracle Implementierung eines Verwaltungssystems für hetero-homogene Data Warehouses zur einfachen Übertragung des konzeptuellen Modells in die Datenbank. Datenbanktechnologie Oracle 11g Objekt-relationale Datenbank Stored Procedures in PL/SQL Die konkrete Implementierung läuft nur unter Oracle, das Konzept lässt sich jedoch auf andere Datenbankverwaltungssysteme übertragen. Christoph Schütz (WIN-DKE) Hetero-Homogene Data Warehouses Juni 2011 12 / 17
Logisches Datenmodell Das logische Datenmodell ist eine Variante des Fact Constellation Schemas. Dimensionstabellen Normalisierte Dimensionstabellen Homogene Dimensionstabellen: keine Null-Werte Faktentabellen Mehrere Faktentabellen mit unterschiedlichen Granularitäten Jede Faktentabelle ist homogen in Bezug auf 1 die Kennzahlen 2 die Granularität der Kennzahlen Christoph Schütz (WIN-DKE) Hetero-Homogene Data Warehouses Juni 2011 13 / 17
Beispiel: Faktentabellen (a) Schema (b) Faktentabellen Christoph Schütz (WIN-DKE) Hetero-Homogene Data Warehouses Juni 2011 14 / 17
Zusammenfassung Hetero-homogenes Modell Dimensionen und OLAP-Würfel sind homogen in Bezug auf ein gemeinsames Schema. Dimensionen und OLAP-Würfel sind insofern heterogen, als dass einzelne, wohl definierte Teildimensionen und Würfelregionen zusätzliche Informationen einführen können. Implementierung Verwendung von Stored Procedures zur Implementierung eines Verwaltungssystems für hetero-homogene Data Warehouses Speicherung der Daten in einer Variante des Star-Schemas. Speicherung zusätzlicher Informationen zum konzeptuellen Modell. Verwendung von Standard-Datenbanktechnologie kann einfach und kostengünstig in bestehende Infrastruktur integriert werden. Christoph Schütz (WIN-DKE) Hetero-Homogene Data Warehouses Juni 2011 15 / 17
Quellen [GMR98] Golfarelli, M.; Maio, D.; Rizzi, S.: The Dimensional Fact Model: A Conceptual Model for Data Warehouses, International Journal of Cooperative Information Systems, Vol. 7, No. 2 & 3, S. 215-247, 1998. [Neu10] Neumayr, B.: Multi-Level Modeling with M-Objects and M-Relationships, Dissertation, Institut fr Wirtschaftsinformatik Data & Knowledge Engineering, Johannes Kepler Universitt Linz, 2010. [NGS09] Neumayr, B.; Grün, K.; Schrefl, M.: Multi-Level Domain Modeling with M-Objects and M-Relationships, 6th Asia-Pacific Conference on Conceptual Modelling, 2009. [NST10] Neumayr, B.; Schrefl, M.; Thalheim, B.: Hetero-Homogeneous Hierarchies in Data Warehouses, 7th Asia-Pacific Conference on Conceptual Modelling, 2010. Christoph Schütz (WIN-DKE) Hetero-Homogene Data Warehouses Juni 2011 16 / 17
Hetero-Homogene Data Warehouses TDWI München 2011 Christoph Schütz http://hh-dw.dke.uni-linz.ac.at/ Institut für Wirtschaftsinformatik Data & Knowledge Engineering Juni 2011