Teil III Multidimensionales Datenmodell
|
|
|
- Hanna Messner
- vor 8 Jahren
- Abrufe
Transkript
1 Teil III Multidimensionales Datenmodell
2 Multidimensionales Datenmodell 1 Grundbegriffe 2 Der Würfel 3 Konzeptuelle Modellierung 4 Operationen zur Datenanalyse 5 Relationale Umsetzung des multidimensionalen Datenmodells 6 Slowly Changing Dimensions c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
3 Grundbegriffe Grundbegriffe Dimensionen Fakten / Kennzahlen Produkt Kategorie Gruppe Artikel Kennzahl Umsatz Zeit Jahr Quartal Monat Filiale Stadt Verkaufsort Bundesland c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
4 Grundbegriffe Motivation Datenmodell ausgerichtet auf Unterstützung der Analyse Datenanalyse im Entscheidungsprozess Betriebswirtschaftliche Kennzahlen stehen im Mittelpunkt Fakten Gewinn Umsatz Kosten, etc. Betrachtung der Kennzahlen aus unterschiedlichen Perspektiven Dimensionen Zeit Raum Sache Unterteilung der Auswertedimensionen möglich Hierarchien oder Konsolidierungsebenen Jahr Quartal Monat c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
5 Grundbegriffe Verfügbare Informationen Qualifizierend Repräsentiert durch Kategorienattribute Daten zur Nutzung als Navigationsraster ( Drill-Pfade ) Modelliert als Begriffshierarchien im Rahmen von Dimensionen Quantifizierend Bilden Gegenstand der Auswertung ( Summenattribute oder andere arithmetische Operationen) Zellen eines Würfels, mit Dimensionen als Kanten c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
6 Grundbegriffe Dimensionen Dimension: Beschreibt mögliche Sicht auf assoziierte Kennzahlen Endliche Menge von n (n 2) Dimensionselementen (Hierarchieobjekten), die eine semantische Beziehung aufweisen Dienen der orthogonalen Strukturierung des Datenraums Beispiele: Produkt, Filialstruktur, Geschäftsjahr c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
7 Grundbegriffe Hierarchien in Dimensionen Dimensionselemente: Knoten einer Klassifikationshierarchie Klassifikationsstufe beschreibt Verdichtungsgrad Darstellung von Dimensionen über Klassifikationsschema (Schema von Klassifikationshierarchien) Formen: Einfache Hierarchien Parallele Hierarchien c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
8 Grundbegriffe Einfache Hierarchie Höhere Hierarchieebene enthält die aggregierten Werte genau einer niedrigeren Hierarchiestufe Oberster Knoten: Top Enthält Verdichtung auf einen einzelnen Wert für die Dimension Top Bundesland Stadt Filiale c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
9 Grundbegriffe Parallele Hierarchie Innerhalb einer Dimension sind mehrere unabhängige Arten der Gruppierung möglich Keine hierarchische Beziehung zwischen parallelen Zweigen Parallelhierarchie Pfad im Klassifikationsschema Konsolidierungspfad Top Jahr Quartal Woche Monat Tag c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
10 Grundbegriffe Schema einer Dimension D Partiell geordnete Menge von Kategorienattributen ({D 1,..., D n, Top D }; ) Generisches maximales Element TopD Funktionale Abhängigkeit Top D wird von allen Attributen funktional bestimmt: i, 1 i n : D i Top D Es gibt genau ein D i, das alle anderen Kategorieattribute bestimmt Gibt feinste Granularität einer Dimension vor i, 1 i n, j, 1 < j n, i j : D i D j c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
11 Grundbegriffe Kategorienattribute Inhaltliche Verfeinerung durch unterschiedliche Rollen: Primärattribut Kategorienattribut, das alle anderen Attribute einer Dimension bestimmt Definiert maximale Feinheit Beispiel: Auftragsposition Klassifikationsattribut Element der Menge, die mehrstufige Kategorisierung (Klassifikationshierarchie) bilden Beispiel: Produkt, Produktgruppe, Produktkategorie Dimensionales Attribut Element der Menge der Attribute, die vom Primärattribut oder einem Klassifikationsattribut bestimmt werden und nur Top D bestimmen Beispiel: Regalposition c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
12 Grundbegriffe Struktur einer Dimension: Beispiel Klassifikationsattribute Top Produktkategorie dimensionales Attribut Produktgruppe Verkaufspreis Steuern Lagerort Primär Attribut Artikel c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
13 Grundbegriffe Kennzahlen Kennzahlen / Fakten (engl. facts): (Verdichtete) numerische Messgrößen Beschreiben betriebswirtschaftliche Sachverhalte Fakt: Maßzahl (engl. measure) Kennzahl: Aus Fakten konstruiert (abgeleitete Kennzahl) Durch Anwendung arithmetischer Operationen Beispiele: Umsatz, Gewinn, Kosten Deckungsbeitrag, ROI (Return on Investment) Fluktuationsquote, Umsatzsteigerung c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
14 Grundbegriffe Fakt: Schema Schema wird durch mehrere Bestandteile spezifiziert Granularität G = {G 1,..., G k } G ist Teilmenge aller Kategorienattribute aller im Schema existierenden Dimensionsschemata DS 1,..., DS n i, 1 i k, j, 1 j n : G i DS j i, 1 i k, j, 1 j k, i j : G i G j (keine funktionalen Abhängigkeit zwischen Kategorienattributen einer Granularität) Detailliertheitsgrad der Fakten Summationstyp SumTyp Bestandsgröße Stromgröße Einheit c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
15 Grundbegriffe Kennzahl Kennzahl M ist definiert durch Granularität G Berechnungsvorschrift f () über Fakten Summationstyp SumTyp Berechnung über nichtleerer Teilmenge der im Schema existierenden Fakten M = (G, f (F 1,..., F k ), SumTyp) c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
16 Grundbegriffe Kennzahl: Bildung von f() Skalarfunktionen +,,, /, mod Beispiel: Umsatzsteueranteil = Menge Preis Steuersatz Aggregatfunktionen Funktion H() zur Verdichtung eines Datenbestandes, indem aus n Einzelwerten ein Aggregatwert ermittelt wird H : 2 dom(x1) dom(xn) dom(y) Bsp.: SUM(), AVG(), MIN(), MAX(), COUNT() Ordnungsbasierte Funktionen Definition von Kennzahlen auf Basis zuvor definierter Ordnungen Bsp.: Kumulation, TOP(n), MEDIAN() c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
17 Grundbegriffe Summationstypen Zuweisung eines Summationstyps charakterisiert erlaubte Aggregationsoperationen FLOW zeitraumbezogen (pro Zeiteinheit) Beliebig aggregierbar Beispiel: Bestellmenge eines Artikels pro Tag STOCK Maß über Zeitraum Beliebig aggregierbar mit Ausnahme temporaler Dimension Beispiel: Lagerbestand, Einwohnerzahl VALUE PER UNIT(VPU) zeitpunktbezogen (zum Zeitpunkt) Aktuelle Zustände, die nicht summierbar sind Zulässig nur: MIN(), MAX(), AVG() Beispiele: Preis, Wechselkurs, Steuersatz c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
18 Grundbegriffe Summierbarkeit FLOW STOCK VPU Aggregation über temporale Dimension? nein ja MIN/MAX SUM + + AVG COUNT c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
19 Grundbegriffe Disjunktheit Konkreter Wert einer Kennzahl geht exakt einmal in Ergebnis ein Bsp.: Verkäufe einer Filiale Umsatz Bier Biermix Softdrinks Gesamt Wie ist der Gesamtumsatz pro Jahr? Wie ist der Gesamtumsatz über die Produktgruppen im Jahr? c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
20 Grundbegriffe Vollständigkeit Kennzahlen auf höherer Aggregationsebene lassen sich komplett aus Werten tieferer Stufen berechnen Weinregion Rheinhessen Saale-Unstrut Mosel Sonstige Gesamt Sonstige = Einige Produzenten aus anderen Gebieten c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
21 Grundbegriffe Vollständigkeit Kennzahlen auf höherer Aggregationsebene lassen sich komplett aus Werten tieferer Stufen berechnen Weinregion Rheinhessen Saale-Unstrut Mosel Sonstige Gesamt Sonstige = Einige Produzenten aus anderen Gebieten c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
22 Grundbegriffe Simpson Paradox Gruppenbewertungen ergeben unterschiedliche Ergebnisse hinsichtlich der betrachteten Aggregationsstufe Quotientenbildung auf stark unterschiedlichen Gruppengrößen Rotwein Weißwein mit Gesamt Prädikats- mit Gesamt Prädikats- Prädikat Gesamt quote Prädikat Gesamt quote % % % % Summe % % c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
23 Grundbegriffe Aggregatfunktionen X ist Klassifikationsknoten und (X 1, X 2,..., X n ) ist Partitionierung Distributive Aggregatfunktion: g : f (X) = f (g(x 1 ), g(x 2 ),..., g(x n )) Algebraische Aggregatsfunktion: f ist berechnbar aus fester Menge G Holistische Aggregatsfunktion: f kann nur aus den Grundelementen von X berechnet werden Aggregatstyp Distributiv Algebraisch Holistisch Beispiel SUM(), COUNT(), MAX(), MIN() AVG() mit g 1 := SUM() und g 2 := COUNT(), STDDEV() MEDIAN(), RANK(), PERCENTILE() c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
24 Der Würfel Der Würfel Würfel (engl. cube, eigentlich Quader): Grundlage der multidimensionalen Analyse Kanten Dimensionen Zellen ein oder mehrere Kennzahlen (als Funktion der Dimensionen) Anzahl der Dimensionen Dimensionalität Visualisierung 2 Dimensionen: Tabelle 3 Dimensionen: Würfel > 3 Dimensionen: Multidimensionale Domänenstruktur Schema C eines Würfels Menge der Dimensionen(-schemata) DS Menge der Kennzahlen M C = (DS, M) = ({D 1,..., D n }, {M 1,..., M m }) c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
25 Der Würfel Orthogonalität In multidimensionalen Schemata gilt Orthogonalität, d.h. Keine funktionalen Abhängigkeiten zwischen Attributen unterschiedlicher Dimensionen i, 1 i n, j, 1 j n, i j k, l : D i.d k D j.d l c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
26 Der Würfel Multidimensionaler Datenwürfel Produkt Kategorie Gruppe Artikel Kennzahl Umsatz Zeit Jahr Quartal Monat Filiale Stadt Verkaufsort Bundesland c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
27 Konzeptuelle Modellierung Konzeptuelle Modellierung Formale Beschreibung des Fachproblems und der im Anwendungsbereich benötigten Informationsstrukturen Probleme konventioneller Entwurfstechniken (ER, UML): Unzureichende Semantik für multidimensionales Datenmodell Hier: Verzicht auf universelle Anwendbarkeit, stattdessen Konzentration auf Analyse Beispiel: Klassifikationsstufe, Fakt Entity? c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
28 Konzeptuelle Modellierung ME/R-Modell Multidimensional Entity/Relationship Model [Sapia et. al. (1998)] Erweiterung des klassischen ER-Modells Entity-Menge Dimension Level (Klassifikationsstufe) Keine explizite Modellierung von Dimensionen n-äre Beziehungsmenge Fact Kennzahlen als Attribute der Beziehung Binäre Beziehungsmenge Classification bzw. Roll-Up (Verbindung von Klassifikationsstufen) Definiert gerichteten, nicht-zyklischen Graphen c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
29 Konzeptuelle Modellierung ME/R: Notationen Faktenname Ebene Attributbezeichnung Faktenbeziehung Klassifikationsstufe Klassifikationsbeziehung Attribut c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
30 Konzeptuelle Modellierung ME/R: Beispiel Anzahl Umsatz Produktgruppe Artikel Verkauf Filiale Stadt Bundesland Produktkategorie Tag Kunde Kundengruppe Woche Monat Quartal Jahr c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
31 Konzeptuelle Modellierung ADAPT Application Design for Analytical Processing Technologies Bulos 1998 & Bulos 2006 Berücksichtigt DDL und DML Aspekte Fokus auf Dimensionen Regeln für Kennzahlen möglich Vermischung von Metadaten und Ausprägungen c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
32 Konzeptuelle Modellierung ADAPT Hypercube Berechnungsformel!(#) Hierarchie Dimension 1 Dimension 2 Dimension { } Hierarchiestufe dimensionales Attribut { } Dimensionsausprägung { } Dimensionsausschnitt c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
33 Konzeptuelle Modellierung ADAPT: Beispiel { } Internet { } Ladengeschäft Vertriebskanal Verkäufe Verkaufskanal Zeit Kunde Ort Produkt Zeit Kunde Ort Produkt Wochenhierarchie Standardhierarchie Standardhierarchie Standardhierarchie Standardhierarchie { } Jahr { } Kundengruppe { } Bundesland { } Produktkategorie { } Quartal { } Woche { } Kunde { } Stadt { } Produktgruppe { } Kernprodukte { } Monat { } Filiale { } Artikel { } Tag Einkaufspreis Steuern Verkaufspreis Rabatt c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
34 Operationen zur Datenanalyse Operationen zur Datenanalyse OLAP-Operationen auf multidimensionalen Datenstrukturen Standardoperationen Pivotierung Roll-Up, Drill-Down Drill-Across Slice und Dice c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
35 Operationen zur Datenanalyse Pivotierung / Rotation Drehen des Würfels durch Vertauschen der Dimensionen Analyse der Daten aus verschiedenen Perspektiven 2009 Softdrink Wein Bier Produkt Bier Zeit Wein Softdrink Zeit Sachsen- Anhalt Thüringen Bayern Ort Produkt Sachsen- Anhalt Thüringen Bayern Ort c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
36 Operationen zur Datenanalyse Roll-Up, Drill-Down, Drill-Across Roll-Up: Erzeugen neuer Informationen durch Aggregierung der Daten entlang des Konsolidierungspfades Dimensionalität bleibt erhalten Beispiel: Tag Monat Quartal Jahr Drill-Down: Komplementär zu Roll-Up Navigation von aggregierten Daten zu Detail-Daten entlang der Klassifikationshierarchie Drill-Across: Wechsel von einem Würfel zu einem anderen c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
37 Operationen zur Datenanalyse Roll-Up und Drill-Down Produkt Drill Down Produkt 2009 Softdrink Wein Bier Roll Up Softdrink Wein Bier Q Q2 Q3 Zeit Sachsen- Anhalt Thüringen Bayern Ort 2010 Q Zeit Sachsen- Anhalt Thüringen Bayern Ort c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
38 Operationen zur Datenanalyse Slice und Dice Erzeugen individueller Sichten Slice: Herausschneiden von Scheiben aus dem Würfel Verringerung der Dimensionalität durch Konditionierung der Dimensionen Beispiel: alle Werte des aktuellen Jahres Entspricht der relationalen Selektion in den Dimensionen Dice: Herausschneiden einen Teilwürfels Erhaltung der Dimensionalität, Veränderung der Hierarchieobjekte Beispiel: die Werte bestimmter Produkte oder Regionen Entspricht der relationalen Selektion mehrerer Dimensionen c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
39 Operationen zur Datenanalyse Slice Produkt Produkt Softdrink Wein Bier Softdrink Wein Bier Zeit Sachsen- Anhalt Thüringen Bayern Ort Zeit Sachsen- Anhalt Thüringen Bayern Ort c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
40 Operationen zur Datenanalyse Dice Produkt Produkt Softdrink Wein Bier Softdrink Wein Bier Zeit Sachsen- Anhalt Thüringen Bayern Ort Zeit Sachsen- Anhalt Thüringen Bayern Ort c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
41 Operationen zur Datenanalyse Problem des Dimensionswechsel Austausch oder Weglassen einer Dimension kann Bestandteil der Analyse sein Beispiel: statt Cube by Produkt, Ort und Zeit kann Kunde, Ort und Zeit interessant sein. Produkt Filiale Tag Verk. Rotwein Magdeburg Weißbier Magdeburg Rotwein Ilmenau Kundengruppe Filiale Tag Verk. Weintrinker Magdeburg Bayer Magdeburg Genießer Ilmenau Was bedeutet ein Wechsel der Dimension? c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
42 Operationen zur Datenanalyse Marginalisierung Randsummenbildung bei Entfernen einer Dimension Entspricht der relationalen Projektion Abhängig vom Typen der Aggregatfunktion Interpretationsproblem Anteil Bierflaschen Magdeburg Ilmenau 1. Halbwoche 95% 88% 2. Halbwoche 68% 54% GesamtWoche 74% 80% c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
43 Relationale Umsetzung des multidimensionalen Datenmodells Umsetzung des multidimensionalen Datenmodells Multidimensionale Sicht Modellierung der Daten Anfrageformulierung Interne Verwaltung der Daten erfordert Umsetzung auf Relationale Strukturen (Tabellen) ROLAP (relationales OLAP) Verfügbarkeit, Reife der Systeme Multidimensionale Strukturen (direkte Speicherung) MOLAP (multidimensionales OLAP) Wegfall der Transformation bzw. Vorwegberechnung Mehrdimensionale Arrays (Fakten) und assoziierte Dimensionslisten Hybride Struktur (Mischform) HOLAP (hybrides OLAP) Detaildaten relational abgespeichert (ROLAP) Aggregate werden multidimensional abgespeichert (MOLAP) Aspekte Speicherung Anfrageformulierung bzw. -ausführung c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
44 Relationale Umsetzung des multidimensionalen Datenmodells Relationale Speicherung Vermeidung des Verlustes anwendungs-bezogener Semantik (aus dem multidimensionalen Modell, z.b. Klassifikationshierarchien) Effiziente Übersetzung multidimensionaler Anfragen Effiziente Verarbeitung der übersetzten Anfragen Einfache Pflege der entstandenen Relationen (z.b. Laden neuer Daten) Berücksichtigung der Anfragecharakteristik und des Datenvolumens von Analyseanwendungen c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
45 Relationale Umsetzung des multidimensionalen Datenmodells Relationale Umsetzung: Faktentabelle Ausgangspunkt: Umsetzung des Datenwürfels ohne Klassifikationshierarchien Dimensionen, Kennzahlen Spalten der Relation Zelle Tupel Produkt Rotwein Weißbier Zeitraum Produkt Filiale Tag Verk. Rotwein Magdeburg Weißbier Magdeburg Rotwein Ilmenau Magdeburg Ilmenau Region c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
46 Relationale Umsetzung des multidimensionalen Datenmodells Snowflake-Schema Abbildung von Klassifikationen: eigene Tabelle für jede Klassifikationsstufe (z.b. Artikel, Produktgruppe, etc.) Dimensionstabelle enthält ID für Klassifikationsknoten Beschreibendes Attribut (z.b. Marke, Hersteller, Bezeichnung) Fremdschlüssel der direkt übergeordneten Klassifikationsstufe Faktentabelle enthält (neben Kenngrößen): Fremdschlüssel der jeweils niedrigsten Klassifikationsstufe Fremdschlüssel bilden zusammengesetzte Primärschlüssel für Faktentabelle c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
47 Relationale Umsetzung des multidimensionalen Datenmodells Snowflake-Schema: Muster 1. Dimensionstabelle3 Dim1_Schlüssel3 Dim1_Attribut3 Dim1_Attribut4 2. Dimensionstabelle3 Dim2_Schlüssel3 Dim2_Attribut3 1. Dimensionstabelle2 Dim1_Schlüssel2 Dim1_Attribut2 Dim1_Schlüssel3 3. Dimensionstabelle2 Dim3_Schlüssel2 Dim3_Attribut2 1. Dimensionstabelle1 Dim1_Schlüssel1 Dim1_Attribut1 Dim1_Schlüssel2 3. Dimensionstabelle1 Dim3_Schlüssel1 Dim3_Attribut1 Dim3_Schlüssel2 Faktentabelle Dim1_Schlüssel1 Dim2_Schlüssel1 Dim3_Schlüssel1 Dim4_Schlüssel1 Fakt1 Fakt2 Fakt Dimensionstabelle1 Dim2_Schlüssel1 Dim2_Attribut1 Dim2_Schlüssel2 4. Dimensionstabelle1 Dim4_Schlüssel1 Dim4_Attribut1 Dim4_Attribut2 Dim4_Schlüssel2 2. Dimensionstabelle2 Dim2_Schlüssel3 Dim2_Attribut2 Dim2_Schlüssel2 4. Dimensionstabelle2 Dim4_Schlüssel2 Dim4_Attribut3 c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
48 Relationale Umsetzung des multidimensionalen Datenmodells Snowflake-Schema: Beispiel Dimension "Produkt" Produktkategorie PK_ID PK_Bezeichnung 1 * Produktgruppe PG_ID PG_Bezeichnung PG_PKategorie_ID 1 Dimension "Kunde" * Bundesland B_ID B_Name B_Land_ID Kundengruppe KG_ID KG_Bezeichnung 1 * 1 Stadt S_ID S_Name S_BLand_ID * 1 * Kunde K_ID K_Name K_Wohnort K_Strasse K_Geschlecht K_KGruppe_ID Filiale F_ID F_Filiale F_Stadt_ID 1 1 * * Verkauf V_Anzahl V_Kanal V_Produkt_ID V_Zeit_ID V_Kunden_ID V_Filial_ID * * 1 1 Produkt P_ID P_Bezeichnung P_Verkaufspreis P_Einkaufspreis P_Rabatt P_Steuern P_PGruppe_ID Zeit Z_ID Z_Datum * Dimension "Zeit" 1 Land L_ID L_Name Dimension "Ort" c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
49 Relationale Umsetzung des multidimensionalen Datenmodells Star-Schema Snowflake-Schema ist normalisiert: Vermeidung von Update-Anomalien 3. NF Aber: erfordert Join über mehrere Tabellen! Star-Schema: Denormalisierung der zu einer Dimension gehörenden Tabellen 1. NF Für jede Dimension genau eine Dimensionstabelle Redundanzen in der Dimensionstabelle für schnellere Anfragebearbeitung Beispiel: Artikel, Produkt, Produktgruppe etc. als Spalten in einer Tabelle Produkt c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
50 Relationale Umsetzung des multidimensionalen Datenmodells Star-Schema: Muster 1. Dimensionstabelle Dim1_Schlüssel Dim1_Attribut1 Dim1_Attribut2 3. Dimensionstabelle Dim3_Schlüssel Dim3_Attribut1 Dim3_Attribut2 Faktentabelle Dim1_Schlüssel Dim2_Schlüssel Dim3_Schlüssel Dim4_Schlüssel... Fakt1 Fakt2 Fakt Dimensionstabelle Dim2_Schlüssel Dim2_Attribut1 Dim2_Attribut2 4. Dimensionstabelle Dim4_Schlüssel Dim4_Attribut1 Dim4_Attribut2 c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
51 Relationale Umsetzung des multidimensionalen Datenmodells Star-Schema: Beispiel Kunde K_ID K_Name K_Wohnort K_Strasse K_Geschlecht K_Kundengruppe Ort O_ID O_Filiale O_Stadt O_Bundesland O_Land 1 1 * * Verkauf V_Anzahl V_Kanal V_Produkt_ID V_Zeit_ID V_Kunden_ID V_Ort_ID * * 1 1 Produkt P_ID P_Bezeichnung P_Verkaufspreis P_Einkaufspreis P_Rabatt P_Steuern P_Produktgruppe P_Produktkategorie Zeit Z_ID Z_Datum c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
52 Relationale Umsetzung des multidimensionalen Datenmodells Star-Schema formal Multidimensionales Schema mit n Dimensionen Dimensionstabellen D 1,..., D n der Form D i (Dim i _Key, A i,1,..., A i,ki ) Faktentabelle F(Dim1 _Key,..., Dim n _Key, f 1,..., f m ) mit m Fakten Jeder Teil des kompositen Primärschlüssels der Faktentabelle ist Fremdschlüssel zum Primärschlüsselattribut der korrespondierenden Dimension c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
53 Relationale Umsetzung des multidimensionalen Datenmodells CREATE DIMENSION in Oracle Fremdschlüsselbedingungen in SQL ausdrückbar Aber: funktionale Beziehungen zwischen Attributen innerhalb einer Dimension nicht spezifizierbar Oracle-Erweiterung: CREATE DIMENSION informative Zusicherung Korrektheit wird vom DBS nicht überprüft Nutzung beim Query Rewriting über materialisierten Sichten c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
54 Relationale Umsetzung des multidimensionalen Datenmodells Beispiel CREATE DIMENSION CREATE DIMENSION ProduktDimension LEVEL Artikel IS (Produkt.P_ID) LEVEL Produktgruppe IS (Produkt.P_PGruppe_ID) LEVEL Produktkategorie IS (Produkt.P_Produktkategorie) HIERARCHY ProduktHierarchie ( Artikel CHILD OF Produktgruppe CHILD OF Produktkategorie) ATTRIBUTE Artikel DETERMINES (P_Bezeichnung, P_Verkaufspreis, P_Einkaufspreis, P_Rabatt, P_Steuern) ATTRIBUTE Produktgruppe DETERMINES (P_Produktgruppe) c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
55 Relationale Umsetzung des multidimensionalen Datenmodells Schlüsselworte LEVEL Definiert Klassifikationsstufen HIERARCHY Festlegung der Abhängigkeiten der Klassifikationsstufen ATTRIBUTE... DETERMINES Definiert Abhängigkeit zwischen Klassifikationsattribut und dimensionalen Attributen c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
56 Relationale Umsetzung des multidimensionalen Datenmodells Snowflake mit CREATE DIMENSION Verkauf V_Anzahl V_Kanal V_Produkt_ID V_Zeit_ID V_Kunden_ID V_Filial_ID Produkt P_ID P_Bezeichnung P_Verkaufspreis P_Einkaufspreis P_Rabatt P_Steuern P_PGruppe_ID Produktgruppe PG_ID PG_Bezeichnung PG_PKategorie_ID CREATE DIMENSION ProduktDimension LEVEL Artikel IS (Produkt.P_ID) LEVEL Produktgruppe IS (Produktgruppe.PG_ID) HIERARCHY ProduktHierarchie ( Artikel CHILD OF Produktgruppe) JOIN KEY (Produkt.P_PGruppe_ID) REFERENCES Produktgruppe c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
57 Relationale Umsetzung des multidimensionalen Datenmodells Star mit CREATE DIMENSION Zeit Z_ID Z_Tag_ID Z_Tag Z_Monat_ID Z_Monat Z_Jahr_ID Z_Jahr Verkauf V_Anzahl V_Kanal V_Produkt_ID V_Zeit_ID V_Kunden_ID V_Filial_ID CREATE DIMENSION ZeitDimension LEVEL Tag IS (Zeit.Z_Tag_ID) LEVEL Monat IS (Zeit.Z_Monat_ID) LEVEL Jahr IS (Zeit.Z_Jahr_ID) HIERARCHY ZeitHierarchie ( Tag CHILD OF Monat CHILD OF Jahr) ATTRIBUTE Tag DETERMINES (Z_Tag) ATTRIBUTE Monat DETERMINES (Z_Monat) ATTRIBUTE Jahr DETERMINES (Z_Jahr) c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
58 Relationale Umsetzung des multidimensionalen Datenmodells Vergleich Star und Snowflake Charakteristika von DW-Anwendungen Typischerweise Einschränkungen in Anfragen auf höherer Granularitätsstufe (Join-Operationen) Geringes Datenvolumen der Dimensionstabellen im Vergleich zu Faktentabellen Seltene Änderungen an Klassifikationen (Gefahr von Update-Anomalien) Vorteile des Star-Schemas Einfache Struktur (vereinfachte Anfrageformulierung) Einfache und flexible Darstellung von Klassifikationshierarchien (Spalten in Dimensionstabellen) Effiziente Anfrageverarbeitung innerhalb einer Dimension (keine Join-Operation notwendig) c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
59 Relationale Umsetzung des multidimensionalen Datenmodells Annahmen für Kostenbetrachtungen n Dimensionen (D n ), je K Klassifikationsstufen plus Top Jeder Klassifikationsknoten hat 3 Kinder Level i = K: 1 = 3 0 Knoten (Top) Level i = K 1: 3 = 3 1 Knoten Level i = K 2: 9 = 3 2 Knoten... Level i = 0: Höchste Granularität, 3 K Knoten N D = i=0...k Knoten pro Dimension N D = i=0...k M Fakten, gleichverteilt in Dimensionen Attribut: b Bytes; Knoten haben nur ID; m Faktattribute 3 i c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
60 Relationale Umsetzung des multidimensionalen Datenmodells Volle Klassifikationshierarchie Zu jedem Knoten gibt es (gleich viele) Fakten Level 2 Top Level 1 K1 K2 K3 Level 0 K1.1 K1.2 K1.3 K2.1 K2.2 K2.3 K3.1 K3.2 K3.3 Fakten c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
61 Relationale Umsetzung des multidimensionalen Datenmodells Anfragekosten Star vs. Snowflake Speicherplatz Snowflake: (((n + m) M) + n N D ) b n Anzahl Fremdschlüssel in Faktentabelle m Anzahl Faktenattribute n ND Ein Tupel pro Klassifikationsknoten Speicherplatz Star: (((n + m) M) + n 3 K K) b n 3 K Ein Tupel pro Klassifikationsknoten Level 0 K Ein Attribut pro Klassifikationsstufe c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
62 Relationale Umsetzung des multidimensionalen Datenmodells Kosten Star vs. Snowflake 2 Anzahl Dimensionen Snowflake-Schema Speicherbedarf in MB Anzahl Klassifikationsstufen 10 Star-Schema c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
63 Relationale Umsetzung des multidimensionalen Datenmodells Anfrage Star und Snowflake Anfrage: Verkäufe der Produktgruppe Wein pro Stadt und Jahr Snowflake-Schema: SELECT S_Name, YEAR(Z_Datum), SUM(V_Anzahl) FROM Verkauf, Filiale, Stadt, Produkt, Produktgruppe, Zeit WHERE V_Produkt_ID = P_ID AND P_PGruppe_ID = PG_ID AND V_Filial_ID = F_ID AND F_Stadt_ID = S_ID AND V_Zeit_ID = Z_ID AND PG_Bezeichnung = Wein GROUP BY S_Name, YEAR(Z_Datum) Anzahl der Joins: 5 (steigt linear mit Anzahl der Aggregationspfade) c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
64 Relationale Umsetzung des multidimensionalen Datenmodells Anfrage Star und Snowflake (2) Anfrage für Star-Schema: SELECT O_Stadt, YEAR(Z_Datum), SUM(V_Anzahl) FROM Verkauf, Ort, Produkt, Zeit WHERE V_Produkt_ID = P_ID AND V_Zeit_ID = Z_ID AND V_Ort_ID = O_ID AND P_Produktgruppe = Wein GROUP BY O_Stadt, YEAR(Z_Datum) Anzahl der Joins: 3 (unabhängig von der Länge der Aggregationspfade) c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
65 Relationale Umsetzung des multidimensionalen Datenmodells Mischformen Abbildung einzelner Dimensionen analog Snowflake-Schema oder Star-Schema Entscheidungskriterien: Änderungshäufigkeit der Dimensionen: Reduzierung des Pflegeaufwandes durch Normalisierung (Snowflake) Anzahl der Klassifikationsstufen einer Dimension: Mehr Klassifikationsstufen größere Redundanz im Star-Schema Anzahl der Dimensionselemente: Einsparung durch Normalisierung bei vielen Elementen einer Dimension auf niedrigster Klassifikationsstufe Materialisierung von Aggregaten: Performance-Verbesserung durch Normalisierung bei materialisierten Aggregaten für eine Klassifikationsstufe c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
66 Relationale Umsetzung des multidimensionalen Datenmodells Galaxie-Schema Star- und Snowflakeschema Eine Faktentabelle Mehrere Kennzahlen nur möglich bei gleichen Dimensionen Galaxie-Schema Mehrere Faktentabellen Teilweise mit gleichen Dimensionstabellen verknüpft Auch: Multi-Faktentabellen-Schema, Multi-Cube, Hyper-Cube c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
67 Relationale Umsetzung des multidimensionalen Datenmodells Galaxie-Schema: Muster 1. Dimensionstabelle Dim1_Schlüssel Dim1_Attribute Faktentabelle1 Dim1_Schlüssel Dim2_Schlüssel Dim3_Schlüssel Fakt1 Fakt2 2. Dimensionstabelle Dim2_Schlüssel Dim2_Attribute 3. Dimensionstabelle Dim3_Schlüssel Dim3_Attribute Faktentabelle2 Dim3_Schlüssel Dim4_Schlüssel Fakt3 Fakt4 4. Dimensionstabelle Dim4_Schlüssel Dim4_Attribute c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
68 Relationale Umsetzung des multidimensionalen Datenmodells Galaxie-Schema: Beispiel 1 Land L_ID L_Name 1 Kundengruppe KG_ID KG_Bezeichnung Produktkategorie PK_ID 1 Produktgruppe PG_ID 1 PK_Bezeichnung * PG_Bezeichnung PG_PKategorie_ID 1 * Bundesland B_ID B_Name B_Land_ID 1 1 * Kunde K_ID K_Name K_Wohnort K_Strasse K_Geschlecht K_KGruppe_ID 1 * * Verkauf V_Anzahl V_Kanal V_Produkt_ID V_Zeit_ID V_Kunden_ID V_Filial_ID * * 1 Produkt P_ID P_Bezeichnung P_Verkaufspreis P_Einkaufspreis P_Rabatt P_Steuern P_PGruppe_ID * * Stadt S_ID S_Name S_BLand_ID 1 * Filiale F_ID F_Filiale F_Stadt_ID 1 * Summe_Verkauf SV_Anzahl SV_Kanal SV_Monat_ID SV_PGruppe_ID SV_BLand_ID * * 1 1 Zeit Z_ID Z_Datum Z_Monat_ID Z_Monat c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
69 Relationale Umsetzung des multidimensionalen Datenmodells Fact Constellation Speicherung vorberechneter Aggregate in Faktentabelle Beispiel: Umsatz für Region Unterscheidung in Dimensionstabelle über spezielle Attribute (Bsp.: Stufe ) Alternative: Auslagerung in eigene Faktentabelle Fact-Constellation-Schema (Spezialfall eines Galaxie-Schemas) c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
70 Relationale Umsetzung des multidimensionalen Datenmodells Fact Constellation: Beispiel Kunde K_ID K_Name K_Wohnort K_Strasse K_Geschlecht K_Kundengruppe Ort O_ID O_Filiale O_Stadt O_BLand_ID O_Bundesland O_Land * * * Verkauf V_Anzahl V_Kanal V_Produkt_ID V_Zeit_ID V_Kunden_ID V_Ort_ID Summe_Verkauf SV_Anzahl SV_Kanal SV_PGruppe_ID SV_Monat_ID SV_BLand_ID * * * * Produkt P_ID P_Bezeichnung P_Verkaufspreis P_Einkaufspreis P_Rabatt P_Steuern P_PGruppe_ID P_Produktgruppe P_Produktkategorie Zeit Z_ID Z_Datum Z_Monat_ID Z_Monat c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
71 Relationale Umsetzung des multidimensionalen Datenmodells Darstellung von Klassifikationshierarchien Horizontal: Modellierung der Stufen der Klassifikationshierarchie als Spalten der denormalisierten Dimensionstabelle Vorteil: Einschränkungen auf höherer Granularität ohne Join Nachteile: Duplikateliminierung beim Anfragen bestimmter Stufen (Bsp.: Produktgruppe innerhalb einer Kategorie) Schemaänderung beim Hinzufügen neuer Stufen Produkt_ID Artikel Produktgruppe Produktkategorie 1234 Immer Ultra Hygiene Kosmetik 1235 Putzich Hygiene Kosmetik 2345 Rohrfrei Reiniger Haushalt c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
72 Relationale Umsetzung des multidimensionalen Datenmodells Darstellung von Klassifikationshierarchien Vertikal (rekursiv): normalisierte Dimensionstabelle mit Attributen Dimensions_ID: Schlüssel für Faktentabelle Eltern_ID: Attributwert der Dimensions-ID der nächsthöheren Stufe Vorteile: Einfache Änderung am Klassifikationsschema Einfache Behandlung vorberechneter Aggregate Nachteil: Self-Join für Anfragen einzelner Stufen (Bsp.: Produktgruppe innerhalb einer Kategorie) Dimensions_ID Immer Ultra Hygiene Putzich Eltern_ID Hygiene Kosmetik Hygiene c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
73 Relationale Umsetzung des multidimensionalen Datenmodells Darstellung von Klassifikationshierarchien Kombiniert: Verbindung beider Strategien Repräsentation der Klassifikationsstufen als Spalten (jedoch generische Bezeichnung) Speicherung der Knoten aller höheren Stufen als Tupel Zusätzliches Attribut Stufe Angabe der bezeichneten Klassifikationsstufe Dimensions_ID Stufe1_ID Stufe2_ID Stufe Immer Ultra Hygiene Kosmetik 0 Putzich Hygiene Kosmetik 0 Hygiene Kosmetik NULL 1 Kosmetik NULL NULL 2 c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
74 Relationale Umsetzung des multidimensionalen Datenmodells Vermeidung von Semantikverlusten Semantikverlust bei relationaler Abbildung: Unterscheidung zwischen Kennzahl und Dimension (Attribute der Faktentabelle) Attribute von Dimensionstabellen (beschreibend, Aufbau der Hierarchie) Aufbau der Dimensionen (Drill-Pfade) Ausweg: Erweiterung des Systemkatalogs um Metadaten für multidimensionale Anwendungen Beispiel: CREATE DIMENSION, HIERARCHY in Oracle c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
75 Relationale Umsetzung des multidimensionalen Datenmodells Probleme der relationalen Umsetzung Transformation multidimensionaler Anfragen in relationale Repräsentation notwendig komplexe Anfragen Einsatz komplexer Anfragewerkzeuge notwendig (OLAP-Werkzeuge) Semantikverlust Daher: direkte multidimensionale Speicherung siehe Teil VI c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
76 Slowly Changing Dimensions Slowly Changing Dimensions Historisierung: Änderungen von Attributsausprägungen, Beziehungen und Entitäten im Zeitablauf Strukturveränderungen in den Dimensionen Schemaveränderungen in den Dimensionen Einfluss auf Analysen c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
77 Slowly Changing Dimensions Slowly Changing Dimensions: Beispiel Getränke Bier Wein Erfurter Bock Anhaltinisch Flüssig Ilmenauer Pils Rotwein Weißwein Dornfelder Portugieser Weißherbst Müller- Thurgau Riesling Getränke Bier Wein Obergärig Untergärig Rotwein Weißwein Berliner Weiße Anhaltinisch Flüssig Erfurter Bock Ilmenauer Pils Dornfelder Portugieser Weißherbstt Blauburgunder Müller- Thurgau Riesling c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
78 Slowly Changing Dimensions Analyseanforderungen nach aktueller Struktur: as is nach definierter historischer Struktur: as of gemäß historischer Wahrheit: as posted vergleichbare Resultate c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
79 Slowly Changing Dimensions Beispiel für Slowly Changing Dimensions Produktdimension 2010 Produkt Müller-Thurgau Riesling Dornfelder Portugieser Weißherbst Produktdimension 2011 Produkt Müller-Thurgau Riesling Portugieser Weißherbst Blauburgunder Dornfelder Produktgruppe Weißwein Weißwein Rotwein Rotwein Produktgruppe Weißwein Weißwein Weißwein Rotwein Rotwein Fakten Produkt Jahr Pakete Dornfelder Müller-Thurgau Portugieser Weißherbst Riesling Blauburgunder Dornfelder Müller-Thurgau Portugieser Weißherbst Riesling c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
80 Slowly Changing Dimensions Berichtsanforderungen aktuelle Struktur Produktgruppe Pakete 2010 Pakete 2011 Weißwein Rotwein alte Struktur Produktgruppe Pakete 2010 Pakete 2011 Weißwein Rotwein historische Wahrheit Produktgruppe Pakete 2010 Pakete 2011 Weißwein Rotwein vergleichbare Resultate Produktgruppe Pakete 2010 Pakete 2011 Weißwein Rotwein c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
81 Slowly Changing Dimensions... mit aktueller Struktur Produktdimension 2011 Produkt Produktgruppe Müller-Thurgau Weißwein Riesling Weißwein Portugieser Weißherbst Weißwein Blauburgunder Rotwein Dornfelder Rotwein Fakten Produkt Jahr Pakete Dornfelder Müller-Thurgau Portugieser Weißherbst Riesling Blauburgunder Dornfelder Müller-Thurgau Portugieser Weißherbst Riesling aktuelle Struktur Produktgruppe Pakete 2010 Pakete 2011 Weißwein Rotwein c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
82 Slowly Changing Dimensions... nach alter Struktur Produktdimension 2010 Produkt Produktgruppe Müller-Thurgau Weißwein Riesling Weißwein Dornfelder Rotwein Portugieser Weißherbst Rotwein Fakten Produkt Jahr Pakete Dornfelder Müller-Thurgau Portugieser Weißherbst Riesling Blauburgunder Dornfelder Müller-Thurgau Portugieser Weißherbst Riesling alte Struktur Produktgruppe Pakete 2010 Pakete 2011 Weißwein Rotwein c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
83 Slowly Changing Dimensions... nach historischer Wahrheit Produktdimension 2010 Produkt Müller-Thurgau Riesling Dornfelder Portugieser Weißherbst Produktdimension 2011 Produkt Müller-Thurgau Riesling Portugieser Weißherbst Blauburgunder Dornfelder Produktgruppe Weißwein Weißwein Rotwein Rotwein Produktgruppe Weißwein Weißwein Weißwein Rotwein Rotwein Fakten Produkt Jahr Pakete Dornfelder Müller-Thurgau Portugieser Weißherbst Riesling Blauburgunder Dornfelder Müller-Thurgau Portugieser Weißherbst Riesling historische Wahrheit Produktgruppe Pakete 2010 Pakete 2011 Weißwein Rotwein c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
84 Slowly Changing Dimensions... mit vergleichbaren Resultaten Produktdimension 2010 Produkt Müller-Thurgau Riesling Dornfelder Portugieser Weißherbst Produktdimension 2011 Produkt Müller-Thurgau Riesling Portugieser Weißherbst Blauburgunder Dornfelder Produktgruppe Weißwein Weißwein Rotwein Rotwein Produktgruppe Weißwein Weißwein Weißwein Rotwein Rotwein Fakten Produkt Jahr Pakete Dornfelder Müller-Thurgau Portugieser Weißherbst Riesling Blauburgunder Dornfelder Müller-Thurgau Portugieser Weißherbst Riesling vergleichbare Resultate Produktgruppe Pakete 2010 Pakete 2011 Weißwein Rotwein c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
85 Slowly Changing Dimensions Realisierungen Anpassung des historischen Datenmaterials an neue Strukturen kleiner Datenbestand, aber alte Strukturen sind nicht vorhanden Separate Speicherung des historischen Datenbestandes zusätzlich zu neuen Strukturen großer Datenbestand und Komplexität für Anwender, aber alte Strukturen abrufbar Aufbau paralleler Hierarchien mit allen Strukturen Dimensionsstruktur komplex, beliebiges Reporting möglich Gültigkeitsstempel beliebige Strukturen abrufbar, aber Performancefrage c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
86 Slowly Changing Dimensions As is -Szenario Einfach zu implemetieren Keine Historie Nur für as is Getraenk_ID Produkt Produktgruppe 1 Dornfelder Rotwein 2 Müller-Thurgau Weißwein Getraenk_ID Produkt Produktgruppe 1 Dornfelder Rotwein 2 Müller-Thurgau Weißwein 3 Portugieser Weißherbst Rotwein 3 Portugieser Weißherbst Weißwein c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
87 Slowly Changing Dimensions As is & quasi as of -Szenario Etwas höherer Speicherbedarf Historie ohne Zeitzuordnung Entspricht paralleler Hierarchie Getraenk_ID Produkt Produktgruppe Alte_Gruppe 1 Dornfelder Rotwein Rotwein 2 Müller-Thurgau Weißwein Weißwein 3 Portugieser Weißherbst Rotwein Rotwein Getraenk_ID Produkt Produktgruppe Alte_Gruppe 1 Dornfelder Rotwein Rotwein 2 Müller-Thurgau Weißwein Weißwein 3 Portugieser Weißherbst Weißwein Rotwein c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
88 Slowly Changing Dimensions As is & as of -Szenario: Versionierung Etwas höherer Speicherbedarf Historie ohne Zeitzuordnung Künstliche Dimensionsschlüssel notwendig Getraenk_ID Produkt Produktgruppe Version G_ID_alt aktiv 1 Dornfelder Rotwein 1 1 X 2 Müller-Thurgau Weißwein 1 2 X 3 Portugieser Weißherbst Rotwein 1 3 X Getraenk_ID Produkt Produktgruppe Version G_ID_alt aktiv 1 Dornfelder Rotwein 1 1 X 2 Müller-Thurgau Weißwein 1 2 X 3 Portugieser Weißherbst Rotwein Portugieser Weißherbst Weißwein 2 6 X c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
89 Slowly Changing Dimensions As is & as of -Szenario: Zeitstempel Höherer Speicherbedarf Historie mit Zeitzuordnung Künstliche Dimensionsschlüssel (oder zusammengesetzte Schlüssel) notwendig in den Fakten Verknüpfung mit Getraenk_ID G_ID G_ID_alt Produkt Produktgruppe Gültig_Von Gültig_Bis 1 1 Dornfelder Rotwein Müller-Thurgau Weißwein Portugieser Weißherbst Rotwein G_ID G_ID_alt Produkt Produktgruppe Gültig_Von Gültig_Bis 1 1 Dornfelder Rotwein Müller-Thurgau Weißwein Portugieser Weißherbst Rotwein Portugieser Weißherbst Weißwein c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
90 Slowly Changing Dimensions As posted -Szenario Höherer Speicherbedarf Historie zum Transaktionszeitpunkt Künstliche Dimensionsschlüssel (oder zusammengesetzte Schlüssel) notwendig in den Fakten Verknüpfung mit G_ID_alt Getraenk_ID Produkt Produktgruppe Version G_ID_alt 1 Dornfelder Rotwein Müller-Thurgau Weißwein Portugieser Weißherbst Rotwein 1 3 Getraenk_ID Produkt Produktgruppe Version G_ID_alt 1 Dornfelder Rotwein Müller-Thurgau Weißwein Portugieser Weißherbst Rotwein Portugieser Weißherbst Weißwein 2 6 c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
91 Slowly Changing Dimensions As is & as of & as posted -Szenario: Snapshot Höherer Speicherbedarf in Dimensions- und Faktentabellen Flag für aktuelle Zuordnung Künstliche Ladezeitpunktdaten nur für kleine Dimensionen empfehlenswert Getraenk_ID Produkt Produktgruppe Ladedatum aktuell 1 Dornfelder Rotwein Müller-Thurgau Weißwein Portugieser Weißherbst Rotwein Dornfelder Rotwein Müller-Thurgau Weißwein Portugieser Weißherbst Weißwein c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
92 Slowly Changing Dimensions Zusammenfassung Multidimensionales Datenmodell: Würfel, Kennzahlen, Dimensionen OLAP-Operationen konzeptionelle Modellierungstechniken kein Quasi -Standard wie ER-Modell spezialisierte Kontrukte für multidimensionale Konzepte Umsetzung des multidimensionalen Modells relational: Star und Snowflake Schema Mischformen Vermeidung von Sematikverlusten c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung:
Multidimensionales Datenmodell
Multidimensionales Datenmodell Grundbegriffe fi Fakten, Dimensionen, Würfel Analyseoperationen fi Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung fi ME/R, ADAPT Relationale
Motivation. Dimensionen. Motivation /2. 3. Multidimensionales Datenmodell
3. Multidimensionales Datenmodell Grundbegriffe Dimensionen, Fakten/Kennzahlen, Würfel Analyseoperationen Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung ME/R, ADAPT, graphbasierte
Motivation. Motivation /2. Dimensionen. Einfache Hierarchien. Hierarchien in Dimensionen. 3. Multidimensionales Datenmodell
3. Multidimensionales Datenmodell Grundbegriffe Dimensionen, Fakten/Kennzahlen, Würfel Analyseoperationen Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung ME/R, ADAPT, graphbasierte
Multidimensionales Datenmodell. Motivation. Motivation /2. Grundbegriffe. Analyseoperationen. Notationen zur konzeptuellen Modellierung
Multidimensionales Datenmodell Grundbegriffe Dimensionen, Fakten/Kennzahlen, Würfel Analyseoperationen Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung ME/R,ADAPT,graphbasierteAnsätze
Das Multidimensionale Datenmodell
Das Multidimensionale Datenmodell Konzeptuelle Modellierung Umsetzung des Modells Beispiel ER-Modell 2 / 36 Probleme ER-Modellierung Keine Unterscheidung Klassifikation, Attribute, Kenngrößen Dimension
Kapitel 6 Einführung in Data Warehouses
Kapitel 6 Einführung in Data Warehouses Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2008, LMU München 2008 Dr. Peer Kröger Dieses Skript basiert zu einem Teil auf dem Skript zur Vorlesung
Data Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel [email protected]
Data Warehouses Sommersemester 2011 Melanie Herschel [email protected] Lehrstuhl für Datenbanksysteme, Universität Tübingen Data Warehouse Architektur Data-Warehouse-System Teilsichten
Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL
Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining 2 Eigenschaften eines Data Warehouse Referenzarchitektur Integrierte Sicht auf beliebige Daten aus verschieden Datenbanken
Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.
Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen
Themenblock: Erstellung eines Cube
Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen
Seminar Data Warehousing. Seminar. Data Warehousing. Thema: Speichermodelle für Data-Warehouse-Strukturen
Seminar Data Warehousing Thema: Speichermodelle für Data-Warehouse-Strukturen Friedrich-Schiller-Universität Jena Fakultät für Mathematik und Informatik Institut für Informatik Lehrstuhl für Datenbanken
Komponenten und Architekturen von Analytischen Informationssystemen (AIS)
Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation 27. Juni 2013 Hinweis Diese Folien ersetzen keinesfalls den Übungsstoff des zugehörigen e-learning-kurses.
Multidimensionales Datenmodell, Cognos
Data Warehousing (II): Multidimensionales Datenmodell, Cognos Praktikum: Data Warehousing und Mining Praktikum Data Warehousing und Mining, Sommersemester 2010 Vereinfachte Sicht auf die Referenzarchitektur
Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:
Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse
Komponenten und Architekturen von Analytischen Informationssystemen (AIS)
Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation Zusammenfassung OPAL 6. Übung Juni 2015 Agenda Hinweise zur Klausur Zusammenfassung OPAL Übungen / Kontrollfragen
Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien
Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...
Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY
Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung
Vorlesung Datenbankmanagementsysteme
Vorlesung Datenbankmanagementsysteme SQL zur Datenanalyse & Einführung Online Analytical Processing (OLAP) (auf Basis von Oracle) Vorlesung Datenbankmanagementsysteme SQL zur Datenanalyse M. Lange, S.
Einführung in Data Warehouses
Kapitel l6 Einführung in Data Warehouses Vorlesung: Dr. Matthias Schubert Skript 2009 Matthias Schubert Dieses Skript basiert auf dem Skript zur Vorlesung Datenbanksysteme II von Prof. Dr. Christian Böhm
Multidimensionales Datenmodell, Anfrageverarbeitung und Anfrageoptimierung
Multidimensionales Datenmodell, Anfrageverarbeitung und Anfrageoptimierung Grundbegriffe Dimensionen, Fakten/Kennzahlen Eigenschaften von multidimensionalen Anfragen Relationale Umsetzung von Anfragen
Data Warehouse Technologien
Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............
Vertrautmachen mit Daten
Kapitel III Vertrautmachen mit Daten 2004 AIFB / FZI 1 III Vertrautmachen mit Daten (see also Data Preparation ) 2004 AIFB / FZI 2 III Vertrautmachen mit Daten III.1 OLAP III.1.1 Einführung in OLAP Wie
Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen Fragen Vertiefung Modellierung
Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation Zusammenfassung OPAL 24. Juni 2014 Agenda Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen
Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:
Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse
Data Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:
Kapitel 16 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining operationale DB operationale DB operationale DB Data Warehouse operationale
OLAP und Data Warehouses
OLP und Data Warehouses Überblick Monitoring & dministration Externe Quellen Operative Datenbanken Extraktion Transformation Laden Metadaten- Repository Data Warehouse OLP-Server nalyse Query/Reporting
Data-Warehouse-Technologien
Data-Warehouse-Technologien Prof. Dr.-Ing. Kai-Uwe Sattler 1 Prof. Dr. Gunter Saake 2 Dr. Veit Köppen 2 1 TU Ilmenau FG Datenbanken & Informationssysteme 2 Universität Magdeburg Institut für Technische
Inhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte
4. Data Warehouses Inhalt 4.1 Motivation 4.2 Datenintegration 4.3 Konzeptuelle Modellierung 4.4 Anfragen an Data Warehouses 4.5 Implementierungsaspekte 2 Literatur V. Köppen, G. Saake und K.-U. Sattler:
Christian Kurze BI-Praktikum IBM WS 2008/09
Einführung in die multidimensionale Datenmodellierung e mit ADAPT BI-Praktikum IBM WS 2008/09 1 Gliederung Einführung multidimensionale Datenmodellierung 1. Multidimensionales Modell BI-Praktikum IBM WS
Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen
Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen (Folien von A. Kemper zum Buch 'Datenbanksysteme') Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP
Data Warehouse Technologien
mitp Professional Data Warehouse Technologien von Veit Köppen, Gunter Saake, Kai-Uwe Sattler 2. Auflage 2014 Data Warehouse Technologien Köppen / Saake / Sattler schnell und portofrei erhältlich bei beck-shop.de
Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH
Einführung in OLAP und Business Analysis Gunther Popp dc soft GmbH Überblick Wozu Business Analysis mit OLAP? OLAP Grundlagen Endlich... Technischer Background Microsoft SQL 7 & OLAP Services Folie 2 -
Data Warehousing und Data Mining
Data Warehousing und Data Mining OLAP Operationen Ein konzeptionelles MDDM Aggregierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Operationen im multidimensionalen Datenmodell
Data Warehouse Grundlagen
Seminarunterlage Version: 2.10 Version 2.10 vom 24. Juli 2015 Dieses Dokument wird durch die veröffentlicht.. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen sind Warenzeichen
Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube
Fragen des Marketingleiters Data Warehousing Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt nach? Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon Technisch
DATA-WAREHOUSE-TECHNOLOGIEN
Vorlesung DATA-WAREHOUSE-TECHNOLOGIEN Wintersemester 2007/2008 Vorlesender: Eike Schallehn Vorlesung und Skript von: Prof. Dr.-Ing. habil. Kai-Uwe Sattler TU Ilmenau, FG Datenbanken und Informationssysteme
Multikonferenz Wirtschaftsinformatik 2004
Multikonferenz Wirtschaftsinformatik 2004 Grafische Repräsentation mehrdimensionaler Datenmodelle des SAP Business Information Warehouse Dr. Michael Hahne, cundus AG Essen, 9. März 2004 cundus AG 2004
Logische Modelle für OLAP. Burkhard Schäfer
Logische Modelle für OLAP Burkhard Schäfer Übersicht Einführung in OLAP Multidimensionale Daten: Hypercubes Operationen Formale Grundlagen Zusammenfassung Einführung in OLAP Verfahren zur Analyse großer
Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier
Realisierung von OLAP Operatoren in einem visuellen Analysetool Vortrag von Alexander Spachmann und Thomas Lindemeier Gliederung Ausgangssituation/Motivation Was ist OLAP? Anwendungen Was sind Operatoren?
MIS by Franziska Täschler, Winformation GmbH [email protected] Ausgabe 01/2001
MIS Glossar by Franziska Täschler, Winformation GmbH [email protected] Ausgabe 01/2001 Aggregat Data Cube Data Marts Data Mining Data Warehouse (DWH) Daten Decision Support Systeme (DSS)
Data Warehousing. Weitere Buzzwörter: OLAP, Decision Support, Data Mining
Data Warehousing Weitere Buzzwörter: OLAP, Decision Support, Data Mining Wichtige Hinweise Zu diesem Thema gibt es eine Spezialvorlesung im Sommersemester Hier nur grober Überblick über Idee und einige
Logische Datenmodellierung zur Abbildung mehrdimensionaler Datenstrukturen im SAP Business Information Warehouse
Logische Datenmodellierung zur Abbildung mehrdimensionaler Datenstrukturen im SAP Business Information Warehouse Vortrag auf der BTW 2003, Leipzig 26.-28.02.2003 Dr. Michael Hahne cundus AG Prokurist,
Data Warehousing. Modellierung im DWH Das multidimensionale Datenmodell. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Modellierung im DWH Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Zusammenfassung: Hubs and Spokes Mart 1 Mart 2 Mart 3 Mart 4 DWH Quelle 1 RDBMS Quelle
5 Data Warehouses und Data Mining
5 Data Warehouses und Data Mining Mittels OLAP Techniken können große Datenmengen unterschiedlich stark verdichtet und gezielt aufbereitet werden. Mittels Data Mining können große Datenmengen nach bisher
Datenbanksysteme 2 Frühjahr-/Sommersemester 2014 28. Mai 2014
Lehrstuhl für Praktische Informatik III Prof. Dr. Guido Moerkotte Email: [email protected] Marius Eich Email: [email protected] Datenbanksysteme 2 8. Übungsblatt Frühjahr-/Sommersemester
Vorwort zur 5. Auflage... 15 Über den Autor... 16
Vorwort zur 5. Auflage...................................... 15 Über den Autor............................................ 16 Teil I Grundlagen.............................................. 17 1 Einführung
Data Warehousing und Data Mining
Data Warehousing und Data Mining Speicherung multidimensionaler Daten Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Relationales OLAP (ROLAP) Snowflake-, Star- und Fullfactschema
Hetero-Homogene Data Warehouses
Hetero-Homogene Data Warehouses TDWI München 2011 Christoph Schütz http://hh-dw.dke.uni-linz.ac.at/ Institut für Wirtschaftsinformatik Data & Knowledge Engineering Juni 2011 1 Data-Warehouse-Modellierung
Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein
1 Definitionen 1.1 Datenbank Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert Integriert, selbstbeschreibend, verwandt 1.2 Intension/Extension Intension: Menge der Attribute Extension:
Index- und Zugriffsstrukturen für. Holger Brämer, 05IND-P
Index- und Zugriffsstrukturen für Data Warehousing Holger Brämer, 05IND-P Index- und Zugriffstrukturen für Data Warehousing Materialisierte Sichten Bitmap-Indexe Verbundindexe Materialisierte Sichten gehören
OLTP: Online Transaction Processing
Moderne Betriebliche Anwendungen von Datenbanksystemen Online Transaction Processing (bisheriger Fokus) Data Warehouse-Anwendungen Data Mining OLTP: Online Transaction Processing Beispiele Flugbuchungssystem
Aufgabe 1: [Logische Modellierung]
Aufgabe 1: [Logische Modellierung] a) Entwerfen Sie für das von Ihnen entworfene Modell aus Aufgabe 2 des 1. Übungsblattes ein Star-Schema. b) Entwerfen Sie für das vorangegangene Modell einen Teil eines
Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten
Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Michael Hahne T&I GmbH Workshop MSS-2000 Bochum, 24. März 2000 Folie 1 Worum es geht...
Logische Modellierung von Data Warehouses
Logische Modellierung von Data Warehouses Vertiefungsarbeit von Karin Schäuble Gliederung. Einführung. Abgrenzung und Grundlagen. Anforderungen. Logische Modellierung. Methoden.. Star Schema.. Galaxy-Schema..
Konzeptuelle und logische Modellierung eines Data-Warehouse-Systems
Seminar Data Warehousing im Verkehrsbereich Sommersemester 2003 Konzeptuelle und logische Modellierung eines Data-Warehouse-Systems Ling Kong 09.07.2003 Inhaltsverzeichnis 1. Einleitung... 1 2. Multidimensionales
3. Mehrdimensionale Datenmodellierung. Cb Cube-Operator, Rollup-Operator, Grouping Sets SS08, Prof. Dr. E. Rahm 3-1 y yy
3. Mehrdimensionale Datenmodellierung und Operationen Grundlagen Kennzahlen, e, Dimensionen, esoe,cube Cuboide / Aggregationsgitter hierarchische Dimensionen / Konzepthierarchien Cube-Operationen Multi-dimensionale
Kapitel 3: Datenbanksysteme
LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Skript zur Vorlesung: Einführung in die Informatik: Systeme und Anwendungen Sommersemester 2015 Kapitel 3: Datenbanksysteme Vorlesung:
Eignung unterschiedlicher Faktenmodellierungen in Data Warehouse-Systemen
Christoph Arnold (B. Sc.) Prof. Dr. Harald Ritz Eignung unterschiedlicher Faktenmodellierungen in Data Warehouse-Systemen AKWI-Tagung, 17.09.2012, Hochschule Pforzheim Christoph Arnold, Prof. Dr. Harald
DBS ::: SERIE 5. Join Right Semi- Join Left Semi-Join Projektion Selektion Fremdschlüssel. Kreuzprodukt
DBS ::: SERIE 5 Die Relation produkt enthält Hersteller, Modellnummer und Produktgattung (pc, laptop oder drucker aller Produkte. Die Modellnummer ist (der Einfachheit halber eindeutig für alle Hersteller
Fortgeschrittene OLAP Analysemodelle
Fortgeschrittene OLAP Analysemodelle Jens Kübler Imperfektion und erweiterte Konzepte im Data Warehousing 2 Grundlagen - Datenanalyse Systemmodell Datenmodell Eingaben System Schätzer Datentypen Datenoperationen
Star - Schema. AnPr. Name Klasse Datum. ANPR_StarSchema_v03.docx Seite 1
Name Klasse Datum 1 OLAP vs. OLTP In den RDBMS Konfigurationen unterscheidet man zwei verschiedene Grundtypen: OLTP: OnLine Transactional Processing ist für die Transaktionsprozesse und somit zur funktionalen
Mengenvergleiche: Alle Konten außer das, mit dem größten Saldo.
Mengenvergleiche: Mehr Möglichkeiten als der in-operator bietet der θany und der θall-operator, also der Vergleich mit irgendeinem oder jedem Tupel der Unteranfrage. Alle Konten außer das, mit dem größten
Anfragen in Operativen Systemen und Data Warehouses
Data Warehouses Sommersemester 011 Melanie Herschel [email protected] Lehrstuhl für Datenbanksysteme, Universität Tübingen Anfragen in Operativen Systemen und Data Warehouses Anfragen Operative
SQL Tutorial. SQL - Tutorial SS 06. Hubert Baumgartner. INSO - Industrial Software
SQL Tutorial SQL - Tutorial SS 06 Hubert Baumgartner INSO - Industrial Software Institut für Rechnergestützte Automation Fakultät für Informatik Technische Universität Wien Inhalt des Tutorials 1 2 3 4
SQL für Trolle. mag.e. Dienstag, 10.2.2009. Qt-Seminar
Qt-Seminar Dienstag, 10.2.2009 SQL ist......die Abkürzung für Structured Query Language (früher sequel für Structured English Query Language )...ein ISO und ANSI Standard (aktuell SQL:2008)...eine Befehls-
OLAP Einführung und Überblick
Kapitel 3 OLAP Einführung und Überblick In diesem Kapitel: Der Begriff OLAP 38 Möglichkeiten und Grenzen von SQL 39 Grundlegende Merkmale des multidimensionalen Konzepts 41 OLAP und Data Warehouse 49 Speicherkonzepte
Intelligente Kanzlei
Seite 1 von 5 Intelligente Kanzlei Datawarehouse und OLAP in der Steuerkanzlei Notwendigkeit eines Kanzleiinformationssystems Seit einigen Jahren sind enorme Veränderungen am Beratungsmarkt durch einen
Mala Bachmann September 2000
Mala Bachmann September 2000 Wein-Shop (1) Umsatz pro Zeit und Produkt Umsatz Jan Feb Mrz Q1 Apr 2000 Merlot 33 55 56 144 18 760 Cabernet-S. 72 136 117 325 74 1338 Shiraz 85 128 99 312 92 1662 Rotweine
Einführung in SQL. Sprachumfang: Indizes. Datensätzen. Zugriffsrechten
Einführung in SQL Die Sprache SQL (Structured Query Language) ist eine Programmiersprache für relationale Datenbanksysteme, die auf dem ANSI-SQL-Standard beruht. SQL wird heute von fast jedem Datenbanksystem
Data Warehouse. für den Microsoft SQL SERVER 2000/2005
Warehouse für den Microsoft SQL SERVER 2000/2005 Begriffe 1 DWH ( Warehouse) ist eine fachübergreifende Zusammenfassung von Datentabellen. Mart ist die Gesamtheit aller Datentabellen für einen fachlich
1. Funktionen und Datenflüsse; Tabellenkalkulationssysteme
Grundwissen Informatik 1. und Datenflüsse; Tabellenkalkulationssysteme Zellbezug relativer Zellbezug absoluter Zellbezug iterative Berechnungen Datentypyen z. B. A4 A ist der Spaltenbezeichner 4 ist die
Modellierung von OLAP- und Data- Warehouse-Systemen
Andreas Totok Modellierung von OLAP- und Data- Warehouse-Systemen Mit einem Geleitwort von Prof. Dr. Burkhard Huch Deutscher Universitäts-Verlag Inhaltsverzeichnis Abbildungsverzeichnis Tabellenverzeichnis
Data Warehousing Grundbegriffe und Problemstellung
Data Warehousing Grundbegriffe und Problemstellung Dr. Andrea Kennel, Trivadis AG, Glattbrugg, Schweiz [email protected] Schlüsselworte Data Warehouse, Cube, Data Mart, Bitmap Index, Star Queries,
Nachtrag: Farben. Farbblindheit. (Light und Bartlein 2004)
Nachtrag: Farben Farbblindheit (Light und Bartlein 2004) 1 Vorgeschlagene Farbskalen (Light and Bartlein 2004) Farbkodierung metrisch skalierter Daten Unterscheide: 1. Sequential Data (ohne Betonung der
Anfrageoptimierung in Data Warehouses durch Verwendung voraggregierter Views
Anfrageoptimierung in Data Warehouses durch Verwendung voraggregierter Views Diplomarbeit Fakultät für Informatik und Elektrotechnik Lehrstuhl Datenbanken und Informationssysteme Universität Rostock Vorgelegt
3. Das Relationale Datenmodell
3. Das Relationale Datenmodell Das Relationale Datenmodell geht zurück auf Codd (1970): E. F. Codd: A Relational Model of Data for Large Shared Data Banks. Comm. of the ACM 13(6): 377-387(1970) DBMS wie
Contents. Datenanalysemethoden im analytischen CRM. Data Warehouse - OLAP Version: July 17, 2007. 1 Datenanalysemethoden im analytischen CRM
Contents Data Warehouse - OLAP Version: July 17, 7 Andreas Geyer-Schulz und Anke Thede Schroff-Stiftungslehrstuhl Informationsdienste und Elektronische Märkte Fakultät für Wirtschaftswissenschaften Gebäude
IV. Datenbankmanagement
Wirtschaftsinformatik 2 (PWIN) IV. Datenbankmanagement Kapitel 2: Datenmanipulationssprache SQL Wirtschaftsinformatik 2 (PWIN) SS 2009, Professur für Mobile Business & Multilateral Security 1 Agenda 1.
OLAP und der MS SQL Server
OLAP und der MS SQL Server OLAP und der MS SQL Server OLAP-Systeme werden wie umfangreiche Berichtssysteme heute nicht mehr von Grund auf neu entwickelt. Stattdessen konzentriert man sich auf die individuellen
Implementierung eines Data Marts. Gunther Popp dc soft GmbH
Implementierung eines Data Marts Gunther Popp dc soft GmbH Überblick Vorstellung der Beispielanwendung Prozeß zur Erstellung eines Data Marts - Design - Datenermittlung - Implementierung Erläutert am Beispiel-Mart
SAP Business Intelligence
SAP Business Intelligence Helmut Roos Diplom-Ingenieur Unternehmensberater Grundlagen zu Netweaver 7.0 D-67067 Ludwigshafen +49 (621) 5 29 44 65 Data Acquisition Common Read / Write Interface Open Interface
Online Analytical Processing
Online Analytical Processing Online Analytical Processing Online Analytical Processing (OLAP) ermöglicht die multidimensionale Betrachtung von Daten zwecks E rmittlung eines entscheidungsunterstützenden
Model Klausel - Der Excel-Killer von Oracle?
Model Klausel - Der Excel-Killer von Oracle? Andrea Kennel Trivadis AG Glattbrugg, Schweiz Schlüsselworte: Model Klausel, SQL, Data Warehousing, OLAP Zusammenfassung Ein Data Mart kann als ein Würfel mit
Oracle OLAP 11g: Performance für das Oracle Data Warehouse
Oracle OLAP 11g: Performance für das Oracle Data Warehouse Marc Bastien Oracle BI Presales Agenda Performanceprobleme in Oracle DWH: gibt s das überhaupt? Mögliche Gründe und Lösungen
Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing
Seminar in der Seminarreihe Business Intelligence 1 OLAP und Datawarehousing OLAP & Warehousing Die wichtigsten Produkte Die Gliederung Produkt Bewertung & Vergleiche Die Marktentwicklung Der aktuelle
Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH)
Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH) Verteilung und Integration von Informationen im Verkehrsbereich Thema: OLAP in verteilten Data-Warehouse- Umgebungen Vortrag: Christian
Universität Augsburg, Institut für Informatik WS 2006/2007 Dr. W.-T. Balke 27. Nov. 2006 M. Endres, A. Huhn, T. Preisinger Lösungsblatt 5
Universität Augsburg, Institut für Informatik WS 2006/2007 Dr. W.-T. Balke 27. Nov. 2006 M. Endres, A. Huhn, T. Preisinger Lösungsblatt 5 Aufgabe 1: Projektion Datenbanksysteme I π A1,...,A n (π B1,...,B
105.3 SQL-Datenverwaltung
LPI-Zertifizierung 105.3 SQL-Datenverwaltung Copyright ( ) 2009 by Dr. W. Kicherer. This work is licensed under the Creative Commons Attribution-Noncommercial-Share Alike 2.0 Germany License. To view a
Objektorientierte Datenbanken
OODB 11 Slide 1 Objektorientierte Datenbanken Vorlesung 11 vom 01.07.2004 Dr. Sebastian Iwanowski FH Wedel OODB 11 Slide 2 Inhalt heute: Datenbanken in betriebswirtschaftlichen Anwendungen OTLP (SAP) Data
Informationssysteme. Prof. Dr. Hans Czap. Lehrstuhl für Wirtschaftsinformatik I. Lehrstuhl für Wirtschaftsinformatik I - II - 1 -
Vorlesung Grundlagen betrieblicher Informationssysteme Prof. Dr. Hans Czap Email: [email protected] - II - 1 - Inhalt Kap. 1 Ziele der Datenbanktheorie Kap. 2 Datenmodellierung und Datenbankentwurf
eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator
eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator Agenda Was ist Business Intelligence? Was ist OLAP? Unterschied zwischen OLAP und OLTP? Bestandteile
