Inhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte

Größe: px
Ab Seite anzeigen:

Download "Inhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte"

Transkript

1 4. Data arehouses

2 Inhalt 4. Motivation 4.2 Datenintegration 4.3 Konzeptuelle Modellierung 4.4 Anfragen an Data arehouses 4.5 Implementierungsaspekte 2

3 Literatur V. Köppen, G. Saake und K.-U. Sattler: Data arehouse Technologien, mitp Professional, Andreas Bauer und Holger Günzel: Data arehouse Systeme, dpunkt.verlag, 203 3

4 4. Motivation Vielzahl von operativen Systemen in Unternehmen Einkauf/Verkauf von Lieferanten/Kunden Kundenverwaltung (Adressen, Beschwerden) Organisation (Mitarbeiter, Abteilungen) Marketing (Management von Kampagnen) Unternehmenssteuerung (management) benötigt ganzheitliche Sicht auf Unternehmensdaten, um analytische Fragen zu beantworten und Entscheidungen zu treffen 4

5 Online Transaction Processing (OLTP) Online Transaction Processing (OLTP) zur raschen Bearbeitung von Transaktionen aus operativen Systemen Transaktionen betreffen nur einen kleinen Teil der Daten Mitarbeiter stoßen Transaktionen im Tagesgeschäft bei Verwendung der operativen Systeme an Beispiele: Zeige Daten zu Kunde mit KundenNr an Füge neue Bestellung mit Bestellpositionen ein RDBMS sind für diese Art von Transaktionen optimiert 5

6 Online Analytical Processing (OLAP) Online Analytical Processing (OLAP) zur raschen Bearbeitung von analytischen Transaktionen Transaktionen betreffen u.u. einen großen Teil der Daten Ursprung der Transaktionen sind analytische Fragen, die in der Unternehmenssteuerung entstehen Beispiele: Umsatzentwicklung von Produkt B in den letzten 0 Jahren Gewinn nach Bundesland und Produktkategorie in den letzten 6 Quartalen 6

7 Data arehouses Data arehouses (Ds) haben sich als eigenständige Systeme zur Unterstützung von OLAP etabliert Ds als eigenständige Systeme, um Beeinträchtigung der operativen Systeme durch Anfragen zu vermeiden Ds müssen Daten aus den verschiedenen operativen Systemen und evtl. externen Datenquellen integrieren 7

8 Datenquellen Ds integrieren Daten aus verschiedenen Quellen operative Systeme (z.b. Einkauf/Verkauf, Organisation) externe Datenquellen (z.b. statistische Daten, etterdaten) Datenintegration stößt auf viele Herausforderungen Verknüpfung von Datensätzen (z.b. nach Akquisition) Datenqualität (z.b. Eingabefehler, fehlende Attribute) Duplikate (z.b. doppelte Kundeneinträge) Effizienz (z.b. inkrementelle Integration, Bulk-Loading) 8

9 Basisdatenbank und Datenwürfel Terminologie im Bereich Data arehouses uneinheitlich; wir orientieren uns an der in [2] vorgeschlagenen Datenintegration führt zu einer Basisdatenbank (BDB), in der alle relevanten Rohdaten zusammengeführt sind Datenwürfel (data cubes) werden aus BDB abgeleitet; sie stellen betriebswirtschaftliche Fakten (z.b. Umsatz) mehrdimensional (z.b. Produkt, Zeitraum, Region) dar 9

10 Datenwürfel Produkt Kategorie Gruppe Artikel Kennzahl Umsatz Zeit Jahr Quartal Monat Filiale Stadt Verkaufsort Bundesland Quelle: Köppen, Saake und Sattler [2, S.46] 0

11 Data Marts und Data arehouse Data Marts sind definierte Sichten (z.b. für eine Sparte oder ein Vertriebsgebiet) auf Datenwürfeln und/oder BDB Data arehouse bezeichnet Gesamtheit aus Basisdatenbank, Datenwürfeln sowie Data Marts

12 2 OLAP-Regeln nach Codd E. F. Codd hat 993 einen Katalog von Anforderungen formuliert, die OLAP-Systeme erfüllen müssen. Multidimensionale Sicht auf Kennzahlen (z.b. Umsatz), die in verschiedenen Dimension (z.b. Zeit) aggregiert und gruppiert werden 2. Transparenz Implementierung bleibt dem Benutzer verborgen 3. OLAP-Zugriffe Zugriffsschnittstelle ist auf OLAP-Analysen zugeschnitten 4. Performanz Leistung des Data-arehouse-Systems ist unempfindlich gegenüber Anzahl von Dimensionen 2

13 2 OLAP-Regeln nach Codd 5. Skalierbarkeit Nutzung von verteilten Architekturen zum Umgang mit sehr großen Datenmengen 6. Generische Dimensionalität Dimensionen gleich behandelt und organisiert 7. Dünnbesetzte Strukturen Effizienter Umgang mit dünnbesetzten Datenwürfeln durch geeignete Daten- und Indexstrukturen 8. Mehrbenutzerbetrieb Konfliktfreier Betrieb mit mehreren Benutzern 3

14 2 OLAP-Regeln nach Codd 9. Uneingeschränkte Operationen Auf Datenwürfel definierte Operatoren werden umgesetzt 0. Intuitive Benutzeroberflächen Benutzeroberfläche soll intuitiv sein und z.b. eine Navigation entlang der Dimensionshierarchien erlauben. Flexibles Reporting Tabellarische, aber auch zwei- oder mehrdimensionale Reports (Berichte) müssen frei konfigurierbar sein 2. Beliebig viele Dimensionen und Aggregationsebenen Keinerlei Einschränkungen bzgl. Anzahl von Dimensionen und Tiefe der Dimensionshierarchien 4

15 FASMI-Anforderungen Pendse und Creeth haben folgende Anforderungen an Data-arehouse-Systeme formuliert Fast, d.h. kurze Antwortzeiten, die dem Benutzer ein interaktives Arbeiten ermöglichen (weniger als 5 Sekunden) Analysis, d.h. es muss eine adäquate auf analytische Fragestellungen ausgerichtete Schnittstelle bereitstehen Shared, d.h. das System muss mehrere Benutzer erlauben und ihre heterogenen Anforderungen unterstützen 5

16 FASMI-Anforderungen Multidimensional, d.h. das konzeptionelle Datenmodell muss die inhärente Multidimensionalität der analytischen Fragestellungen berücksichtigen Information, d.h. das System muss alle für die Analysen benötigten Daten zusammenführen und verwalten 6

17 4.2 Datenintegration Daten werden im Rahmen eines ETL-Prozesses aus operativen Systemen ins Data arehouse überführt Extraktionsphase identifiziert regelmäßig zu übernehmende Änderungen in den Datenquellen Transformationsphase behebt Daten- und Schemakonflikte zwischen Datenquelle und Basisdatenbank Ladephase bringt die transformierten Daten effizient (z.b. mittels Bulk-Loading) in die Basisdatenbank ein 7

18 Datenqualität und Datenbereinigung Mangelnde Qualität der Daten aus den verschiedenen Datenquellen machen eine Bereinigung notwendig Vereinheitlichung von Datentypen und Format (z.b. Name) Erkennen und Zusammenführen von Duplikaten Eindeutigkeit verletzt Unterschiedliche Repräsentation idersprüchliche erte Referentielle Integrität verletzt unvollständig Person KNr Name Geb.datum Alter Geschl. Telefon PLZ 34 Meier, Tom M Tina Möller Tom Meier F null null t@r.de Ort PLZ Ort Magdeburg Spanien Illmenau Falsche oder unzulässige erte Fehlende erte (z.b. Default-erte) Duplikate Schreib- oder Tippfehler Quelle: Köppen, Saake und Sattler [2, S.82] 8

19 Duplikatenerkennung Duplikatenerkennung mittels einer Vergleichsfunktion, welche die Ähnlichkeit von zwei Datensätzen misst Editierdistanzen für textuelle Attribute Numerischen Distanzen für numerische Attribute Paare von Datensätzen deren Ähnlichkeit über einem Schwellwert liegt, werden zusammengefasst Verfahren versuchen durch geschicktes Abschätzen von Ähnlichkeiten oder Sortieren möglichst weniger als O(n 2 ) Vergleiche durchzuführen 9

20 Editierdistanz nach Levenshtein Editierdistanz nach Levenshtein d(s,t) zwischen zwei Zeichenketten s und t misst die minimale Anzahl von Operationen (Zeichen löschen, ändern, hinzufügen), die notwendig sind, um s in t umzuwandeln Beispiel: Editierdistanz zwischen cabel und cube lösche l am Ende von cabel ersetzte a durch u 20

21 Editierdistanz nach Levenshtein Editierdistanz lässt sich somit wie folgt rekursiv definieren Y _] d(s[0..i],t[0..j]) = min _[ d(s[0..i ],t[0..j ]) + (s[i] = t[j]) // Ändern? d(s[0..i],t[0..j ]) + // Hinzufügen d(s[0..i ],t[0..j]) + // Löschen Berechnung in O(n 2 ) mit dynamischer Programmierung 2

22 Editierdistanz nach Levenshtein Beispiel: Editierdistanz von ware und wurst w u r s t w a r e DP-Tabelle beinhaltet d(s[0..i],t[0..j]) in DP[i,j] 22

23 Editierdistanz nach Levenshtein Beispiel: Editierdistanz von ware und wurst w u r s t w a r e DP-Tabelle beinhaltet d(s[0..i],t[0..j]) in DP[i,j] 23

24 q-gramme Menge der q-gramme zu einer Zeichenkette beinhaltet alle Zeichenketten der Länge 3, die darin enthalten sind Beispiel: warehouse beinhaltet die 3-Gramme { w, _wa, war, are, reh, eho, hou, ous, use, se_, e } Ähnlichkeit von zwei Zeichenketten als Dice-Koeffizient der Mengen ihrer q-gramme dice(s, t) = 2 grams(s, q) fl grams(t, q) grams(s, q)+grams(t, q) 24

25 q-gramme Zwei Zeichenketten s und t müssen mindestens max( s, t ) (k ) gemeinsame q-gramme haben, um eine Editierdistanz von höchstens k zu haben Man kann diese Schranke ausnutzen, um die Zahl der Paare von Zeichenketten, für die die Editierdistanz exakt berechnet werden muss, deutlich zu reduzieren 25

26 4.3 Konzeptuelle Modellierung erkzeuge zur konzeptuellen Modellierung von Data arehouses betrachten Fakten und Dimensionen Produkt Kategorie Gruppe Artikel Kennzahl Umsatz Zeit Jahr Quartal Monat Filiale Stadt Verkaufsort Bundesland Quelle: Köppen, Saake und Sattler [3, S.46] 26

27 Fakten und Kennzahlen Zellen eines Datenwürfels stellen betriebswirtschaftliche Fakten in Form einer Kennzahl (measure) dar Fakten sind in den Dimensionen des Datenwürfels eingebettet und beziehen sich auf eine Position im aufgespannten Datenraum Kennzahlen (z.b. Umsatz, Gewinn, verkaufte Stückzahl) sollen Verdichtung entlang der Dimensionen erlauben Beispiel: Umsatz für Produkt B in Filiale im Mai

28 Dimensionen Dimensionen beschreiben mögliche Sichten und strukturieren den aufgespannten Datenraum Dimensionen beinhalten einfache oder parallele Klassifikationshierarchien, entlang derer sich Fakten auf einer höheren Klassifikationsstufe weiter verdichten lassen 28

29 Einfache und parallele Hierarchien Einfache Hierarchie für Dimension Verkaufsort Top Bundesland Stadt Filiale Parallele Hierarchien für Dimension Zeitraum Top Jahr Quartal oche Monat Tag Quelle: Köppen, Saake und Sattler [2, S.48] 29

30 Multidimensional Entity-Relationship-Modell Multidimensional Entity-Relationship-Modell (ME/R) als Erweiterung des ERMs zur konzeptuellen Modellierung von Data arehouses Fakten als ausgezeichnete Beziehungstypen Dimensionen als Gruppen von Entitytypen verbunden durch ausgezeichneten Klassifikationsbeziehungstyp Faktenname Ebene Attributbezeichnung Faktenbeziehung Klassifikationsstufe Klassifikationsbeziehung Attribut Quelle: Köppen, Saake und Sattler [2, S.53] 30

31 Rückblick Unterstützung der Unternehmenssteuerung durch Data arehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen Online Transaction Processing (OLTP) und Online Analytical Processing unterscheiden sich deutlich Datenintegration als eine wichtige Herausforderung Multidimensional Entity-Relationship-Model zur konzeptuellen Modellierung von Data arehouses 3

32 Multidimensional Entity-Relationship-Modell Anzahl Umsatz Produktgruppe Artikel Verkauf Filiale Stadt Bundesland Produktkategorie Tag Kunde Kundengruppe oche Monat Quartal Jahr Quelle: Köppen, Saake und Sattler [2, S.54] 32

33 Zusammenfassung Unterstützung der Unternehmenssteuerung durch Data arehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen Online Transaction Processing (OLTP) und Online Analytical Processing unterscheiden sich deutlich Datenintegration als eine wichtige Herausforderung Multidimensional Entity-Relationship-Model zur konzeptuellen Modellierung von Data arehouses 33

34 Literatur [] A. Kemper und A. Eickler: Datenbanksysteme Eine Einführung, De Gruyter Oldenbourg, 203 (Kapitel 7) [2] V. Köppen, G. Saake und K.-U. Sattler: Data arehouse Technologien, mitp Professional,

35 Implementierung von Data arehouses Verschiedene Ansätze zur Speicherung von Datenwürfeln Relationales OLAP (ROLAP) bildet Datenwürfel auf Relationen ab und verwendet RDBMS Multidimensionales OLAP (MOLAP) speichert Datenwürfel direkt in Form eines mehrdimensionalen Arrays Hybrides OLAP (HOLAP) verwendet eine Kombination von ROLAP und MOLAP (z.b. Detaildaten relational und vorberechnete Aggregate mehrdimensional) 35

36 Snowflake-Schema Snowflake-Schema setzt Fakten in eine Faktentabelle und jede Dimension in mehrere normalisierte Dimensionstabellen um Faktentabelle enthält Kennzahl sowie Fremdschlüssel der jeweils niedrigsten Klassifikationsstufe Dimensionstabelle enthält eine ID, beschreibende Attribute sowie Fremdschlüssel der jeweils nächsthöheren Klassifikationsstufe 36

37 Snowflake-Schema Dimension "Produkt" Produktkategorie PK_ID PK_Bezeichnung * Produktgruppe PG_ID PG_Bezeichnung PG_PKategorie_ID Dimension "Kunde" * Bundesland B_ID B_Name B_Land_ID Kundengruppe KG_ID KG_Bezeichnung * Stadt S_ID S_Name S_BLand_ID * * Kunde K_ID K_Name K_ohnort K_Strasse K_Geschlecht K_KGruppe_ID Filiale F_ID F_Filiale F_Stadt_ID * * Verkauf V_Anzahl V_Kanal V_Produkt_ID V_Zeit_ID V_Kunden_ID V_Filial_ID * * Produkt P_ID P_Bezeichnung P_Verkaufspreis P_Einkaufspreis P_Rabatt P_Steuern P_PGruppe_ID Zeit Z_ID Z_Datum * Dimension "Zeit" Land L_ID L_Name Dimension "Ort" Quelle: Köppen, Saake und Sattler [2, S.58] 37

38 Star-Schema Star-Schema setzt Fakten in eine Faktentabelle und jede Dimension in eine denormalisierte Dimensionstabelle um Faktentabelle enthält Kennzahl sowie Fremdschlüssel der jeweils zugehörigen Einträge in den Dimensionstabellen Dimensionstabelle enthält ID sowie beschreibende Attribute für eine der niedrigsten Klassifikationsstufe und allen höheren Klassifikationsstufen 38

39 Star-Schema Kunde K_ID K_Name K_ohnort K_Strasse K_Geschlecht K_Kundengruppe Ort O_ID O_Filiale O_Stadt O_Bundesland O_Land * * Verkauf V_Anzahl V_Kanal V_Produkt_ID V_Zeit_ID V_Kunden_ID V_Ort_ID * * Produkt P_ID P_Bezeichnung P_Verkaufspreis P_Einkaufspreis P_Rabatt P_Steuern P_Produktgruppe P_Produktkategorie Zeit Z_ID Z_Datum Quelle: Köppen, Saake und Sattler [2, S.59] 39

40 Snowflake-Schema vs. Star-Schema Snowflake-Schema hält Dimensionstabellen in 3NF und vermeidet somit redundante Datenspeicherung; beim Star-Schema sind sie nur in NF, wodurch Redundanzen und Anomalien entstehen Star-Schema kann, dank seiner Denormalisierung, Anfragen bzgl. höherer Klassifikationsstufen direkt, ohne zusätzliche Joins bearbeiten 40

41 Snowflake-Schema vs. Star-Schema Beispielanfrage im Snowflake-Schema (5 Joins) SELECT S_Name, YEAR(Z_Datum), SUM(V_Anzahl) 2 FROM Verkauf, Filiale, Stadt, Produkt, Produktgruppe, Zeit 3 HERE V_Produkt_ID = P_ID AND P_PGruppe_ID = PG_ID 4 AND V_Filial_ID = F_ID AND F_Stadt_ID = S_ID 5 AND V_Zeit_ID = Z_ID AND PG_Bezeichnung = ein 6 GROUP BY S_Name, YEAR(Z_Datum) Beispielanfrage im Star-Schema (3 Joins) SELECT O_Stadt, YEAR(Z_Datum), SUM(V_Anzahl) 2 FROM Verkauf, Ort, Produkt, Zeit 3 HERE V_Produkt_ID = P_ID AND V_Zeit_ID = Z_ID 4 AND V_Ort_ID = O_ID AND P_Produktgruppe = ein 5 GROUP BY O_Stadt, YEAR(Z_Datum) 4

42 Galaxie-Schema Snowflake-Schema und Star-Schema beinhalten eine Faktentabelle, die Kennzahlen in den gleichen Dimensionen speichert Galaxie-Schema als Erweiterung des Snowflake-Schemas beinhaltet mehrere Faktentabellen, die Kennzahlen in verschiedenen Dimensionen speichern Vorberechnete Aggregate (z.b. über alle Filialen hinweg) als eine Quelle zusätzlicher Faktentabellen 42

43 Galaxie-Schema Land L_ID L_Name Kundengruppe KG_ID KG_Bezeichnung Produktkategorie PK_ID Produktgruppe PG_ID PK_Bezeichnung * PG_Bezeichnung PG_PKategorie_ID * Bundesland B_ID B_Name B_Land_ID * Kunde K_ID K_Name K_ohnort K_Strasse K_Geschlecht K_KGruppe_ID * * Verkauf V_Anzahl V_Kanal V_Produkt_ID V_Zeit_ID V_Kunden_ID V_Filial_ID * * Produkt P_ID P_Bezeichnung P_Verkaufspreis P_Einkaufspreis P_Rabatt P_Steuern P_PGruppe_ID * * Stadt S_ID S_Name S_BLand_ID * Filiale F_ID F_Filiale F_Stadt_ID * Summe_Verkauf SV_Anzahl SV_Kanal SV_Monat_ID SV_PGruppe_ID SV_BLand_ID * * Zeit Z_ID Z_Datum Z_Monat_ID Z_Monat Quelle: Köppen, Saake und Sattler [2, S.63] 43

44 4.4 Anfragen an Data arehouses Analytische Anfragen an Data arehouses wählen einen mehrdimensionalen Teilbereich von Fakten aus und berechnen Aggregationen auf höheren Klassifikationsstufen Beispiel: Umsatz je Produktkategorie in allen europäischen Filialen in den Monaten seit Januar 200 Beispiel: Verkaufte Einheiten je Produkt über alle Filialen pro Jahr seit

45 Anfragen an Data arehouses Analytische Anfragen betreffen oft eine große Menge von Daten (z.b. alle Verkäufe seit 200) Antwortzeiten sollen interaktiv (d.h. kürzer 5 Sekunden) sein, um eine Interaktion mit dem Datenwürfel zu erlauben Betrachtung eines kleineren Teilwürfels Verdichtung der Kennzahlen zu höherer Klassifikationsstufe etc. Data arehouses setzen auf Vorberechnungen, um diese Anforderungen zu erfüllen 45

46 OLAP-Operatoren Datenwürfel dient nicht nur der Modellierung, sondern es lassen sich eine Reihe von Operatoren auf ihm definieren, die dann effizient umgesetzt werden müssen Pivotieren/Rotieren des gesamten Datenwürfels (PIVOT) Navigieren aufwärts/abwärts entlang der Dimensionen (ROLL UP / DRILL DON) Betrachten eines Teilwürfels oder einer Scheibe (DICE / SLICE) 46

47 PIVOT Pivotieren/Rotieren des gesamten Datenwürfels Produkt Zeit Softdrink ein Bier Bier 200 ein 20 Softdrink Zeit Sachsen- Anhalt Thüringen Bayern Ort Produkt Sachsen- Anhalt Thüringen Bayern Ort Quelle: Köppen, Saake und Sattler [2, S.26] 47

48 DRILL DON und ROLL UP Navigieren aufwärts/abwärts entlang der Dimensionen Produkt Drill Down Produkt 2009 Softdrink ein Bier Roll Up Softdrink ein Bier Q Q2 Q3 Zeit Sachsen- Anhalt Thüringen Bayern Ort 200 Q Zeit Sachsen- Anhalt Thüringen Bayern Ort Quelle: Köppen, Saake und Sattler [2, S.27] 48

49 SLICE Betrachten einer Scheibe des Datenwürfels Produkt Produkt Softdrink ein Bier Softdrink ein Bier Zeit Sachsen- Anhalt Thüringen Bayern Ort Zeit Sachsen- Anhalt Thüringen Bayern Ort Quelle: Köppen, Saake und Sattler [2, S.27] 49

50 DICE Betrachten eines Teilwürfels des Datenwürfels Produkt Produkt 2009 Softdrink ein Bier 2009 Softdrink ein Bier Zeit Sachsen- Anhalt Thüringen Bayern Ort Zeit Sachsen- Anhalt Thüringen Bayern Ort Quelle: Köppen, Saake und Sattler [2, S.28] 50

51 Umsetzung in SQL Data-arehouse-Systeme vertrauen meist auf RDBMS zur Speicherung und zum Anfragen der Daten Bei Verwendung eines Star-Schema ergibt sich folgendes Anfragemuster zum Berechnen eines Datenwürfels (n+)-ege-verbund zwischen n Dimensionstabellen und einer Faktentabelle Restriktionen über den Dimensionstabellen Aggregation und Gruppierung über Kennzahlen 5

52 Umsetzung in SQL Beispiel: SELECT O_Stadt, YEAR(Z_Datum), SUM(V_Anzahl) 2 FROM Verkauf, Ort, Produkt, Zeit 3 HERE V_Produkt_ID = P_ID AND V_Zeit_ID = Z_ID 4 AND V_Ort_ID = O_ID AND P_Produktgruppe = ein 5 GROUP BY O_Stadt, YEAR(Z_Datum) In den Standards SQL:999 und SQL:2003 wurden Erweiterungen speziell für OLAP eingeführt zusätzliche (statistische) Aggregatfunktionen CUBE und ROLLUP Operatoren 52

53 Aggregatfunktionen Zusätzliche statistische Aggregatfunktionen in SQL:2003 VAR_POP(A) und VAR_SAMP(A) zum Berechnen der Varianz auf Population oder Stichprobe STDDEV_POP(A) und STDDEV_SAMP(A) zum Berechnen der Standardabweichung auf Population oder Stichprobe COVAR_POP(A,B) und COVAR_SAMP(A,B) zum Berechnen der Kovarianz auf Population oder Stichprobe CORR(A,B) zum Berechnen des Korrelationskoeffizienten 53

54 CUBE Analysen benötigen oft Zwischen- und Gesamtsummen PGruppe Jahr Bundesland Umsatz Umsatz Umsatz PGruppe- PGruppe- PGruppe Jahr- Jahr Bundesland ein 200 Sachsen-Anhalt 45 Thüringen Sachsen-Anhalt 47 Bier 20 Thüringen 42 Quelle: Köppen, Saake und Sattler [2, S.32] Je Zwischen- oder Gesamtsumme ist eine separate Unteranfrage an das RDBMS notwendig 54

55 CUBE Beispiel: Zwischen- und Gesamtsummen mittels Vereinigung von Unteranfragen -- Zwischensumme () über alle Produktgruppen,Jahre und Bundesländer 2 SELECT P_Produktgruppe AS PGruppe, YEAR(Z_Datum), O_Bundesland, 3 SUM(V_Anzahl * P_Verkaufspreis) AS Umsatz 4 FROM Verkauf, Zeit, Produkt, Ort 5 HERE V_Zeit_ID = Z_ID AND V_Produkt_ID = P_ID AND V_Ort_ID = O_ID 6 GROUP BY P_Produktgruppe, YEAR (Z_Datum), O_Bundesland 7 8 UNION ALL Zwischensumme (2) über alle Produktgruppen und Jahre SELECT P_Produktgruppe AS PGruppe, YEAR (Z_Datum), 2 CAST( NULL AS VARCHAR(50)), 3 SUM(V_Anzahl * P_Verkaufspreis) AS Umsatz 4 FROM Verkauf, Zeit, Produkt, Ort 5 HERE V_Zeit_ID = Z_ID AND V_Produkt_ID = P_ID AND V_Ort_ID = O_ID 6 GROUP BY P_Produktgruppe, YEAR(Z_Datum) 7 8 UNION ALL

56 CUBE Vollständige Berechnung aller Zwischen- und Gesamtsummen führt bei n Gruppierattributen zu 2 n auszuwertenden Unteranfragen CUBE-Operator berechnet für gegebene Menge von Gruppierattributen {A,..., A n } Summen für alle Teilmengen der Gruppierattribute {} {A }, {A 2 }, {A 3 },... {A,A 2 }, {A,A 3 },.... {A,...A n } 56

57 CUBE Beispiel: Zwischen- und Gesamtsummen mittels Verwendung des CUBE-Operators SELECT P_Produktgruppe AS PGruppe, O_Bundesland, YEAR(Z_Datum), 2 SUM(V_Anzahl * P_Verkaufspreis) AS Umsatz 3 FROM Verkauf, Zeit, Produkt, Ort 4 HERE V_Zeit_ID = Z_ID AND V_Produkt_ID = P_ID AND V_Ort_ID = O_ID 5 GROUP BY CUBE(P_Produktgruppe, O_Bundesland, YEAR(Z_Datum)) CUBE-Operator ist interdimensional, d.h. Gruppierattribute stammen von verschiedenen Klassifikationsstufen unterschiedlicher Dimensionen 57

58 ROLLUP ROLLUP-Operator als intradimensionales Pendant zum CUBE-Operator berechnet Zwischen- und Gesamtsummen entlang verschiedener Klassifikationsstufen einer Dimension Beispiel: Zwischen- und Gesamtsummen für Bundesländer, Städte und Filialen SELECT O_Bundesland, O_Stadt, O_Filiale, 2 SUM(V_Anzahl * P_Verkaufspreis) AS Umsatz 3 FROM Verkauf, Zeit, Produkt, Ort 4 HERE V_Produkt_ID = P_ID AND V_Ort_ID = O_ID 5 AND V_Zeit_ID = Z_ID AND YEAR(Z_Datum) = 20 6 AND P_Produktgruppe = ein 7 GROUP BY ROLLUP(O_Bundesland, O_Stadt, O_Filiale) 58

59 MD Multidimensional Expressions (MD) als von Microsoft vorgeschlagene Anfragesprache für multidimensionale Daten, die auch von anderen Herstellern unterstützt wird MD-Anfrage nach folgendem Muster SELECT <Achsen> 2 FROM <Cube> 3 HERE <Slicer> zur Spezifikation eines Datenwürfels 59

60 MD Achsen-Klausel spezifiziert Achsen des Datenwürfels Aufzählung z.b. {ProduktA, ProduktC} Mengenausdruck z.b. Produkte.CHILDREN Kreuzprodukt z.b. CROSSJOIN(Produkte, Regionen) Cube-Klausel spezifiziert Faktentabelle als Datenquelle Slicer-Klausel erlaubt eine Selektion der Daten gemäß Dimensionen, die nicht als Achsen verwendet werden (z.b. Measures.[Umsatz] betrachtet nur Umsätze) 60

61 MD Beispiel ([2], S. 49) SELECT CROSSJOIN ( 2 {Produkt.Kategorie.Gruppe.[Rotwein], 3 Produkt.Kategorie.Gruppe.[eißwein]}, 4 {Ort.[Sachsen-Anhalt].CHILDREN, 5 Ort.[Thüringen]}) 6 ON COLUMNS, 7 {Zeit.[20].[Q].CHILDREN, Zeit.[20].[Q2], 8 Zeit.[20].[Q3], Zeit.[20].[Q4].CHILDREN} 9 ON ROS 0 FROM Verkauf HERE (Measures.[Umsatz]) Achse : Kreuzprodukt aus Produktkategorien Rotwein und eißwein mit Orten in Sachsen-Anhalt und Thüringen Achse 2: Monate im ersten Quartal von 20, zweites und drittes Quartal von 20, Monate im vierten Quartal von 20 6

62 MD Beispiel ([2], S. 49) SELECT CROSSJOIN ( 2 {Produkt.Kategorie.Gruppe.[Rotwein], 3 Produkt.Kategorie.Gruppe.[eißwein]}, 4 {Ort.[Sachsen-Anhalt].CHILDREN, 5 Ort.[Thüringen]}) 6 ON COLUMNS, 7 {Zeit.[20].[Q].CHILDREN, Zeit.[20].[Q2], 8 Zeit.[20].[Q3], Zeit.[20].[Q4].CHILDREN} 9 ON ROS 0 FROM Verkauf HERE (Measures.[Umsatz]) Datenquelle: Faktentabelle Verkauf Slicer: Nur Umsätze werden berücksichtigt 62

63 MD Beispiel ([2], S. 49) Umsätze 20 Rotwein eißwein S.-A. Thür. S.-A. Thür. Magdeb. Halle Magdeb. Halle. Quart. Jan Feb Mär Quart Quart Quart. Okt Nov Dez

64 4.5 Implementierungsaspekte Implementierungsansätze für Data-arehouse-Systeme ROLAP verwendet RDBMS zum Speichern und Anfragen MOLAP speichert Daten als multidimensionales Array HOLAP verwendet Kombination der beiden Ansätze Bitmap-Indizes als zusätzliche Indexstruktur, die insbesondere für Attribute mit kleiner Anzahl möglicher Attributwerte und relativ statische Daten geeignet ist 64

65 ROLAP Relationales OLAP (ROLAP) verwendet ein RDBMS, um Datenwürfel in Fakten- und Dimensionstabellen zu speichern Vorteile: RDBMS sind ausgereifte Systeme und weit verfügbar geringer Implementierungsaufwand und Kosten Nachteile: Faktentabellen haben, aufgrund von Dimensionsattributen, einen vergleichsweise hohen Speicherbedarf 65

66 MOLAP Multidimensionales OLAP (MOLAP) verwendet ein multidimensionales Arrays zur Speicherung des Datenwürfels Klassifikationsstufen der verschiedenen Dimensionen müssen intern als ganze Zahlen (0...n) kodiert werden Dimensionsinformation eines Fakts muss dann nicht separat gespeichert werden, sondern ist aus seiner Position im multidimensionalen Array ablesbar 66

67 MOLAP Datenwürfel als multidimensionales Array, welches dann mittels Linearisierung (wie in Programmiersprachen) als Folge von Fakten (Kennzahlen) gespeichert wird D 3 Magdeburg D Halle D 2 Sachsen-Anhalt Erfurt Thüringen Februar März. Quartal Januar Quelle: Köppen, Saake und Sattler [2, S.57/59] 67

68 Bitmap-Indizes Bitmap-Indizes als zusätzliche Form von Indexstruktur (neben B + -Bäumen und hashbasierten Indizes), die insbesondere in Data arehouses Anwendung findet Bitmap-Indizes geeignet für Attribute mit kleiner Anzahl möglicher Attributwerte (z.b. Geschlecht, Kategorie) Für jeden möglichen Attributwert wird ein Bitvektor gespeichert, der Tupel anzeigt (Bit auf gesetzt), welche diesen Attributwert besitzen 68

69 69 Bitmap-Indizes Beispiel: eibliche Kunden in Vertriebsgebieten S und G:w S U T V V:S S U T V V: S U T V Q c c c c c c c c a S U T V R d d d d d d d d b = S U T V

70 Bitmap-Indizes Bitvektoren lassen sich kompakt speichern und sehr effizient mittels Boole scher Operationen verknüpfen Bitmap-Indizes haben für Attribut mit wenigen möglichen erten einen geringeren Speicherbedarf als herkömmliche B + -Bäume Bitmap-Indizes sind insbesondere für statische Daten geeignet; ein Einfügen oder Löschen von Tupeln erfordert eine Neuberechnung aller Bitvektoren 70

71 Zusammenfassung Datenwürfel besteht aus Fakten und Dimensionen, die sich in Form eines Snowflake-Schemas oder eines Star-Schemas in Relationen abbilden lassen OLAP-Operatoren (ROLL UP, DRILL DON, SLICE, etc.) zur Interaktion mit einem Datenwürfel OLAP-Unterstützung in SQL und durch in Form der von Microsoft vorgeschlagenen Anfragesprache MD 7

72 Literatur [] A. Kemper und A. Eickler: Datenbanksysteme Eine Einführung, De Gruyter Oldenbourg, 203 (Kapitel 7) [2] V. Köppen, G. Saake und K.-U. Sattler: Data arehouse Technologien, mitp Professional,

Unterstützung der Unternehmenssteuerung durch Data Warehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen

Unterstützung der Unternehmenssteuerung durch Data Warehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen Rückblick Unterstützung der Unternehmenssteuerung durch Data arehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen Online Transaction Processing (OLTP) und Online Analytical Processing unterscheiden

Mehr

Inhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte

Inhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte 4. Data Warehouses Inhalt 4.1 Motivation 4.2 Datenintegration 4.3 Konzeptuelle Modellierung 4.4 Anfragen an Data Warehouses 4.5 Implementierungsaspekte 2 Literatur V. Köppen, G. Saake und K.-U. Sattler:

Mehr

Inhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte

Inhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte 4. Data Warehouses Inhalt 4.1 Motivation 4.2 Datenintegration 4.3 Konzeptuelle Modellierung 4.4 Anfragen an Data Warehouses 4.5 Implementierungsaspekte 2 Literatur V. Köppen, G. Saake und K.-U. Sattler:

Mehr

Teil III Multidimensionales Datenmodell

Teil III Multidimensionales Datenmodell Teil III Multidimensionales Datenmodell Multidimensionales Datenmodell 1 Grundbegriffe 2 Der Würfel 3 Konzeptuelle Modellierung 4 Operationen zur Datenanalyse 5 Relationale Umsetzung des multidimensionalen

Mehr

Das Multidimensionale Datenmodell

Das Multidimensionale Datenmodell Das Multidimensionale Datenmodell Konzeptuelle Modellierung Umsetzung des Modells Beispiel ER-Modell 2 / 36 Probleme ER-Modellierung Keine Unterscheidung Klassifikation, Attribute, Kenngrößen Dimension

Mehr

Data Warehouse Technologien

Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............

Mehr

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...

Mehr

Rückblick. SQL bietet viele Möglichkeiten zur Anfrageformulierung

Rückblick. SQL bietet viele Möglichkeiten zur Anfrageformulierung Rückblick SQL bietet viele Möglichkeiten zur Anfrageformulierung mathematische Funktionen (z.b. ABS(A) und SIGN(A)) Aggregatfunktionen (z.b. MIN(A) und SUM(A)) Boole sche Operatoren (AND, OR, EXCEPT) Verknüpfungen

Mehr

Anfragen an multidimensionale Daten

Anfragen an multidimensionale Daten Anfragen an multidimensionale Daten Alexander Heidrich - BID8 09.06.2005 Hintergrundbild: http://www.csc.calpoly.edu/~zwood/teaching/csc471/finalproj02/afternoon/mfouquet/cube.jpg Inhaltsübersicht Motivation

Mehr

Data-Warehouse-Technologien

Data-Warehouse-Technologien Data-Warehouse-Technologien Prof. Dr.-Ing. Kai-Uwe Sattler 1 Prof. Dr. Gunter Saake 2 Dr. Veit Köppen 2 1 TU Ilmenau FG Datenbanken & Informationssysteme 2 Universität Magdeburg Institut für Technische

Mehr

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH Einführung in OLAP und Business Analysis Gunther Popp dc soft GmbH Überblick Wozu Business Analysis mit OLAP? OLAP Grundlagen Endlich... Technischer Background Microsoft SQL 7 & OLAP Services Folie 2 -

Mehr

Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen

Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen (Folien von A. Kemper zum Buch 'Datenbanksysteme') Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP

Mehr

Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube

Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube Fragen des Marketingleiters Data Warehousing Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt nach? Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon Technisch

Mehr

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem. Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen

Mehr

Themenblock: Erstellung eines Cube

Themenblock: Erstellung eines Cube Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen

Mehr

Inhaltsverzeichnis. vii.

Inhaltsverzeichnis. vii. vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt 2 1.2 OLTP versus OLAP 4 1.2.1 OLAP-versus OLTP-Transaktionen 5 1.2.2 Vergleich von OLTP und OLAP 6 1.2.3 Abgrenzung: DBMS-Techniken

Mehr

OLAP und Data Warehouses

OLAP und Data Warehouses OLP und Data Warehouses Überblick Monitoring & dministration Externe Quellen Operative Datenbanken Extraktion Transformation Laden Metadaten- Repository Data Warehouse OLP-Server nalyse Query/Reporting

Mehr

Kapitel 7 Grundlagen von Data

Kapitel 7 Grundlagen von Data LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS DATABASE Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2014 Kapitel 7 Grundlagen von Data Warehouses Vorlesung: PD

Mehr

Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken

Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken 31. V. 2016 Outline 1 Organisatorisches 2 SQL 3 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 4 Objekt-relationale Datenbanken Beispiel

Mehr

Vertrautmachen mit Daten

Vertrautmachen mit Daten Kapitel III Vertrautmachen mit Daten 2004 AIFB / FZI 1 III Vertrautmachen mit Daten (see also Data Preparation ) 2004 AIFB / FZI 2 III Vertrautmachen mit Daten III.1 OLAP III.1.1 Einführung in OLAP Wie

Mehr

Data Warehouse Technologien

Data Warehouse Technologien mitp Professional Data Warehouse Technologien von Veit Köppen, Gunter Saake, Kai-Uwe Sattler 2. Auflage 2014 Data Warehouse Technologien Köppen / Saake / Sattler schnell und portofrei erhältlich bei beck-shop.de

Mehr

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining 2 Eigenschaften eines Data Warehouse Referenzarchitektur Integrierte Sicht auf beliebige Daten aus verschieden Datenbanken

Mehr

Rückblick: Datenbankentwurf

Rückblick: Datenbankentwurf Rückblick: Datenbankentwurf Entity-Relationship-Modell für konzeptuellen Entwurf Entitytypen (entity types) (z.b. Studenten) Beziehungstypen (relationships) (z.b. hören) Attribute beschreiben Gegenstände

Mehr

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse

Mehr

Datenbanken Grundlagen und Design

Datenbanken Grundlagen und Design Frank Geisler Datenbanken Grundlagen und Design 3., aktualisierte und erweiterte Auflage mitp Vorwort 15 Teil I Grundlagen 19 i Einführung in das Thema Datenbanken 21 i.i Warum ist Datenbankdesign wichtig?

Mehr

Datenbanksysteme 2009

Datenbanksysteme 2009 Datenbanksysteme 2009 Kapitel 17: Data Warehouse Oliver Vornberger Institut für Informatik Universität Osnabrück 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen

Mehr

Frühjahrsemester 2011. Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil

Frühjahrsemester 2011. Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil Frühjahrsemester Data Warehousing Kapitel 5: Data Warehousing H. Schuldt Wiederholung aus Kapitel 5. Einführung Tresgros Tresgros Tresgros Filiale Muttenz Filiale Allschwil Filiale Liestal Anfragen: Welches

Mehr

Data Warehousing Kapitel 3: Mehrdimensionale Datenmodellierung

Data Warehousing Kapitel 3: Mehrdimensionale Datenmodellierung Data Warehousing Kapitel 3: Mehrdimensionale Datenmodellierung und Operationen Michael Hartung Sommersemester 2011 Universität Leipzig Institut für Informatik y y y http://dbs.uni-leipzig.de SS11, Prof.

Mehr

Themenblock: Data Warehousing (I)

Themenblock: Data Warehousing (I) Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining Agenda Einführung Data Warehouses Online Transactional Processing (OLTP) Datenmanipulation mit SQL Anfragen mit SQL Online

Mehr

Business Intelligence & Reporting. Michael Cordes Holger Oehring Matthias Rein

Business Intelligence & Reporting. Michael Cordes Holger Oehring Matthias Rein Business Intelligence & Reporting Michael Cordes Holger Oehring Matthias Rein Ziele Einführung Business Intelligence / Front Room Online Analytical Processing (OLAP) Arten des Reporting & Nutzergruppen

Mehr

MIS by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001

MIS by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001 MIS Glossar by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001 Aggregat Data Cube Data Marts Data Mining Data Warehouse (DWH) Daten Decision Support Systeme (DSS)

Mehr

Frühjahrsemester 2010. Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil

Frühjahrsemester 2010. Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil Frühjahrsemester Data Warehousing Kapitel 5: Data Warehousing H. Schuldt Wiederholung aus Kapitel 5. Einführung Tresgros Tresgros Tresgros Filiale Muttenz Filiale Allschwil Filiale Liestal Anfragen: Welches

Mehr

Datenbanksysteme 2 Frühjahr-/Sommersemester 2014 28. Mai 2014

Datenbanksysteme 2 Frühjahr-/Sommersemester 2014 28. Mai 2014 Lehrstuhl für Praktische Informatik III Prof. Dr. Guido Moerkotte Email: moer@db.informatik.uni-mannheim.de Marius Eich Email: marius.eich@uni-mannheim.de Datenbanksysteme 2 8. Übungsblatt Frühjahr-/Sommersemester

Mehr

Data Warehousing. und Operationen. Dr. Andreas Thor Wintersemester 2009/10. Universität Leipzig Institut für Informatik.

Data Warehousing. und Operationen. Dr. Andreas Thor Wintersemester 2009/10. Universität Leipzig Institut für Informatik. Data Warehousing Kapitel 3: Mehrdimensionale Datenmodellierung und Operationen Dr. Andreas Thor Wintersemester 2009/10 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de WS09/10, Prof.

Mehr

Übung zur Einführung in die Wirtschaftsinformatik Cognos Powerplay als Beispiel für ein DSS

Übung zur Einführung in die Wirtschaftsinformatik Cognos Powerplay als Beispiel für ein DSS Übung zur Einführung in die Wirtschaftsinformatik 2006-05 - 10 Cognos Powerplay als Beispiel für ein DSS 1 Entscheidungsunterstützungssysteme (EUS) Decision Support Systems (DSS) EUS sollen das gemeinsame

Mehr

Multidimensionales Datenmodell, Cognos

Multidimensionales Datenmodell, Cognos Data Warehousing (II): Multidimensionales Datenmodell, Cognos Praktikum: Data Warehousing und Mining Praktikum Data Warehousing und Mining, Sommersemester 2010 Vereinfachte Sicht auf die Referenzarchitektur

Mehr

Data Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de

Data Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de Data Warehouses Sommersemester 2011 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen Data Warehouse Architektur Data-Warehouse-System Teilsichten

Mehr

OLTP: Online Transaction Processing

OLTP: Online Transaction Processing Moderne Betriebliche Anwendungen von Datenbanksystemen Online Transaction Processing (bisheriger Fokus) Data Warehouse-Anwendungen Data Mining OLTP: Online Transaction Processing Beispiele Flugbuchungssystem

Mehr

Kapitel 6 Einführung in Data Warehouses

Kapitel 6 Einführung in Data Warehouses Kapitel 6 Einführung in Data Warehouses Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2008, LMU München 2008 Dr. Peer Kröger Dieses Skript basiert zu einem Teil auf dem Skript zur Vorlesung

Mehr

Data Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 16 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining operationale DB operationale DB operationale DB Data Warehouse operationale

Mehr

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse

Mehr

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation Zusammenfassung OPAL 6. Übung Juni 2015 Agenda Hinweise zur Klausur Zusammenfassung OPAL Übungen / Kontrollfragen

Mehr

Datenbankanwendungen werden oft über einen sehr langen Zeitraum (z.b. Jahrzehnte) eingesetzt

Datenbankanwendungen werden oft über einen sehr langen Zeitraum (z.b. Jahrzehnte) eingesetzt 2. Datenbankentwurf Motivation Datenbankanwendungen werden oft über einen sehr langen Zeitraum (z.b. Jahrzehnte) eingesetzt Fehler sind umso teurer zu beheben, je weiter die Entwicklung bzw. der Einsatz

Mehr

Data Warehousing. Beispiel: : Amazon. Aufbau eines DWH OLAP <-> OLTP Datacube. FU-Berlin, DBS I 2006, Hinze / Scholz

Data Warehousing. Beispiel: : Amazon. Aufbau eines DWH OLAP <-> OLTP Datacube. FU-Berlin, DBS I 2006, Hinze / Scholz Data Warehousing Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon 2 1 Datenbank 3 Fragen des Marketingleiters Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt

Mehr

Inhaltsübersicht...IX Inhaltsverzeichnis...XI Abbildungsverzeichnis...XVII Tabellenverzeichnis... XXIII Abkürzungsverzeichnis...

Inhaltsübersicht...IX Inhaltsverzeichnis...XI Abbildungsverzeichnis...XVII Tabellenverzeichnis... XXIII Abkürzungsverzeichnis... Inhaltsübersicht...IX Inhaltsverzeichnis...XI Abbildungsverzeichnis...XVII Tabellenverzeichnis... XXIII Abkürzungsverzeichnis... XXV 1 Einführung... 1 1.1 Problemstellung... 1 1.2 Zielsetzung... 3 1.3

Mehr

Datenbanken Unit 4: Das Relationale Modell & Datenintegrität

Datenbanken Unit 4: Das Relationale Modell & Datenintegrität Datenbanken Unit 4: Das Relationale Modell & Datenintegrität 15. III. 2016 Outline 1 Organisatorisches 2 SQL 3 Relationale Algebra Notation 4 Datenintegrität Organisatorisches Erster Zwischentest: nach

Mehr

Inhaltsverzeichnis. 1 Einleitung Motivation und Umfeld Zielsetzung der Arbeit Methodisches Vorgehen und Aufbau der Arbeit 3

Inhaltsverzeichnis. 1 Einleitung Motivation und Umfeld Zielsetzung der Arbeit Methodisches Vorgehen und Aufbau der Arbeit 3 Inhaltsverzeichnis 1 Einleitung 1 1.1 Motivation und Umfeld 1 1.2 Zielsetzung der Arbeit 2 1.3 Methodisches Vorgehen und Aufbau der Arbeit 3 2 Grundlagen des Feuerwehrwesens 5 2.1 Kategorisierung der Feuerwehren

Mehr

Vorlesung Wissensentdeckung in Datenbanken

Vorlesung Wissensentdeckung in Datenbanken Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Uwe Ligges Informatik LS 8 22.04.2010 1 von 26 Gliederung 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der

Mehr

1 Business-Intelligence-Architektur 1

1 Business-Intelligence-Architektur 1 D3kjd3Di38lk323nnm xi 1 Business-Intelligence-Architektur 1 1.1 Data Warehouse....................................... 1 1.2 OLAP und mehrdimensionale Datenbanken.................. 4 1.3 Architekturvarianten....................................

Mehr

Rückblick: Relationales Modell

Rückblick: Relationales Modell Rückblick: Relationales Modell Relationales Modell als vorherrschendes Datenmodell Relationen (Tabellen) besitzen Attribute (Spalten) mit Wertebereichen und beinhalten Tupel (Zeilen) Umsetzung eines konzeptuellen

Mehr

Online Kurse Modulbeschreibungen

Online Kurse Modulbeschreibungen Online Kurse Modulbeschreibungen K0100 SQL Basics M0101 DB Theorie Dieses Modul führt in die Thematik von Datenbanken und deren grundlegenden Begriffen und Konzepten ein. Es werden Fragen beantwortet,

Mehr

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation 27. Juni 2013 Hinweis Diese Folien ersetzen keinesfalls den Übungsstoff des zugehörigen e-learning-kurses.

Mehr

Kapitel 17: Date Warehouse

Kapitel 17: Date Warehouse Kapitel 17: Date Warehouse 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen kleine, kurze Transaktionen jeweils auf jüngstem Zustand OLAP (Online Analytical

Mehr

Datenbanken. Datenbanken. Grundlagen und Design. Grundlagen und Design. Frank. Geisler. 4. Auflage

Datenbanken. Datenbanken. Grundlagen und Design. Grundlagen und Design. Frank. Geisler. 4. Auflage Datenbanksysteme, Datenbankanwendungen und Middleware Das relationale Datenbankmodell ER-Datenbankmodellierung und Normalisierung SQL-Grundlagen Projektablauf bei der Erstellung einer Datenbank Transaktionen

Mehr

Data Warehouse und Data Mining

Data Warehouse und Data Mining Einführungsseminar Data Mining Seminarvortrag zum Thema: Data Warehouse und Data Mining Von gehalten am Betreuer: Dr. M. Grabert Einführung Problemstellung Seite 2 Einführung Unternehmen bekommen eine

Mehr

Mala Bachmann September 2000

Mala Bachmann September 2000 Mala Bachmann September 2000 Wein-Shop (1) Umsatz pro Zeit und Produkt Umsatz Jan Feb Mrz Q1 Apr 2000 Merlot 33 55 56 144 18 760 Cabernet-S. 72 136 117 325 74 1338 Shiraz 85 128 99 312 92 1662 Rotweine

Mehr

Data Cubes PG Wissensmangement Seminarphase

Data Cubes PG Wissensmangement Seminarphase PG 402 - Wissensmangement Seminarphase 23.10.2001-25.10.2001 Hanna Köpcke Lehrstuhl für Künstliche Intelligenz Universität Dortmund Übersicht 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit

Mehr

Datenbanken - Grundlagen und Design

Datenbanken - Grundlagen und Design mitp Professional Datenbanken - Grundlagen und Design von Frank Geisler überarbeitet Datenbanken - Grundlagen und Design Geisler schnell und portofrei erhältlich bei beck-shop.de DIE FACHBUCHHANDLUNG mitp/bhv

Mehr

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein 1 Definitionen 1.1 Datenbank Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert Integriert, selbstbeschreibend, verwandt 1.2 Intension/Extension Intension: Menge der Attribute Extension:

Mehr

9. Sicherheitsaspekte

9. Sicherheitsaspekte 9. Sicherheitsaspekte Motivation Datenbanken enthalten häufig sensible Daten (z.b. personenbezogene oder unternehmenskritische) Vielzahl verschiedener Benutzer hat Zugriff (z.b. Anwendungen, Mitarbeiter,

Mehr

Kapitel 1: Einführung 1.1 Datenbanken?

Kapitel 1: Einführung 1.1 Datenbanken? 1. Einführung 1.1. Datenbanken? Seite 1 Kapitel 1: Einführung 1.1 Datenbanken? 1. Einführung 1.1. Datenbanken? Seite 2 Willkommen! Studierenden-Datenbank Hans Eifrig hat die Matrikelnummer 1223. Seine

Mehr

Multidimensionales Datenmodell

Multidimensionales Datenmodell Multidimensionales Datenmodell Grundbegriffe fi Fakten, Dimensionen, Würfel Analyseoperationen fi Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung fi ME/R, ADAPT Relationale

Mehr

Rückblick: Entity-Relationship-Modell

Rückblick: Entity-Relationship-Modell Rückblick: Entity-Relationship-Modell Entity-Relationship-Modell für konzeptuellen Entwurf Entitytypen (entity types) (z.b. Studenten) Beziehungstypen (relationships) (z.b. hören) Attribute beschreiben

Mehr

Online Analytical Processing

Online Analytical Processing Online Analytical Processing Online Analytical Processing Online Analytical Processing (OLAP) ermöglicht die multidimensionale Betrachtung von Daten zwecks E rmittlung eines entscheidungsunterstützenden

Mehr

bersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter

bersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter bersicht Niels Schršter EinfŸhrung GROUP BY Roll UpÔs Kreuztabellen Cubes Datenbank Ansammlung von Tabellen, die einen ãausschnitt der WeltÒ fÿr eine Benutzergruppe beschreiben. Sie beschreiben die funktionalen

Mehr

Aufgabe 1: [Logische Modellierung]

Aufgabe 1: [Logische Modellierung] Aufgabe 1: [Logische Modellierung] a) Entwerfen Sie für das von Ihnen entworfene Modell aus Aufgabe 2 des 1. Übungsblattes ein Star-Schema. b) Entwerfen Sie für das vorangegangene Modell einen Teil eines

Mehr

Kap. 6 Data Warehouse

Kap. 6 Data Warehouse 1 Kap. 6 Data Warehouse 6.1 Was ist ein Data Warehouse, Motivation? 6.2 Data Cube und Cube-Operationen 6.3 Workshop: MS SQL Server, Cube Operationen 6.4 Physischer Entwurf, Implementierung von Cubes 6.5

Mehr

Data Warehousing. Ausführung von OLAP Operationen. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Ausführung von OLAP Operationen. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Ausführung von OLAP Operationen Ulf Leser Wissensmanagement in der Bioinformatik Variante 1 - Snowflake Year id year Productgroup id pg_name Month Id Month year_id Day Id day month_id

Mehr

Data Warehousing. Weitere Buzzwörter: OLAP, Decision Support, Data Mining

Data Warehousing. Weitere Buzzwörter: OLAP, Decision Support, Data Mining Data Warehousing Weitere Buzzwörter: OLAP, Decision Support, Data Mining Wichtige Hinweise Zu diesem Thema gibt es eine Spezialvorlesung im Sommersemester Hier nur grober Überblick über Idee und einige

Mehr

Wiederholung VU Datenmodellierung

Wiederholung VU Datenmodellierung Wiederholung VU Datenmodellierung VU Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester

Mehr

Christian Kurze BI-Praktikum IBM WS 2008/09

Christian Kurze BI-Praktikum IBM WS 2008/09 Einführung in die multidimensionale Datenmodellierung e mit ADAPT BI-Praktikum IBM WS 2008/09 1 Gliederung Einführung multidimensionale Datenmodellierung 1. Multidimensionales Modell BI-Praktikum IBM WS

Mehr

Mengenvergleiche: Alle Konten außer das, mit dem größten Saldo.

Mengenvergleiche: Alle Konten außer das, mit dem größten Saldo. Mengenvergleiche: Mehr Möglichkeiten als der in-operator bietet der θany und der θall-operator, also der Vergleich mit irgendeinem oder jedem Tupel der Unteranfrage. Alle Konten außer das, mit dem größten

Mehr

Daniel Warner SQL. Das Praxisbuch. Mit 119 Abbildungen. Franzis

Daniel Warner SQL. Das Praxisbuch. Mit 119 Abbildungen. Franzis Daniel Warner SQL Das Praxisbuch Mit 119 Abbildungen Franzis Inhaltsverzeichnis Teil I - Einleitung 15 1 Einleitung 17 1.1 Zum Aufbau des Buchs 17 1.2 Hinweise zur Buch-CD 18 1.3 Typografische Konventionen

Mehr

Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen Fragen Vertiefung Modellierung

Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen Fragen Vertiefung Modellierung Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation Zusammenfassung OPAL 24. Juni 2014 Agenda Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen

Mehr

Auf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort... 13

Auf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort... 13 Auf einen Blick Vorwort... 13 Teil 1 Vorbereitung Kapitel 1 Einleitung... 17 Kapitel 2 SQL der Standard relationaler Datenbanken... 21 Kapitel 3 Die Beispieldatenbanken... 39 Teil 2 Abfrage und Bearbeitung

Mehr

Seminar Data Warehousing. Seminar. Data Warehousing. Thema: Speichermodelle für Data-Warehouse-Strukturen

Seminar Data Warehousing. Seminar. Data Warehousing. Thema: Speichermodelle für Data-Warehouse-Strukturen Seminar Data Warehousing Thema: Speichermodelle für Data-Warehouse-Strukturen Friedrich-Schiller-Universität Jena Fakultät für Mathematik und Informatik Institut für Informatik Lehrstuhl für Datenbanken

Mehr

Betriebliche Anwendungen

Betriebliche Anwendungen Betriebliche nwendungen SP R/3: Enterprise Resource Modelling (ERP-System) OLTP Data Warehouse Data Mining WN (Internet) LN Kapitel 17 1 Relationales DBMS als Backend-Server (Oracle, Informix, DB2, MS

Mehr

Auf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort 13

Auf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort 13 Auf einen Blick Vorwort 13 Teil 1 Vorbereitung Kapitel 1 Einleitung 17 Kapitel 2 SQL - der Standard relationaler Datenbanken 21 Kapitel 3 Die Beispieldatenbanken 39 Teil 2 Abfrage und Bearbeitung Kapitel

Mehr

eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator

eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator Agenda Was ist Business Intelligence? Was ist OLAP? Unterschied zwischen OLAP und OLTP? Bestandteile

Mehr

Kapitel DB:IV (Fortsetzung)

Kapitel DB:IV (Fortsetzung) Kapitel DB:IV (Fortsetzung) IV. Logischer Datenbankentwurf mit dem relationalen Modell Das relationale Modell Integritätsbedingungen Umsetzung ER-Schema in relationales Schema DB:IV-46 Relational Design

Mehr

Inhaltsverzeichnis. Vorwort 13. Kapitel 1 Einleitung 15

Inhaltsverzeichnis. Vorwort 13. Kapitel 1 Einleitung 15 Vorwort 13 Kapitel 1 Einleitung 15 Kapitel 2 SQL-der Standard relationaler Datenbanken... 19 2.1 Die Geschichte 19 2.2 Die Bestandteile 20 2.3 Die Verarbeitung einer SQL-Anweisung 22 2.4 Die Struktur von

Mehr

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher

Mehr

Data Warehousing Grundbegriffe und Problemstellung

Data Warehousing Grundbegriffe und Problemstellung Data Warehousing Grundbegriffe und Problemstellung Dr. Andrea Kennel, Trivadis AG, Glattbrugg, Schweiz Andrea.Kennel@trivadis.com Schlüsselworte Data Warehouse, Cube, Data Mart, Bitmap Index, Star Queries,

Mehr

SQL - Datenbankdesign - Aufbau

SQL - Datenbankdesign - Aufbau SQL - Datenbankdesign - Aufbau Kompakt-Intensiv-Training Unsere fünftägige ANSI SQL Schulung vermittelt Ihnen alle nötigen Kenntnisse zur Erstellung von Datenauswertungen und Programmierung wiederkehrender

Mehr

OLAP und der MS SQL Server

OLAP und der MS SQL Server OLAP und der MS SQL Server OLAP und der MS SQL Server OLAP-Systeme werden wie umfangreiche Berichtssysteme heute nicht mehr von Grund auf neu entwickelt. Stattdessen konzentriert man sich auf die individuellen

Mehr

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung

Mehr

Seminar 2. SQL - DML(Data Manipulation Language) und. DDL(Data Definition Language) Befehle.

Seminar 2. SQL - DML(Data Manipulation Language) und. DDL(Data Definition Language) Befehle. Seminar 2 SQL - DML(Data Manipulation Language) und DDL(Data Definition Language) Befehle. DML Befehle Aggregatfunktionen - werden auf eine Menge von Tupeln angewendet - Verdichtung einzelner Tupeln yu

Mehr

Logische Modellierung von Data Warehouses

Logische Modellierung von Data Warehouses Logische Modellierung von Data Warehouses Vertiefungsarbeit von Karin Schäuble Gliederung. Einführung. Abgrenzung und Grundlagen. Anforderungen. Logische Modellierung. Methoden.. Star Schema.. Galaxy-Schema..

Mehr

Datenbanken zur Entscheidungsunterstützung - Data Warehousing. Prof. Dr. T. Kudraß 1

Datenbanken zur Entscheidungsunterstützung - Data Warehousing. Prof. Dr. T. Kudraß 1 Datenbanken zur Entscheidungsunterstützung - Data Warehousing Prof. Dr. T. Kudraß 1 Einführung Zunehmender Bedarf nach Analyse aktueller und historischer Daten Identifizierung interessanter Patterns Entscheidungsfindung

Mehr

7. XML-Datenbanksysteme und SQL/XML

7. XML-Datenbanksysteme und SQL/XML 7. XML-Datenbanksysteme und SQL/XML Native XML-DBS vs. XML-Erweiterungen von ORDBS Speicherung von XML-Dokumenten Speicherung von XML-Dokumenten als Ganzes Generische Dekomposition von XML-Dokumenten Schemabasierte

Mehr

Das relationale Datenmodell

Das relationale Datenmodell Das relationale Datenmodell Konzepte Attribute, Relationenschemata, Datenbank-Schemata Konsistenzbedingungen Beispiel-Datenbank Seite 1 Einführung Zweck datenmäßige Darstellung von Objekten und Beziehungen

Mehr

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier Realisierung von OLAP Operatoren in einem visuellen Analysetool Vortrag von Alexander Spachmann und Thomas Lindemeier Gliederung Ausgangssituation/Motivation Was ist OLAP? Anwendungen Was sind Operatoren?

Mehr

5 Data Warehouses und Data Mining

5 Data Warehouses und Data Mining 5 Data Warehouses und Data Mining Mittels OLAP Techniken können große Datenmengen unterschiedlich stark verdichtet und gezielt aufbereitet werden. Mittels Data Mining können große Datenmengen nach bisher

Mehr

Semantische Integrität (auch: Konsistenz) der in einer Datenbank gespeicherten Daten als wichtige Anforderung

Semantische Integrität (auch: Konsistenz) der in einer Datenbank gespeicherten Daten als wichtige Anforderung 6. Datenintegrität Motivation Semantische Integrität (auch: Konsistenz) der in einer Datenbank gespeicherten Daten als wichtige Anforderung nur sinnvolle Attributwerte (z.b. keine negativen Semester) Abhängigkeiten

Mehr

Die richtige Grafik als Zauberstab zur Mart Modellierung Referat vom

Die richtige Grafik als Zauberstab zur Mart Modellierung Referat vom Die richtige Grafik als Zauberstab zur Mart Modellierung Referat vom 22.11.2016 Peter Brunner,NTTData Dr. Andrea Kennel, InfoPunkt Kennel GmbH Copyright 2014 NTT DATA EMEA Ltd. Die richtige Grafik als

Mehr

3. Mehrdimensionale Datenmodellierung. Cb Cube-Operator, Rollup-Operator, Grouping Sets SS08, Prof. Dr. E. Rahm 3-1 y yy

3. Mehrdimensionale Datenmodellierung. Cb Cube-Operator, Rollup-Operator, Grouping Sets SS08, Prof. Dr. E. Rahm 3-1 y yy 3. Mehrdimensionale Datenmodellierung und Operationen Grundlagen Kennzahlen, e, Dimensionen, esoe,cube Cuboide / Aggregationsgitter hierarchische Dimensionen / Konzepthierarchien Cube-Operationen Multi-dimensionale

Mehr

Inhaltsverzeichnis. Vorwort Kapitel 1 Einleitung... 15

Inhaltsverzeichnis. Vorwort Kapitel 1 Einleitung... 15 Vorwort..................................................... 13 Kapitel 1 Einleitung.......................................... 15 Kapitel 2 SQL der Standard relationaler Datenbanken... 19 2.1 Die Geschichte................................

Mehr