Inhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte
|
|
- Linus Pfeiffer
- vor 6 Jahren
- Abrufe
Transkript
1 4. Data arehouses
2 Inhalt 4. Motivation 4.2 Datenintegration 4.3 Konzeptuelle Modellierung 4.4 Anfragen an Data arehouses 4.5 Implementierungsaspekte 2
3 Literatur V. Köppen, G. Saake und K.-U. Sattler: Data arehouse Technologien, mitp Professional, Andreas Bauer und Holger Günzel: Data arehouse Systeme, dpunkt.verlag, 203 3
4 4. Motivation Vielzahl von operativen Systemen in Unternehmen Einkauf/Verkauf von Lieferanten/Kunden Kundenverwaltung (Adressen, Beschwerden) Organisation (Mitarbeiter, Abteilungen) Marketing (Management von Kampagnen) Unternehmenssteuerung (management) benötigt ganzheitliche Sicht auf Unternehmensdaten, um analytische Fragen zu beantworten und Entscheidungen zu treffen 4
5 Online Transaction Processing (OLTP) Online Transaction Processing (OLTP) zur raschen Bearbeitung von Transaktionen aus operativen Systemen Transaktionen betreffen nur einen kleinen Teil der Daten Mitarbeiter stoßen Transaktionen im Tagesgeschäft bei Verwendung der operativen Systeme an Beispiele: Zeige Daten zu Kunde mit KundenNr an Füge neue Bestellung mit Bestellpositionen ein RDBMS sind für diese Art von Transaktionen optimiert 5
6 Online Analytical Processing (OLAP) Online Analytical Processing (OLAP) zur raschen Bearbeitung von analytischen Transaktionen Transaktionen betreffen u.u. einen großen Teil der Daten Ursprung der Transaktionen sind analytische Fragen, die in der Unternehmenssteuerung entstehen Beispiele: Umsatzentwicklung von Produkt B in den letzten 0 Jahren Gewinn nach Bundesland und Produktkategorie in den letzten 6 Quartalen 6
7 Data arehouses Data arehouses (Ds) haben sich als eigenständige Systeme zur Unterstützung von OLAP etabliert Ds als eigenständige Systeme, um Beeinträchtigung der operativen Systeme durch Anfragen zu vermeiden Ds müssen Daten aus den verschiedenen operativen Systemen und evtl. externen Datenquellen integrieren 7
8 Datenquellen Ds integrieren Daten aus verschiedenen Quellen operative Systeme (z.b. Einkauf/Verkauf, Organisation) externe Datenquellen (z.b. statistische Daten, etterdaten) Datenintegration stößt auf viele Herausforderungen Verknüpfung von Datensätzen (z.b. nach Akquisition) Datenqualität (z.b. Eingabefehler, fehlende Attribute) Duplikate (z.b. doppelte Kundeneinträge) Effizienz (z.b. inkrementelle Integration, Bulk-Loading) 8
9 Basisdatenbank und Datenwürfel Terminologie im Bereich Data arehouses uneinheitlich; wir orientieren uns an der in [2] vorgeschlagenen Datenintegration führt zu einer Basisdatenbank (BDB), in der alle relevanten Rohdaten zusammengeführt sind Datenwürfel (data cubes) werden aus BDB abgeleitet; sie stellen betriebswirtschaftliche Fakten (z.b. Umsatz) mehrdimensional (z.b. Produkt, Zeitraum, Region) dar 9
10 Datenwürfel Produkt Kategorie Gruppe Artikel Kennzahl Umsatz Zeit Jahr Quartal Monat Filiale Stadt Verkaufsort Bundesland Quelle: Köppen, Saake und Sattler [2, S.46] 0
11 Data Marts und Data arehouse Data Marts sind definierte Sichten (z.b. für eine Sparte oder ein Vertriebsgebiet) auf Datenwürfeln und/oder BDB Data arehouse bezeichnet Gesamtheit aus Basisdatenbank, Datenwürfeln sowie Data Marts
12 2 OLAP-Regeln nach Codd E. F. Codd hat 993 einen Katalog von Anforderungen formuliert, die OLAP-Systeme erfüllen müssen. Multidimensionale Sicht auf Kennzahlen (z.b. Umsatz), die in verschiedenen Dimension (z.b. Zeit) aggregiert und gruppiert werden 2. Transparenz Implementierung bleibt dem Benutzer verborgen 3. OLAP-Zugriffe Zugriffsschnittstelle ist auf OLAP-Analysen zugeschnitten 4. Performanz Leistung des Data-arehouse-Systems ist unempfindlich gegenüber Anzahl von Dimensionen 2
13 2 OLAP-Regeln nach Codd 5. Skalierbarkeit Nutzung von verteilten Architekturen zum Umgang mit sehr großen Datenmengen 6. Generische Dimensionalität Dimensionen gleich behandelt und organisiert 7. Dünnbesetzte Strukturen Effizienter Umgang mit dünnbesetzten Datenwürfeln durch geeignete Daten- und Indexstrukturen 8. Mehrbenutzerbetrieb Konfliktfreier Betrieb mit mehreren Benutzern 3
14 2 OLAP-Regeln nach Codd 9. Uneingeschränkte Operationen Auf Datenwürfel definierte Operatoren werden umgesetzt 0. Intuitive Benutzeroberflächen Benutzeroberfläche soll intuitiv sein und z.b. eine Navigation entlang der Dimensionshierarchien erlauben. Flexibles Reporting Tabellarische, aber auch zwei- oder mehrdimensionale Reports (Berichte) müssen frei konfigurierbar sein 2. Beliebig viele Dimensionen und Aggregationsebenen Keinerlei Einschränkungen bzgl. Anzahl von Dimensionen und Tiefe der Dimensionshierarchien 4
15 FASMI-Anforderungen Pendse und Creeth haben folgende Anforderungen an Data-arehouse-Systeme formuliert Fast, d.h. kurze Antwortzeiten, die dem Benutzer ein interaktives Arbeiten ermöglichen (weniger als 5 Sekunden) Analysis, d.h. es muss eine adäquate auf analytische Fragestellungen ausgerichtete Schnittstelle bereitstehen Shared, d.h. das System muss mehrere Benutzer erlauben und ihre heterogenen Anforderungen unterstützen 5
16 FASMI-Anforderungen Multidimensional, d.h. das konzeptionelle Datenmodell muss die inhärente Multidimensionalität der analytischen Fragestellungen berücksichtigen Information, d.h. das System muss alle für die Analysen benötigten Daten zusammenführen und verwalten 6
17 4.2 Datenintegration Daten werden im Rahmen eines ETL-Prozesses aus operativen Systemen ins Data arehouse überführt Extraktionsphase identifiziert regelmäßig zu übernehmende Änderungen in den Datenquellen Transformationsphase behebt Daten- und Schemakonflikte zwischen Datenquelle und Basisdatenbank Ladephase bringt die transformierten Daten effizient (z.b. mittels Bulk-Loading) in die Basisdatenbank ein 7
18 Datenqualität und Datenbereinigung Mangelnde Qualität der Daten aus den verschiedenen Datenquellen machen eine Bereinigung notwendig Vereinheitlichung von Datentypen und Format (z.b. Name) Erkennen und Zusammenführen von Duplikaten Eindeutigkeit verletzt Unterschiedliche Repräsentation idersprüchliche erte Referentielle Integrität verletzt unvollständig Person KNr Name Geb.datum Alter Geschl. Telefon PLZ 34 Meier, Tom M Tina Möller Tom Meier F null null t@r.de Ort PLZ Ort Magdeburg Spanien Illmenau Falsche oder unzulässige erte Fehlende erte (z.b. Default-erte) Duplikate Schreib- oder Tippfehler Quelle: Köppen, Saake und Sattler [2, S.82] 8
19 Duplikatenerkennung Duplikatenerkennung mittels einer Vergleichsfunktion, welche die Ähnlichkeit von zwei Datensätzen misst Editierdistanzen für textuelle Attribute Numerischen Distanzen für numerische Attribute Paare von Datensätzen deren Ähnlichkeit über einem Schwellwert liegt, werden zusammengefasst Verfahren versuchen durch geschicktes Abschätzen von Ähnlichkeiten oder Sortieren möglichst weniger als O(n 2 ) Vergleiche durchzuführen 9
20 Editierdistanz nach Levenshtein Editierdistanz nach Levenshtein d(s,t) zwischen zwei Zeichenketten s und t misst die minimale Anzahl von Operationen (Zeichen löschen, ändern, hinzufügen), die notwendig sind, um s in t umzuwandeln Beispiel: Editierdistanz zwischen cabel und cube lösche l am Ende von cabel ersetzte a durch u 20
21 Editierdistanz nach Levenshtein Editierdistanz lässt sich somit wie folgt rekursiv definieren Y _] d(s[0..i],t[0..j]) = min _[ d(s[0..i ],t[0..j ]) + (s[i] = t[j]) // Ändern? d(s[0..i],t[0..j ]) + // Hinzufügen d(s[0..i ],t[0..j]) + // Löschen Berechnung in O(n 2 ) mit dynamischer Programmierung 2
22 Editierdistanz nach Levenshtein Beispiel: Editierdistanz von ware und wurst w u r s t w a r e DP-Tabelle beinhaltet d(s[0..i],t[0..j]) in DP[i,j] 22
23 Editierdistanz nach Levenshtein Beispiel: Editierdistanz von ware und wurst w u r s t w a r e DP-Tabelle beinhaltet d(s[0..i],t[0..j]) in DP[i,j] 23
24 q-gramme Menge der q-gramme zu einer Zeichenkette beinhaltet alle Zeichenketten der Länge 3, die darin enthalten sind Beispiel: warehouse beinhaltet die 3-Gramme { w, _wa, war, are, reh, eho, hou, ous, use, se_, e } Ähnlichkeit von zwei Zeichenketten als Dice-Koeffizient der Mengen ihrer q-gramme dice(s, t) = 2 grams(s, q) fl grams(t, q) grams(s, q)+grams(t, q) 24
25 q-gramme Zwei Zeichenketten s und t müssen mindestens max( s, t ) (k ) gemeinsame q-gramme haben, um eine Editierdistanz von höchstens k zu haben Man kann diese Schranke ausnutzen, um die Zahl der Paare von Zeichenketten, für die die Editierdistanz exakt berechnet werden muss, deutlich zu reduzieren 25
26 4.3 Konzeptuelle Modellierung erkzeuge zur konzeptuellen Modellierung von Data arehouses betrachten Fakten und Dimensionen Produkt Kategorie Gruppe Artikel Kennzahl Umsatz Zeit Jahr Quartal Monat Filiale Stadt Verkaufsort Bundesland Quelle: Köppen, Saake und Sattler [3, S.46] 26
27 Fakten und Kennzahlen Zellen eines Datenwürfels stellen betriebswirtschaftliche Fakten in Form einer Kennzahl (measure) dar Fakten sind in den Dimensionen des Datenwürfels eingebettet und beziehen sich auf eine Position im aufgespannten Datenraum Kennzahlen (z.b. Umsatz, Gewinn, verkaufte Stückzahl) sollen Verdichtung entlang der Dimensionen erlauben Beispiel: Umsatz für Produkt B in Filiale im Mai
28 Dimensionen Dimensionen beschreiben mögliche Sichten und strukturieren den aufgespannten Datenraum Dimensionen beinhalten einfache oder parallele Klassifikationshierarchien, entlang derer sich Fakten auf einer höheren Klassifikationsstufe weiter verdichten lassen 28
29 Einfache und parallele Hierarchien Einfache Hierarchie für Dimension Verkaufsort Top Bundesland Stadt Filiale Parallele Hierarchien für Dimension Zeitraum Top Jahr Quartal oche Monat Tag Quelle: Köppen, Saake und Sattler [2, S.48] 29
30 Multidimensional Entity-Relationship-Modell Multidimensional Entity-Relationship-Modell (ME/R) als Erweiterung des ERMs zur konzeptuellen Modellierung von Data arehouses Fakten als ausgezeichnete Beziehungstypen Dimensionen als Gruppen von Entitytypen verbunden durch ausgezeichneten Klassifikationsbeziehungstyp Faktenname Ebene Attributbezeichnung Faktenbeziehung Klassifikationsstufe Klassifikationsbeziehung Attribut Quelle: Köppen, Saake und Sattler [2, S.53] 30
31 Rückblick Unterstützung der Unternehmenssteuerung durch Data arehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen Online Transaction Processing (OLTP) und Online Analytical Processing unterscheiden sich deutlich Datenintegration als eine wichtige Herausforderung Multidimensional Entity-Relationship-Model zur konzeptuellen Modellierung von Data arehouses 3
32 Multidimensional Entity-Relationship-Modell Anzahl Umsatz Produktgruppe Artikel Verkauf Filiale Stadt Bundesland Produktkategorie Tag Kunde Kundengruppe oche Monat Quartal Jahr Quelle: Köppen, Saake und Sattler [2, S.54] 32
33 Zusammenfassung Unterstützung der Unternehmenssteuerung durch Data arehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen Online Transaction Processing (OLTP) und Online Analytical Processing unterscheiden sich deutlich Datenintegration als eine wichtige Herausforderung Multidimensional Entity-Relationship-Model zur konzeptuellen Modellierung von Data arehouses 33
34 Literatur [] A. Kemper und A. Eickler: Datenbanksysteme Eine Einführung, De Gruyter Oldenbourg, 203 (Kapitel 7) [2] V. Köppen, G. Saake und K.-U. Sattler: Data arehouse Technologien, mitp Professional,
35 Implementierung von Data arehouses Verschiedene Ansätze zur Speicherung von Datenwürfeln Relationales OLAP (ROLAP) bildet Datenwürfel auf Relationen ab und verwendet RDBMS Multidimensionales OLAP (MOLAP) speichert Datenwürfel direkt in Form eines mehrdimensionalen Arrays Hybrides OLAP (HOLAP) verwendet eine Kombination von ROLAP und MOLAP (z.b. Detaildaten relational und vorberechnete Aggregate mehrdimensional) 35
36 Snowflake-Schema Snowflake-Schema setzt Fakten in eine Faktentabelle und jede Dimension in mehrere normalisierte Dimensionstabellen um Faktentabelle enthält Kennzahl sowie Fremdschlüssel der jeweils niedrigsten Klassifikationsstufe Dimensionstabelle enthält eine ID, beschreibende Attribute sowie Fremdschlüssel der jeweils nächsthöheren Klassifikationsstufe 36
37 Snowflake-Schema Dimension "Produkt" Produktkategorie PK_ID PK_Bezeichnung * Produktgruppe PG_ID PG_Bezeichnung PG_PKategorie_ID Dimension "Kunde" * Bundesland B_ID B_Name B_Land_ID Kundengruppe KG_ID KG_Bezeichnung * Stadt S_ID S_Name S_BLand_ID * * Kunde K_ID K_Name K_ohnort K_Strasse K_Geschlecht K_KGruppe_ID Filiale F_ID F_Filiale F_Stadt_ID * * Verkauf V_Anzahl V_Kanal V_Produkt_ID V_Zeit_ID V_Kunden_ID V_Filial_ID * * Produkt P_ID P_Bezeichnung P_Verkaufspreis P_Einkaufspreis P_Rabatt P_Steuern P_PGruppe_ID Zeit Z_ID Z_Datum * Dimension "Zeit" Land L_ID L_Name Dimension "Ort" Quelle: Köppen, Saake und Sattler [2, S.58] 37
38 Star-Schema Star-Schema setzt Fakten in eine Faktentabelle und jede Dimension in eine denormalisierte Dimensionstabelle um Faktentabelle enthält Kennzahl sowie Fremdschlüssel der jeweils zugehörigen Einträge in den Dimensionstabellen Dimensionstabelle enthält ID sowie beschreibende Attribute für eine der niedrigsten Klassifikationsstufe und allen höheren Klassifikationsstufen 38
39 Star-Schema Kunde K_ID K_Name K_ohnort K_Strasse K_Geschlecht K_Kundengruppe Ort O_ID O_Filiale O_Stadt O_Bundesland O_Land * * Verkauf V_Anzahl V_Kanal V_Produkt_ID V_Zeit_ID V_Kunden_ID V_Ort_ID * * Produkt P_ID P_Bezeichnung P_Verkaufspreis P_Einkaufspreis P_Rabatt P_Steuern P_Produktgruppe P_Produktkategorie Zeit Z_ID Z_Datum Quelle: Köppen, Saake und Sattler [2, S.59] 39
40 Snowflake-Schema vs. Star-Schema Snowflake-Schema hält Dimensionstabellen in 3NF und vermeidet somit redundante Datenspeicherung; beim Star-Schema sind sie nur in NF, wodurch Redundanzen und Anomalien entstehen Star-Schema kann, dank seiner Denormalisierung, Anfragen bzgl. höherer Klassifikationsstufen direkt, ohne zusätzliche Joins bearbeiten 40
41 Snowflake-Schema vs. Star-Schema Beispielanfrage im Snowflake-Schema (5 Joins) SELECT S_Name, YEAR(Z_Datum), SUM(V_Anzahl) 2 FROM Verkauf, Filiale, Stadt, Produkt, Produktgruppe, Zeit 3 HERE V_Produkt_ID = P_ID AND P_PGruppe_ID = PG_ID 4 AND V_Filial_ID = F_ID AND F_Stadt_ID = S_ID 5 AND V_Zeit_ID = Z_ID AND PG_Bezeichnung = ein 6 GROUP BY S_Name, YEAR(Z_Datum) Beispielanfrage im Star-Schema (3 Joins) SELECT O_Stadt, YEAR(Z_Datum), SUM(V_Anzahl) 2 FROM Verkauf, Ort, Produkt, Zeit 3 HERE V_Produkt_ID = P_ID AND V_Zeit_ID = Z_ID 4 AND V_Ort_ID = O_ID AND P_Produktgruppe = ein 5 GROUP BY O_Stadt, YEAR(Z_Datum) 4
42 Galaxie-Schema Snowflake-Schema und Star-Schema beinhalten eine Faktentabelle, die Kennzahlen in den gleichen Dimensionen speichert Galaxie-Schema als Erweiterung des Snowflake-Schemas beinhaltet mehrere Faktentabellen, die Kennzahlen in verschiedenen Dimensionen speichern Vorberechnete Aggregate (z.b. über alle Filialen hinweg) als eine Quelle zusätzlicher Faktentabellen 42
43 Galaxie-Schema Land L_ID L_Name Kundengruppe KG_ID KG_Bezeichnung Produktkategorie PK_ID Produktgruppe PG_ID PK_Bezeichnung * PG_Bezeichnung PG_PKategorie_ID * Bundesland B_ID B_Name B_Land_ID * Kunde K_ID K_Name K_ohnort K_Strasse K_Geschlecht K_KGruppe_ID * * Verkauf V_Anzahl V_Kanal V_Produkt_ID V_Zeit_ID V_Kunden_ID V_Filial_ID * * Produkt P_ID P_Bezeichnung P_Verkaufspreis P_Einkaufspreis P_Rabatt P_Steuern P_PGruppe_ID * * Stadt S_ID S_Name S_BLand_ID * Filiale F_ID F_Filiale F_Stadt_ID * Summe_Verkauf SV_Anzahl SV_Kanal SV_Monat_ID SV_PGruppe_ID SV_BLand_ID * * Zeit Z_ID Z_Datum Z_Monat_ID Z_Monat Quelle: Köppen, Saake und Sattler [2, S.63] 43
44 4.4 Anfragen an Data arehouses Analytische Anfragen an Data arehouses wählen einen mehrdimensionalen Teilbereich von Fakten aus und berechnen Aggregationen auf höheren Klassifikationsstufen Beispiel: Umsatz je Produktkategorie in allen europäischen Filialen in den Monaten seit Januar 200 Beispiel: Verkaufte Einheiten je Produkt über alle Filialen pro Jahr seit
45 Anfragen an Data arehouses Analytische Anfragen betreffen oft eine große Menge von Daten (z.b. alle Verkäufe seit 200) Antwortzeiten sollen interaktiv (d.h. kürzer 5 Sekunden) sein, um eine Interaktion mit dem Datenwürfel zu erlauben Betrachtung eines kleineren Teilwürfels Verdichtung der Kennzahlen zu höherer Klassifikationsstufe etc. Data arehouses setzen auf Vorberechnungen, um diese Anforderungen zu erfüllen 45
46 OLAP-Operatoren Datenwürfel dient nicht nur der Modellierung, sondern es lassen sich eine Reihe von Operatoren auf ihm definieren, die dann effizient umgesetzt werden müssen Pivotieren/Rotieren des gesamten Datenwürfels (PIVOT) Navigieren aufwärts/abwärts entlang der Dimensionen (ROLL UP / DRILL DON) Betrachten eines Teilwürfels oder einer Scheibe (DICE / SLICE) 46
47 PIVOT Pivotieren/Rotieren des gesamten Datenwürfels Produkt Zeit Softdrink ein Bier Bier 200 ein 20 Softdrink Zeit Sachsen- Anhalt Thüringen Bayern Ort Produkt Sachsen- Anhalt Thüringen Bayern Ort Quelle: Köppen, Saake und Sattler [2, S.26] 47
48 DRILL DON und ROLL UP Navigieren aufwärts/abwärts entlang der Dimensionen Produkt Drill Down Produkt 2009 Softdrink ein Bier Roll Up Softdrink ein Bier Q Q2 Q3 Zeit Sachsen- Anhalt Thüringen Bayern Ort 200 Q Zeit Sachsen- Anhalt Thüringen Bayern Ort Quelle: Köppen, Saake und Sattler [2, S.27] 48
49 SLICE Betrachten einer Scheibe des Datenwürfels Produkt Produkt Softdrink ein Bier Softdrink ein Bier Zeit Sachsen- Anhalt Thüringen Bayern Ort Zeit Sachsen- Anhalt Thüringen Bayern Ort Quelle: Köppen, Saake und Sattler [2, S.27] 49
50 DICE Betrachten eines Teilwürfels des Datenwürfels Produkt Produkt 2009 Softdrink ein Bier 2009 Softdrink ein Bier Zeit Sachsen- Anhalt Thüringen Bayern Ort Zeit Sachsen- Anhalt Thüringen Bayern Ort Quelle: Köppen, Saake und Sattler [2, S.28] 50
51 Umsetzung in SQL Data-arehouse-Systeme vertrauen meist auf RDBMS zur Speicherung und zum Anfragen der Daten Bei Verwendung eines Star-Schema ergibt sich folgendes Anfragemuster zum Berechnen eines Datenwürfels (n+)-ege-verbund zwischen n Dimensionstabellen und einer Faktentabelle Restriktionen über den Dimensionstabellen Aggregation und Gruppierung über Kennzahlen 5
52 Umsetzung in SQL Beispiel: SELECT O_Stadt, YEAR(Z_Datum), SUM(V_Anzahl) 2 FROM Verkauf, Ort, Produkt, Zeit 3 HERE V_Produkt_ID = P_ID AND V_Zeit_ID = Z_ID 4 AND V_Ort_ID = O_ID AND P_Produktgruppe = ein 5 GROUP BY O_Stadt, YEAR(Z_Datum) In den Standards SQL:999 und SQL:2003 wurden Erweiterungen speziell für OLAP eingeführt zusätzliche (statistische) Aggregatfunktionen CUBE und ROLLUP Operatoren 52
53 Aggregatfunktionen Zusätzliche statistische Aggregatfunktionen in SQL:2003 VAR_POP(A) und VAR_SAMP(A) zum Berechnen der Varianz auf Population oder Stichprobe STDDEV_POP(A) und STDDEV_SAMP(A) zum Berechnen der Standardabweichung auf Population oder Stichprobe COVAR_POP(A,B) und COVAR_SAMP(A,B) zum Berechnen der Kovarianz auf Population oder Stichprobe CORR(A,B) zum Berechnen des Korrelationskoeffizienten 53
54 CUBE Analysen benötigen oft Zwischen- und Gesamtsummen PGruppe Jahr Bundesland Umsatz Umsatz Umsatz PGruppe- PGruppe- PGruppe Jahr- Jahr Bundesland ein 200 Sachsen-Anhalt 45 Thüringen Sachsen-Anhalt 47 Bier 20 Thüringen 42 Quelle: Köppen, Saake und Sattler [2, S.32] Je Zwischen- oder Gesamtsumme ist eine separate Unteranfrage an das RDBMS notwendig 54
55 CUBE Beispiel: Zwischen- und Gesamtsummen mittels Vereinigung von Unteranfragen -- Zwischensumme () über alle Produktgruppen,Jahre und Bundesländer 2 SELECT P_Produktgruppe AS PGruppe, YEAR(Z_Datum), O_Bundesland, 3 SUM(V_Anzahl * P_Verkaufspreis) AS Umsatz 4 FROM Verkauf, Zeit, Produkt, Ort 5 HERE V_Zeit_ID = Z_ID AND V_Produkt_ID = P_ID AND V_Ort_ID = O_ID 6 GROUP BY P_Produktgruppe, YEAR (Z_Datum), O_Bundesland 7 8 UNION ALL Zwischensumme (2) über alle Produktgruppen und Jahre SELECT P_Produktgruppe AS PGruppe, YEAR (Z_Datum), 2 CAST( NULL AS VARCHAR(50)), 3 SUM(V_Anzahl * P_Verkaufspreis) AS Umsatz 4 FROM Verkauf, Zeit, Produkt, Ort 5 HERE V_Zeit_ID = Z_ID AND V_Produkt_ID = P_ID AND V_Ort_ID = O_ID 6 GROUP BY P_Produktgruppe, YEAR(Z_Datum) 7 8 UNION ALL
56 CUBE Vollständige Berechnung aller Zwischen- und Gesamtsummen führt bei n Gruppierattributen zu 2 n auszuwertenden Unteranfragen CUBE-Operator berechnet für gegebene Menge von Gruppierattributen {A,..., A n } Summen für alle Teilmengen der Gruppierattribute {} {A }, {A 2 }, {A 3 },... {A,A 2 }, {A,A 3 },.... {A,...A n } 56
57 CUBE Beispiel: Zwischen- und Gesamtsummen mittels Verwendung des CUBE-Operators SELECT P_Produktgruppe AS PGruppe, O_Bundesland, YEAR(Z_Datum), 2 SUM(V_Anzahl * P_Verkaufspreis) AS Umsatz 3 FROM Verkauf, Zeit, Produkt, Ort 4 HERE V_Zeit_ID = Z_ID AND V_Produkt_ID = P_ID AND V_Ort_ID = O_ID 5 GROUP BY CUBE(P_Produktgruppe, O_Bundesland, YEAR(Z_Datum)) CUBE-Operator ist interdimensional, d.h. Gruppierattribute stammen von verschiedenen Klassifikationsstufen unterschiedlicher Dimensionen 57
58 ROLLUP ROLLUP-Operator als intradimensionales Pendant zum CUBE-Operator berechnet Zwischen- und Gesamtsummen entlang verschiedener Klassifikationsstufen einer Dimension Beispiel: Zwischen- und Gesamtsummen für Bundesländer, Städte und Filialen SELECT O_Bundesland, O_Stadt, O_Filiale, 2 SUM(V_Anzahl * P_Verkaufspreis) AS Umsatz 3 FROM Verkauf, Zeit, Produkt, Ort 4 HERE V_Produkt_ID = P_ID AND V_Ort_ID = O_ID 5 AND V_Zeit_ID = Z_ID AND YEAR(Z_Datum) = 20 6 AND P_Produktgruppe = ein 7 GROUP BY ROLLUP(O_Bundesland, O_Stadt, O_Filiale) 58
59 MD Multidimensional Expressions (MD) als von Microsoft vorgeschlagene Anfragesprache für multidimensionale Daten, die auch von anderen Herstellern unterstützt wird MD-Anfrage nach folgendem Muster SELECT <Achsen> 2 FROM <Cube> 3 HERE <Slicer> zur Spezifikation eines Datenwürfels 59
60 MD Achsen-Klausel spezifiziert Achsen des Datenwürfels Aufzählung z.b. {ProduktA, ProduktC} Mengenausdruck z.b. Produkte.CHILDREN Kreuzprodukt z.b. CROSSJOIN(Produkte, Regionen) Cube-Klausel spezifiziert Faktentabelle als Datenquelle Slicer-Klausel erlaubt eine Selektion der Daten gemäß Dimensionen, die nicht als Achsen verwendet werden (z.b. Measures.[Umsatz] betrachtet nur Umsätze) 60
61 MD Beispiel ([2], S. 49) SELECT CROSSJOIN ( 2 {Produkt.Kategorie.Gruppe.[Rotwein], 3 Produkt.Kategorie.Gruppe.[eißwein]}, 4 {Ort.[Sachsen-Anhalt].CHILDREN, 5 Ort.[Thüringen]}) 6 ON COLUMNS, 7 {Zeit.[20].[Q].CHILDREN, Zeit.[20].[Q2], 8 Zeit.[20].[Q3], Zeit.[20].[Q4].CHILDREN} 9 ON ROS 0 FROM Verkauf HERE (Measures.[Umsatz]) Achse : Kreuzprodukt aus Produktkategorien Rotwein und eißwein mit Orten in Sachsen-Anhalt und Thüringen Achse 2: Monate im ersten Quartal von 20, zweites und drittes Quartal von 20, Monate im vierten Quartal von 20 6
62 MD Beispiel ([2], S. 49) SELECT CROSSJOIN ( 2 {Produkt.Kategorie.Gruppe.[Rotwein], 3 Produkt.Kategorie.Gruppe.[eißwein]}, 4 {Ort.[Sachsen-Anhalt].CHILDREN, 5 Ort.[Thüringen]}) 6 ON COLUMNS, 7 {Zeit.[20].[Q].CHILDREN, Zeit.[20].[Q2], 8 Zeit.[20].[Q3], Zeit.[20].[Q4].CHILDREN} 9 ON ROS 0 FROM Verkauf HERE (Measures.[Umsatz]) Datenquelle: Faktentabelle Verkauf Slicer: Nur Umsätze werden berücksichtigt 62
63 MD Beispiel ([2], S. 49) Umsätze 20 Rotwein eißwein S.-A. Thür. S.-A. Thür. Magdeb. Halle Magdeb. Halle. Quart. Jan Feb Mär Quart Quart Quart. Okt Nov Dez
64 4.5 Implementierungsaspekte Implementierungsansätze für Data-arehouse-Systeme ROLAP verwendet RDBMS zum Speichern und Anfragen MOLAP speichert Daten als multidimensionales Array HOLAP verwendet Kombination der beiden Ansätze Bitmap-Indizes als zusätzliche Indexstruktur, die insbesondere für Attribute mit kleiner Anzahl möglicher Attributwerte und relativ statische Daten geeignet ist 64
65 ROLAP Relationales OLAP (ROLAP) verwendet ein RDBMS, um Datenwürfel in Fakten- und Dimensionstabellen zu speichern Vorteile: RDBMS sind ausgereifte Systeme und weit verfügbar geringer Implementierungsaufwand und Kosten Nachteile: Faktentabellen haben, aufgrund von Dimensionsattributen, einen vergleichsweise hohen Speicherbedarf 65
66 MOLAP Multidimensionales OLAP (MOLAP) verwendet ein multidimensionales Arrays zur Speicherung des Datenwürfels Klassifikationsstufen der verschiedenen Dimensionen müssen intern als ganze Zahlen (0...n) kodiert werden Dimensionsinformation eines Fakts muss dann nicht separat gespeichert werden, sondern ist aus seiner Position im multidimensionalen Array ablesbar 66
67 MOLAP Datenwürfel als multidimensionales Array, welches dann mittels Linearisierung (wie in Programmiersprachen) als Folge von Fakten (Kennzahlen) gespeichert wird D 3 Magdeburg D Halle D 2 Sachsen-Anhalt Erfurt Thüringen Februar März. Quartal Januar Quelle: Köppen, Saake und Sattler [2, S.57/59] 67
68 Bitmap-Indizes Bitmap-Indizes als zusätzliche Form von Indexstruktur (neben B + -Bäumen und hashbasierten Indizes), die insbesondere in Data arehouses Anwendung findet Bitmap-Indizes geeignet für Attribute mit kleiner Anzahl möglicher Attributwerte (z.b. Geschlecht, Kategorie) Für jeden möglichen Attributwert wird ein Bitvektor gespeichert, der Tupel anzeigt (Bit auf gesetzt), welche diesen Attributwert besitzen 68
69 69 Bitmap-Indizes Beispiel: eibliche Kunden in Vertriebsgebieten S und G:w S U T V V:S S U T V V: S U T V Q c c c c c c c c a S U T V R d d d d d d d d b = S U T V
70 Bitmap-Indizes Bitvektoren lassen sich kompakt speichern und sehr effizient mittels Boole scher Operationen verknüpfen Bitmap-Indizes haben für Attribut mit wenigen möglichen erten einen geringeren Speicherbedarf als herkömmliche B + -Bäume Bitmap-Indizes sind insbesondere für statische Daten geeignet; ein Einfügen oder Löschen von Tupeln erfordert eine Neuberechnung aller Bitvektoren 70
71 Zusammenfassung Datenwürfel besteht aus Fakten und Dimensionen, die sich in Form eines Snowflake-Schemas oder eines Star-Schemas in Relationen abbilden lassen OLAP-Operatoren (ROLL UP, DRILL DON, SLICE, etc.) zur Interaktion mit einem Datenwürfel OLAP-Unterstützung in SQL und durch in Form der von Microsoft vorgeschlagenen Anfragesprache MD 7
72 Literatur [] A. Kemper und A. Eickler: Datenbanksysteme Eine Einführung, De Gruyter Oldenbourg, 203 (Kapitel 7) [2] V. Köppen, G. Saake und K.-U. Sattler: Data arehouse Technologien, mitp Professional,
Unterstützung der Unternehmenssteuerung durch Data Warehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen
Rückblick Unterstützung der Unternehmenssteuerung durch Data arehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen Online Transaction Processing (OLTP) und Online Analytical Processing unterscheiden
MehrInhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte
4. Data Warehouses Inhalt 4.1 Motivation 4.2 Datenintegration 4.3 Konzeptuelle Modellierung 4.4 Anfragen an Data Warehouses 4.5 Implementierungsaspekte 2 Literatur V. Köppen, G. Saake und K.-U. Sattler:
MehrInhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte
4. Data Warehouses Inhalt 4.1 Motivation 4.2 Datenintegration 4.3 Konzeptuelle Modellierung 4.4 Anfragen an Data Warehouses 4.5 Implementierungsaspekte 2 Literatur V. Köppen, G. Saake und K.-U. Sattler:
MehrTeil III Multidimensionales Datenmodell
Teil III Multidimensionales Datenmodell Multidimensionales Datenmodell 1 Grundbegriffe 2 Der Würfel 3 Konzeptuelle Modellierung 4 Operationen zur Datenanalyse 5 Relationale Umsetzung des multidimensionalen
MehrDas Multidimensionale Datenmodell
Das Multidimensionale Datenmodell Konzeptuelle Modellierung Umsetzung des Modells Beispiel ER-Modell 2 / 36 Probleme ER-Modellierung Keine Unterscheidung Klassifikation, Attribute, Kenngrößen Dimension
MehrData Warehouse Technologien
Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............
MehrVeit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien
Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...
MehrRückblick. SQL bietet viele Möglichkeiten zur Anfrageformulierung
Rückblick SQL bietet viele Möglichkeiten zur Anfrageformulierung mathematische Funktionen (z.b. ABS(A) und SIGN(A)) Aggregatfunktionen (z.b. MIN(A) und SUM(A)) Boole sche Operatoren (AND, OR, EXCEPT) Verknüpfungen
MehrAnfragen an multidimensionale Daten
Anfragen an multidimensionale Daten Alexander Heidrich - BID8 09.06.2005 Hintergrundbild: http://www.csc.calpoly.edu/~zwood/teaching/csc471/finalproj02/afternoon/mfouquet/cube.jpg Inhaltsübersicht Motivation
MehrData-Warehouse-Technologien
Data-Warehouse-Technologien Prof. Dr.-Ing. Kai-Uwe Sattler 1 Prof. Dr. Gunter Saake 2 Dr. Veit Köppen 2 1 TU Ilmenau FG Datenbanken & Informationssysteme 2 Universität Magdeburg Institut für Technische
MehrEinführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH
Einführung in OLAP und Business Analysis Gunther Popp dc soft GmbH Überblick Wozu Business Analysis mit OLAP? OLAP Grundlagen Endlich... Technischer Background Microsoft SQL 7 & OLAP Services Folie 2 -
MehrData Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen
Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen (Folien von A. Kemper zum Buch 'Datenbanksysteme') Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP
MehrData Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube
Fragen des Marketingleiters Data Warehousing Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt nach? Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon Technisch
MehrEinführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.
Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen
MehrThemenblock: Erstellung eines Cube
Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen
MehrInhaltsverzeichnis. vii.
vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt 2 1.2 OLTP versus OLAP 4 1.2.1 OLAP-versus OLTP-Transaktionen 5 1.2.2 Vergleich von OLTP und OLAP 6 1.2.3 Abgrenzung: DBMS-Techniken
MehrOLAP und Data Warehouses
OLP und Data Warehouses Überblick Monitoring & dministration Externe Quellen Operative Datenbanken Extraktion Transformation Laden Metadaten- Repository Data Warehouse OLP-Server nalyse Query/Reporting
MehrKapitel 7 Grundlagen von Data
LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS DATABASE Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2014 Kapitel 7 Grundlagen von Data Warehouses Vorlesung: PD
MehrDatenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken
Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken 31. V. 2016 Outline 1 Organisatorisches 2 SQL 3 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 4 Objekt-relationale Datenbanken Beispiel
MehrVertrautmachen mit Daten
Kapitel III Vertrautmachen mit Daten 2004 AIFB / FZI 1 III Vertrautmachen mit Daten (see also Data Preparation ) 2004 AIFB / FZI 2 III Vertrautmachen mit Daten III.1 OLAP III.1.1 Einführung in OLAP Wie
MehrData Warehouse Technologien
mitp Professional Data Warehouse Technologien von Veit Köppen, Gunter Saake, Kai-Uwe Sattler 2. Auflage 2014 Data Warehouse Technologien Köppen / Saake / Sattler schnell und portofrei erhältlich bei beck-shop.de
MehrAgenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL
Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining 2 Eigenschaften eines Data Warehouse Referenzarchitektur Integrierte Sicht auf beliebige Daten aus verschieden Datenbanken
MehrRückblick: Datenbankentwurf
Rückblick: Datenbankentwurf Entity-Relationship-Modell für konzeptuellen Entwurf Entitytypen (entity types) (z.b. Studenten) Beziehungstypen (relationships) (z.b. hören) Attribute beschreiben Gegenstände
MehrData Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:
Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse
MehrDatenbanken Grundlagen und Design
Frank Geisler Datenbanken Grundlagen und Design 3., aktualisierte und erweiterte Auflage mitp Vorwort 15 Teil I Grundlagen 19 i Einführung in das Thema Datenbanken 21 i.i Warum ist Datenbankdesign wichtig?
MehrDatenbanksysteme 2009
Datenbanksysteme 2009 Kapitel 17: Data Warehouse Oliver Vornberger Institut für Informatik Universität Osnabrück 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen
MehrFrühjahrsemester 2011. Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil
Frühjahrsemester Data Warehousing Kapitel 5: Data Warehousing H. Schuldt Wiederholung aus Kapitel 5. Einführung Tresgros Tresgros Tresgros Filiale Muttenz Filiale Allschwil Filiale Liestal Anfragen: Welches
MehrData Warehousing Kapitel 3: Mehrdimensionale Datenmodellierung
Data Warehousing Kapitel 3: Mehrdimensionale Datenmodellierung und Operationen Michael Hartung Sommersemester 2011 Universität Leipzig Institut für Informatik y y y http://dbs.uni-leipzig.de SS11, Prof.
MehrThemenblock: Data Warehousing (I)
Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining Agenda Einführung Data Warehouses Online Transactional Processing (OLTP) Datenmanipulation mit SQL Anfragen mit SQL Online
MehrBusiness Intelligence & Reporting. Michael Cordes Holger Oehring Matthias Rein
Business Intelligence & Reporting Michael Cordes Holger Oehring Matthias Rein Ziele Einführung Business Intelligence / Front Room Online Analytical Processing (OLAP) Arten des Reporting & Nutzergruppen
MehrMIS by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001
MIS Glossar by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001 Aggregat Data Cube Data Marts Data Mining Data Warehouse (DWH) Daten Decision Support Systeme (DSS)
MehrFrühjahrsemester 2010. Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil
Frühjahrsemester Data Warehousing Kapitel 5: Data Warehousing H. Schuldt Wiederholung aus Kapitel 5. Einführung Tresgros Tresgros Tresgros Filiale Muttenz Filiale Allschwil Filiale Liestal Anfragen: Welches
MehrDatenbanksysteme 2 Frühjahr-/Sommersemester 2014 28. Mai 2014
Lehrstuhl für Praktische Informatik III Prof. Dr. Guido Moerkotte Email: moer@db.informatik.uni-mannheim.de Marius Eich Email: marius.eich@uni-mannheim.de Datenbanksysteme 2 8. Übungsblatt Frühjahr-/Sommersemester
MehrData Warehousing. und Operationen. Dr. Andreas Thor Wintersemester 2009/10. Universität Leipzig Institut für Informatik.
Data Warehousing Kapitel 3: Mehrdimensionale Datenmodellierung und Operationen Dr. Andreas Thor Wintersemester 2009/10 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de WS09/10, Prof.
MehrÜbung zur Einführung in die Wirtschaftsinformatik Cognos Powerplay als Beispiel für ein DSS
Übung zur Einführung in die Wirtschaftsinformatik 2006-05 - 10 Cognos Powerplay als Beispiel für ein DSS 1 Entscheidungsunterstützungssysteme (EUS) Decision Support Systems (DSS) EUS sollen das gemeinsame
MehrMultidimensionales Datenmodell, Cognos
Data Warehousing (II): Multidimensionales Datenmodell, Cognos Praktikum: Data Warehousing und Mining Praktikum Data Warehousing und Mining, Sommersemester 2010 Vereinfachte Sicht auf die Referenzarchitektur
MehrData Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de
Data Warehouses Sommersemester 2011 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen Data Warehouse Architektur Data-Warehouse-System Teilsichten
MehrOLTP: Online Transaction Processing
Moderne Betriebliche Anwendungen von Datenbanksystemen Online Transaction Processing (bisheriger Fokus) Data Warehouse-Anwendungen Data Mining OLTP: Online Transaction Processing Beispiele Flugbuchungssystem
MehrKapitel 6 Einführung in Data Warehouses
Kapitel 6 Einführung in Data Warehouses Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2008, LMU München 2008 Dr. Peer Kröger Dieses Skript basiert zu einem Teil auf dem Skript zur Vorlesung
MehrData Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:
Kapitel 16 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining operationale DB operationale DB operationale DB Data Warehouse operationale
MehrData Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:
Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse
MehrKomponenten und Architekturen von Analytischen Informationssystemen (AIS)
Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation Zusammenfassung OPAL 6. Übung Juni 2015 Agenda Hinweise zur Klausur Zusammenfassung OPAL Übungen / Kontrollfragen
MehrDatenbankanwendungen werden oft über einen sehr langen Zeitraum (z.b. Jahrzehnte) eingesetzt
2. Datenbankentwurf Motivation Datenbankanwendungen werden oft über einen sehr langen Zeitraum (z.b. Jahrzehnte) eingesetzt Fehler sind umso teurer zu beheben, je weiter die Entwicklung bzw. der Einsatz
MehrData Warehousing. Beispiel: : Amazon. Aufbau eines DWH OLAP <-> OLTP Datacube. FU-Berlin, DBS I 2006, Hinze / Scholz
Data Warehousing Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon 2 1 Datenbank 3 Fragen des Marketingleiters Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt
MehrInhaltsübersicht...IX Inhaltsverzeichnis...XI Abbildungsverzeichnis...XVII Tabellenverzeichnis... XXIII Abkürzungsverzeichnis...
Inhaltsübersicht...IX Inhaltsverzeichnis...XI Abbildungsverzeichnis...XVII Tabellenverzeichnis... XXIII Abkürzungsverzeichnis... XXV 1 Einführung... 1 1.1 Problemstellung... 1 1.2 Zielsetzung... 3 1.3
MehrDatenbanken Unit 4: Das Relationale Modell & Datenintegrität
Datenbanken Unit 4: Das Relationale Modell & Datenintegrität 15. III. 2016 Outline 1 Organisatorisches 2 SQL 3 Relationale Algebra Notation 4 Datenintegrität Organisatorisches Erster Zwischentest: nach
MehrInhaltsverzeichnis. 1 Einleitung Motivation und Umfeld Zielsetzung der Arbeit Methodisches Vorgehen und Aufbau der Arbeit 3
Inhaltsverzeichnis 1 Einleitung 1 1.1 Motivation und Umfeld 1 1.2 Zielsetzung der Arbeit 2 1.3 Methodisches Vorgehen und Aufbau der Arbeit 3 2 Grundlagen des Feuerwehrwesens 5 2.1 Kategorisierung der Feuerwehren
MehrVorlesung Wissensentdeckung in Datenbanken
Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Uwe Ligges Informatik LS 8 22.04.2010 1 von 26 Gliederung 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der
Mehr1 Business-Intelligence-Architektur 1
D3kjd3Di38lk323nnm xi 1 Business-Intelligence-Architektur 1 1.1 Data Warehouse....................................... 1 1.2 OLAP und mehrdimensionale Datenbanken.................. 4 1.3 Architekturvarianten....................................
MehrRückblick: Relationales Modell
Rückblick: Relationales Modell Relationales Modell als vorherrschendes Datenmodell Relationen (Tabellen) besitzen Attribute (Spalten) mit Wertebereichen und beinhalten Tupel (Zeilen) Umsetzung eines konzeptuellen
MehrOnline Kurse Modulbeschreibungen
Online Kurse Modulbeschreibungen K0100 SQL Basics M0101 DB Theorie Dieses Modul führt in die Thematik von Datenbanken und deren grundlegenden Begriffen und Konzepten ein. Es werden Fragen beantwortet,
MehrKomponenten und Architekturen von Analytischen Informationssystemen (AIS)
Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation 27. Juni 2013 Hinweis Diese Folien ersetzen keinesfalls den Übungsstoff des zugehörigen e-learning-kurses.
MehrKapitel 17: Date Warehouse
Kapitel 17: Date Warehouse 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen kleine, kurze Transaktionen jeweils auf jüngstem Zustand OLAP (Online Analytical
MehrDatenbanken. Datenbanken. Grundlagen und Design. Grundlagen und Design. Frank. Geisler. 4. Auflage
Datenbanksysteme, Datenbankanwendungen und Middleware Das relationale Datenbankmodell ER-Datenbankmodellierung und Normalisierung SQL-Grundlagen Projektablauf bei der Erstellung einer Datenbank Transaktionen
MehrData Warehouse und Data Mining
Einführungsseminar Data Mining Seminarvortrag zum Thema: Data Warehouse und Data Mining Von gehalten am Betreuer: Dr. M. Grabert Einführung Problemstellung Seite 2 Einführung Unternehmen bekommen eine
MehrMala Bachmann September 2000
Mala Bachmann September 2000 Wein-Shop (1) Umsatz pro Zeit und Produkt Umsatz Jan Feb Mrz Q1 Apr 2000 Merlot 33 55 56 144 18 760 Cabernet-S. 72 136 117 325 74 1338 Shiraz 85 128 99 312 92 1662 Rotweine
MehrData Cubes PG Wissensmangement Seminarphase
PG 402 - Wissensmangement Seminarphase 23.10.2001-25.10.2001 Hanna Köpcke Lehrstuhl für Künstliche Intelligenz Universität Dortmund Übersicht 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit
MehrDatenbanken - Grundlagen und Design
mitp Professional Datenbanken - Grundlagen und Design von Frank Geisler überarbeitet Datenbanken - Grundlagen und Design Geisler schnell und portofrei erhältlich bei beck-shop.de DIE FACHBUCHHANDLUNG mitp/bhv
MehrVerwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein
1 Definitionen 1.1 Datenbank Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert Integriert, selbstbeschreibend, verwandt 1.2 Intension/Extension Intension: Menge der Attribute Extension:
Mehr9. Sicherheitsaspekte
9. Sicherheitsaspekte Motivation Datenbanken enthalten häufig sensible Daten (z.b. personenbezogene oder unternehmenskritische) Vielzahl verschiedener Benutzer hat Zugriff (z.b. Anwendungen, Mitarbeiter,
MehrKapitel 1: Einführung 1.1 Datenbanken?
1. Einführung 1.1. Datenbanken? Seite 1 Kapitel 1: Einführung 1.1 Datenbanken? 1. Einführung 1.1. Datenbanken? Seite 2 Willkommen! Studierenden-Datenbank Hans Eifrig hat die Matrikelnummer 1223. Seine
MehrMultidimensionales Datenmodell
Multidimensionales Datenmodell Grundbegriffe fi Fakten, Dimensionen, Würfel Analyseoperationen fi Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung fi ME/R, ADAPT Relationale
MehrRückblick: Entity-Relationship-Modell
Rückblick: Entity-Relationship-Modell Entity-Relationship-Modell für konzeptuellen Entwurf Entitytypen (entity types) (z.b. Studenten) Beziehungstypen (relationships) (z.b. hören) Attribute beschreiben
MehrOnline Analytical Processing
Online Analytical Processing Online Analytical Processing Online Analytical Processing (OLAP) ermöglicht die multidimensionale Betrachtung von Daten zwecks E rmittlung eines entscheidungsunterstützenden
Mehrbersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter
bersicht Niels Schršter EinfŸhrung GROUP BY Roll UpÔs Kreuztabellen Cubes Datenbank Ansammlung von Tabellen, die einen ãausschnitt der WeltÒ fÿr eine Benutzergruppe beschreiben. Sie beschreiben die funktionalen
MehrAufgabe 1: [Logische Modellierung]
Aufgabe 1: [Logische Modellierung] a) Entwerfen Sie für das von Ihnen entworfene Modell aus Aufgabe 2 des 1. Übungsblattes ein Star-Schema. b) Entwerfen Sie für das vorangegangene Modell einen Teil eines
MehrKap. 6 Data Warehouse
1 Kap. 6 Data Warehouse 6.1 Was ist ein Data Warehouse, Motivation? 6.2 Data Cube und Cube-Operationen 6.3 Workshop: MS SQL Server, Cube Operationen 6.4 Physischer Entwurf, Implementierung von Cubes 6.5
MehrData Warehousing. Ausführung von OLAP Operationen. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Ausführung von OLAP Operationen Ulf Leser Wissensmanagement in der Bioinformatik Variante 1 - Snowflake Year id year Productgroup id pg_name Month Id Month year_id Day Id day month_id
MehrData Warehousing. Weitere Buzzwörter: OLAP, Decision Support, Data Mining
Data Warehousing Weitere Buzzwörter: OLAP, Decision Support, Data Mining Wichtige Hinweise Zu diesem Thema gibt es eine Spezialvorlesung im Sommersemester Hier nur grober Überblick über Idee und einige
MehrWiederholung VU Datenmodellierung
Wiederholung VU Datenmodellierung VU Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester
MehrChristian Kurze BI-Praktikum IBM WS 2008/09
Einführung in die multidimensionale Datenmodellierung e mit ADAPT BI-Praktikum IBM WS 2008/09 1 Gliederung Einführung multidimensionale Datenmodellierung 1. Multidimensionales Modell BI-Praktikum IBM WS
MehrMengenvergleiche: Alle Konten außer das, mit dem größten Saldo.
Mengenvergleiche: Mehr Möglichkeiten als der in-operator bietet der θany und der θall-operator, also der Vergleich mit irgendeinem oder jedem Tupel der Unteranfrage. Alle Konten außer das, mit dem größten
MehrDaniel Warner SQL. Das Praxisbuch. Mit 119 Abbildungen. Franzis
Daniel Warner SQL Das Praxisbuch Mit 119 Abbildungen Franzis Inhaltsverzeichnis Teil I - Einleitung 15 1 Einleitung 17 1.1 Zum Aufbau des Buchs 17 1.2 Hinweise zur Buch-CD 18 1.3 Typografische Konventionen
MehrHinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen Fragen Vertiefung Modellierung
Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation Zusammenfassung OPAL 24. Juni 2014 Agenda Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen
MehrAuf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort... 13
Auf einen Blick Vorwort... 13 Teil 1 Vorbereitung Kapitel 1 Einleitung... 17 Kapitel 2 SQL der Standard relationaler Datenbanken... 21 Kapitel 3 Die Beispieldatenbanken... 39 Teil 2 Abfrage und Bearbeitung
MehrSeminar Data Warehousing. Seminar. Data Warehousing. Thema: Speichermodelle für Data-Warehouse-Strukturen
Seminar Data Warehousing Thema: Speichermodelle für Data-Warehouse-Strukturen Friedrich-Schiller-Universität Jena Fakultät für Mathematik und Informatik Institut für Informatik Lehrstuhl für Datenbanken
MehrBetriebliche Anwendungen
Betriebliche nwendungen SP R/3: Enterprise Resource Modelling (ERP-System) OLTP Data Warehouse Data Mining WN (Internet) LN Kapitel 17 1 Relationales DBMS als Backend-Server (Oracle, Informix, DB2, MS
MehrAuf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort 13
Auf einen Blick Vorwort 13 Teil 1 Vorbereitung Kapitel 1 Einleitung 17 Kapitel 2 SQL - der Standard relationaler Datenbanken 21 Kapitel 3 Die Beispieldatenbanken 39 Teil 2 Abfrage und Bearbeitung Kapitel
Mehreevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator
eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator Agenda Was ist Business Intelligence? Was ist OLAP? Unterschied zwischen OLAP und OLTP? Bestandteile
MehrKapitel DB:IV (Fortsetzung)
Kapitel DB:IV (Fortsetzung) IV. Logischer Datenbankentwurf mit dem relationalen Modell Das relationale Modell Integritätsbedingungen Umsetzung ER-Schema in relationales Schema DB:IV-46 Relational Design
MehrInhaltsverzeichnis. Vorwort 13. Kapitel 1 Einleitung 15
Vorwort 13 Kapitel 1 Einleitung 15 Kapitel 2 SQL-der Standard relationaler Datenbanken... 19 2.1 Die Geschichte 19 2.2 Die Bestandteile 20 2.3 Die Verarbeitung einer SQL-Anweisung 22 2.4 Die Struktur von
MehrData Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse
Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher
MehrData Warehousing Grundbegriffe und Problemstellung
Data Warehousing Grundbegriffe und Problemstellung Dr. Andrea Kennel, Trivadis AG, Glattbrugg, Schweiz Andrea.Kennel@trivadis.com Schlüsselworte Data Warehouse, Cube, Data Mart, Bitmap Index, Star Queries,
MehrSQL - Datenbankdesign - Aufbau
SQL - Datenbankdesign - Aufbau Kompakt-Intensiv-Training Unsere fünftägige ANSI SQL Schulung vermittelt Ihnen alle nötigen Kenntnisse zur Erstellung von Datenauswertungen und Programmierung wiederkehrender
MehrOLAP und der MS SQL Server
OLAP und der MS SQL Server OLAP und der MS SQL Server OLAP-Systeme werden wie umfangreiche Berichtssysteme heute nicht mehr von Grund auf neu entwickelt. Stattdessen konzentriert man sich auf die individuellen
MehrData Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY
Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung
MehrSeminar 2. SQL - DML(Data Manipulation Language) und. DDL(Data Definition Language) Befehle.
Seminar 2 SQL - DML(Data Manipulation Language) und DDL(Data Definition Language) Befehle. DML Befehle Aggregatfunktionen - werden auf eine Menge von Tupeln angewendet - Verdichtung einzelner Tupeln yu
MehrLogische Modellierung von Data Warehouses
Logische Modellierung von Data Warehouses Vertiefungsarbeit von Karin Schäuble Gliederung. Einführung. Abgrenzung und Grundlagen. Anforderungen. Logische Modellierung. Methoden.. Star Schema.. Galaxy-Schema..
MehrDatenbanken zur Entscheidungsunterstützung - Data Warehousing. Prof. Dr. T. Kudraß 1
Datenbanken zur Entscheidungsunterstützung - Data Warehousing Prof. Dr. T. Kudraß 1 Einführung Zunehmender Bedarf nach Analyse aktueller und historischer Daten Identifizierung interessanter Patterns Entscheidungsfindung
Mehr7. XML-Datenbanksysteme und SQL/XML
7. XML-Datenbanksysteme und SQL/XML Native XML-DBS vs. XML-Erweiterungen von ORDBS Speicherung von XML-Dokumenten Speicherung von XML-Dokumenten als Ganzes Generische Dekomposition von XML-Dokumenten Schemabasierte
MehrDas relationale Datenmodell
Das relationale Datenmodell Konzepte Attribute, Relationenschemata, Datenbank-Schemata Konsistenzbedingungen Beispiel-Datenbank Seite 1 Einführung Zweck datenmäßige Darstellung von Objekten und Beziehungen
MehrRealisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier
Realisierung von OLAP Operatoren in einem visuellen Analysetool Vortrag von Alexander Spachmann und Thomas Lindemeier Gliederung Ausgangssituation/Motivation Was ist OLAP? Anwendungen Was sind Operatoren?
Mehr5 Data Warehouses und Data Mining
5 Data Warehouses und Data Mining Mittels OLAP Techniken können große Datenmengen unterschiedlich stark verdichtet und gezielt aufbereitet werden. Mittels Data Mining können große Datenmengen nach bisher
MehrSemantische Integrität (auch: Konsistenz) der in einer Datenbank gespeicherten Daten als wichtige Anforderung
6. Datenintegrität Motivation Semantische Integrität (auch: Konsistenz) der in einer Datenbank gespeicherten Daten als wichtige Anforderung nur sinnvolle Attributwerte (z.b. keine negativen Semester) Abhängigkeiten
MehrDie richtige Grafik als Zauberstab zur Mart Modellierung Referat vom
Die richtige Grafik als Zauberstab zur Mart Modellierung Referat vom 22.11.2016 Peter Brunner,NTTData Dr. Andrea Kennel, InfoPunkt Kennel GmbH Copyright 2014 NTT DATA EMEA Ltd. Die richtige Grafik als
Mehr3. Mehrdimensionale Datenmodellierung. Cb Cube-Operator, Rollup-Operator, Grouping Sets SS08, Prof. Dr. E. Rahm 3-1 y yy
3. Mehrdimensionale Datenmodellierung und Operationen Grundlagen Kennzahlen, e, Dimensionen, esoe,cube Cuboide / Aggregationsgitter hierarchische Dimensionen / Konzepthierarchien Cube-Operationen Multi-dimensionale
MehrInhaltsverzeichnis. Vorwort Kapitel 1 Einleitung... 15
Vorwort..................................................... 13 Kapitel 1 Einleitung.......................................... 15 Kapitel 2 SQL der Standard relationaler Datenbanken... 19 2.1 Die Geschichte................................
Mehr