Datenbanksysteme I Data Warehouses Felix Naumann

Ähnliche Dokumente
Data Warehousing. Ausführung von OLAP Operationen. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Architektur Komponenten Prozesse. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube

Data Warehousing und Data Mining

Data Warehousing. Einleitung und Motivation. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Komponenten Prozesse. Architektur. Wissensmanagement in der. Bioinformatik. Ulf Leser

Data Warehousing und Data Mining

Data Warehousing. Speicherung multidimensionaler Daten. Ulf Leser Wissensmanagement in der Bioinformatik

Themenblock: Erstellung eines Cube

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.

Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen

Informationsintegration

Data Warehousing. Modellierung im DWH Das multidimensionale Datenmodell. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing und Data Mining

Datenbanksysteme 2 Frühjahr-/Sommersemester Mai 2014

Data Warehousing und Data Mining

Data Warehousing und Data Mining

Data Warehousing und Data Mining

Frühjahrsemester Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil

bersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter

Data Warehousing Grundbegriffe und Problemstellung

Data Warehousing und Data Mining

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Oracle OLAP 11g: Performance für das Oracle Data Warehouse

OLTP: Online Transaction Processing

Frühjahrsemester Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil

ISU 1. Ue_08/02_Datenbanken/SQL. 08 Datenbanken. Übung. SQL Einführung. Eckbert Jankowski.

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Kap. 6 Data Warehouse

Kapitel 17: Date Warehouse

Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing

Data Warehousing. Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit. Ulf Leser Wissensmanagement in der Bioinformatik

Vorlesung Datenbankmanagementsysteme

Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH

OLAP und Data Warehouses

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH

Data Warehousing. DWH Projekte. Ulf Leser Wissensmanagement in der Bioinformatik

Index- und Zugriffsstrukturen für. Holger Brämer, 05IND-P

Repetitorium. Data Warehousing und Data Mining 11/12. Sebastian Wandelt 13./16. Februar 2012

Performanceoptimierung mit Exadata Verarbeitung extremer Datenmengen mit PL/SQL basierter Datenbewirtschaftung (Erfahrungsbericht)

Marketing Intelligence Vorstellung der Softwarekomponenten. Josef Kolbitsch Manuela Reinisch

SQL/OLAP und Multidimensionalität in der Lehre

Fortgeschrittene OLAP Analysemodelle

Data Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik

Das Multidimensionale Datenmodell

Data Warehousing und Data Mining

Data Warehousing und Data Mining

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL

Hauptspeicher- Datenbanksysteme. Hardware-Entwicklungen Column- versus Row-Store...

MIS by Franziska Täschler, Winformation GmbH Ausgabe 01/2001

Themenblock: Data Warehousing (I)

ACCESS SQL ACCESS SQL

Data Warehousing und Data Mining

Data Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH)

REAL-TIME DATA WAREHOUSING

3.17 Zugriffskontrolle

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Einleitung. ROLLUP, CUBE und GROUPING. Markus Jägle Art der Info Technische Background Info (April 2002)

Kapitel 5: Vom relationalen zum multidimensionalen Datenmodell

Business Intelligence Data Warehouse. Jan Weinschenker

Data Warehousing. Weitere Buzzwörter: OLAP, Decision Support, Data Mining

Unterabfragen (Subqueries)

Mengenvergleiche: Alle Konten außer das, mit dem größten Saldo.

Einführung in Hauptspeicherdatenbanken

MySQL-Befehle. In diesem Tutorial möchte ich eine kurze Übersicht der wichtigsten Befehle von MySQL geben.

Pivotieren. Themenblock: Anfragen auf dem Cube. Roll-up und Drill-down. Slicing und Dicing. Praktikum: Data Warehousing und Data Mining. Produkt.

SQL structured query language

Data Warehousing. Einleitung und Motivation. Wissensmanagement in der. Bioinformatik. Ulf Leser

SQL für Trolle. mag.e. Dienstag, Qt-Seminar

Modellierung agiler Data Warehouses mit Data Vault Dani Schnider, Trivadis AG DOAG Konferenz 2015

Data Warehouse Grundlagen

Data-Warehouse-Systeme

Kapitel 6 Einführung in Data Warehouses

DW Data Warehousing Funktionsweise, Einsatz- und Problemfelder

Universität Augsburg, Institut für Informatik WS 2006/2007 Dr. W.-T. Balke 27. Nov M. Endres, A. Huhn, T. Preisinger Lösungsblatt 5

Einführungsveranstaltung: Data Warehouse

Data Warehouses. Kapitel 1 Einführung. Sommersemester Melanie Herschel melanie.herschel@uni-tuebingen.de

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004

SQL. strukturierte Datenbankabfragesprache eine Datenbanksprache zur. Structured Query Language:

Self Service BI. - Business Intelligence im Mittelstand - schnelle Ergebnisse, nachhaltige Erfolge

SAP Business Intelligence

5 Data Warehouses und Data Mining

Kapitel II. Datenbereitstellung 2004 AIFB / FZI 1. Vorlesung Knowledge Discovery

DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER

Merkblatt DWH. Mittwoch, 6. Januar :55. Info Seite 1

IV. Datenbankmanagement

IT-basierte Kennzahlenanalyse im Versicherungswesen

S(tructured)Q(uery)L(anguage)

Data Warehousing. Kapitel 1: Data-Warehousing-Architektur. Folien teilweise übernommen von Matthias Gimbel

Data Warehouse ??? Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle

Datenbanksysteme I. Klausur zum Praktikum. Mehrere Professoren prüfen mit genau einem Beisitzer genau einen Studenten.

Modellierung und Implementierung einer End-to-End BI Lösung

Data Warehouse Technologien

9. Einführung in Datenbanken

Microsoft Access 2010 SQL nutzen

Transkript:

Datenbanksysteme I Data Warehouses 5.7.2010 Felix Naumann

Überblick 2 Einsatzgebiete OLAP versus OLTP Multimensionale i l Modellierung OLAP Operationen Relationale Implementierung Neue Architekturen Folien zu DWH teilweise von: Ulf Leser (HU Berlin)

Beispielszenario 3 Ein beliebiges Handelshaus: Spar, Kaufland,... Physikalische Datenverteilung Viele Niederlassungen (bis zu mehrere tausend) Noch mehr Registerkassen Aber: Zentrale Planung, Beschaffung, Verteilung Was wird wo und wie oft verkauft? Was muss wann wohin geliefert werden? Bedenke: Verderbliche Waren... nur möglich, wenn Zentrale Übersicht über Umsätze Integration mit Lieferanten / Produktdaten

Handels - DWH 4 Verkaufen wir im Wedding mehr Dosenbier als in Zehlendorf? FILIALE 3... FILIALE 1 FILIALE 2 Analyse DWH Artikeldaten Kundendaten Welches sind meine Topkunden? Lieferanten -daten

DWH Datenquellen 5 Lieferantendatenbanken Produktinformationen: Packungsgrößen, Farben,... Lieferbedingungen, Rabatte, Lieferzeiten,... Personaldatenbank Zuordnung Kassenbuchung auf Mitarbeiter Stundenabrechnung, Prämien Kundendatenbank Kundenklassen: Premium, normal, soziale Brennpunkte,... Persönliche Vorlieben & Historie Kundenkarten (Safeway, ) Weitere Vertriebswege Internet, Katalogbestellung, Verkaufsclubs,...

Definition DWH 6 A DWH is a subject-oriented, integrated, non-volatile, and timevariant collection of data in support of management s decisions. [Inman96] Subject-oriented: Integrated: Non-Volatile: Time-Variant: Verkäufe, Personen, Produkte, etc. Erstellt aus vielen Quellen Hält Daten unverändert über die Zeit Vergleich von Daten über die Zeit

Erfolg von DWH 7 Top-Thema seit Mitte der 90er Jahre Industrie schneller als Forschung Voraussetzungen Extreme Verbilligung von Plattenspeicherplatz Relationale Modellierung: Anwendungsneutral Graphische Benutzeroberflächen und Terminals IT in allen Unternehmensbereichen (SAP R/3) Vernetzung und DB Standardisierung (SQL) Aber Vision der vollständigen Integration scheitert (immer wieder aufs neue) ETL Soziale versus technische Aspekte

Datenbank größen 8 http://www.wintercorp.com/vldb/2005_topten_survey/toptenwinners_2005.asp

Datenbank -größen 9 http://www.wintercorp.com/vldb/2005_topten_survey/toptenwinners_2005.asp

Überblick 10 Einsatzgebiete OLAP versus OLTP Multimensionale i l Modellierung OLAP Operationen Relationale Implementierung Neue Architekturen Folien zu DWH: Ulf Leser (HU Berlin)

OLTP Beispiel 11 SELECT pw FROM kunde WHERE login=... Login UPDATE kunde SET last_acc=date, tries=0 WHERE... COMMIT Willkommen Bestellung Best. löschen SELECT k_, name FROM kunde WHERE login=... SELECT last_pur FROM purchase WHERE k_=... COMMIT... SELECT av_qty FROM stock WHERE p_ =... UPDATE stock SET av_qty=av_qty-1 where... INSERT INTO shop_cart VALUES( o_, k_,... COMMIT... DELETE FROM shop_cart WHERE o_=... UPDATE stock SET av_qty=av_qty+1 where...... COMMIT

OLAP Beispiele 12 Welche Produkte hatten im letzten Jahr im Bereich Potsdam einen Umsatzrückgang um mehr als 10%? Welche Produktgruppen sind davon betroffen? Welche Lieferanten haben diese Produkte? Welche Kunden haben über die letzten 5 Jahre eine Bestellung über 50 Euro innerhalb von 4 Wochen nach einem persönlichen Anschreiben aufgegeben? Wie hoch waren die Bestellungen im Durchschnitt? Wie hoch waren die Bestellungen im Vergleich e zu den durchschnittlichen Bestellungen des jeweiligen Kunden in einem vergleichbaren Zeitraum? Lohnen sich Mailing-Aktionen? Haben solche Zweigstellen einen höheren Umsatz, die gemeinsam gekaufte Produkte nebeneinander platzieren? Welche Produkte werden überhaupt zusammen gekauft und wo?

OLAP versus OLTP 13 OLTP OLAP Typische Operationen Insert, Update, Delete, Select Select, Bulk-Inserts Transaktionen viele, kurze Lange Lesetransaktionen Typische Anfragen Einfache Anfragen, Primärschlüsselzugriff, Schnelle Abfolgen von Selects/inserts/updates/deletes Komplexe Anfragen: Aggregate, Gruppierung, Subselects, etc. Bereichsanfragen über mehrere Attribute Daten pro Operation Wenige Tupel Mega-/ Gigabyte Datenmenge in DB Gigabyte Terabyte Eigenschaften der Daten Erwartete Antwortzeiten Rohdaten, häufige Änderungen msec - sec Abgeleitete Daten, historisch & stabil Minuten Stunden Modellierung Anwendungsorientiert Themenorientiert Typische Benutzer Sachbearbeiter, Kunde Management

DWH Architektur & Komponenten 14 Monitoring Quelle 1 RDBMS Quelle 2 IMS Staging Area Staging Area Metadaten Cube Analysewerkzeuge Mart 2 Mart 1 Datenquellen Arbeitsbereich Basisdaten Abgeleitete Sichten

Alternativen 15 Physikalische Aufteilung variabel Data Marts auf eigenen Rechnern (Laptop) Staging Area auf eigenen Servern Metadaten auf eigenem Server (Repository) Quelle 1 Staging RDBMS Area Mart 2 Quelle 2 IMS Staging g Area Cube Mart 1 Metadaten

Arbeitsbereich 16 Staging Area Temporärer Speicher Quellnahes Schema Motivation ETL Arbeitsschritte effizienter implementierbar Mengenoperationen, SQL Zugriff auf Basisdatenbank möglich (Lookups) Vergleich zwischen Datenquellen möglich Filterfunktion: Nur einwandfreie Daten in Basisdatenbank übernehmen

Basisdatenbank 17 Zentrale Komponente des DWH Begriff DWH meint oft nur die Basisdatenbank. Speichert Daten in feinster Auflösung Einzelne Verkäufe Einzelne Bons Historische Daten Große Datenmengen Spezielle Modellierung Spezielle Optimierungsstrategien

Überblick 18 Einsatzgebiete OLAP versus OLTP Multimensionale i l Modellierung OLAP Operationen Relationale Implementierung Neue Architekturen Folien zu DWH: Ulf Leser (HU Berlin)

Beispiel: Normalisiertes Schema 19 Customer Id Name Cust_Class Year year Month Id Month year _ Day Id day month_ Discount Customer_ Productg_ discount Sales Bon_ Product_ amount single_price Discount_ Bon Id Day_ Shop_ Customer_ Total_amt Productgroup name Product Productgroup_ Shop region_ name Region

20 Multimensionales Schema Customer Id Name Cust_Class Article Bon Id Product_ Day_ Product_name Shop_ Sales Productgroup_ Total_ amt bon_ Productgroup p_ name article_ location_ time_ Star customer_ Time discount_ Location day month shop_ year region_ Discount region_name Customer_ Productg_ discount

Begriffe 21 Fkt Faktentabelle tbll Article Bon Id Product_ Day_ Product_name Shop_ Sales Productgroup_ Total_ amt bon_ Productgroup p_ name article_ location_ time_ customer_ Time discount_ Location day month shop_ year region_ region_name Dimensionstabelleni

22 Cube Time Bier Verkäufe in BWB in 2002 2002 2001 Sales 2000 Cube 1999 Bier Limo Product NR W Ber rlin Bay yern BW WB Location Cube -> Hypercube: Bon / Lieferant / Kunde /...

Dimensionen 23 Eindeutige Strukturierung des Datenraums Jede Dimension hat ein Schema Tag, Woche, Jahr Landkreis, Land, Staat Produkt, Produktgruppe, Produktklasse, Produktfamilie... und Wertebereiche (1, 2, 3,..., 31), (1,... 52), (1900,..., 2003) (...), (Berlin, NRW, Department-1,...), (BRD, F,...)

Überblick 24 Einsatzgebiete OLAP versus OLTP Multimensionale i l Modellierung OLAP Operationen Relationale Implementierung Neue Architekturen Folien zu DWH: Ulf Leser (HU Berlin)

Beispiel: Aggregation (Roll-Up) 25 Z.Tag Z.Monat 4.1.1999 B.Abteilung 4 1999 BAbt B.Abt. 3.1.1999 3 1999 2.1.1999 1.1.1999 Skoda.Reparatur Skoda.Ersatzteile 2 1999 1 1999 Skoda.Repa. Skoda.Ersatz Münch hen Wedding Nantes Lyon R.Shop Münch hen Wedding Nantes Lyon R.Shop

Beispiel: Verfeinerung (Drill-Down) 26 Z.Tag Z.Monat 4.1.1999 B.Abteilung 4 1999 BAbt B.Abt. 3.1.1999 3 1999 2.1.1999 1.1.1999 Skoda.Reparatur Skoda.Ersatzteile 2 1999 1 1999 Skoda.Repa. Skoda.Ersatz Münch hen Wedding Nantes Lyon R.Shop Münch hen Wedding Nantes Lyon R.Shop

Aggregation bis TOP 27 Summe Umsatz pro Tag und Abteilungen über alle Shops Z.Tag 4.1.1999 3.1.1999 2.1.1999 1.1.1999 B.Abteilung Skoda.Reparatur Skoda.Ersatzteile München n Wedding Nantes Lyon R.Shop Summe Umsatz pro Shop und dtag, über alle Abteilungen

... in mehreren Dimensionen 28 Z.Tag 4.1.1999 3.1.1999 2.1.1999 1.1.1999 B.Abteilung Skoda.Reparatur Skoda.Ersatzteile München n Wedding Nantes Lyon R.Shop Gesamtsumme

Selektion einer Scheibe (Slicing) 29 Verkäufe von Peugeot Verkäufe in Asien pro Jahr und Kontinent pro Jahr und Marke Jahr 2002 2001 2000 1999 Asien Südamerika Kontinent BMW Peugeot VW Ford Automarke

Auswahl von Unterwürfeln (Dicing) 30 Verkäufe von (Peugeot, VW) in (2000, 2001) pro Kontinent Jahr 2002 2001 2000 1999 Asien Südamerika Kontinent BMW Peugeot VW Ford Automarke

Überblick 31 Einsatzgebiete OLAP versus OLTP Multimensionale i l Modellierung OLAP Operationen Relationale Implementierung Neue Architekturen Folien zu DWH: Ulf Leser (HU Berlin)

Variante 1 - Snowflake 32 Year Productgroup year pg_name Month month year_ Day day month_ Sales product_ day_ shop_ amount price Product product_name pg_ Shop shop_name region_ Region region_name

Variante 2: Star Schema 33 Product product_ product_name pg_ pg_name Time day_ day month_ month year_ year Sales product_ day_ shop_ amount price Localization shop_ shop_name region_ region_name

Variante 3: Fullfact 34 Year year Productgroup pg_name Month month year_ Day day month_ Sales product_ pg_ day_ month_ year_ shop_ region _ amount price Product product_name pg_ Shop shop_name region_ Region region_name

Fazit Speicher und Query 35 Speicherverbrauch Snowflake / Star praktisch entisch Wenn Bedarf für Dimensionen vernachlässigbar Fullfact mit deutlich höherem Speicherverbrauch Faktentabelle wird breiter Dafür minimale Anzahl Joins Anzahl Joins: FullFact < Star < Snowflake Laufzeitverhalten hängt von mehr Faktoren als dem Schema ab Bereichs- oder Punktanfrage Indexierung Selektivität der Bedingungen g Gruppierung und Aggregation... aber Joins sind tendenziell teuer

Roll-Up Operationen: Hierarchische Aggregation 36 Wunsch: Verkaufsumsatz der Produktgruppe Wein nach Tagen, Monaten und Jahren SELECT T.year_, T.month_, T.day_, sum(s.amount) FROM Sales S, Product P, Time T WHERE P.pg_name= Wein AND P.product_ = S.product_ AND T.day_ = S.day_ GROUP BY T.year_, T.month_, T.day_ Summe nur für Tage (unterteilt nach Monaten/Jahren) Keine Summen pro Monat / pro Jahr Wunsch nicht in einer Anfrage formulierbar 1997 1 1 150 1997 1 2 130 1997 1 3 145 1997 1 4 122............ 1997 1 31 145 1997 2 1 133 1997 2 2 122............ 1997 3 10 180 1997 12 31 480 1998 1 1 240............ 2003 6 18 345

Hierarchische Aggregation 2-37 Alle Verkäufe der Produktgruppe Wein nach Tagen, Monaten und Jahren Benötigt UNION und eine Anfrage pro Klassifikationsstufe SELECT T.day_, sum(amount*price) FROM Sales S, Product P WHERE P.pg_name= Wein and P.product_ SELECT T.month = S.product, sum(amount*price) GROUP BY FROM T.day_ Sales S, Product P, Time T WHERE P.pg_name= Wein and P.product_ SELECT T.year_, = S.product_ sum(amount*price) and T.day_ FROM = S.day_ Sales S, Product P, Time T GROUP BY T.month_ WHERE P.pg_name= Wein and P.product _ = S.product _ and T.day_ = S.day_ GROUP BY T.year_

ROLLUP Operator 38 Herkömmliches SQL Dimension mit k Stufen Union von k Queries k Scans der Faktentabelle t Keine Optimierung wg. fehlender Multiple-Query Optimierung in kommerziellen RDBMS Schlechte Ergebnisreihenfolge ROLLUP Operator Hierarchische Aggregation mit Zwischensummen Summen werden durch ALL als Wert repräsentiert

ROLLUP Beispiel 39 SELECT T.year_, T.month_, T.day_, sum(...) FROM Sales S, Time T WHERE T.day_ = S.day_ GROUP BY ROLLUP(T.year_, T.month_, T.day_) 1997 Jan 1 200 1997 Jan... 1997 Jan 31 300 1997 Jan ALL 31.000 1997 Feb... 1997 March ALL 45.000 1997...... 1997 ALL ALL 1.456.400 1998 Jan 1 100 1998...... 1998 ALL ALL 2.450.000......... ALL ALL ALL 12.445.750

Multimensionale Aggregation 40 Verkäufe nach Produktgruppen und Jahren 1998 1999 2000 Gesamt Weine 15 17 13 45 Biere 10 15 11 36 Gesamt 25 32 24 81 sum()... GROUP BY pg_, year_ sum()... GROUP BY pg_ sum()... GROUP BY year_ sum() Wie viele Queries sind notwendig?

Cube Operator 41 d Dimensionen, jeweils eine Klassifikationsstufe Jede Dimension kann in Gruppierung enthalten sein oder nicht 2 d Gruppierungsmöglichkeiten Herkömmliches SQL Viel Schreibarbeit 2 d Scans der Faktentabelle (wieder keine Optimierung möglich) CUBE Operator Berechnung der Summen von sämtlichen Kombinationen der Argumente (Klassifikationsstufen) Summen werden durch ALL repräsentiert

Einfacher SQL Ansatz 42 Marke Farbe Verkäufe SELECT Marke, Farbe, SUM(Verkäufe) VW Blau 32 FROM AutoTab VW Weiß 17 GROUP BY (Marke, Farbe) VW Rot 5 UNION SELECT Marke, ALL, SUM(Verkäufe) Opel Blau 24 FROM AutoTab Opel Weiß 19 GROUP BY (Marke) Opel Rot 12 UNION VW ALL 54 SELECT ALL, Farbe, SUM(Verkäufe) FROM AutoTab Opel ALL 55 GROUP BY (Farbe) ALL Blau 56 UNION ALL Weiß 36 SELECT ALL, ALL, SUM(Verkäufe) FROM AutoTab; ALL Rot 17 ALL ALL 109 Folie: Mark Liebetrau (HPI)

Ansatz mit CUBE-Operator 43 Neuer Ansatz SELECT Marke, Farbe, SUM(Verkäufe) FROM AutoTab GROUP BY CUBE(Marke, Farbe); Unterschiede in der Syntax: keine UNIONs mehr notwendig einfachere Anfrage Unterschiede in der Semantik: Keine Bisheriger Ansatz SELECT Marke, Farbe, SUM(Verkäufe) FROM AutoTab GROUP BY (Marke, Farbe) UNION SELECT Marke, ALL, SUM(Verkäufe) FROM AutoTab GROUP BY (Marke) UNION SELECT ALL, Farbe, SUM(Verkäufe) FROM AutoTab GROUP BY (Farbe) UNION SELECT ALL, ALL, SUM(Verkäufe) FROM AutoTab; Folie: Mark Liebetrau (HPI)

Ansatz mit CUBE-Operator 44 Ableitbarkeit der Gruppen Beziehung lässt sich mithilfe eines Aggregationsgitters darstellen (X,Y) Gruppierung über X und Y () Marke Farbe Verkäufe VW Blau 32 VW Weiß 17 VW Rot 5 Opel Blau 24 Opel Weiß 19 Opel Rot 12 VW ALL 54 Opel ALL 55 (Marke) (Farbe) ALL Blau 56 (Marke, Farbe) ALL Weiß 36 ALL Rot 17 ALL ALL 109 Folie: Mark Liebetrau (HPI)

Another Lattice 45

Überblick 46 Einsatzgebiete OLAP versus OLTP Multimensionale i l Modellierung OLAP Operationen Relationale Implementierung Neue Architekturen Folie nach: Hasso Plattner, A Common Database Approach for OLTP and OLAP Using an In-Memory Column Database SIGMOD 2009

Row storage 47