Multidimensionales Datenmodell, Anfrageverarbeitung und Anfrageoptimierung

Größe: px
Ab Seite anzeigen:

Download "Multidimensionales Datenmodell, Anfrageverarbeitung und Anfrageoptimierung"

Transkript

1 Multidimensionales Datenmodell, Anfrageverarbeitung und Anfrageoptimierung Grundbegriffe Dimensionen, Fakten/Kennzahlen Eigenschaften von multidimensionalen Anfragen Relationale Umsetzung von Anfragen Star-Joins Optimierungsaspekt Gruppierung und Aggregation Group-By-Erweiterungen Cube-Operator Benutzerdefinierte Aggregatfunktionen Sequenzbasierte Operationen Gruppierung: Implementierung und Optimierung

2 Motivation Datenmodell ausgerichtet auf Unterstützung der Analyse Datenanalyse im Entscheidungsprozess Betriebswirtschaftliche Kennzahlen (Erlöse, Gewinne, Verluste etc.) stehen im Mittelpunkt Betrachtung der Kennzahlen aus unterschiedlichen Perspektiven (zeitlich, regional, produktbezogen) Dimensionen Unterteilung der Auswertedimensionen möglich (Jahr, Quartal, Monat) Hierarchien oder Konsolidierungsebenen Karczewski Data Warehouse Systeme 2

3 Dimensionen beschreiben mögliche Sicht auf die assoziierte Kennzahl endliche Menge von n (n 2) Dimensionselementen (Hierarchieobjekten), die eine semantische Beziehung aufweisen dienen der orthogonalen Strukturierung des Datenraums Beispiele: Produkttypen: Tasse, Service, Haushaltswaren Geografie: Hessen, Bundesrepublik, Europa Zeit: Monat, Quartal, Jahr Karczewski Data Warehouse Systeme 3

4 Hierarchien in Dimensionen Dimensionselemente: Knoten einer Klassifikationshierarchie Klassifikationsstufe beschreibt Verdichtungsgrad Darstellung von Dimensionen über Klassifikationsschema (Schema von Klassifikationshierarchien) Formen einfache Hierarchien parallele Hierarchien Karczewski Data Warehouse Systeme 4

5 Einfache Hierarchien Höhere Hierarchieebene enthält die aggregierten Werte genau einer niedrigeren Hierarchiestufe Oberster Knoten (Top) enthält Verdichtung auf einen einzelnen Wert der Dimension Top Top Produktfamilie Haushaltswaren Europa Erdteil Produktgruppe Service Bundesrepublik Staat Artikel Tasse Hessen Land Karczewski Data Warehouse Systeme 5

6 Parallele Hierarchien Innerhalb einer Dimension sind zwei verschiedene Arten der Gruppierung möglich Keine hierarchische Beziehung in den parallelen Zweigen Parallelhierarchie Pfad im Klassifikationsschema (Konsolidierungspfad) Top Jahr Quartal Woche Monat Karczewski Data Warehouse Systeme 6 Tag

7 Kategorienattribute Inhaltliche Verfeinerung durch unterschiedliche Rollen Primärattribut Kategorienattribut, das alle anderen Attribute einer Dimension bestimmt definiert maximale Feinheit Beispiel: Auftrag Klassifikationsattribut Element der Menge, die mehrstufige Kategorisierung (Klassifikationshierarchie) bilden Beispiel: Kunde, Nation, Kontinent Dimensionales Attribut Element der Menge der Attribute, die vom Primärattribut oder einem Klassifikationsattribut bestimmt werden und nur TopD bestimmen Beispiel: Adresse, Telefon Karczewski Data Warehouse Systeme 7

8 Struktur einer Dimension: Beispiel Top Region Klassifikationsattribute Dimensionsattribute Nation Kunde Adresse Telefon Status Bestellpreis Auftrag Primärattribut Karczewski Data Warehouse Systeme 8

9 Kennzahlen / Fakten Kennzahlen/Fakten: (vedichtete) numerische Messgrößen beschreiben betriebswirtschaftliche Sachverhalte Fakt: Basiskennzahl Kennzahl: aus Fakten konstruiert (abgeleitete Kennzahl) durch Anwendung arithmetischer Operationen Beispiele: Umsatz, Gewinn, Verlust, Deckungsbeitrag Karczewski Data Warehouse Systeme 9

10 Kennzahl: Berechnungsvorschrift Bildung von f(): Skalarfunktionen +, -, *, /, mod Beispiel: Umsatzsteueranteil = Menge * Preis * Steuersatz Aggregatfunktionen Funktion H() zur Verdichtung eines Datenbestandes, indem aus n Einzelwerten ein Aggregatwert ermittelt wird SUM(), AVG(), MIN(), MAX(), COUNT() Ordnungsbasierte Funktionen Definition von Kennzahlen auf Basis zuvor definierter Ordnungen (Bsp.: Kumulation) Karczewski Data Warehouse Systeme 10

11 Logische vs. Physische Operatoren Bereichsanfrage range query Produkt (Artikel) Zeit (Tage) Partielle Bereichsanfrage partial range query Produkt (Artikel) Zeit (Tage) Karczewski Data Warehouse Systeme 11

12 Logische vs. Physische Operatoren Partial-Match-Abfrage Produkt (Artikel) Zeit (Tage) Punktanfrage Produkt (Artikel) Zeit (Tage) Karczewski Data Warehouse Systeme 12

13 Logische vs. Physische Operatoren Zusammengesetzte Anfragebereiche Produkt (Artikel) Zeit (Tage) Unregelmäßige Anfrageform Produkt (Artikel) Zeit (Tage) Karczewski Data Warehouse Systeme 13

14 Star-Join: Beispiel SELECT FROM Geographie.Region, Zeit.Monat, sum(verkaeufe) Verkauf, Zeit, Produkte, Geographie WHERE Verkauf.Produkt_ID = Produkt.Produkt.ID AND Verkauf.Zeit_ID = Zeit.Zeit_ID AND Verkauf.Geographie_ID = Geographie.Geographie_ID AND Produkt.Produktkategorie = Kosmetik AND Geographie.Land = Deutschland AND Zeit.Jahr = 2000 GROUP BY Geographie.Region, Zeit.Monat Karczewski Data Warehouse Systeme 14

15 Star-Join: Aufbau Select-Klausel Kenngrößen (evtl. aggregiert) Ergebnisgranularität (z.b. Monat, Region) From-Klausel Fakten- und Dimensionstabellen Where-Klausel Verbundbedingungen Restriktionen (z.b. Zeit.Jahr = 2000) Karczewski Data Warehouse Systeme 15

16 Star-Join: Optimierung (1) Star-Joins stellen typisches Muster für Data-Warehouse-Anfragen dar Typische Eigenschaften durch das Star-Schema: Sehr große Faktentabelle Deutlich kleinere, unabhängige Dimensionstabellen Klassische relationale Optimierer schlagen fehl, weil sie i.d.r. von gleichmäßigen Verteilungen in den Tabellen ausgehen Karczewski Data Warehouse Systeme 16

17 Star-Join: Optimierung (2) Im Beispiel: Join über Faktentabelle Verkauf und die drei Dimensionstabellen Produkt, Zeit und Geographie: 4-Wege-Join In RDBMS üblicherweise nur paarweiser Join: Sequenz paarweiser Joins notwendig 4! Mögliche Join-Reihenfolgen Heuristik zur Verringerung der zu untersuchenden Möglichkeiten: Joins zwischen Relationen, die nicht durch eine Join-Bedingung in der Anfrage verknüpft sind, werden nicht betrachtet Karczewski Data Warehouse Systeme 17

18 Star-Join: Optimierung (3) Heuristik liefert z.b. folgenden Ausführungsplan: Plan A: σ Produktkategorie= Kosmetik σ Monat= Januar 2000 Produkt Verkauf σ Land= Deutschland Zeit Geographie Karczewski Data Warehouse Systeme 18

19 Star-Join: Optimierung (4) Heuristik liefert z.b. folgenden Ausführungsplan: Plan B: Verkauf σ Land= Deutschland σ Produktkategorie= Kosmetik σ Monat= Januar 2000 Geographie Produkt Zeit Karczewski Data Warehouse Systeme 19

20 Star-Join: Berechnungsbeispiel Annahmen: Tabelle Verkauf: Datensätze 10 Geschäfte in Deutschland (von 100) 20 Verkaufstage im Januar 2000 (von 1000 gespeicherten Tagen) 50 Produkte in Produktkategorie Kosmetik (von 1000) Gleichverteilung/gleiche Selektivität der einzelnen Ausprägungen Plan A: 1. Join: Tupel (Ergebnis) 2. Join: Tupel 3. Join: Tupel Plan B: 1. Kreuzprodukt 200 Tupel 2. Kreuzprodukt Tupel Join: Tupel Karczewski Data Warehouse Systeme 20

21 Gruppierung und Aggregation Datenanalyse: Aggregation mehrdimensionaler Daten Aggregatfunktion: Standard: SUM, MIN, MAX, COUNT Erweiterungen: statistische, physikalische und Finanzfunktion Benutzerdefinierte Aggregatfunktionen Gruppierung: Ergebnis: Tabelle mit Aggregatwerten indiziert durch Menge von Attributen Karczewski Data Warehouse Systeme 21

22 Gruppierung und Aggregation SQL: GROUP BY attr-liste [ HAVING bedingung ] Gruppierung bzgl. gleicher Werte der Gruppierungsattribute Abschließende Projektion nur über Gruppierungsattribute oder Aggregationen Einschränkungen Berechnung von Histogrammen: Aggregationen über berechnete Kategorien Berechnung von Zwischen- und Gesamtsummen Berechnung von Kreuztabellen Karczewski Data Warehouse Systeme 22

23 Berechnung von Zwischen- und Gesamtsummen PRODUKT JAHR REGION VERKÄUFE VERKÄUFE VERKÄUFE Produkt Jahr Region Produkt Jahr Produkt Sonnenschutz 1999 Hessen 135 Thüringen Hessen 140 Thüringen Karczewski Data Warehouse Systeme 23

24 Berechnung von Zwischen- und Gesamtsummen PRODUKT JAHR REGION VERKÄUFE Sonnenschutz 1999 Hessen 135 Sonnenschutz 1999 Thüringen 120 Sonnenschutz 1999 NULL 255 Sonnenschutz 2000 Hessen 140 Sonnenschutz 2000 Thüringen 135 Sonnenschutz 2000 NULL 275 Sonnenschutz NULL NULL 530 Karczewski Data Warehouse Systeme 24

25 Berechnung von Zwischen- und Gesamtsummen: SQL-Anfrage SELECT Produkt, NULL, NULL, SUM(Verkäufe) UNION FROM Verkauf WHERE Produkt = Sonnenschutz GROUP BY Produkt SELECT Produkt, Jahr, NULL, SUM(Verkäufe) UNION FROM Verkauf WHERE Produkt = Sonnenschutz GROUP BY Produkt, Jahr SELECT Produkt, Jahr, Region, SUM(Verkäufe) FROM Verkauf WHERE Produkt = Sonnenschutz GROUP BY Produkt, Jahr, Region; Karczewski Data Warehouse Systeme 25

26 Berechnung von Zwischen- und Gesamtsummen Nachteil von Variante mit UNION Hoher Aufwand: Berechnung aller Teilsummen für N Gruppierungsattribute erfordert 2 N Teilanfragen Eventuelle Vebundoperationen müssen mehrfach wiederholt werden Aufwändige Formulierung: Eventuell jedoch Generierung durch OLAP-Werkzeuge Karczewski Data Warehouse Systeme 26

27 Berechnung von Kreuztabellen Symmetrische Aggregation Pivottabellen (MS Access: Transform-Pivot) Sonnenschutz TOTAL Hessen Thüringen TOTAL Karczewski Data Warehouse Systeme 27

28 Cube-Operator Kurzform für Anfragemuster zur Berechnung von Teil- und Gesamtsummen Generierung aller möglichen Gruppierungskombinationen aus einer gegebenen Menge von Gruppierungsattributen Ergebnis: Tabelle mit aggregierten Werten NULL, NULL,, NULL, SUM( ) Jeweils einmal NULL weniger Am Ende ohne NULL Karczewski Data Warehouse Systeme 28

29 Cube-Operator: SQL-Syntax Implementierung in Oracle (ab Version 8i) Syntax: SELECT Produktgruppe, Region, Jahr, SUM(Verkäufe) FROM Verkauf GROUP BY CUBE (Produktgruppe, Region, Jahr) Funktion grouping(attribut) Liefert Wert=1, wenn über Attribut aggregiert wurde Liefert Wert=0, wenn über Attribut gruppiert wurde Dient der Unterdrückung von Teilsummen Bsp.: having not (grouping(produktgruppe)=1 Karczewski Data Warehouse Systeme 29

30 Rollup-Operator Cube-Operator ist interdimensional Anwendbar für Attribute aus unterschiedlichen Dimensionen Ist für Roll-Up oder Drill-Down-Operationen zu aufwendig Rollup-Operator ist intradimensional Generierung der Attributkombinationen (A1,, An), (A1,, An-1),, (A1, A2), (A1), ( ) für gegebene Attributliste A1,, An Karczewski Data Warehouse Systeme 30

31 Rollup-Operator: Beispiel Anfrage: SELECT Prodkategorie, Prodfamilie, Land, Region, sum(verkäufe) FROM GROUP BY ROLLUP (Produkategorie, Prodfamilie), Auswertung: ROLLUP (Land, Region) 1. Rollup: (Prodkategorie, Prodfamilie), (Prodkategorie), ( ) 2. Rollup: (Land, Region), (Land), ( ) Kreuzprodukt beider Kombinationen Karczewski Data Warehouse Systeme 31

32 Rollup-Operator: Beispiel Prodkategorie Prodfamilie Land Region Verkäufe Elektronik Video D Europa 102 Elektronik Audio D Europa 98 Elektronik NULL D Europa 200 Elektronik Video D NULL 541 Elektronik Audio D NULL 326 Elektronik NULL D NULL 867 Karczewski Data Warehouse Systeme 32

33 Cube- vs. Rollup-Operator Cube-Operator: generiert alle Kombinationen: z.b. für 4 Gruppierungsattribute: 16 Kombinationen Rollup-Operator: generiert nur Kombinationen mit sogenannten Superaggregaten: (f1, f2,, NULL) (f1, NULL,, NULL) (NULL, NULL,, NULL) Karczewski Data Warehouse Systeme 33

34 Grouping Sets Standard in SQL99 GROUP BY GROUPING SETS (gruppierung) Gruppierung: Einfache Gruppierungskombinatioen, z.b. (Land, Region) Komplexe Gruppierungsbedingung mit Cube oder Rollup Karczewski Data Warehouse Systeme 34

35 Grouping Sets: Beispiel Anfrage: GROUP BY ROLLUP (Prodkategorie, Prodfamilie), (1) GROUPING SETS ((Stadt), (Region)), (2) GROUPING SETS (ROLLUP (Jahr, Quartal, Monat), (Woche)) (3) Bedeutung: (1) entlang der Klassifikationshierarchie (2) nur für Städte und Regionen (3) Nutzung der Parallelhierarchien Jahr Quartal Monat bzw. Woche Karczewski Data Warehouse Systeme 35

36 Grouping Sets: Semantik Fall 1: GROUP BY A, B GROUP BY GROUPING SETS ((A, B)) (A, B) Fall 2: GROUP BY GROUPING SETS ((A, B), (A, C), (A)) GROUP BY A, GROUPING SETS ((B), (C), ( )) (A) x (B), (C), () (A, B), (A, C), (A) Karczewski Data Warehouse Systeme 36

37 Grouping Sets: Semantik Fall 3: GROUP BY GROUPING SETS ((A, B), (B, C)), GROUPING SETS ((D, E), (D), ( )) (A, B), (B, C) x (D, E), (D), ( ) (A, B, D, E), (A, B, D), (A, B), (B, C, D, E), (B, C, D), (B, C) Karczewski Data Warehouse Systeme 37

38 Sequenzbasierte Operationen SQL:1999 Erweiterung um OLAP-Funktionen zur attribut- und sequenzbasierten Auswertung Attribut- und tupelbasierte Aggregation Umsetzung existiert u.a. ab Oracle 9i bzw. DB2 V7.2 Unterstützte Anfragetypen Ratio-To-Total Laufende Summen (Kumulation) Gleitender Durchschnitt Ranking-Analyse Karczewski Data Warehouse Systeme 38

39 OLAP-Funktionen: Syntax Allgemein: FUNKTION (arg) OVER (Partitionierungsklausel, Ordnungsklausel, Fenster) Partitionierung für jedes Attribut des Ergebnisses ohne Verdichtung: jeder Eingangswert liefert Ergebniswert optional Ordnung innerhalb einer Partition optional Festlegung des Aggregationsfensters optional nur in Verbindung mit Ordnungsklausel Karczewski Data Warehouse Systeme 39

40 OLAP-Funktionen: Motivation Ratio-To-Total-Analyse Berechnung des täglichen Anteils an Gesamtstückzahlen Schemabeispiel aus der Übung: Produkt (Produktreihe, Produkttyp, Produktname, Produktnummer) Umsatz (Bestelldatum, Produktnummer,...,Umsatz) Ratio-To-Total- mit SQL (ohne OLAP-Funktion): SELECT bestelldatum, umsatz AS t_umsatz, g_umsatz, 100.0*umsatz/g_umsatz AS a_umsatz FROM produkt p, umsatz u, (SELECT SUM (umsatz) as g_umsatz FROM umsatz WHERE to_char(bestelldatum,'mm')=11) WHERE p.produktnummer=u.produktnummer AND to_char(bestelldatum,'mm')=11; Karczewski Data Warehouse Systeme 40

41 OLAP-Funktionen: Bsp. Ergebnis BESTELLDATUM T_UMSATZ G_UMSATZ A_UMSATZ , , , , , , , , , , , , , , ,82 T: Teil G: Gesamt A: Anteil in % Karczewski Data Warehouse Systeme 41

42 OLAP-Funktionen: Anwendung Anfrage SELECT bestelldatum, umsatz AS t_umsatz, SUM (umsatz) OVER () AS g_umsatz, 100.0*umsatz / SUM (umsatz) OVER () AS a_umsatz FROM produkt p, umsatz u WHERE p.produktnummer=u.produktnummer AND to_char(bestelldatum,'mm')=11; Ergebnis identisch OLAP-Funktion SUM (umsatz) OVER() Aggregation über gesamten Eingangsbereich Partition für Aggregation wird lokal für jeden Eintrag generiert Karczewski Data Warehouse Systeme 42

43 Attributlokale Partitionierung Partitionierung des Eingabestroms einer OLAP-Funktion (ähnlich Gruppierung) Aber: Partitionierung erfolgt pro Attribut/Anweisung der Aggregatoperation. Dies ermöglich Nachgruppierung. Beispiel: Ermittlung der Anteile der Tageszahlen im Vergleich zu Monatszahlen SELECT bestelldatum, umsatz, SUM (umsatz) OVER (PARTITION BY bestelldatum) AStagesumsatz, 100.0*umsatz / SUM (umsatz) OVER (PARTITION BY bestelldatum) AS a_tagesumsatz FROM produkt p, umsatz u WHERE p.produktnummer=u.produktnummer AND (to_char(bestelldatum,'mm')=3) ORDER BY bestelldatum; Karczewski Data Warehouse Systeme 43

44 Attributlokale Partitionierung (tagesweise) BESTELLDATUM UMSATZ TAGESUMSATZ A_TAGESUMSATZ , , , ,71 A: Anteil in % , , , , , , ,00 Karczewski Data Warehouse Systeme 44

45 Attributlokale Partitionierung (jahresweise) SELECT bestelldatum, umsatz, SUM (umsatz) OVER (PARTITION BY extract (YEAR FROM bestelldatum)) AS jahresumsatz, 100.0*umsatz / SUM (umsatz) OVER (PARTITION BY extract (YEAR FROM bestelldatum)) AS a_jahresumsatz FROM produkt p, umsatz u WHERE p.produktnummer=u.produktnummer AND (to_char(bestelldatum,'mm')=11) ORDER BY bestelldatum; Karczewski Data Warehouse Systeme 45

46 Sequenzorientierte Analyse (jahresweise) BESTELLDATUM UMSATZ JAHRESUMSATZ A_JAHRESUMSATZ , , , , , , , , , , , , , , ,53 A: Anteil in % Karczewski Data Warehouse Systeme 46

47 Attributlokale Partitionierung Prinzip: SUM (umsatz) OVER (PARTITION BY bestelldatum) Partitionierungsschema Keine Konflikte durch unterschiedliche Partitionierungsschemata innerhalb einer Anfrage Jeweils alle Einträge einer Partition werden in die Berechnung einbezogen. Karczewski Data Warehouse Systeme 47

48 Sequenzorientierte Analyse Spezifikation einer attributlokalen Ordnung für Partitionen Anwendung: laufende Summe, gleitender Durchschnitt usw. Beispiel: kumulative Liefermengen über Gesamtzeitraum und pro Jahr SELECT bestelldatum, umsatz, SUM (umsatz) OVER (ORDER BY bestelldatum) as sum_gesamt, SUM (umsatz) OVER (PARTITION BY extract (YEAR FROM bestelldatum) ORDER BY bestelldatum) AS sum_jahr FROM produkt p, umsatz u WHERE p.produktnummer=u.produktnummer AND (to_char(bestelldatum,'mm')=3) ORDER BY bestelldatum; Karczewski Data Warehouse Systeme 48

49 Sequenzorientierte Analyse BESTELLDATUM UMSATZ SUM_GESAMT SUM_JAHR Pro Tag wird kumuliert, wobei SUM_GESAMT unabhängig vom Jahr vorgeht, SUM_JAHR pro Jahr neu beginnt Karczewski Data Warehouse Systeme 49

50 Sequenzorientierte Analyse Prinzip: Anzahl der Tupel, die in ein Ergebnistupel eingehen, entspricht der Position des Tupels bzgl. gegebener Ordnung Eingangstupel ti, Ergebnistupel si t1 SUM({t1}) s1 t2 SUM({t1, t2}) s2 t3 SUM({t1, t2, t3}) s3 Schrittweise Vergrößerung des Analysefensters Karczewski Data Warehouse Systeme 50

51 Nutzung für Ranking-Analyse Funktionen RANK(): liefert Rang eines Tupels bzgl. vorgegebener Ordnung innerhalb der Partition DENSERANK(): wie RANK(), jedoch ohne Lücken Beispiel A: Ranking nach Umsatz SELECT bestelldatum, umsatz, RANK() OVER (ORDER BY umsatz) AS rang FROM produkt p, umsatz u WHERE p.produktnummer=u.produktnummer; Beispiel B: Ranking nach Umsatz und Datum SELECT bestelldatum, umsatz, RANK() OVER (ORDER BY umsatz, bestelldatum) AS rang FROM produkt p, umsatz u WHERE p.produktnummer=u.produktnummer; Karczewski Data Warehouse Systeme 51

52 Ranking-Analyse (Beispiel) A: BESTELLDATUM UMSATZ RANG B: BESTELLDATUM UMSATZ RANG Karczewski Data Warehouse Systeme 52

53 Ranking-Analyse (Beispiel) Beschränkung auf Hitlisten Beispiel: Top10 der Tage mit dem höchsten Volumen pro Jahr Anfrage: SELECT AUF.bestelldatum, AUF.topMonat FROM (select bestelldatum, RANK() OVER(PARTITION BY extract(year from bestelldatum) ORDER BY umsatz DESC) AStopMonat FROM umsatz u, produkt p WHERE u.produktnummer=p.produktnummer AND extract(year from bestelldatum) = 2001) AUF WHERE AUF.topMonat <= 10 ORDER BY AUF.topMonat DESC; Karczewski Data Warehouse Systeme 53

54 Ranking-Analyse (Beispiel) BESTELLDATUM TOPMONAT Karczewski Data Warehouse Systeme 54

55 Bildung dynamischer Fenster Bisher: nur wachsende Fenstergröße für die Partition Jetzt: explizite Angaben des Fensters ROWS: Anzahl der Tupel RANGE: Anzahl der wertmäßig verschiedenen Tupel Anwendung: gleitender Durchschnitt Karczewski Data Warehouse Systeme 55

56 Bildung dynamischer Fenster Ausgehend von definiertem Startpunkt bis zum aktuellen Tupel UNBOUNDED PRECEDING: erstes Tupel der jeweiligen Partition n PRECEDING: n-ter Vorgänger relativ zur aktuellen Position CURRENT ROW: aktuelles Tupel (nur mit RANGE und Duplikaten sinnvoll) Karczewski Data Warehouse Systeme 56

57 Bildung dynamischer Fenster Angabe der unteren und oberen Schranken: BETWEEN <untere Grenze> AND <obere Grenze> Spezifikation der Grenzen UNBOUNDED PRECEDING UNBOUNDED FOLLOWING n PRECEDING n FOLLOWING CURRENT ROW <obere Grenze> muss höhere Position als <untere Grenze> spezifizieren Karczewski Data Warehouse Systeme 57

58 Bildung dynamischer Fenster: Beispiel Gleitender Durchschnitt SELECT bestelldatum, umsatz, AVG (umsatz) OVER(PARTITION BY extract(year from bestelldatum) ORDER BY bestelldatum ROWS BETWEEN 3 PRECEDING AND 3 FOLLOWING) as Durch3Tage FROM umsatz u, produkt p WHERE u.produktnummer=p.produktnummer AND extract(month from bestelldatum)=8; Karczewski Data Warehouse Systeme 58

59 Bildung dynamischer Fenster: Beispiel Gleitender Durchschnitt mit 3-Tages-Fenster auf Jahresebene BESTELLDATUM UMSATZ DURCH3TAGE , , , , , , , , , , , , ,71 ( ) / 7 = 74,57 Karczewski Data Warehouse Systeme 59

60 Gruppierung: Optimierungsaspekte Berücksichtigung der Gruppierungs-/Aggregationsoperationen im Rahmen der Optimierung Logische/Algebraische Optimierung: Push-down von Gruppierungen Reduzierung der Kardinalität der Zwischenergebnisse Invariantes Gruppieren Frühzeitiges Vorgruppieren Physische/Interne Optimierung: Spezielle Implementierungen für GROUP BY CUBE, sowie OLAP-Funktionen Karczewski Data Warehouse Systeme 60

Data-Warehouse-Technologien

Data-Warehouse-Technologien Data-Warehouse-Technologien Prof. Dr.-Ing. Kai-Uwe Sattler 1 Prof. Dr. Gunter Saake 2 Dr. Veit Köppen 2 1 TU Ilmenau FG Datenbanken & Informationssysteme 2 Universität Magdeburg Institut für Technische

Mehr

Vorlesung Datenbankmanagementsysteme

Vorlesung Datenbankmanagementsysteme Vorlesung Datenbankmanagementsysteme SQL zur Datenanalyse & Einführung Online Analytical Processing (OLAP) (auf Basis von Oracle) Vorlesung Datenbankmanagementsysteme SQL zur Datenanalyse M. Lange, S.

Mehr

Datenbankprogrammierung

Datenbankprogrammierung Datenbankprogrammierung Arbeiten mit DB2 Server DB2- Befehlszeilenprozessor ausführen SQL-Skript-Datei bearbeiten Editor SSH Client Linux SSH-Konsole für Befehlszeilenproz. (ssh) X-Weiterleitung für Editor

Mehr

27 Transact-SQL-Erweiterungen in Bezug auf Analysis Services

27 Transact-SQL-Erweiterungen in Bezug auf Analysis Services 531 27 Transact-SQL-Erweiterungen in Bezug auf Analysis Services Im zweiten Teil dieses Buches haben wir die Eigenschaften der Transact-SQL- Sprache in Bezug auf die Bearbeitung von operativen Daten gezeigt.

Mehr

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung

Mehr

SQL. strukturierte Datenbankabfragesprache eine Datenbanksprache zur. Structured Query Language:

SQL. strukturierte Datenbankabfragesprache eine Datenbanksprache zur. Structured Query Language: SQL Structured Query Language: strukturierte Datenbankabfragesprache eine Datenbanksprache zur Definition, Abfrage und Manipulation von Daten in relationalen Datenbanken In der SQL-Ansicht arbeiten In

Mehr

Einführung in Data Warehouses

Einführung in Data Warehouses Kapitel l6 Einführung in Data Warehouses Vorlesung: Dr. Matthias Schubert Skript 2009 Matthias Schubert Dieses Skript basiert auf dem Skript zur Vorlesung Datenbanksysteme II von Prof. Dr. Christian Böhm

Mehr

Datenbanktechnologie für Data-Warehouse-Systeme

Datenbanktechnologie für Data-Warehouse-Systeme Wolfgang Lehner Datenbanktechnologie für Data-Warehouse-Systeme Konzepte und Methoden dpunkt.verlag 1 1.1 1.2 1.3 1.4 1. 5 2 2.1 2.2 2.3 Einleitung 1 Betriebswirtschaftlicher Ursprung des Data Warehousing...

Mehr

Kapitel 3: Datenbanksysteme

Kapitel 3: Datenbanksysteme LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Skript zur Vorlesung: Einführung in die Informatik: Systeme und Anwendungen Sommersemester 2015 Kapitel 3: Datenbanksysteme Vorlesung:

Mehr

Themenblock: Erstellung eines Cube

Themenblock: Erstellung eines Cube Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen

Mehr

Das Multidimensionale Datenmodell

Das Multidimensionale Datenmodell Das Multidimensionale Datenmodell Konzeptuelle Modellierung Umsetzung des Modells Beispiel ER-Modell 2 / 36 Probleme ER-Modellierung Keine Unterscheidung Klassifikation, Attribute, Kenngrößen Dimension

Mehr

Anfragen an multidimensionale Daten

Anfragen an multidimensionale Daten Anfragen an multidimensionale Daten Seminar: Data Warehousing im Sommersemester 2005 Lehrstuhl für Datenbanken und Informationssysteme Betreuer: David Wiese 20. Juni 2005 Inhaltsverzeichnis 1. Einleitung...

Mehr

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem. Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen

Mehr

bersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter

bersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter bersicht Niels Schršter EinfŸhrung GROUP BY Roll UpÔs Kreuztabellen Cubes Datenbank Ansammlung von Tabellen, die einen ãausschnitt der WeltÒ fÿr eine Benutzergruppe beschreiben. Sie beschreiben die funktionalen

Mehr

Datenbanksysteme 2 Frühjahr-/Sommersemester 2014 28. Mai 2014

Datenbanksysteme 2 Frühjahr-/Sommersemester 2014 28. Mai 2014 Lehrstuhl für Praktische Informatik III Prof. Dr. Guido Moerkotte Email: moer@db.informatik.uni-mannheim.de Marius Eich Email: marius.eich@uni-mannheim.de Datenbanksysteme 2 8. Übungsblatt Frühjahr-/Sommersemester

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Sprachen für OLAP Operationen Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung OLAP Operationen MDX: Multidimensional Expressions SQL Erweiterungen

Mehr

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining 2 Eigenschaften eines Data Warehouse Referenzarchitektur Integrierte Sicht auf beliebige Daten aus verschieden Datenbanken

Mehr

Aufbau des SELECT-Befehls. Im Folgenden werden zunächst Abfragen aus einer Tabelle vorgenommen.

Aufbau des SELECT-Befehls. Im Folgenden werden zunächst Abfragen aus einer Tabelle vorgenommen. Datenbankabfragen (Query) mit SQL (Structured Query Language) 1 Aufbau des SELECT-Befehls Im Folgenden werden zunächst Abfragen aus einer Tabelle vorgenommen. SQL-Syntax: SELECT spaltenliste FROM tabellenname

Mehr

Fachbereich Informatik Praktikum 1

Fachbereich Informatik Praktikum 1 Hochschule Darmstadt DATA WAREHOUSE SS2015 Fachbereich Informatik Praktikum 1 Prof. Dr. S. Karczewski Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 14.April.2015 1. Kurzbeschreibung In diesem Praktikum geht

Mehr

Einführung in SQL. Sprachumfang: Indizes. Datensätzen. Zugriffsrechten

Einführung in SQL. Sprachumfang: Indizes. Datensätzen. Zugriffsrechten Einführung in SQL Die Sprache SQL (Structured Query Language) ist eine Programmiersprache für relationale Datenbanksysteme, die auf dem ANSI-SQL-Standard beruht. SQL wird heute von fast jedem Datenbanksystem

Mehr

Multidimensionales Datenmodell, Cognos

Multidimensionales Datenmodell, Cognos Data Warehousing (II): Multidimensionales Datenmodell, Cognos Praktikum: Data Warehousing und Mining Praktikum Data Warehousing und Mining, Sommersemester 2010 Vereinfachte Sicht auf die Referenzarchitektur

Mehr

Inhaltsverzeichnis. jetzt lerne ich

Inhaltsverzeichnis. jetzt lerne ich Inhaltsverzeichnis jetzt lerne ich Einführung 15 1 Erste Schritte 21 1.1 Datenbanken und Datenbank-Managementsysteme 21 1.2 Zugriff auf Datenbanken 22 1.3 Was der Großvater noch wusste... 22 1.4 Einordnung

Mehr

Data Warehouse Technologien

Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............

Mehr

Data Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de

Data Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de Data Warehouses Sommersemester 2011 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen Data Warehouse Architektur Data-Warehouse-System Teilsichten

Mehr

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...

Mehr

Themenblock: Data Warehousing (I)

Themenblock: Data Warehousing (I) Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining Agenda Einführung Data Warehouses Online Transactional Processing (OLTP) Datenmanipulation mit SQL Anfragen mit SQL Online

Mehr

Universität Augsburg, Institut für Informatik WS 2006/2007 Dr. W.-T. Balke 27. Nov. 2006 M. Endres, A. Huhn, T. Preisinger Lösungsblatt 5

Universität Augsburg, Institut für Informatik WS 2006/2007 Dr. W.-T. Balke 27. Nov. 2006 M. Endres, A. Huhn, T. Preisinger Lösungsblatt 5 Universität Augsburg, Institut für Informatik WS 2006/2007 Dr. W.-T. Balke 27. Nov. 2006 M. Endres, A. Huhn, T. Preisinger Lösungsblatt 5 Aufgabe 1: Projektion Datenbanksysteme I π A1,...,A n (π B1,...,B

Mehr

SQL Intensivpraktikum SS 2008

SQL Intensivpraktikum SS 2008 SQL Intensivpraktikum SS 2008 Aggregation von Daten Arbeit mit Gruppen SQL1 basierend auf OAI-Kurs Copyright Oracle Corporation, 1998. All rights reserved. Gruppenfunktionen Gruppenfunktionen verarbeiten

Mehr

Die bisher bereits bekannten Aggregatsfunktionen MIN, MAX, SUM, AVG, COUNT, VARIANCE und STDDEV wurden um FIRST und LAST erweitert.

Die bisher bereits bekannten Aggregatsfunktionen MIN, MAX, SUM, AVG, COUNT, VARIANCE und STDDEV wurden um FIRST und LAST erweitert. Betrifft Autor FIRST, LAST Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Quelle Aus dem NF9i-Kurs, NF9i-Techno-Circle der Trivadis und Oracle9i Data Warehousing

Mehr

Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen

Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen (Folien von A. Kemper zum Buch 'Datenbanksysteme') Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP

Mehr

SQL für Trolle. mag.e. Dienstag, 10.2.2009. Qt-Seminar

SQL für Trolle. mag.e. Dienstag, 10.2.2009. Qt-Seminar Qt-Seminar Dienstag, 10.2.2009 SQL ist......die Abkürzung für Structured Query Language (früher sequel für Structured English Query Language )...ein ISO und ANSI Standard (aktuell SQL:2008)...eine Befehls-

Mehr

Mengenvergleiche: Alle Konten außer das, mit dem größten Saldo.

Mengenvergleiche: Alle Konten außer das, mit dem größten Saldo. Mengenvergleiche: Mehr Möglichkeiten als der in-operator bietet der θany und der θall-operator, also der Vergleich mit irgendeinem oder jedem Tupel der Unteranfrage. Alle Konten außer das, mit dem größten

Mehr

Eine völlig andere Form Abfragen zu erstellen ist, sie mit Hilfe der Datenbankabfragesprache SQL zu gestalten.

Eine völlig andere Form Abfragen zu erstellen ist, sie mit Hilfe der Datenbankabfragesprache SQL zu gestalten. Einführung SQL 2010 Niko Becker Mit unseren Übungen zu ACCESS können Sie Aufbau und Struktur einer relationalen Datenbank kennenlernen. Wir zeigen Ihnen wie Sie Tabellen, Formulare und Berichte erstellen

Mehr

3. Mehrdimensionale Datenmodellierung. Cb Cube-Operator, Rollup-Operator, Grouping Sets SS08, Prof. Dr. E. Rahm 3-1 y yy

3. Mehrdimensionale Datenmodellierung. Cb Cube-Operator, Rollup-Operator, Grouping Sets SS08, Prof. Dr. E. Rahm 3-1 y yy 3. Mehrdimensionale Datenmodellierung und Operationen Grundlagen Kennzahlen, e, Dimensionen, esoe,cube Cuboide / Aggregationsgitter hierarchische Dimensionen / Konzepthierarchien Cube-Operationen Multi-dimensionale

Mehr

Aufgabe 1: [Logische Modellierung]

Aufgabe 1: [Logische Modellierung] Aufgabe 1: [Logische Modellierung] a) Entwerfen Sie für das von Ihnen entworfene Modell aus Aufgabe 2 des 1. Übungsblattes ein Star-Schema. b) Entwerfen Sie für das vorangegangene Modell einen Teil eines

Mehr

Analytische Funktionen erfolgreich eingesetzt

Analytische Funktionen erfolgreich eingesetzt Analytische Funktionen erfolgreich eingesetzt Dani Schnider Trivadis AG Glattbrugg, Schweiz Schlüsselworte: Analytische Funktionen, SQL, Performance Optimierung, Data Warehousing Zusammenfassung Analytische

Mehr

SQL SQL. SQL = Structured Query Language (SEQUEL) IBM San Jose Research Laboratory SYSTEM R. Grundlagen der Datenbanksysteme I

SQL SQL. SQL = Structured Query Language (SEQUEL) IBM San Jose Research Laboratory SYSTEM R. Grundlagen der Datenbanksysteme I SQL SQL = Structured Query Language (SEQUEL) IBM San Jose Research Laboratory SYSTEM R VII-1 Beispielrelationen Filiale ( Name Leiter Stadt Einlagen ) Konto ( KontoNr KundenNr FilialName Saldo ) Kredit

Mehr

Multidimensionales Datenmodell

Multidimensionales Datenmodell Multidimensionales Datenmodell Grundbegriffe fi Fakten, Dimensionen, Würfel Analyseoperationen fi Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung fi ME/R, ADAPT Relationale

Mehr

Einführung in SQL. 1. Grundlagen SQL. Structured Query Language. Viele Dialekte. Unterteilung: i. DDL (Data Definition Language)

Einführung in SQL. 1. Grundlagen SQL. Structured Query Language. Viele Dialekte. Unterteilung: i. DDL (Data Definition Language) Einführung in SQL 1. Grundlagen Structured Query Language Viele Dialekte Unterteilung: i. DDL (Data Definition Language) ii. iii. DML (Data Modifing Language) DRL (Data Retrival Language) 1/12 2. DDL Data

Mehr

SQL. Abfragesprache Datenmanipulation - DML

SQL. Abfragesprache Datenmanipulation - DML SQL Abfragesprache Datenmanipulation - DML SQL DML-Operationen DML = Data Manipulation Language Sprache zur Veränderung der Daten Operationen Daten selektieren Daten einfügen Daten ändern Daten löschen

Mehr

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse

Mehr

Einleitung. ROLLUP, CUBE und GROUPING. Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002)

Einleitung. ROLLUP, CUBE und GROUPING. Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Betrifft Autör: GROUPING_ID Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Quelle Aus dem Oracle9i Data Warehousing Guide und den Kursen New Features Oracle9i

Mehr

Frühjahrsemester 2010. Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil

Frühjahrsemester 2010. Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil Frühjahrsemester Data Warehousing Kapitel 5: Data Warehousing H. Schuldt Wiederholung aus Kapitel 5. Einführung Tresgros Tresgros Tresgros Filiale Muttenz Filiale Allschwil Filiale Liestal Anfragen: Welches

Mehr

Datenbankanfragen und -operationen mittels SQL

Datenbankanfragen und -operationen mittels SQL Datenbankanfragen und -operationen mittels SQL Über den verschiedenen Tabellen einer Datenbank werden Operationen ausgeführt, die immer wieder eine Tabelle als Ergebnis zurückgeben. Mathematisch modelliert

Mehr

Fortgeschrittene OLAP Analysemodelle

Fortgeschrittene OLAP Analysemodelle Fortgeschrittene OLAP Analysemodelle Jens Kübler Imperfektion und erweiterte Konzepte im Data Warehousing 2 Grundlagen - Datenanalyse Systemmodell Datenmodell Eingaben System Schätzer Datentypen Datenoperationen

Mehr

Kapitel 6 Einführung in Data Warehouses

Kapitel 6 Einführung in Data Warehouses Kapitel 6 Einführung in Data Warehouses Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2008, LMU München 2008 Dr. Peer Kröger Dieses Skript basiert zu einem Teil auf dem Skript zur Vorlesung

Mehr

ACCESS SQL ACCESS SQL

ACCESS SQL ACCESS SQL ACCESS SQL Datenbankabfragen mit der Query-Language ACCESS SQL Datenbankpraxis mit Access 34 Was ist SQL Structured Query Language Bestehend aus Datendefinitionssprache (DDL) Datenmanipulationssprache

Mehr

Data Warehousing. Ausführung von OLAP Operationen. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Ausführung von OLAP Operationen. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Ausführung von OLAP Operationen Ulf Leser Wissensmanagement in der Bioinformatik Variante 1 - Snowflake Year id year Productgroup id pg_name Month Id Month year_id Day Id day month_id

Mehr

ISU 1. Ue_08/02_Datenbanken/SQL. 08 Datenbanken. Übung. SQL Einführung. Eckbert Jankowski. www.iit.tu-cottbus.de

ISU 1. Ue_08/02_Datenbanken/SQL. 08 Datenbanken. Übung. SQL Einführung. Eckbert Jankowski. www.iit.tu-cottbus.de 08 Datenbanken Übung SQL Einführung Eckbert Jankowski www.iit.tu-cottbus.de Datenmodell (Wiederholung, Zusammenfassung) Objekte und deren Eigenschaften definieren Beziehungen zwischen den Objekten erkennen/definieren

Mehr

Kap. 6 Data Warehouse

Kap. 6 Data Warehouse 1 Kap. 6 Data Warehouse 6.1 Was ist ein Data Warehouse, Motivation? 6.2 Data Cube und Cube-Operationen 6.3 Workshop: MS SQL Server, Cube Operationen 6.4 Physischer Entwurf, Implementierung von Cubes 6.5

Mehr

Teil 7: Data Warehouses und neuere SQL-Konstrukte

Teil 7: Data Warehouses und neuere SQL-Konstrukte 7. Data Warehouses und neuere SQL-Konstrukte 7-1 Teil 7: Data Warehouses und neuere SQL-Konstrukte Literatur: Kemper/Eickler: Datenbanksysteme, 7. Aufl., Kap. 17, Oldenbourg, 2009. Elmasri/Navathe: Fundamentals

Mehr

Oracle OLAP 11g: Performance für das Oracle Data Warehouse

Oracle OLAP 11g: Performance für das Oracle Data Warehouse Oracle OLAP 11g: Performance für das Oracle Data Warehouse Marc Bastien Oracle BI Presales Agenda Performanceprobleme in Oracle DWH: gibt s das überhaupt? Mögliche Gründe und Lösungen

Mehr

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Michael Hahne T&I GmbH Workshop MSS-2000 Bochum, 24. März 2000 Folie 1 Worum es geht...

Mehr

Frühjahrsemester 2011. Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil

Frühjahrsemester 2011. Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil Frühjahrsemester Data Warehousing Kapitel 5: Data Warehousing H. Schuldt Wiederholung aus Kapitel 5. Einführung Tresgros Tresgros Tresgros Filiale Muttenz Filiale Allschwil Filiale Liestal Anfragen: Welches

Mehr

Teil 7: Data Warehouses und neuere SQL-Konstrukte

Teil 7: Data Warehouses und neuere SQL-Konstrukte 7. Data Warehouses und neuere SQL-Konstrukte 7-1 Teil 7: Data Warehouses und neuere SQL-Konstrukte Literatur: Kemper/Eickler: Datenbanksysteme, 7. Aufl., Kap. 17, Oldenbourg, 2009. Elmasri/Navathe: Fundamentals

Mehr

Data Warehousing. Weitere Buzzwörter: OLAP, Decision Support, Data Mining

Data Warehousing. Weitere Buzzwörter: OLAP, Decision Support, Data Mining Data Warehousing Weitere Buzzwörter: OLAP, Decision Support, Data Mining Wichtige Hinweise Zu diesem Thema gibt es eine Spezialvorlesung im Sommersemester Hier nur grober Überblick über Idee und einige

Mehr

Business Intelligence Praktikum 1

Business Intelligence Praktikum 1 Hochschule Darmstadt Business Intelligence SS 2014 Fachbereich Informatik Praktikumsversuch 1 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 07.05.2014 Business Intelligence Praktikum

Mehr

Anfrageoptimierung in Data Warehouses durch Verwendung voraggregierter Views

Anfrageoptimierung in Data Warehouses durch Verwendung voraggregierter Views Anfrageoptimierung in Data Warehouses durch Verwendung voraggregierter Views Diplomarbeit Fakultät für Informatik und Elektrotechnik Lehrstuhl Datenbanken und Informationssysteme Universität Rostock Vorgelegt

Mehr

Pivotieren. Themenblock: Anfragen auf dem Cube. Roll-up und Drill-down. Slicing und Dicing. Praktikum: Data Warehousing und Data Mining. Produkt.

Pivotieren. Themenblock: Anfragen auf dem Cube. Roll-up und Drill-down. Slicing und Dicing. Praktikum: Data Warehousing und Data Mining. Produkt. Zeit Pivotieren Themenblock: Anfragen auf dem Cube Praktikum: Data Warehousing und Data Mining Zeit Zeit 2 Roll-up und Drill-down Slicing und Dicing Drill-down Januar 2 3 33 1. Quartal 11 36 107 Februar

Mehr

Inhalt. 1. Indextypen B*Baum-Index Reversed Key Index Bitmap Index Funktionsbasierter Index

Inhalt. 1. Indextypen B*Baum-Index Reversed Key Index Bitmap Index Funktionsbasierter Index Inhalt 1. Indextypen B*Baum-Index Reversed Key Index Bitmap Index Funktionsbasierter Index 2. Indexverwendung Vergleich von B*Baum und Bitmap Steuerung der Indexverwendung Richtlinien für die Indizierung

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Logische Optimierung Ulf Leser Wissensmanagement in der Bioinformatik Inhaltsübersicht Vorlesung Einleitung & Motivation Architektur Modellierung von Daten im DWH Umsetzung

Mehr

Anfragen in Operativen Systemen und Data Warehouses

Anfragen in Operativen Systemen und Data Warehouses Data Warehouses Sommersemester 011 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen Anfragen in Operativen Systemen und Data Warehouses Anfragen Operative

Mehr

Multidimensionales Datenmodell. Motivation. Motivation /2. Grundbegriffe. Analyseoperationen. Notationen zur konzeptuellen Modellierung

Multidimensionales Datenmodell. Motivation. Motivation /2. Grundbegriffe. Analyseoperationen. Notationen zur konzeptuellen Modellierung Multidimensionales Datenmodell Grundbegriffe Dimensionen, Fakten/Kennzahlen, Würfel Analyseoperationen Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung ME/R,ADAPT,graphbasierteAnsätze

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining 2 Cognos Report Net (CRN) Ermöglicht Erstellen von Ad-hoc-Anfragen (Query Studio) Berichten (Report Studio) Backend Data Cube Relationale Daten Übung: Cognos Report Net

Mehr

Datenbanken Wintersemester 11/12. Prof. Dr. W. May

Datenbanken Wintersemester 11/12. Prof. Dr. W. May AG Datenbanken und Informationssysteme Institut für Informatik Universität Göttingen Datenbanken Wintersemester 11/12 Prof. Dr. W. May 3. Übungsblatt: SQL Besprechung voraussichtlich am 20/21.12.2011 Aufgabe

Mehr

Data-Warehouse-Technologien

Data-Warehouse-Technologien Data-Warehouse-Technologien Prof. Dr.-Ing. Kai-Uwe Sattler 1 Prof. Dr. Gunter Saake 2 1 TU Ilmenau FG Datenbanken & Informationssysteme 2 Universität Magdeburg Institut für Technische und Betriebliche

Mehr

Die SQL-Syntax für den Befehl CREATE TABLE sieht folgendermassen aus:

Die SQL-Syntax für den Befehl CREATE TABLE sieht folgendermassen aus: Einführung in MySQL SQL (Structured Query Language) ist eine Computersprache zum Speichern, Bearbeiten und Abfragen von Daten in relationalen Datenbanken. Eine relationale Datenbank kann man sich als eine

Mehr

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D.

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. Blatt Nr. 7 Übung zur Vorlesung Grundlagen: Datenbanken im WS13/14 Henrik Mühe (muehe@in.tum.de) http://www-db.in.tum.de/teaching/ws1314/dbsys/exercises/

Mehr

Data Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 16 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining operationale DB operationale DB operationale DB Data Warehouse operationale

Mehr

Inhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte

Inhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte 4. Data Warehouses Inhalt 4.1 Motivation 4.2 Datenintegration 4.3 Konzeptuelle Modellierung 4.4 Anfragen an Data Warehouses 4.5 Implementierungsaspekte 2 Literatur V. Köppen, G. Saake und K.-U. Sattler:

Mehr

Arbeiten mit ACCESS 2013

Arbeiten mit ACCESS 2013 Dipl.-Hdl., Dipl.-Kfm. Werner Geers Arbeiten mit ACCESS 2013 Datenbanken mit Datenmodellierung Tabellen, Abfragen, Formularen und Berichten Beziehungen Makros Datenaustausch SQL Structured Query Language

Mehr

SQL Tutorial. SQL - Tutorial SS 06. Hubert Baumgartner. INSO - Industrial Software

SQL Tutorial. SQL - Tutorial SS 06. Hubert Baumgartner. INSO - Industrial Software SQL Tutorial SQL - Tutorial SS 06 Hubert Baumgartner INSO - Industrial Software Institut für Rechnergestützte Automation Fakultät für Informatik Technische Universität Wien Inhalt des Tutorials 1 2 3 4

Mehr

6. Sichten, Integrität und Zugriffskontrolle. Vorlesung "Informa=onssysteme" Sommersemester 2015

6. Sichten, Integrität und Zugriffskontrolle. Vorlesung Informa=onssysteme Sommersemester 2015 6. Sichten, Integrität und Zugriffskontrolle Vorlesung "Informa=onssysteme" Sommersemester 2015 Überblick Sichten Integritätsbedingungen Zugriffsrechte SQL- Schema und SQL- Katalog Das Informa=onsschema

Mehr

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse

Mehr

Nachtrag: Farben. Farbblindheit. (Light und Bartlein 2004)

Nachtrag: Farben. Farbblindheit. (Light und Bartlein 2004) Nachtrag: Farben Farbblindheit (Light und Bartlein 2004) 1 Vorgeschlagene Farbskalen (Light and Bartlein 2004) Farbkodierung metrisch skalierter Daten Unterscheide: 1. Sequential Data (ohne Betonung der

Mehr

Hetero-Homogene Data Warehouses

Hetero-Homogene Data Warehouses Hetero-Homogene Data Warehouses TDWI München 2011 Christoph Schütz http://hh-dw.dke.uni-linz.ac.at/ Institut für Wirtschaftsinformatik Data & Knowledge Engineering Juni 2011 1 Data-Warehouse-Modellierung

Mehr

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier Realisierung von OLAP Operatoren in einem visuellen Analysetool Vortrag von Alexander Spachmann und Thomas Lindemeier Gliederung Ausgangssituation/Motivation Was ist OLAP? Anwendungen Was sind Operatoren?

Mehr

Materialisierte Sichten in Oracle

Materialisierte Sichten in Oracle Materialisierte Sichten in Oracle Seminar Intelligente Datenbanken Prof. Dr. Rainer Manthey Kai-Lin Pang 07. Juni 2005 Seminar Intelligente Datenbanken Materialisierte Sichten in Oracle 1 Überblick Motivation

Mehr

Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube

Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube Fragen des Marketingleiters Data Warehousing Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt nach? Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon Technisch

Mehr

Projektion. Projektion. Operation: Projektion

Projektion. Projektion. Operation: Projektion Projektion einfache Abfragen Aufbereiten der Ergebnisse von Abfragen Ausdrücke und Formeln Abfragen im Verbund aggregierende Abfragen gruppierende Abfragen Angabe der zu bearbeitenden Tabelle(n) Angabe

Mehr

Seminar Data Warehousing. Seminar. Data Warehousing. Thema: Speichermodelle für Data-Warehouse-Strukturen

Seminar Data Warehousing. Seminar. Data Warehousing. Thema: Speichermodelle für Data-Warehouse-Strukturen Seminar Data Warehousing Thema: Speichermodelle für Data-Warehouse-Strukturen Friedrich-Schiller-Universität Jena Fakultät für Mathematik und Informatik Institut für Informatik Lehrstuhl für Datenbanken

Mehr

Views in SQL. 2 Anlegen und Verwenden von Views 2

Views in SQL. 2 Anlegen und Verwenden von Views 2 Views in SQL Holger Jakobs bibjah@bg.bib.de, holger@jakobs.com 2010-07-15 Inhaltsverzeichnis 1 Wozu dienen Views? 1 2 Anlegen und Verwenden von Views 2 3 Schreibfähigkeit von Views 3 3.1 Views schreibfähig

Mehr

Motivation. Dimensionen. Motivation /2. 3. Multidimensionales Datenmodell

Motivation. Dimensionen. Motivation /2. 3. Multidimensionales Datenmodell 3. Multidimensionales Datenmodell Grundbegriffe Dimensionen, Fakten/Kennzahlen, Würfel Analyseoperationen Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung ME/R, ADAPT, graphbasierte

Mehr

Model Klausel - Der Excel-Killer von Oracle?

Model Klausel - Der Excel-Killer von Oracle? Model Klausel - Der Excel-Killer von Oracle? Andrea Kennel Trivadis AG Glattbrugg, Schweiz Schlüsselworte: Model Klausel, SQL, Data Warehousing, OLAP Zusammenfassung Ein Data Mart kann als ein Würfel mit

Mehr

Motivation. Motivation /2. Dimensionen. Einfache Hierarchien. Hierarchien in Dimensionen. 3. Multidimensionales Datenmodell

Motivation. Motivation /2. Dimensionen. Einfache Hierarchien. Hierarchien in Dimensionen. 3. Multidimensionales Datenmodell 3. Multidimensionales Datenmodell Grundbegriffe Dimensionen, Fakten/Kennzahlen, Würfel Analyseoperationen Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung ME/R, ADAPT, graphbasierte

Mehr

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein 1 Definitionen 1.1 Datenbank Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert Integriert, selbstbeschreibend, verwandt 1.2 Intension/Extension Intension: Menge der Attribute Extension:

Mehr

Datenintegration & Datenherkunft Varianten der Data Provenance

Datenintegration & Datenherkunft Varianten der Data Provenance Datenintegration & Datenherkunft Varianten der Data Provenance Wintersemester 2010/11 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen 1 Arten des

Mehr

Andreas Heuer Gunter Saake Kai-Uwe Sattler. Datenbanken. kompakt

Andreas Heuer Gunter Saake Kai-Uwe Sattler. Datenbanken. kompakt Andreas Heuer Gunter Saake Kai-Uwe Sattler Datenbanken kompakt Inhaltsverzeichnis Vorwort v 1 Was sind Datenbanken 1 1.1 Warum Datenbanken 1 1.2 Datenbanksysteme 4 1.3 Anforderungen: Die Codd'schen Regeln

Mehr

Kalkülteil. Structured Query Language, SQL. 1. Semantik: erzeuge alle Kombinationen von Tupeln

Kalkülteil. Structured Query Language, SQL. 1. Semantik: erzeuge alle Kombinationen von Tupeln Structured Query Language, SQL vom American National Standards Institute, ANSI, genormte Datenbanksprache. enthält eine Teilsprache, die eine relationale Anfragesprache ist, Mischung von tupelorientierten

Mehr

Informatik 12 Datenbanken SQL-Einführung

Informatik 12 Datenbanken SQL-Einführung Informatik 12 Datenbanken SQL-Einführung Gierhardt Vorbemerkungen Bisher haben wir Datenbanken nur über einzelne Tabellen kennen gelernt. Stehen mehrere Tabellen in gewissen Beziehungen zur Beschreibung

Mehr

Schulinternes Curriculum im Fach Informatik

Schulinternes Curriculum im Fach Informatik Schulinternes Curriculum im Fach Informatik Unterricht in EF : 1. Geschichte der elektronischen Datenverarbeitung (3 Stunden) 2. Einführung in die Nutzung von Informatiksystemen und in grundlegende Begriffe

Mehr

SQL-Befehlsliste. Vereinbarung über die Schreibweise

SQL-Befehlsliste. Vereinbarung über die Schreibweise Vereinbarung über die Schreibweise Schlüsselwort [optionale Elemente] Beschreibung Befehlsworte in SQL-Anweisungen werden in Großbuchstaben geschrieben mögliche, aber nicht zwingend erforderliche Teile

Mehr

Oracle Analytic Functions

Oracle Analytic Functions Mittwoch, 13.02.2008, 17:00 Uhr Regionaltreffen München/Südbayern Oracle Analytic Functions Seit Jahren auf dem Markt (8.1.6), jedoch unbekannt und selten im Einsatz S e i t e 1 Agenda Einsatzmöglichkeiten

Mehr

Data Warehousing. Modellierung im DWH Das multidimensionale Datenmodell. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Modellierung im DWH Das multidimensionale Datenmodell. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Modellierung im DWH Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Zusammenfassung: Hubs and Spokes Mart 1 Mart 2 Mart 3 Mart 4 DWH Quelle 1 RDBMS Quelle

Mehr

Sructred Query Language

Sructred Query Language Sructred Query Language Michael Dienert 11. November 2010 Inhaltsverzeichnis 1 Ein kurzer Versionsüberblick 1 2 SQL-1 mit einigen Erweiterungen aus SQL-92 2 3 Eine Sprache zur Beschreibung anderer Sprachen

Mehr

Details zu den Ausdrücken nach FROM, WHERE, GROUP BY und HAVING finden Sie in den Abschnitten über JOIN, WHERE und GROUP BY.

Details zu den Ausdrücken nach FROM, WHERE, GROUP BY und HAVING finden Sie in den Abschnitten über JOIN, WHERE und GROUP BY. SELECT - Der Grundbefehl zur Auswahl von Daten Die SELECT-Anweisung fragt Daten aus einer Datenbank ab und stellt diese in einer virtuellen Tabelle zur Verfügung. Diese virtuelle Tabelle, eine Menge von

Mehr

SQL: Abfragen für einzelne Tabellen

SQL: Abfragen für einzelne Tabellen Musterlösungen zu LOTS SQL: Abfragen für einzelne Tabellen Die Aufgaben lösen Sie mit dem SQL-Training-Tool LOTS der Universität Leipzig: http://lots.uni-leipzig.de:8080/sql-training/ Wir betrachten für

Mehr

Online Analytical Processing

Online Analytical Processing Online Analytical Processing Online Analytical Processing Online Analytical Processing (OLAP) ermöglicht die multidimensionale Betrachtung von Daten zwecks E rmittlung eines entscheidungsunterstützenden

Mehr

Christian Kurze BI-Praktikum IBM WS 2008/09

Christian Kurze BI-Praktikum IBM WS 2008/09 Einführung in die multidimensionale Datenmodellierung e mit ADAPT BI-Praktikum IBM WS 2008/09 1 Gliederung Einführung multidimensionale Datenmodellierung 1. Multidimensionales Modell BI-Praktikum IBM WS

Mehr

Data Warehouse Grundlagen

Data Warehouse Grundlagen Seminarunterlage Version: 2.10 Version 2.10 vom 24. Juli 2015 Dieses Dokument wird durch die veröffentlicht.. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen sind Warenzeichen

Mehr