Multidimensionales Datenmodell, Anfrageverarbeitung und Anfrageoptimierung

Größe: px
Ab Seite anzeigen:

Download "Multidimensionales Datenmodell, Anfrageverarbeitung und Anfrageoptimierung"

Transkript

1 Multidimensionales Datenmodell, Anfrageverarbeitung und Anfrageoptimierung Grundbegriffe Dimensionen, Fakten/Kennzahlen Eigenschaften von multidimensionalen Anfragen Relationale Umsetzung von Anfragen Star-Joins Optimierungsaspekt Gruppierung und Aggregation Group-By-Erweiterungen Cube-Operator Benutzerdefinierte Aggregatfunktionen Sequenzbasierte Operationen Gruppierung: Implementierung und Optimierung

2 Motivation Datenmodell ausgerichtet auf Unterstützung der Analyse Datenanalyse im Entscheidungsprozess Betriebswirtschaftliche Kennzahlen (Erlöse, Gewinne, Verluste etc.) stehen im Mittelpunkt Betrachtung der Kennzahlen aus unterschiedlichen Perspektiven (zeitlich, regional, produktbezogen) Dimensionen Unterteilung der Auswertedimensionen möglich (Jahr, Quartal, Monat) Hierarchien oder Konsolidierungsebenen Karczewski Data Warehouse Systeme 2

3 Dimensionen beschreiben mögliche Sicht auf die assoziierte Kennzahl endliche Menge von n (n 2) Dimensionselementen (Hierarchieobjekten), die eine semantische Beziehung aufweisen dienen der orthogonalen Strukturierung des Datenraums Beispiele: Produkttypen: Tasse, Service, Haushaltswaren Geografie: Hessen, Bundesrepublik, Europa Zeit: Monat, Quartal, Jahr Karczewski Data Warehouse Systeme 3

4 Hierarchien in Dimensionen Dimensionselemente: Knoten einer Klassifikationshierarchie Klassifikationsstufe beschreibt Verdichtungsgrad Darstellung von Dimensionen über Klassifikationsschema (Schema von Klassifikationshierarchien) Formen einfache Hierarchien parallele Hierarchien Karczewski Data Warehouse Systeme 4

5 Einfache Hierarchien Höhere Hierarchieebene enthält die aggregierten Werte genau einer niedrigeren Hierarchiestufe Oberster Knoten (Top) enthält Verdichtung auf einen einzelnen Wert der Dimension Top Top Produktfamilie Haushaltswaren Europa Erdteil Produktgruppe Service Bundesrepublik Staat Artikel Tasse Hessen Land Karczewski Data Warehouse Systeme 5

6 Parallele Hierarchien Innerhalb einer Dimension sind zwei verschiedene Arten der Gruppierung möglich Keine hierarchische Beziehung in den parallelen Zweigen Parallelhierarchie Pfad im Klassifikationsschema (Konsolidierungspfad) Top Jahr Quartal Woche Monat Karczewski Data Warehouse Systeme 6 Tag

7 Kategorienattribute Inhaltliche Verfeinerung durch unterschiedliche Rollen Primärattribut Kategorienattribut, das alle anderen Attribute einer Dimension bestimmt definiert maximale Feinheit Beispiel: Auftrag Klassifikationsattribut Element der Menge, die mehrstufige Kategorisierung (Klassifikationshierarchie) bilden Beispiel: Kunde, Nation, Kontinent Dimensionales Attribut Element der Menge der Attribute, die vom Primärattribut oder einem Klassifikationsattribut bestimmt werden und nur TopD bestimmen Beispiel: Adresse, Telefon Karczewski Data Warehouse Systeme 7

8 Struktur einer Dimension: Beispiel Top Region Klassifikationsattribute Dimensionsattribute Nation Kunde Adresse Telefon Status Bestellpreis Auftrag Primärattribut Karczewski Data Warehouse Systeme 8

9 Kennzahlen / Fakten Kennzahlen/Fakten: (vedichtete) numerische Messgrößen beschreiben betriebswirtschaftliche Sachverhalte Fakt: Basiskennzahl Kennzahl: aus Fakten konstruiert (abgeleitete Kennzahl) durch Anwendung arithmetischer Operationen Beispiele: Umsatz, Gewinn, Verlust, Deckungsbeitrag Karczewski Data Warehouse Systeme 9

10 Kennzahl: Berechnungsvorschrift Bildung von f(): Skalarfunktionen +, -, *, /, mod Beispiel: Umsatzsteueranteil = Menge * Preis * Steuersatz Aggregatfunktionen Funktion H() zur Verdichtung eines Datenbestandes, indem aus n Einzelwerten ein Aggregatwert ermittelt wird SUM(), AVG(), MIN(), MAX(), COUNT() Ordnungsbasierte Funktionen Definition von Kennzahlen auf Basis zuvor definierter Ordnungen (Bsp.: Kumulation) Karczewski Data Warehouse Systeme 10

11 Logische vs. Physische Operatoren Bereichsanfrage range query Produkt (Artikel) Zeit (Tage) Partielle Bereichsanfrage partial range query Produkt (Artikel) Zeit (Tage) Karczewski Data Warehouse Systeme 11

12 Logische vs. Physische Operatoren Partial-Match-Abfrage Produkt (Artikel) Zeit (Tage) Punktanfrage Produkt (Artikel) Zeit (Tage) Karczewski Data Warehouse Systeme 12

13 Logische vs. Physische Operatoren Zusammengesetzte Anfragebereiche Produkt (Artikel) Zeit (Tage) Unregelmäßige Anfrageform Produkt (Artikel) Zeit (Tage) Karczewski Data Warehouse Systeme 13

14 Star-Join: Beispiel SELECT FROM Geographie.Region, Zeit.Monat, sum(verkaeufe) Verkauf, Zeit, Produkte, Geographie WHERE Verkauf.Produkt_ID = Produkt.Produkt.ID AND Verkauf.Zeit_ID = Zeit.Zeit_ID AND Verkauf.Geographie_ID = Geographie.Geographie_ID AND Produkt.Produktkategorie = Kosmetik AND Geographie.Land = Deutschland AND Zeit.Jahr = 2000 GROUP BY Geographie.Region, Zeit.Monat Karczewski Data Warehouse Systeme 14

15 Star-Join: Aufbau Select-Klausel Kenngrößen (evtl. aggregiert) Ergebnisgranularität (z.b. Monat, Region) From-Klausel Fakten- und Dimensionstabellen Where-Klausel Verbundbedingungen Restriktionen (z.b. Zeit.Jahr = 2000) Karczewski Data Warehouse Systeme 15

16 Star-Join: Optimierung (1) Star-Joins stellen typisches Muster für Data-Warehouse-Anfragen dar Typische Eigenschaften durch das Star-Schema: Sehr große Faktentabelle Deutlich kleinere, unabhängige Dimensionstabellen Klassische relationale Optimierer schlagen fehl, weil sie i.d.r. von gleichmäßigen Verteilungen in den Tabellen ausgehen Karczewski Data Warehouse Systeme 16

17 Star-Join: Optimierung (2) Im Beispiel: Join über Faktentabelle Verkauf und die drei Dimensionstabellen Produkt, Zeit und Geographie: 4-Wege-Join In RDBMS üblicherweise nur paarweiser Join: Sequenz paarweiser Joins notwendig 4! Mögliche Join-Reihenfolgen Heuristik zur Verringerung der zu untersuchenden Möglichkeiten: Joins zwischen Relationen, die nicht durch eine Join-Bedingung in der Anfrage verknüpft sind, werden nicht betrachtet Karczewski Data Warehouse Systeme 17

18 Star-Join: Optimierung (3) Heuristik liefert z.b. folgenden Ausführungsplan: Plan A: σ Produktkategorie= Kosmetik σ Monat= Januar 2000 Produkt Verkauf σ Land= Deutschland Zeit Geographie Karczewski Data Warehouse Systeme 18

19 Star-Join: Optimierung (4) Heuristik liefert z.b. folgenden Ausführungsplan: Plan B: Verkauf σ Land= Deutschland σ Produktkategorie= Kosmetik σ Monat= Januar 2000 Geographie Produkt Zeit Karczewski Data Warehouse Systeme 19

20 Star-Join: Berechnungsbeispiel Annahmen: Tabelle Verkauf: Datensätze 10 Geschäfte in Deutschland (von 100) 20 Verkaufstage im Januar 2000 (von 1000 gespeicherten Tagen) 50 Produkte in Produktkategorie Kosmetik (von 1000) Gleichverteilung/gleiche Selektivität der einzelnen Ausprägungen Plan A: 1. Join: Tupel (Ergebnis) 2. Join: Tupel 3. Join: Tupel Plan B: 1. Kreuzprodukt 200 Tupel 2. Kreuzprodukt Tupel Join: Tupel Karczewski Data Warehouse Systeme 20

21 Gruppierung und Aggregation Datenanalyse: Aggregation mehrdimensionaler Daten Aggregatfunktion: Standard: SUM, MIN, MAX, COUNT Erweiterungen: statistische, physikalische und Finanzfunktion Benutzerdefinierte Aggregatfunktionen Gruppierung: Ergebnis: Tabelle mit Aggregatwerten indiziert durch Menge von Attributen Karczewski Data Warehouse Systeme 21

22 Gruppierung und Aggregation SQL: GROUP BY attr-liste [ HAVING bedingung ] Gruppierung bzgl. gleicher Werte der Gruppierungsattribute Abschließende Projektion nur über Gruppierungsattribute oder Aggregationen Einschränkungen Berechnung von Histogrammen: Aggregationen über berechnete Kategorien Berechnung von Zwischen- und Gesamtsummen Berechnung von Kreuztabellen Karczewski Data Warehouse Systeme 22

23 Berechnung von Zwischen- und Gesamtsummen PRODUKT JAHR REGION VERKÄUFE VERKÄUFE VERKÄUFE Produkt Jahr Region Produkt Jahr Produkt Sonnenschutz 1999 Hessen 135 Thüringen Hessen 140 Thüringen Karczewski Data Warehouse Systeme 23

24 Berechnung von Zwischen- und Gesamtsummen PRODUKT JAHR REGION VERKÄUFE Sonnenschutz 1999 Hessen 135 Sonnenschutz 1999 Thüringen 120 Sonnenschutz 1999 NULL 255 Sonnenschutz 2000 Hessen 140 Sonnenschutz 2000 Thüringen 135 Sonnenschutz 2000 NULL 275 Sonnenschutz NULL NULL 530 Karczewski Data Warehouse Systeme 24

25 Berechnung von Zwischen- und Gesamtsummen: SQL-Anfrage SELECT Produkt, NULL, NULL, SUM(Verkäufe) UNION FROM Verkauf WHERE Produkt = Sonnenschutz GROUP BY Produkt SELECT Produkt, Jahr, NULL, SUM(Verkäufe) UNION FROM Verkauf WHERE Produkt = Sonnenschutz GROUP BY Produkt, Jahr SELECT Produkt, Jahr, Region, SUM(Verkäufe) FROM Verkauf WHERE Produkt = Sonnenschutz GROUP BY Produkt, Jahr, Region; Karczewski Data Warehouse Systeme 25

26 Berechnung von Zwischen- und Gesamtsummen Nachteil von Variante mit UNION Hoher Aufwand: Berechnung aller Teilsummen für N Gruppierungsattribute erfordert 2 N Teilanfragen Eventuelle Vebundoperationen müssen mehrfach wiederholt werden Aufwändige Formulierung: Eventuell jedoch Generierung durch OLAP-Werkzeuge Karczewski Data Warehouse Systeme 26

27 Berechnung von Kreuztabellen Symmetrische Aggregation Pivottabellen (MS Access: Transform-Pivot) Sonnenschutz TOTAL Hessen Thüringen TOTAL Karczewski Data Warehouse Systeme 27

28 Cube-Operator Kurzform für Anfragemuster zur Berechnung von Teil- und Gesamtsummen Generierung aller möglichen Gruppierungskombinationen aus einer gegebenen Menge von Gruppierungsattributen Ergebnis: Tabelle mit aggregierten Werten NULL, NULL,, NULL, SUM( ) Jeweils einmal NULL weniger Am Ende ohne NULL Karczewski Data Warehouse Systeme 28

29 Cube-Operator: SQL-Syntax Implementierung in Oracle (ab Version 8i) Syntax: SELECT Produktgruppe, Region, Jahr, SUM(Verkäufe) FROM Verkauf GROUP BY CUBE (Produktgruppe, Region, Jahr) Funktion grouping(attribut) Liefert Wert=1, wenn über Attribut aggregiert wurde Liefert Wert=0, wenn über Attribut gruppiert wurde Dient der Unterdrückung von Teilsummen Bsp.: having not (grouping(produktgruppe)=1 Karczewski Data Warehouse Systeme 29

30 Rollup-Operator Cube-Operator ist interdimensional Anwendbar für Attribute aus unterschiedlichen Dimensionen Ist für Roll-Up oder Drill-Down-Operationen zu aufwendig Rollup-Operator ist intradimensional Generierung der Attributkombinationen (A1,, An), (A1,, An-1),, (A1, A2), (A1), ( ) für gegebene Attributliste A1,, An Karczewski Data Warehouse Systeme 30

31 Rollup-Operator: Beispiel Anfrage: SELECT Prodkategorie, Prodfamilie, Land, Region, sum(verkäufe) FROM GROUP BY ROLLUP (Produkategorie, Prodfamilie), Auswertung: ROLLUP (Land, Region) 1. Rollup: (Prodkategorie, Prodfamilie), (Prodkategorie), ( ) 2. Rollup: (Land, Region), (Land), ( ) Kreuzprodukt beider Kombinationen Karczewski Data Warehouse Systeme 31

32 Rollup-Operator: Beispiel Prodkategorie Prodfamilie Land Region Verkäufe Elektronik Video D Europa 102 Elektronik Audio D Europa 98 Elektronik NULL D Europa 200 Elektronik Video D NULL 541 Elektronik Audio D NULL 326 Elektronik NULL D NULL 867 Karczewski Data Warehouse Systeme 32

33 Cube- vs. Rollup-Operator Cube-Operator: generiert alle Kombinationen: z.b. für 4 Gruppierungsattribute: 16 Kombinationen Rollup-Operator: generiert nur Kombinationen mit sogenannten Superaggregaten: (f1, f2,, NULL) (f1, NULL,, NULL) (NULL, NULL,, NULL) Karczewski Data Warehouse Systeme 33

34 Grouping Sets Standard in SQL99 GROUP BY GROUPING SETS (gruppierung) Gruppierung: Einfache Gruppierungskombinatioen, z.b. (Land, Region) Komplexe Gruppierungsbedingung mit Cube oder Rollup Karczewski Data Warehouse Systeme 34

35 Grouping Sets: Beispiel Anfrage: GROUP BY ROLLUP (Prodkategorie, Prodfamilie), (1) GROUPING SETS ((Stadt), (Region)), (2) GROUPING SETS (ROLLUP (Jahr, Quartal, Monat), (Woche)) (3) Bedeutung: (1) entlang der Klassifikationshierarchie (2) nur für Städte und Regionen (3) Nutzung der Parallelhierarchien Jahr Quartal Monat bzw. Woche Karczewski Data Warehouse Systeme 35

36 Grouping Sets: Semantik Fall 1: GROUP BY A, B GROUP BY GROUPING SETS ((A, B)) (A, B) Fall 2: GROUP BY GROUPING SETS ((A, B), (A, C), (A)) GROUP BY A, GROUPING SETS ((B), (C), ( )) (A) x (B), (C), () (A, B), (A, C), (A) Karczewski Data Warehouse Systeme 36

37 Grouping Sets: Semantik Fall 3: GROUP BY GROUPING SETS ((A, B), (B, C)), GROUPING SETS ((D, E), (D), ( )) (A, B), (B, C) x (D, E), (D), ( ) (A, B, D, E), (A, B, D), (A, B), (B, C, D, E), (B, C, D), (B, C) Karczewski Data Warehouse Systeme 37

38 Sequenzbasierte Operationen SQL:1999 Erweiterung um OLAP-Funktionen zur attribut- und sequenzbasierten Auswertung Attribut- und tupelbasierte Aggregation Umsetzung existiert u.a. ab Oracle 9i bzw. DB2 V7.2 Unterstützte Anfragetypen Ratio-To-Total Laufende Summen (Kumulation) Gleitender Durchschnitt Ranking-Analyse Karczewski Data Warehouse Systeme 38

39 OLAP-Funktionen: Syntax Allgemein: FUNKTION (arg) OVER (Partitionierungsklausel, Ordnungsklausel, Fenster) Partitionierung für jedes Attribut des Ergebnisses ohne Verdichtung: jeder Eingangswert liefert Ergebniswert optional Ordnung innerhalb einer Partition optional Festlegung des Aggregationsfensters optional nur in Verbindung mit Ordnungsklausel Karczewski Data Warehouse Systeme 39

40 OLAP-Funktionen: Motivation Ratio-To-Total-Analyse Berechnung des täglichen Anteils an Gesamtstückzahlen Schemabeispiel aus der Übung: Produkt (Produktreihe, Produkttyp, Produktname, Produktnummer) Umsatz (Bestelldatum, Produktnummer,...,Umsatz) Ratio-To-Total- mit SQL (ohne OLAP-Funktion): SELECT bestelldatum, umsatz AS t_umsatz, g_umsatz, 100.0*umsatz/g_umsatz AS a_umsatz FROM produkt p, umsatz u, (SELECT SUM (umsatz) as g_umsatz FROM umsatz WHERE to_char(bestelldatum,'mm')=11) WHERE p.produktnummer=u.produktnummer AND to_char(bestelldatum,'mm')=11; Karczewski Data Warehouse Systeme 40

41 OLAP-Funktionen: Bsp. Ergebnis BESTELLDATUM T_UMSATZ G_UMSATZ A_UMSATZ , , , , , , , , , , , , , , ,82 T: Teil G: Gesamt A: Anteil in % Karczewski Data Warehouse Systeme 41

42 OLAP-Funktionen: Anwendung Anfrage SELECT bestelldatum, umsatz AS t_umsatz, SUM (umsatz) OVER () AS g_umsatz, 100.0*umsatz / SUM (umsatz) OVER () AS a_umsatz FROM produkt p, umsatz u WHERE p.produktnummer=u.produktnummer AND to_char(bestelldatum,'mm')=11; Ergebnis identisch OLAP-Funktion SUM (umsatz) OVER() Aggregation über gesamten Eingangsbereich Partition für Aggregation wird lokal für jeden Eintrag generiert Karczewski Data Warehouse Systeme 42

43 Attributlokale Partitionierung Partitionierung des Eingabestroms einer OLAP-Funktion (ähnlich Gruppierung) Aber: Partitionierung erfolgt pro Attribut/Anweisung der Aggregatoperation. Dies ermöglich Nachgruppierung. Beispiel: Ermittlung der Anteile der Tageszahlen im Vergleich zu Monatszahlen SELECT bestelldatum, umsatz, SUM (umsatz) OVER (PARTITION BY bestelldatum) AStagesumsatz, 100.0*umsatz / SUM (umsatz) OVER (PARTITION BY bestelldatum) AS a_tagesumsatz FROM produkt p, umsatz u WHERE p.produktnummer=u.produktnummer AND (to_char(bestelldatum,'mm')=3) ORDER BY bestelldatum; Karczewski Data Warehouse Systeme 43

44 Attributlokale Partitionierung (tagesweise) BESTELLDATUM UMSATZ TAGESUMSATZ A_TAGESUMSATZ , , , ,71 A: Anteil in % , , , , , , ,00 Karczewski Data Warehouse Systeme 44

45 Attributlokale Partitionierung (jahresweise) SELECT bestelldatum, umsatz, SUM (umsatz) OVER (PARTITION BY extract (YEAR FROM bestelldatum)) AS jahresumsatz, 100.0*umsatz / SUM (umsatz) OVER (PARTITION BY extract (YEAR FROM bestelldatum)) AS a_jahresumsatz FROM produkt p, umsatz u WHERE p.produktnummer=u.produktnummer AND (to_char(bestelldatum,'mm')=11) ORDER BY bestelldatum; Karczewski Data Warehouse Systeme 45

46 Sequenzorientierte Analyse (jahresweise) BESTELLDATUM UMSATZ JAHRESUMSATZ A_JAHRESUMSATZ , , , , , , , , , , , , , , ,53 A: Anteil in % Karczewski Data Warehouse Systeme 46

47 Attributlokale Partitionierung Prinzip: SUM (umsatz) OVER (PARTITION BY bestelldatum) Partitionierungsschema Keine Konflikte durch unterschiedliche Partitionierungsschemata innerhalb einer Anfrage Jeweils alle Einträge einer Partition werden in die Berechnung einbezogen. Karczewski Data Warehouse Systeme 47

48 Sequenzorientierte Analyse Spezifikation einer attributlokalen Ordnung für Partitionen Anwendung: laufende Summe, gleitender Durchschnitt usw. Beispiel: kumulative Liefermengen über Gesamtzeitraum und pro Jahr SELECT bestelldatum, umsatz, SUM (umsatz) OVER (ORDER BY bestelldatum) as sum_gesamt, SUM (umsatz) OVER (PARTITION BY extract (YEAR FROM bestelldatum) ORDER BY bestelldatum) AS sum_jahr FROM produkt p, umsatz u WHERE p.produktnummer=u.produktnummer AND (to_char(bestelldatum,'mm')=3) ORDER BY bestelldatum; Karczewski Data Warehouse Systeme 48

49 Sequenzorientierte Analyse BESTELLDATUM UMSATZ SUM_GESAMT SUM_JAHR Pro Tag wird kumuliert, wobei SUM_GESAMT unabhängig vom Jahr vorgeht, SUM_JAHR pro Jahr neu beginnt Karczewski Data Warehouse Systeme 49

50 Sequenzorientierte Analyse Prinzip: Anzahl der Tupel, die in ein Ergebnistupel eingehen, entspricht der Position des Tupels bzgl. gegebener Ordnung Eingangstupel ti, Ergebnistupel si t1 SUM({t1}) s1 t2 SUM({t1, t2}) s2 t3 SUM({t1, t2, t3}) s3 Schrittweise Vergrößerung des Analysefensters Karczewski Data Warehouse Systeme 50

51 Nutzung für Ranking-Analyse Funktionen RANK(): liefert Rang eines Tupels bzgl. vorgegebener Ordnung innerhalb der Partition DENSERANK(): wie RANK(), jedoch ohne Lücken Beispiel A: Ranking nach Umsatz SELECT bestelldatum, umsatz, RANK() OVER (ORDER BY umsatz) AS rang FROM produkt p, umsatz u WHERE p.produktnummer=u.produktnummer; Beispiel B: Ranking nach Umsatz und Datum SELECT bestelldatum, umsatz, RANK() OVER (ORDER BY umsatz, bestelldatum) AS rang FROM produkt p, umsatz u WHERE p.produktnummer=u.produktnummer; Karczewski Data Warehouse Systeme 51

52 Ranking-Analyse (Beispiel) A: BESTELLDATUM UMSATZ RANG B: BESTELLDATUM UMSATZ RANG Karczewski Data Warehouse Systeme 52

53 Ranking-Analyse (Beispiel) Beschränkung auf Hitlisten Beispiel: Top10 der Tage mit dem höchsten Volumen pro Jahr Anfrage: SELECT AUF.bestelldatum, AUF.topMonat FROM (select bestelldatum, RANK() OVER(PARTITION BY extract(year from bestelldatum) ORDER BY umsatz DESC) AStopMonat FROM umsatz u, produkt p WHERE u.produktnummer=p.produktnummer AND extract(year from bestelldatum) = 2001) AUF WHERE AUF.topMonat <= 10 ORDER BY AUF.topMonat DESC; Karczewski Data Warehouse Systeme 53

54 Ranking-Analyse (Beispiel) BESTELLDATUM TOPMONAT Karczewski Data Warehouse Systeme 54

55 Bildung dynamischer Fenster Bisher: nur wachsende Fenstergröße für die Partition Jetzt: explizite Angaben des Fensters ROWS: Anzahl der Tupel RANGE: Anzahl der wertmäßig verschiedenen Tupel Anwendung: gleitender Durchschnitt Karczewski Data Warehouse Systeme 55

56 Bildung dynamischer Fenster Ausgehend von definiertem Startpunkt bis zum aktuellen Tupel UNBOUNDED PRECEDING: erstes Tupel der jeweiligen Partition n PRECEDING: n-ter Vorgänger relativ zur aktuellen Position CURRENT ROW: aktuelles Tupel (nur mit RANGE und Duplikaten sinnvoll) Karczewski Data Warehouse Systeme 56

57 Bildung dynamischer Fenster Angabe der unteren und oberen Schranken: BETWEEN <untere Grenze> AND <obere Grenze> Spezifikation der Grenzen UNBOUNDED PRECEDING UNBOUNDED FOLLOWING n PRECEDING n FOLLOWING CURRENT ROW <obere Grenze> muss höhere Position als <untere Grenze> spezifizieren Karczewski Data Warehouse Systeme 57

58 Bildung dynamischer Fenster: Beispiel Gleitender Durchschnitt SELECT bestelldatum, umsatz, AVG (umsatz) OVER(PARTITION BY extract(year from bestelldatum) ORDER BY bestelldatum ROWS BETWEEN 3 PRECEDING AND 3 FOLLOWING) as Durch3Tage FROM umsatz u, produkt p WHERE u.produktnummer=p.produktnummer AND extract(month from bestelldatum)=8; Karczewski Data Warehouse Systeme 58

59 Bildung dynamischer Fenster: Beispiel Gleitender Durchschnitt mit 3-Tages-Fenster auf Jahresebene BESTELLDATUM UMSATZ DURCH3TAGE , , , , , , , , , , , , ,71 ( ) / 7 = 74,57 Karczewski Data Warehouse Systeme 59

60 Gruppierung: Optimierungsaspekte Berücksichtigung der Gruppierungs-/Aggregationsoperationen im Rahmen der Optimierung Logische/Algebraische Optimierung: Push-down von Gruppierungen Reduzierung der Kardinalität der Zwischenergebnisse Invariantes Gruppieren Frühzeitiges Vorgruppieren Physische/Interne Optimierung: Spezielle Implementierungen für GROUP BY CUBE, sowie OLAP-Funktionen Karczewski Data Warehouse Systeme 60

Datenbankprogrammierung

Datenbankprogrammierung Datenbankprogrammierung Arbeiten mit DB2 Server DB2- Befehlszeilenprozessor ausführen SQL-Skript-Datei bearbeiten Editor SSH Client Linux SSH-Konsole für Befehlszeilenproz. (ssh) X-Weiterleitung für Editor

Mehr

27 Transact-SQL-Erweiterungen in Bezug auf Analysis Services

27 Transact-SQL-Erweiterungen in Bezug auf Analysis Services 531 27 Transact-SQL-Erweiterungen in Bezug auf Analysis Services Im zweiten Teil dieses Buches haben wir die Eigenschaften der Transact-SQL- Sprache in Bezug auf die Bearbeitung von operativen Daten gezeigt.

Mehr

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung

Mehr

Einführung in Data Warehouses

Einführung in Data Warehouses Kapitel l6 Einführung in Data Warehouses Vorlesung: Dr. Matthias Schubert Skript 2009 Matthias Schubert Dieses Skript basiert auf dem Skript zur Vorlesung Datenbanksysteme II von Prof. Dr. Christian Böhm

Mehr

Kapitel 3: Datenbanksysteme

Kapitel 3: Datenbanksysteme LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Skript zur Vorlesung: Einführung in die Informatik: Systeme und Anwendungen Sommersemester 2015 Kapitel 3: Datenbanksysteme Vorlesung:

Mehr

Themenblock: Erstellung eines Cube

Themenblock: Erstellung eines Cube Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen

Mehr

SQL. strukturierte Datenbankabfragesprache eine Datenbanksprache zur. Structured Query Language:

SQL. strukturierte Datenbankabfragesprache eine Datenbanksprache zur. Structured Query Language: SQL Structured Query Language: strukturierte Datenbankabfragesprache eine Datenbanksprache zur Definition, Abfrage und Manipulation von Daten in relationalen Datenbanken In der SQL-Ansicht arbeiten In

Mehr

Datenbanktechnologie für Data-Warehouse-Systeme

Datenbanktechnologie für Data-Warehouse-Systeme Wolfgang Lehner Datenbanktechnologie für Data-Warehouse-Systeme Konzepte und Methoden dpunkt.verlag 1 1.1 1.2 1.3 1.4 1. 5 2 2.1 2.2 2.3 Einleitung 1 Betriebswirtschaftlicher Ursprung des Data Warehousing...

Mehr

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining 2 Eigenschaften eines Data Warehouse Referenzarchitektur Integrierte Sicht auf beliebige Daten aus verschieden Datenbanken

Mehr

Multidimensionales Datenmodell, Cognos

Multidimensionales Datenmodell, Cognos Data Warehousing (II): Multidimensionales Datenmodell, Cognos Praktikum: Data Warehousing und Mining Praktikum Data Warehousing und Mining, Sommersemester 2010 Vereinfachte Sicht auf die Referenzarchitektur

Mehr

bersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter

bersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter bersicht Niels Schršter EinfŸhrung GROUP BY Roll UpÔs Kreuztabellen Cubes Datenbank Ansammlung von Tabellen, die einen ãausschnitt der WeltÒ fÿr eine Benutzergruppe beschreiben. Sie beschreiben die funktionalen

Mehr

Fachbereich Informatik Praktikum 1

Fachbereich Informatik Praktikum 1 Hochschule Darmstadt DATA WAREHOUSE SS2015 Fachbereich Informatik Praktikum 1 Prof. Dr. S. Karczewski Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 14.April.2015 1. Kurzbeschreibung In diesem Praktikum geht

Mehr

Aufbau des SELECT-Befehls. Im Folgenden werden zunächst Abfragen aus einer Tabelle vorgenommen.

Aufbau des SELECT-Befehls. Im Folgenden werden zunächst Abfragen aus einer Tabelle vorgenommen. Datenbankabfragen (Query) mit SQL (Structured Query Language) 1 Aufbau des SELECT-Befehls Im Folgenden werden zunächst Abfragen aus einer Tabelle vorgenommen. SQL-Syntax: SELECT spaltenliste FROM tabellenname

Mehr

Einführung in SQL. Sprachumfang: Indizes. Datensätzen. Zugriffsrechten

Einführung in SQL. Sprachumfang: Indizes. Datensätzen. Zugriffsrechten Einführung in SQL Die Sprache SQL (Structured Query Language) ist eine Programmiersprache für relationale Datenbanksysteme, die auf dem ANSI-SQL-Standard beruht. SQL wird heute von fast jedem Datenbanksystem

Mehr

Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen

Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen (Folien von A. Kemper zum Buch 'Datenbanksysteme') Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP

Mehr

Data Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de

Data Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de Data Warehouses Sommersemester 2011 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen Data Warehouse Architektur Data-Warehouse-System Teilsichten

Mehr

3. Mehrdimensionale Datenmodellierung. Cb Cube-Operator, Rollup-Operator, Grouping Sets SS08, Prof. Dr. E. Rahm 3-1 y yy

3. Mehrdimensionale Datenmodellierung. Cb Cube-Operator, Rollup-Operator, Grouping Sets SS08, Prof. Dr. E. Rahm 3-1 y yy 3. Mehrdimensionale Datenmodellierung und Operationen Grundlagen Kennzahlen, e, Dimensionen, esoe,cube Cuboide / Aggregationsgitter hierarchische Dimensionen / Konzepthierarchien Cube-Operationen Multi-dimensionale

Mehr

Multidimensionales Datenmodell

Multidimensionales Datenmodell Multidimensionales Datenmodell Grundbegriffe fi Fakten, Dimensionen, Würfel Analyseoperationen fi Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung fi ME/R, ADAPT Relationale

Mehr

SQL. Abfragesprache Datenmanipulation - DML

SQL. Abfragesprache Datenmanipulation - DML SQL Abfragesprache Datenmanipulation - DML SQL DML-Operationen DML = Data Manipulation Language Sprache zur Veränderung der Daten Operationen Daten selektieren Daten einfügen Daten ändern Daten löschen

Mehr

Analytische Funktionen erfolgreich eingesetzt

Analytische Funktionen erfolgreich eingesetzt Analytische Funktionen erfolgreich eingesetzt Dani Schnider Trivadis AG Glattbrugg, Schweiz Schlüsselworte: Analytische Funktionen, SQL, Performance Optimierung, Data Warehousing Zusammenfassung Analytische

Mehr

SQL für Trolle. mag.e. Dienstag, 10.2.2009. Qt-Seminar

SQL für Trolle. mag.e. Dienstag, 10.2.2009. Qt-Seminar Qt-Seminar Dienstag, 10.2.2009 SQL ist......die Abkürzung für Structured Query Language (früher sequel für Structured English Query Language )...ein ISO und ANSI Standard (aktuell SQL:2008)...eine Befehls-

Mehr

Kapitel 6 Einführung in Data Warehouses

Kapitel 6 Einführung in Data Warehouses Kapitel 6 Einführung in Data Warehouses Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2008, LMU München 2008 Dr. Peer Kröger Dieses Skript basiert zu einem Teil auf dem Skript zur Vorlesung

Mehr

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse

Mehr

Datenbankanfragen und -operationen mittels SQL

Datenbankanfragen und -operationen mittels SQL Datenbankanfragen und -operationen mittels SQL Über den verschiedenen Tabellen einer Datenbank werden Operationen ausgeführt, die immer wieder eine Tabelle als Ergebnis zurückgeben. Mathematisch modelliert

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Logische Optimierung Ulf Leser Wissensmanagement in der Bioinformatik Inhaltsübersicht Vorlesung Einleitung & Motivation Architektur Modellierung von Daten im DWH Umsetzung

Mehr

Die bisher bereits bekannten Aggregatsfunktionen MIN, MAX, SUM, AVG, COUNT, VARIANCE und STDDEV wurden um FIRST und LAST erweitert.

Die bisher bereits bekannten Aggregatsfunktionen MIN, MAX, SUM, AVG, COUNT, VARIANCE und STDDEV wurden um FIRST und LAST erweitert. Betrifft Autor FIRST, LAST Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Quelle Aus dem NF9i-Kurs, NF9i-Techno-Circle der Trivadis und Oracle9i Data Warehousing

Mehr

SQL SQL. SQL = Structured Query Language (SEQUEL) IBM San Jose Research Laboratory SYSTEM R. Grundlagen der Datenbanksysteme I

SQL SQL. SQL = Structured Query Language (SEQUEL) IBM San Jose Research Laboratory SYSTEM R. Grundlagen der Datenbanksysteme I SQL SQL = Structured Query Language (SEQUEL) IBM San Jose Research Laboratory SYSTEM R VII-1 Beispielrelationen Filiale ( Name Leiter Stadt Einlagen ) Konto ( KontoNr KundenNr FilialName Saldo ) Kredit

Mehr

Anfragen in Operativen Systemen und Data Warehouses

Anfragen in Operativen Systemen und Data Warehouses Data Warehouses Sommersemester 011 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen Anfragen in Operativen Systemen und Data Warehouses Anfragen Operative

Mehr

Die SQL-Syntax für den Befehl CREATE TABLE sieht folgendermassen aus:

Die SQL-Syntax für den Befehl CREATE TABLE sieht folgendermassen aus: Einführung in MySQL SQL (Structured Query Language) ist eine Computersprache zum Speichern, Bearbeiten und Abfragen von Daten in relationalen Datenbanken. Eine relationale Datenbank kann man sich als eine

Mehr

Teil 7: Data Warehouses und neuere SQL-Konstrukte

Teil 7: Data Warehouses und neuere SQL-Konstrukte 7. Data Warehouses und neuere SQL-Konstrukte 7-1 Teil 7: Data Warehouses und neuere SQL-Konstrukte Literatur: Kemper/Eickler: Datenbanksysteme, 7. Aufl., Kap. 17, Oldenbourg, 2009. Elmasri/Navathe: Fundamentals

Mehr

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Michael Hahne T&I GmbH Workshop MSS-2000 Bochum, 24. März 2000 Folie 1 Worum es geht...

Mehr

Anfrageoptimierung in Data Warehouses durch Verwendung voraggregierter Views

Anfrageoptimierung in Data Warehouses durch Verwendung voraggregierter Views Anfrageoptimierung in Data Warehouses durch Verwendung voraggregierter Views Diplomarbeit Fakultät für Informatik und Elektrotechnik Lehrstuhl Datenbanken und Informationssysteme Universität Rostock Vorgelegt

Mehr

Data Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 16 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining operationale DB operationale DB operationale DB Data Warehouse operationale

Mehr

Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube

Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube Fragen des Marketingleiters Data Warehousing Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt nach? Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon Technisch

Mehr

Motivation. Dimensionen. Motivation /2. 3. Multidimensionales Datenmodell

Motivation. Dimensionen. Motivation /2. 3. Multidimensionales Datenmodell 3. Multidimensionales Datenmodell Grundbegriffe Dimensionen, Fakten/Kennzahlen, Würfel Analyseoperationen Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung ME/R, ADAPT, graphbasierte

Mehr

Multidimensionales Datenmodell. Motivation. Motivation /2. Grundbegriffe. Analyseoperationen. Notationen zur konzeptuellen Modellierung

Multidimensionales Datenmodell. Motivation. Motivation /2. Grundbegriffe. Analyseoperationen. Notationen zur konzeptuellen Modellierung Multidimensionales Datenmodell Grundbegriffe Dimensionen, Fakten/Kennzahlen, Würfel Analyseoperationen Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung ME/R,ADAPT,graphbasierteAnsätze

Mehr

Data Warehousing. Weitere Buzzwörter: OLAP, Decision Support, Data Mining

Data Warehousing. Weitere Buzzwörter: OLAP, Decision Support, Data Mining Data Warehousing Weitere Buzzwörter: OLAP, Decision Support, Data Mining Wichtige Hinweise Zu diesem Thema gibt es eine Spezialvorlesung im Sommersemester Hier nur grober Überblick über Idee und einige

Mehr

Data Warehousing. Modellierung im DWH Das multidimensionale Datenmodell. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Modellierung im DWH Das multidimensionale Datenmodell. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Modellierung im DWH Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Zusammenfassung: Hubs and Spokes Mart 1 Mart 2 Mart 3 Mart 4 DWH Quelle 1 RDBMS Quelle

Mehr

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier Realisierung von OLAP Operatoren in einem visuellen Analysetool Vortrag von Alexander Spachmann und Thomas Lindemeier Gliederung Ausgangssituation/Motivation Was ist OLAP? Anwendungen Was sind Operatoren?

Mehr

SQL Tutorial. SQL - Tutorial SS 06. Hubert Baumgartner. INSO - Industrial Software

SQL Tutorial. SQL - Tutorial SS 06. Hubert Baumgartner. INSO - Industrial Software SQL Tutorial SQL - Tutorial SS 06 Hubert Baumgartner INSO - Industrial Software Institut für Rechnergestützte Automation Fakultät für Informatik Technische Universität Wien Inhalt des Tutorials 1 2 3 4

Mehr

Hetero-Homogene Data Warehouses

Hetero-Homogene Data Warehouses Hetero-Homogene Data Warehouses TDWI München 2011 Christoph Schütz http://hh-dw.dke.uni-linz.ac.at/ Institut für Wirtschaftsinformatik Data & Knowledge Engineering Juni 2011 1 Data-Warehouse-Modellierung

Mehr

Business Intelligence Praktikum 1

Business Intelligence Praktikum 1 Hochschule Darmstadt Business Intelligence SS 2014 Fachbereich Informatik Praktikumsversuch 1 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 07.05.2014 Business Intelligence Praktikum

Mehr

SQL-Befehlsliste. Vereinbarung über die Schreibweise

SQL-Befehlsliste. Vereinbarung über die Schreibweise Vereinbarung über die Schreibweise Schlüsselwort [optionale Elemente] Beschreibung Befehlsworte in SQL-Anweisungen werden in Großbuchstaben geschrieben mögliche, aber nicht zwingend erforderliche Teile

Mehr

Materialisierte Sichten in Oracle

Materialisierte Sichten in Oracle Materialisierte Sichten in Oracle Seminar Intelligente Datenbanken Prof. Dr. Rainer Manthey Kai-Lin Pang 07. Juni 2005 Seminar Intelligente Datenbanken Materialisierte Sichten in Oracle 1 Überblick Motivation

Mehr

Motivation. Motivation /2. Dimensionen. Einfache Hierarchien. Hierarchien in Dimensionen. 3. Multidimensionales Datenmodell

Motivation. Motivation /2. Dimensionen. Einfache Hierarchien. Hierarchien in Dimensionen. 3. Multidimensionales Datenmodell 3. Multidimensionales Datenmodell Grundbegriffe Dimensionen, Fakten/Kennzahlen, Würfel Analyseoperationen Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung ME/R, ADAPT, graphbasierte

Mehr

Informatik 12 Datenbanken SQL-Einführung

Informatik 12 Datenbanken SQL-Einführung Informatik 12 Datenbanken SQL-Einführung Gierhardt Vorbemerkungen Bisher haben wir Datenbanken nur über einzelne Tabellen kennen gelernt. Stehen mehrere Tabellen in gewissen Beziehungen zur Beschreibung

Mehr

Christian Kurze BI-Praktikum IBM WS 2008/09

Christian Kurze BI-Praktikum IBM WS 2008/09 Einführung in die multidimensionale Datenmodellierung e mit ADAPT BI-Praktikum IBM WS 2008/09 1 Gliederung Einführung multidimensionale Datenmodellierung 1. Multidimensionales Modell BI-Praktikum IBM WS

Mehr

Kalkülteil. Structured Query Language, SQL. 1. Semantik: erzeuge alle Kombinationen von Tupeln

Kalkülteil. Structured Query Language, SQL. 1. Semantik: erzeuge alle Kombinationen von Tupeln Structured Query Language, SQL vom American National Standards Institute, ANSI, genormte Datenbanksprache. enthält eine Teilsprache, die eine relationale Anfragesprache ist, Mischung von tupelorientierten

Mehr

Nachtrag: Farben. Farbblindheit. (Light und Bartlein 2004)

Nachtrag: Farben. Farbblindheit. (Light und Bartlein 2004) Nachtrag: Farben Farbblindheit (Light und Bartlein 2004) 1 Vorgeschlagene Farbskalen (Light and Bartlein 2004) Farbkodierung metrisch skalierter Daten Unterscheide: 1. Sequential Data (ohne Betonung der

Mehr

OLAP und Data Warehouses

OLAP und Data Warehouses OLP und Data Warehouses Überblick Monitoring & dministration Externe Quellen Operative Datenbanken Extraktion Transformation Laden Metadaten- Repository Data Warehouse OLP-Server nalyse Query/Reporting

Mehr

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation 27. Juni 2013 Hinweis Diese Folien ersetzen keinesfalls den Übungsstoff des zugehörigen e-learning-kurses.

Mehr

Sructred Query Language

Sructred Query Language Sructred Query Language Michael Dienert 11. November 2010 Inhaltsverzeichnis 1 Ein kurzer Versionsüberblick 1 2 SQL-1 mit einigen Erweiterungen aus SQL-92 2 3 Eine Sprache zur Beschreibung anderer Sprachen

Mehr

SQL SQL. SQL = Structured Query Language (SEQUEL) IBM San Jose Research Laboratory SYSTEM R. Grundlagen der Programmierung 2

SQL SQL. SQL = Structured Query Language (SEQUEL) IBM San Jose Research Laboratory SYSTEM R. Grundlagen der Programmierung 2 SQL SQL = Structured Query Language (SEQUEL) IBM San Jose Research Laboratory SYSTEM R IV-1 Beispielrelationen Filiale ( Name Leiter Stadt Einlagen ) Konto ( KontoNr KundenNr FilialName Saldo ) Kredit

Mehr

Data Warehouse Technologien

Data Warehouse Technologien mitp Professional Data Warehouse Technologien von Veit Köppen, Gunter Saake, Kai-Uwe Sattler 2. Auflage 2014 Data Warehouse Technologien Köppen / Saake / Sattler schnell und portofrei erhältlich bei beck-shop.de

Mehr

Oracle Analytic Functions

Oracle Analytic Functions Mittwoch, 13.02.2008, 17:00 Uhr Regionaltreffen München/Südbayern Oracle Analytic Functions Seit Jahren auf dem Markt (8.1.6), jedoch unbekannt und selten im Einsatz S e i t e 1 Agenda Einsatzmöglichkeiten

Mehr

IV. Datenbankmanagement

IV. Datenbankmanagement Wirtschaftsinformatik 2 (PWIN) IV. Datenbankmanagement Kapitel 2: Datenmanipulationssprache SQL Wirtschaftsinformatik 2 (PWIN) SS 2009, Professur für Mobile Business & Multilateral Security 1 Agenda 1.

Mehr

DBS ::: SERIE 5. Join Right Semi- Join Left Semi-Join Projektion Selektion Fremdschlüssel. Kreuzprodukt

DBS ::: SERIE 5. Join Right Semi- Join Left Semi-Join Projektion Selektion Fremdschlüssel. Kreuzprodukt DBS ::: SERIE 5 Die Relation produkt enthält Hersteller, Modellnummer und Produktgattung (pc, laptop oder drucker aller Produkte. Die Modellnummer ist (der Einfachheit halber eindeutig für alle Hersteller

Mehr

Wirtschaftsinformatik. SQL Abfragen und QBE. Unterrichtsskript. Version: 2.0

Wirtschaftsinformatik. SQL Abfragen und QBE. Unterrichtsskript. Version: 2.0 Wirtschaftsinformatik SQL Abfragen und QBE Unterrichtsskript Version: 2.0 Autor: Jonas Lanz Datum: 02.06.2006 FHNW Hochschule für Wirtschaft 2 / 29 Inhaltsverzeichnis 1. Einführung 3 1.1 Relationale Operationen

Mehr

SQL structured query language

SQL structured query language Umfangreiche Datenmengen werden üblicherweise in relationalen Datenbank-Systemen (RDBMS) gespeichert Logische Struktur der Datenbank wird mittels Entity/Realtionship-Diagrammen dargestellt structured query

Mehr

In Tabelle 2.1 sehen Sie das Ergebnis beider Ausführungen auf meiner Maschine.

In Tabelle 2.1 sehen Sie das Ergebnis beider Ausführungen auf meiner Maschine. Kapitel 2 Datenverwaltung durch SQL Server Wir wollen das obige Skript zwei Mal laufen lassen, einmal mit und einmal ohne eingeschalteten Schreibcache der Festplatte. Für eine lokale Festplatte können

Mehr

Data Warehouse Grundlagen

Data Warehouse Grundlagen Seminarunterlage Version: 2.10 Version 2.10 vom 24. Juli 2015 Dieses Dokument wird durch die veröffentlicht.. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen sind Warenzeichen

Mehr

Implementierung der SQL Operatoren GROUP BY und CUBE

Implementierung der SQL Operatoren GROUP BY und CUBE Implementierung der SQL Operatoren GROUP BY und CUBE Seminararbeit von Christian Brandt Seminar Advanced Data Warehousing WS 2003/2004 Einführung Ein zentrales Element von OLAP - Anwendungen ist die Aggregation

Mehr

Structured Query Language (SQL) 1

Structured Query Language (SQL) 1 Structured Query Language (SQL) 1 1. Grundlagen und Hilfsmittel Structured Query Language, kurz SQL, wurde in den 70er Jahren bei IBM entwickelt, als eine Arbeitsgruppe die erste relationale Datenbank

Mehr

Einführung in die Informatik II

Einführung in die Informatik II Einführung in die Informatik II Die Structured Query Language SQL Prof. Dr. Nikolaus Wulff SQL Das E/R-Modell lässt sich eins zu eins auf ein Tabellenschema abbilden. Benötigt wird eine Syntax, um Tabellen

Mehr

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation Zusammenfassung OPAL 6. Übung Juni 2015 Agenda Hinweise zur Klausur Zusammenfassung OPAL Übungen / Kontrollfragen

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Vom Spreadsheet zum Würfel Multidimensionales Datenmodell (MDDM)

Mehr

Datenbankadministration

Datenbankadministration Datenbankadministration 2. SQL-Grundlagen AG DBIS University of Kaiserslautern, Germany Karsten Schmidt kschmidt@informatik.uni-kl.de (Vorlage TU-Dresden) Wintersemester 2008/2009 SQL SQL (Structured Query

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining OLAP Operationen Ein konzeptionelles MDDM Aggregierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Operationen im multidimensionalen Datenmodell

Mehr

Datenbanksprache SQL. Datenbanksprache SQL. 5.1 Anfragesprache SQL-DQL. from-klausel SS 2005

Datenbanksprache SQL. Datenbanksprache SQL. 5.1 Anfragesprache SQL-DQL. from-klausel SS 2005 Webbasierte Informationssysteme SS 2005 8. SQL-Vertiefung Prof. Dr. Stefan Böttcher Universität Paderborn Datenbanksprache SQL Structured Query Language (SQL) - am IBM San Jose Research Laboratory entwickelt

Mehr

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH Einführung in OLAP und Business Analysis Gunther Popp dc soft GmbH Überblick Wozu Business Analysis mit OLAP? OLAP Grundlagen Endlich... Technischer Background Microsoft SQL 7 & OLAP Services Folie 2 -

Mehr

Vertrautmachen mit Daten

Vertrautmachen mit Daten Kapitel III Vertrautmachen mit Daten 2004 AIFB / FZI 1 III Vertrautmachen mit Daten (see also Data Preparation ) 2004 AIFB / FZI 2 III Vertrautmachen mit Daten III.1 OLAP III.1.1 Einführung in OLAP Wie

Mehr

PostgreSQL im praktischen Einsatz. Stefan Schumacher

PostgreSQL im praktischen Einsatz. Stefan Schumacher PostgreSQL im praktischen Einsatz 2. Brandenburger Linux Infotag 2005 Stefan Schumacher , PGP Key http:/// $Header: /home/daten/cvs/postgresql/folien.tex,v 1.11 2005/04/25

Mehr

Download:.../~rieche. gehalten am 2. Februar 2004. Stephan Rieche. Vortrag. Thema: Index Selection. von. Seminar Advanced Data Warehouse

Download:.../~rieche. gehalten am 2. Februar 2004. Stephan Rieche. Vortrag. Thema: Index Selection. von. Seminar Advanced Data Warehouse Seminar Advanced Data Warehouse Thema: Index Selection Vortrag von Stephan Rieche gehalten am 2. Februar 2004 Download:.../~rieche Inhalt des Vortrages 1. Einleitung - Was ist das Index Selection Problem?

Mehr

SQL. SQL = Structured Query Language, ist eine standardisierte Sprache zum Gebrauch im Zusammenhang mit Datenbanken.

SQL. SQL = Structured Query Language, ist eine standardisierte Sprache zum Gebrauch im Zusammenhang mit Datenbanken. Vorlesungsteil SQL Grundlagen - 1 / 8 - SQL SQL = Structured Query Language, ist eine standardisierte Sprache zum Gebrauch im Zusammenhang mit Datenbanken. Auf einem Server (Rechner im Netz, der Dienste

Mehr

Sichten II. Definition einer Sicht. Sichten. Drei-Ebenen-Schema-Architektur. Vorteile Vereinfachung von Anfragen Strukturierung der Datenbank

Sichten II. Definition einer Sicht. Sichten. Drei-Ebenen-Schema-Architektur. Vorteile Vereinfachung von Anfragen Strukturierung der Datenbank Vorteile Vereinfachung von Anfragen Strukturierung der Datenbank Sichten II logische Datenunabhängigkeit (Sichten stabil bei Änderungen der Datenbankstruktur) Beschränkung von Zugriffen (Datenschutz) Definition

Mehr

Business Intelligence Praktikum 1

Business Intelligence Praktikum 1 Hochschule Darmstadt Business Intelligence WS 2013-14 Fachbereich Informatik Praktikumsversuch 1 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 14.10.2013 Business Intelligence Praktikum

Mehr

Logische Modellierung von Data Warehouses

Logische Modellierung von Data Warehouses Logische Modellierung von Data Warehouses Vertiefungsarbeit von Karin Schäuble Gliederung. Einführung. Abgrenzung und Grundlagen. Anforderungen. Logische Modellierung. Methoden.. Star Schema.. Galaxy-Schema..

Mehr

Stichwortverzeichnis. Iron Werther. Business Intelligence

Stichwortverzeichnis. Iron Werther. Business Intelligence Stichwortverzeichnis Iron Werther Business Intelligence Komplexe SQL-Abfragen am Beispiel eines Online-Shops. Inkl. Testdatenbank mit über zwei Millionen Datensätzen ISBN (Buch): 978-3-446-43580-3 ISBN

Mehr

Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen Fragen Vertiefung Modellierung

Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen Fragen Vertiefung Modellierung Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation Zusammenfassung OPAL 24. Juni 2014 Agenda Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen

Mehr

Kapitel 7 Datenbank-Tuning

Kapitel 7 Datenbank-Tuning Kapitel 7 Datenbank-Tuning Flien zum Datenbankpraktikum Wintersemester 2012/13 LMU München 2008 Thmas Bernecker, Tbias Emrich 2010 Tbias Emrich, Erich Schubert unter Verwendung der Flien des Datenbankpraktikums

Mehr

First. Kapitel 4Functions. Deterministische und nicht-deterministische Funktionen

First. Kapitel 4Functions. Deterministische und nicht-deterministische Funktionen First Kapitel 4Functions 4 SQL-Funktionen Eine Funktion ist ein spezieller Typ von Befehl aus dem Befehlsvorrat von SQL, und jeder SQL-Dialekt implementiert diesen Befehlsvorrat anders. Im Grunde sind

Mehr

zwei verschiedene Darstellungsformen derselben Abfrage.

zwei verschiedene Darstellungsformen derselben Abfrage. SQL Sprache Die strukturierte Abfragesprache SQL (englisch: Structured Query Language) bildet einen Standard zur Formulierung von Abfragen. Das SQL und das Abfragefenster bilden zwei verschiedene Darstellungsformen

Mehr

Kapitel 7 Datenbank-Tuning. Folien zum Datenbankpraktikum Wintersemester 2010/11 LMU München

Kapitel 7 Datenbank-Tuning. Folien zum Datenbankpraktikum Wintersemester 2010/11 LMU München Kapitel 7 Datenbank-Tuning Flien zum Datenbankpraktikum Wintersemester 2010/11 LMU München 2008 Thmas Bernecker, Tbias Emrich unter Verwendung der Flien des Datenbankpraktikums aus dem Wintersemester 2007/08

Mehr

Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben. Die Hypercube-Technologie

Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben. Die Hypercube-Technologie Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben Transbase Hypercube ist eine Transbase -Option, die die innovative Hypercube-Technologie für komplexe analytische Anwendungen (OLAP)

Mehr

Objektorientierte Datenbanken

Objektorientierte Datenbanken OODB 11 Slide 1 Objektorientierte Datenbanken Vorlesung 11 Sebastian Iwanowski FH Wedel OODB 11 Slide 2 Wesentliche Eigenschaften von Hibernate Transparente Persistenz Transitive Persistenz (Persistenz

Mehr

Taschenbuch der Wirtschaftsinformatik und Wirtschaftsmathematik

Taschenbuch der Wirtschaftsinformatik und Wirtschaftsmathematik Taschenbuch der Wirtschaftsinformatik und Wirtschaftsmathematik von Wolfgang König, Heinrich Rommelfanger, Dietrich Ohse, Oliver Wendt, Markus Hofmann, Michael Schwind, Klaus Schäfer, Helmut Kuhnle, Andreas

Mehr

Kapitel 3: Datenbanksysteme

Kapitel 3: Datenbanksysteme LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Skript zur Vorlesung: Einführung in die Informatik: Systeme und Anwendungen Sommersemester 2008 Kapitel 3: Datenbanksysteme Vorlesung:

Mehr

Cassandra Query Language (CQL)

Cassandra Query Language (CQL) Cassandra Query Language (CQL) Seminar: NoSQL Wintersemester 2013/2014 Cassandra Zwischenpräsentation 1 Gliederung Basic facts Datentypen DDL/DML ähnlich zu SQL Besonderheiten Basic facts CQL kurz für

Mehr

Herbstsemester 2009. Datenbanken mit Übungen Kapitel 4: SQL. H. Schuldt. Inhalt

Herbstsemester 2009. Datenbanken mit Übungen Kapitel 4: SQL. H. Schuldt. Inhalt Herbstsemester 2009 Datenbanken mit Übungen Kapitel 4: SQL H. Schuldt Inhalt Datenmanipulationssprache SQL: SQL (Structured Query Language) ist die Standardsprache für die Datendefinition und Datenmanipulation

Mehr

Implementierung eines Data Marts. Gunther Popp dc soft GmbH

Implementierung eines Data Marts. Gunther Popp dc soft GmbH Implementierung eines Data Marts Gunther Popp dc soft GmbH Überblick Vorstellung der Beispielanwendung Prozeß zur Erstellung eines Data Marts - Design - Datenermittlung - Implementierung Erläutert am Beispiel-Mart

Mehr

Eignung unterschiedlicher Faktenmodellierungen in Data Warehouse-Systemen

Eignung unterschiedlicher Faktenmodellierungen in Data Warehouse-Systemen Christoph Arnold (B. Sc.) Prof. Dr. Harald Ritz Eignung unterschiedlicher Faktenmodellierungen in Data Warehouse-Systemen AKWI-Tagung, 17.09.2012, Hochschule Pforzheim Christoph Arnold, Prof. Dr. Harald

Mehr

Einstieg in das SQL- und Datenbanktuning 14.01.2009. Loblied auf den Tabellen-Index!

Einstieg in das SQL- und Datenbanktuning 14.01.2009. Loblied auf den Tabellen-Index! 1/40 PHP-User-Group Stuttgart 14.01.2009 Warum Datenbanken einen Hals bekommen und was sich dagegen tun lässt. Tuning und Performancesteigerung ohne zusätzliche Hardware. Ein. Loblied auf den Tabellen-Index!

Mehr

Kapitel 3 Abfragen mit SQL Seite 1. Abbildung 3.1: Die Datenbank EDV_Kurse

Kapitel 3 Abfragen mit SQL Seite 1. Abbildung 3.1: Die Datenbank EDV_Kurse Kapitel 3 Abfragen mit SQL Seite 1 3 Abfragen mit SQL Um bestimmte Datensätze aus der Datenbank zu gewinnen, verwendest du die»programmiersprache«sql (Structured Query Language). Sie ist derzeit die am

Mehr

4.1 SQL. Wichtige skalare Datentypen

4.1 SQL. Wichtige skalare Datentypen 4. Basierend auf dem Tupelkalkül und der relationalen Algebra wurden mit dem Aufkommen relationaler DBMS auch spezielle Sprachen entwickelt. SQL ist die derzeit am weitesten verbreitete Anfragesprache

Mehr

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

Einführung in SQL Datenbanken bearbeiten

Einführung in SQL Datenbanken bearbeiten Einführung in SQL Datenbanken bearbeiten Jürgen Thomas Entstanden als Wiki-Buch Bibliografische Information Diese Publikation ist bei der Deutschen Nationalbibliothek registriert. Detaillierte Angaben

Mehr

Motivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi

Motivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi Motivation Themenblock: Data Preprocessing We are drowning in information, but starving for knowledge! (John Naisbett) Was genau ist Datenanalyse? Praktikum: Data Warehousing und Data Mining Was ist Data

Mehr

Konzeption und Realisierung eines Data Warehouses zur Analyse chirurgischer Workflows

Konzeption und Realisierung eines Data Warehouses zur Analyse chirurgischer Workflows Matthias Röger Konzeption und Realisierung eines Data Warehouses zur Analyse chirurgischer Workflows Diplomica Verlag Matthias Röger Konzeption und Realisierung eines Data Warehouses zur Analyse chirurgischer

Mehr

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher

Mehr

Data Warehousing Grundbegriffe und Problemstellung

Data Warehousing Grundbegriffe und Problemstellung Data Warehousing Grundbegriffe und Problemstellung Dr. Andrea Kennel, Trivadis AG, Glattbrugg, Schweiz Andrea.Kennel@trivadis.com Schlüsselworte Data Warehouse, Cube, Data Mart, Bitmap Index, Star Queries,

Mehr