Data Warehousing. Ausführung von OLAP Operationen. Ulf Leser Wissensmanagement in der Bioinformatik
|
|
- Catharina Schulz
- vor 7 Jahren
- Abrufe
Transkript
1 Data Warehousing Ausführung von OLAP Operationen Ulf Leser Wissensmanagement in der Bioinformatik
2 Variante 1 - Snowflake Year id year Productgroup id pg_name Month Id Month year_id Day Id day month_id Sales Product_id Day_id Shop_id amount price Product id product_name pg_id Shop id shop_name region_id Region id region_name Ulf Leser: Data Warehousing, Vorlesung, SoSe
3 Variante 2: Star Schema Product product_id product_name pg_id pg_name Time day_id day month_id month year_id year Sales product_id day_id shop_id amount price Localization shop_id shop_name region_id region_name Ulf Leser: Data Warehousing, Vorlesung, SoSe
4 Variante 3: Fullfact Year id year Productgroup id pg_name Month Id Month year_id Day Id day month_id Sales Product_id pg_id Day_id month_id year_id Shop_id region_id amount price Product id product_name pg_id Shop id shop_name region_id Region id region_name Ulf Leser: Data Warehousing, Vorlesung, SoSe
5 Speicherverbrauch 3 Speicherplatz nach Anz. K-Stufen, M=10 6, D=4 Speicher snowflake star fullfact Klassifikationsstufen Ulf Leser: Data Warehousing, Vorlesung, SoSe
6 Änderungskosten Snowflake Star Fullfact InsN 1 Insert (1 Insert) 1 Insert InsS 1 neue Tabelle, 3 (k+1)-(i-1) Updates (Umhängung) 1 neues Attribut, 3 K Updates (Wert des Attrib.) 1 neues Attribut, M Updates (In Faktentabelle) DelN 1 Delete, 3 Update 0 Delete, 3 Update 1 Delete, M/3 K-i Updates (Level i: 3 k-i Knoten) DelN 0 1 Delete, M/3 K Update 1 Delete, M/3 K Update 1 Delete, M/3 K Updates Ulf Leser: Data Warehousing, Vorlesung, SoSe
7 Arrayspeicherung - Probleme Naive MOLAP: Unterschiedliche Performanz je nach Dimensionsreihenfolge in Array / Anfrage Daten liegen nach D n geordnet auf Platte Zugriff auf <2,2,X> - sequentieller Read Zugriff auf <X,1,3> oder <3,X,3> - Zugriff auf viele Blöcke RDBMS mit ähnlichen Problemen Speicherung verschiedener Werte pro Zelle? Mehrere Verkäufe von CocaCola an einem Tag in einem Shop Auflösung durch Listen o.ä. Ulf Leser: Data Warehousing, Vorlesung, SoSe
8 Vergleich Speicherplatz Faktoren Füllgrad k: Anz. Knoten n: Anz. Dimensionen Schon bei geringen Füllgraden ist Array platzeffizienter Aber: Füllgrad ist bei vielen Dimensionen bzw. Klassifikationsknoten oft erstaunlich gering Bei weitem nicht alle Kombinationen vorhanden Speicherplatz nach Füllgrad, b=8, k=100, n= Füllgrad in % Speicherplatz nach Füllgrad, b=8, k=20, n= Füllgrad in % Ulf Leser: Data Warehousing, Vorlesung, SoSe Array Relational Array Relational
9 Inhalt dieser Vorlesung Sprachen für OLAP Operationen MDX SQL Erweiterungen Ulf Leser: Data Warehousing, Vorlesung, SoSe
10 OLAP Operationen Die schon besprochenen Roll-Up, Drill-Down, Slice, Dice Keine Rotierung: Aufgabe der Darstellungsschicht Vor allem: Hierarchische Aggregation Roll-Ups mit Aggregation auf allen Ebenen (Summe pro Tag, pro Monat, pro Jahr) Roll-Ups über mehrere Dimensionen (Cross-Tabs): Verkäufe pro Marke und Jahr und Shop, Summen in allen Kombinationen... Ulf Leser: Data Warehousing, Vorlesung, SoSe
11 Absetzen von OLAP Operationen MDX Eigene Sprache Benutzt MDDM Elementen: Cube, Dimension, Fakt,... Auf dem Vormarsch als Standard Erweiterungen von SQL Umsetzung in relationale Operationen Operiert auf Star oder Snowflake-Schema Ulf Leser: Data Warehousing, Vorlesung, SoSe
12 MDX Microsoft s Vorschlag Teil von OLE DB for OLAP MDX: Multidimensional Expressions Neue Sprache Standard ohne feste Semantik (by example) MDDM Konzepte als First-Class Elemente SQL-artige Syntax, aber gänzlich andere Bedeutung DDL und DML (hier nur letzteres) Sehr mächtig und komplex Ulf Leser: Data Warehousing, Vorlesung, SoSe
13 MDX Elemente Measures = Fakten Modelliert als eigene Dimension mit einer Stufe Faktname ist der einzige Klassifikationsknoten Dimensions = Dimensionen Level = Klassifikationsstufe Multiple hierarchies = Verschiedene Pfade Member = Klassifikationsknoten Syntax {} Sets [] Einschluss von Strings Ulf Leser: Data Warehousing, Vorlesung, SoSe
14 Grundprinzip 1997 Jahr Kontinent MDX Query Asien Südamerika 1998 BMW Peugot VW Ford Automarke 1999 Ulf Leser: Data Warehousing, Vorlesung, SoSe
15 Struktur SELECT <axis-spec1>, <axis-spec2>,.. FROM <cube-spec1>, <cube-spec2>,... WHERE <slice-specification> Dimensions (Select) Angabe der darzustellenden Achsen Abbildung in zweidimensionale Tabellen ON COLUMNS, ROWS, PAGES, CHAPTER,... Mischungen verschiedener Klassifikationsstufen einer Dim. erlaubt Werte auf verschiedenen Aggregatsebenen werden gemischt dargestellt Cube (From) Verbundoperationen auf Cubes (?) Slicer (Where) Auswahl des betreffenden Fakten/Gruppen Mengen Ulf Leser: Data Warehousing, Vorlesung, SoSe
16 Remember... Jahr Monat Tag Menge Preis Verkauf Shop Region Produktgruppe Produkt Country Ulf Leser: Data Warehousing, Vorlesung, SoSe
17 Beispiel Knotenbezeichnung: Unique Names oder Navigation (s.u.) Verschiedene Klassifikationsstufen möglich SELECT {Wein, Bier, Limo, Saft} ON COLUMNS {[2000], [1999], [1998].[1], [1998].[2]} on ROWS FROM Sales WHERE (Measures.Menge, Country.Germany) Slicer: Auswahl des Fakt Menge, Beschränkung auf Werte in BRD 2000 Wein Bier Limo Saft Implizite Summierung von Menge, nur BRD, nach Produktgruppe / Zeitangabe Ulf Leser: Data Warehousing, Vorlesung, SoSe
18 Navigation SELECT {Prodgroup.MEMBERS, [Becks Bier].PARENT} ON COLUMNS {Year.MEMBERS} on ROWS FROM Sales WHERE (Measures.Menge) Navigationsfunktionen Members: Knoten einer Klassifikationsstufe Children: Kinderknoten eines Klassifikationsknoten Parent: Vaterknoten eines Klassifikationsknoten LastChild, FirstChild, NextMember, CurrentMember,... Descendent: Recursives Absteigen Ulf Leser: Data Warehousing, Vorlesung, SoSe
19 Crossjoin SELECT CROSSJOIN( {Germany, France} {Wein, Bier}) ON COLUMNS {Year.MEMBERS} on ROWS FROM Sales WHERE (Measures.Menge) Germany France Wein Bier Wein Bier Projektion zweier Dimensionen in Eine Semantik: Alle möglichen Kombinationen Ulf Leser: Data Warehousing, Vorlesung, SoSe
20 Weitere Feature TOPN Queries SELECT {Year.MEMBERS} ON COLUMNS {TOPCOUNT(Country.MEMBERS, 5, Measures.Menge} ON ROWS Filtering dimension values SELECT FILTER(Germany.CHILDREN, ([2002], M.Menge) > ([2001], M.Menge)} ON COLUMNS Month.MEMBER ON ROWS Named Sets und Calculated Members Zeitreihenoperationen und conditionale Werte... Ulf Leser: Data Warehousing, Vorlesung, SoSe
21 MDX - Fazit Hohe Komplexität Mächtige Sprache Direkte Anlehnung an MDDM Könnte sich als Standard durchsetzen Schnittstelle zwischen OLAP GUI und DB-Server Unterstützt von MS, Microstrategy, Cognos, BusinessObjects,... Ulf Leser: Data Warehousing, Vorlesung, SoSe
22 Inhalt dieser Vorlesung Sprachen für OLAP Operationen MDX SQL Erweiterungen Ulf Leser: Data Warehousing, Vorlesung, SoSe
23 SQL und OLAP Übersetzung eines MDDM in ein Star-Schema Oder Snowflake Schema Triviale Operationen Auswahl (slice, dice): Joins und Selects Verfeinerung (drill-down): Joins und Selects Einfache Operation Aggregation um eine Stufe: Group-by Schwieriger Mehrere hierarchische, multidimensionale Aggregationen Ulf Leser: Data Warehousing, Vorlesung, SoSe
24 Beispielschema Time day_id day month_id month year_id year Sales product_id day_id shop_id amount price Product product_id product_name pg_id pg_name Localization shop_id shop_name region_id region_name Ulf Leser: Data Warehousing, Vorlesung, SoSe
25 Einschub: GROUP-BY SELECT T.day_id, sum(amount*price) FROM Sales S GROUP BY T.day_id Syntax SELECT Klausel darf nur GROUP_BY Ausdrücke, Konstante und Aggregatfunktionen enthalten Semantik Partitionierung der Ergebnistupel nach unterschiedlichen Werten der GROUP-BY Attribute Summierung der Aggregationswerte (Measures) pro Partition Innere Query (Tuplestrom) Partitionierung (Group by) Aggregation (pro Partition) Selektion der Part. (having) Sortierung (der Partitionen) Ulf Leser: Data Warehousing, Vorlesung, SoSe
26 Beispiel Aggregation Alle Verkäufe der Produktgruppe Wein nach Monaten SELECT T.month, sum(amount*price) FROM Sales S, Product P, Time T WHERE P.pg_name= Wein and P.product_id = S.product_id and T.day_id = S.day_id GROUP BY T.month_id Scheitert:... T.month is not a GROUP-BY expression... Funktionale Abhängigkeit T.month_id->T.Month nicht bekannt (Erinnerung: ATTRIBUTE... DETERMINES in Oracle) Ulf Leser: Data Warehousing, Vorlesung, SoSe
27 Hierarchische Aggregation Alle Verkäufe der Produktgruppe Wein nach Tagen, Monaten und Jahren SELECT T.year_id, T.month_id, T.day_id, sum(...) FROM Sales S, Product P, Time T WHERE P.pg_name= Wein and P.product_id = S.product_id and T.day_id = S.day_id GROUP BY T.year_id, T.month_id, T.day_id Summe nur für Tage (unterteilt nach Monaten/Jahren) Keine Summen pro Monat / pro Jahr Nicht in einer Query formulierbar Ulf Leser: Data Warehousing, Vorlesung, SoSe
28 Hierarchische Aggregation 2- Alle Verkäufe der Produktgruppe Wein nach Tagen, Monaten und Jahren Benötigt UNION und eine Query pro Klassifikationsstufe SELECT T.day_id, sum(amount*price) FROM Sales S, Product P WHERE P.pg_name= Wein and P.product_id SELECT T.month_id, = S.product_id sum(amount*price) GROUP BY FROM T.day_id Sales S, Product P, Time T WHERE P.pg_name= Wein and P.product_id SELECT T.year_id, = S.product_id sum(amount*price) and T.day_id FROM = S.day_id Sales S, Product P, Time T GROUP BY T.month_id WHERE P.pg_name= Wein and P.product_id = S.product_id and T.day_id = S.day_id GROUP BY T.year_id Ulf Leser: Data Warehousing, Vorlesung, SoSe
29 Ergebnis Tage Monate Jahre Schöner wäre Ulf Leser: Data Warehousing, Vorlesung, SoSe
30 ROLLUP Operator Herkömmliches SQL Dimension mit k Stufen Union von k Queries k Scans der Faktentabelle Keine Optimierung wg. fehlender Multiple-Query Optimierung in kommerziellen RDBMS Schlechte Ergebnisreihenfolge ROLLUP Operator Hierarchische Aggregation mit Zwischensummen Summen werden durch ALL als Wert repräsentiert Ulf Leser: Data Warehousing, Vorlesung, SoSe
31 ROLLUP Beispiel SELECT T.year_id, T.month_id, T.day_id, sum(...) FROM Sales S, Time T WHERE T.day_id = S.day_id GROUP BY ROLLUP(T.year_id, T.month_id, T.day_id) 1997 Jan Jan Jan Jan Feb Feb... ALL ALL... ALL... ALL Jan ALL ALL ALL ALL ALL Ulf Leser: Data Warehousing, Vorlesung, SoSe
32 Multidimensionale Aggregation Verkäufe nach Produktgruppen und Jahren Gesamt Weine Biere Gesamt sum()... GROUP BY pg_id, year_id sum()... GROUP BY pg_id sum() Wie... viele GROUP Queries BY sind year_id notwendig? sum() Ulf Leser: Data Warehousing, Vorlesung, SoSe
33 Cube Operator d Dimensionen, jeweils eine Klassifikationsstufe Jede Dimension kann in Gruppierung enthalten sein oder nicht 2 d Gruppierungsmöglichkeiten Herkömmliches SQL Viel Schreibarbeit 2 d Scans der Faktentabelle (wieder keine Optimierung möglich) CUBE Operator Berechnung der Summen von sämtlichen Kombinationen der Argumente (Klassifikationsstufen) Summen werden durch ALL repräsentiert Keine Beachtung von Hierarchien Durch Schachtelung mit ROLLUP erreichbar Ulf Leser: Data Warehousing, Vorlesung, SoSe
34 CUBE - Beispiel SELECT pg_id, shop_id, sum(amount*price) FROM Sales S... GROUP BY CUBE (S.pg_id, S.shop_id, T.year_id) Bier Kreuzberg ALL... Bier Charlottenburg ALL... Bier ALL Wein ALL ALL Kreuzberg ALL Charlottenburg Bier ALL ALL... Wein ALL ALL... ALL ALL ALL ALL ALL Kreuzberg ALL... ALL Charlottenburg ALL... ALL ALL ALL... Ulf Leser: Data Warehousing, Vorlesung, SoSe
35 Cube-Operator: Veranschaulichung Aggregate Sum RED WHITE BLUE Group By (with total) By Color Sum RED WHITE BLUE By Make Cross Tab Chevy Ford By Color Sum By Make & Year By Year FORD CHEVY By Color & Year The Data Cube and The Sub-Space Aggregates By Make RED WHITE BLUE By Make & Color Sum By Color Source: Gray et al., Datacube, Microsoft & IBM Ulf Leser: Data Warehousing, Vorlesung, SoSe
36 GROUPING SETS Operator CUBE Alle Gruppierungskombinationen Das sind sehr viele... GROUPING SETS Explizite Angabe der gewünschten Gruppierungen Gruppierung wird für jeden SET einzeln ausgeführt, benötigt aber nur einen SCAN Äquivalent zu UNION einzelner GROUP BY Ulf Leser: Data Warehousing, Vorlesung, SoSe
37 GROUPING SETS - Beispiel SELECT pg_id, shop_id, sum(amount*price) FROM Sales S GROUP BY GROUPING SETS((S.pg_id), (S.shop_id)) Bier ALL 300 Wein ALL 450 ALL Kreuzberg 350 ALL Charlottenburg 400 Ulf Leser: Data Warehousing, Vorlesung, SoSe
38 Fazit Operationen schachtelbar GROUP BY ROLLUP( year, month, day, CUBE(pg_id, shop_id)) SQL-Standard Implementiert (mindestens) von Oracle, DB2, SQLServer Wesentliche Verbesserung Kompaktere Queries Deutliche Beschleunigung durch weniger Scans Aggregierbarkeit beachten: ROLLUP AVG? Implementierung von CUBE nicht trivial sehr viele Zwischensummen Weitere Operationen GROUPING Erkennen von Summenwerten Sliding Windows, sequenzbasierte Operationen Percentile, Rank, TopN Queries... Aktives Gebiet aller DB-Hersteller Ulf Leser: Data Warehousing, Vorlesung, SoSe
39 Literatur [BG01]: Bauer, Günzel: Data Warehouse Systeme: Architektur, Entwicklung, Anwendung, dpunkt.verlag, 2001 [Leh03] Lehner: Datenbanktechnologie für Data Warehouse Systeme, dpunkt.verlag, 2003 [GCB+97] Gray et al. Data Cube: A Relational Aggregation Operator Generalizing Group-By, Cross- Tab, and Sub-Totals, Journal on Data Mining and Knowledge Discovery, 1997 [Nol99] Nolan: Introduction to Multidimensional Expressions (MDX), Microsoft Corp. Ulf Leser: Data Warehousing, Vorlesung, SoSe
Data Warehousing und Data Mining
Data Warehousing und Data Mining Sprachen für OLAP Operationen Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung OLAP Operationen MDX: Multidimensional Expressions SQL Erweiterungen
MehrMultidimensionale Modellierung
Multidimensionale Modellierung Vorlesung: Übung: Patrick Schäfer Berlin, 27. November 2017 patrick.schaefer@hu-berlin.de https://hu.berlin/vl_dwhdm17 https://hu.berlin/ue_dwhdm17 Grundlagen Fakten (Kennzahlen/Messgrößen):
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Sprachen für OLAP Operationen Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung OLAP Operationen MDX: Multidimensional Expressions SQL Erweiterungen
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Sprachen für OLAP Operationen Ulf Leser Wissensmanagement in der Bioinformatik Beispielquery Year Month Day Shop_name Pg_name Amount Price Sales Shop Region Productgroup
MehrAnfragen an multidimensionale Daten
Anfragen an multidimensionale Daten Alexander Heidrich - BID8 09.06.2005 Hintergrundbild: http://www.csc.calpoly.edu/~zwood/teaching/csc471/finalproj02/afternoon/mfouquet/cube.jpg Inhaltsübersicht Motivation
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Sprachen für OLAP Operationen Ulf Leser Wissensmanagement in der Bioinformatik Übersicht Konzeptionell: Modellierung und Sprachen Architektur & Prozesse Multidimensionale
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Speicherung multidimensionaler Daten Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Relationales OLAP (ROLAP) Snowflake-, Star- und Fullfactschema
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Speicherung multidimensionaler Daten Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Relationales OLAP (ROLAP) Snowflake-, Star- und Fullfactschema
MehrData Warehousing. Speicherung multidimensionaler Daten. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Speicherung multidimensionaler Daten Ulf Leser Wissensmanagement in der Bioinformatik Beispiel Z.Tag Z.Monat 4.1.1999 B.Abteilung 4 1999 B.Sparte 3.1.1999 3 1999 2.1.1999 1.1.1999 Skoda.Reparatur
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Logische Optimierung Ulf Leser Wissensmanagement in der Bioinformatik Inhaltsübersicht Vorlesung Architektur Modellierung von Daten im DWH Umsetzung des multidimensionalen
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Speicherung multidimensionaler Daten Ulf Leser Wissensmanagement in der Bioinformatik Dimension Dimension Top Jahr 1997 1998 1999 2000 Quartal I II III IV I II III IV Klassifikationsstufen
Mehr6.5 Workshop: Operationen auf dem Cube Multidimensional Expressions (MDX)
6.5 Workshop: Operationen auf dem Cube Multidimensional Expressions (MDX) Was ist MDX? Microsoft Terminologie im OLAP Bereich MDX Basiskonstrukte MDX weiterführende Konstrukte Fazit MDX.- 1 Was ist MDX?
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Logische Optimierung Ulf Leser Wissensmanagement in der Bioinformatik Inhaltsübersicht Vorlesung Einleitung & Motivation Architektur Modellierung von Daten im DWH Umsetzung
MehrDatenbanksysteme I Data Warehouses Felix Naumann
Datenbanksysteme I Data Warehouses 13.7.2009 Felix Naumann Überblick 2 Einsatzgebiete OLAP versus OLTP Multimensionale i l Modellierung OLAP Operationen Relationale Implementierung Folien zu DWH: Ulf Leser
MehrDatenbanksysteme I Data Warehouses Felix Naumann
Datenbanksysteme I Data Warehouses 5.7.2010 Felix Naumann Überblick 2 Einsatzgebiete OLAP versus OLTP Multimensionale i l Modellierung OLAP Operationen Relationale Implementierung Neue Architekturen Folien
MehrAnfragesprachen für On-Line Analytical Processing (OLAP)
Anfragesprachen für On-Line Analytical Processing (OLAP) Seminar Business Intelligence Teil I: OLAP & Data Warehousing René Rondot rondot@informatik.uni-kl.de Universität Kaiserslautern Anfragesprachen
MehrEinleitung. ROLLUP, CUBE und GROUPING. Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002)
Betrifft Autör: GROUPING_ID Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Quelle Aus dem Oracle9i Data Warehousing Guide und den Kursen New Features Oracle9i
Mehrbersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter
bersicht Niels Schršter EinfŸhrung GROUP BY Roll UpÔs Kreuztabellen Cubes Datenbank Ansammlung von Tabellen, die einen ãausschnitt der WeltÒ fÿr eine Benutzergruppe beschreiben. Sie beschreiben die funktionalen
MehrData Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Sommersemester 2004 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte
MehrData Warehousing. Indexierung. Wissensmanagement in der. Bioinformatik. Ulf Leser
Data Warehousing Indexierung Ulf Leser Wissensmanagement in der Bioinformatik Beispielquery Jahr Monat Tag Menge Preis Verkauf Shop Region Produktgruppe Produkt Alle Verkäufe der Produktgruppe Bier nach
MehrInhaltsverzeichnis. 1 Einleitung 1. 2 Aufbau von Data-Warehouse-Systemen 15. Lehner, Wolfgang Datenbanktechnologie für Data-Warehouse-Systeme 2003
1 Einleitung 1 1.1 Betriebswirtschaftlicher Ursprung des Data Warehousing 2 1.2 Statistischer Ursprung des Data Warehousing 5 1.3 Fòderativer Ursprung des Data Warehousing 7 1.4 Definition eines Data-Warehouse-Systems
MehrSummarization-based Aggregation
Summarization-based Aggregation Daten Generalisierung: Prozess, der Anwendungsdaten schrittweise von niedrigen auf höhere konzeptuelle Level aggregiert Conceptual levels 2 3 4 5 example: all federal states
MehrDimensionen, Measures
... Operationen und peicherung Multi-dimensionaler Daten Aggregate um RED WHITE BLUE Group By (with total) By Color um Cross Tab Chevy Ford By Color RED WHITE BLUE By Make um By Make & Year By Year FORD
MehrKapitel 5: Vom relationalen zum multidimensionalen Datenmodell
Kapitel 5: Vom relationalen zum multidimensionalen Datenmodell Data Warehousing und Mining 1 Data Warehousing, Gliederung Dimensionen und Measures Schematypen für Data Warehousing GroupBy und Data Cubes
MehrKapitel 5: Vom relationalen zum multidimensionalen Datenmodell
Data Warehousing, Gliederung Kapitel 5: Vom relationalen zum multidimensionalen Datenmodell Dimensionen und Measures Schematypen für Data Warehousing GroupBy und Data Cubes Operatoren für den Data Cube
MehrACCESS SQL ACCESS SQL
ACCESS SQL Datenbankabfragen mit der Query-Language ACCESS SQL Datenbankpraxis mit Access 34 Was ist SQL Structured Query Language Bestehend aus Datendefinitionssprache (DDL) Datenmanipulationssprache
MehrFortgeschrittene OLAP Analysemodelle
Fortgeschrittene OLAP Analysemodelle Jens Kübler Imperfektion und erweiterte Konzepte im Data Warehousing 2 Grundlagen - Datenanalyse Systemmodell Datenmodell Eingaben System Schätzer Datentypen Datenoperationen
MehrRepetitorium. Data Warehousing und Data Mining 11/12. Sebastian Wandelt 13./16. Februar 2012
Repetitorium Data Warehousing und Data Mining 11/12 Sebastian Wandelt 13./16. Februar 2012 Inhalt Data Warehousing und Data Mining auf 40 Slides Weder in-, noch exklusiv! Subjektive Zusammenfassung pro
MehrBusiness Intelligence & Reporting. Michael Cordes Holger Oehring Matthias Rein
Business Intelligence & Reporting Michael Cordes Holger Oehring Matthias Rein Ziele Einführung Business Intelligence / Front Room Online Analytical Processing (OLAP) Arten des Reporting & Nutzergruppen
MehrChapter 6 Data Analysis in SQL
Chapter 6 Data Analysis in SQL Prof. Dr.Ing. Stefan Deßloch Geb. 36, Raum 329 Tel. 63/25 3275 dessloch@informatik.unikl.de Inhalt Überblick I. Objektorientierung und Erweiterbarkeit. Benutzerdefinierte
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Materialisierte Sichten I Optimierung mit MV Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Materialisierte Sichten Logische Anfrageplanung mit
MehrISU 1. Ue_08/02_Datenbanken/SQL. 08 Datenbanken. Übung. SQL Einführung. Eckbert Jankowski. www.iit.tu-cottbus.de
08 Datenbanken Übung SQL Einführung Eckbert Jankowski www.iit.tu-cottbus.de Datenmodell (Wiederholung, Zusammenfassung) Objekte und deren Eigenschaften definieren Beziehungen zwischen den Objekten erkennen/definieren
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining OLAP Operationen Ein konzeptionelles MDDM Aggregierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Operationen im multidimensionalen Datenmodell
MehrThemenblock: Erstellung eines Cube
Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen
MehrKapitel 5: Vom relationalen zum multidimensionalen Datenmodell
Data Warehousing, Gliederung Kapitel 5: Vom relationalen zum multidimensionalen Datenmodell Dimensionen und Measures Schematypen für Data Warehousing Groupy und Data Cubes Operatoren für den Data Cube
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Materialisierte Sichten I Optimierung mit MV Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Materialisierte Sichten Logische Anfrageplanung mit
MehrAnalytic Views: Einsatzgebiete im Data Warehouse
Analytic Views: Einsatzgebiete im Data Warehouse Dani Schnider Trivadis AG Zürich/Glattbrugg, Schweiz Einleitung Analytic Views sind eine der wesentlichen Erweiterungen in Oracle 12c Release 2. Durch zusätzliche
MehrAnfragen in Operativen Systemen und Data Warehouses
Data Warehouses Sommersemester 011 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen Anfragen in Operativen Systemen und Data Warehouses Anfragen Operative
MehrSQL. Ziele. Grundlagen von SQL. Beziehung zur relationalen Algebra SELECT, FROM, WHERE. Joins ORDER BY. Aggregatfunktionen. dbis.
SQL Lehr- und Forschungseinheit Datenbanken und Informationssysteme Ziele Grundlagen von SQL Beziehung zur relationalen Algebra SELECT, FROM, WHERE Joins ORDER BY Aggregatfunktionen Lehr- und Forschungseinheit
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Materialisierte Sichten I Optimierung mit MV Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Materialisierte Sichten Logische Anfrageplanung mit
MehrEinführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.
Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen
Mehr6.2 Datenmodellierung
Umsetzung des multidimensionalen Modells Interne Verwaltung der Daten durch - Relationale Strukturen (Tabellen) Relationales OLAP (ROLAP) Vorteile: Verfügbarkeit, Reife der Systeme - Multidimensionale
MehrUnterstützung der Unternehmenssteuerung durch Data Warehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen
Rückblick Unterstützung der Unternehmenssteuerung durch Data arehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen Online Transaction Processing (OLTP) und Online Analytical Processing unterscheiden
MehrUnterstützung der Unternehmenssteuerung durch Data Warehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen
Rückblick Unterstützung der Unternehmenssteuerung durch Data arehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen Online Transaction Processing (OLTP) und Online Analytical Processing unterscheiden
MehrSeminar 2. SQL - DML(Data Manipulation Language) und. DDL(Data Definition Language) Befehle.
Seminar 2 SQL - DML(Data Manipulation Language) und DDL(Data Definition Language) Befehle. DML Befehle Aggregatfunktionen - werden auf eine Menge von Tupeln angewendet - Verdichtung einzelner Tupeln yu
MehrKap. 6 Data Warehouse
1 Kap. 6 Data Warehouse 6.1 Was ist ein Data Warehouse, Motivation? 6.2 Data Cube und Cube-Operationen 6.3 Workshop: MS SQL Server, Cube Operationen 6.4 Physischer Entwurf, Implementierung von Cubes 6.5
MehrData Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte
MehrData-Warehouse-Technologien
Data-Warehouse-Technologien Prof. Dr.-Ing. Kai-Uwe Sattler 1 Prof. Dr. Gunter Saake 2 Dr. Veit Köppen 2 1 TU Ilmenau FG Datenbanken & Informationssysteme 2 Universität Magdeburg Institut für Technische
MehrSQL. DDL (Data Definition Language) Befehle und DML(Data Manipulation Language)
SQL DDL (Data Definition Language) Befehle und DML(Data Manipulation Language) DML(Data Manipulation Language) SQL Abfragen Studenten MatrNr Name Vorname Email Age Gruppe 1234 Schmidt Hans schmidt@cs.ro
MehrData Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube
Fragen des Marketingleiters Data Warehousing Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt nach? Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon Technisch
MehrWS 2010/11 Datenbanksysteme Fr 15:15 16:45 R Vorlesung #3. SQL (Teil 1)
Vorlesung #3 SQL (Teil 1) Fahrplan Wiederholung/Zusammenfassung Relationales Modell Relationale Algebra Relationenkalkül Geschichte der Sprache SQL SQL DDL (CREATE TABLE...) SQL DML (INSERT, UPDATE, DELETE)
MehrData Warehousing. Answering Queries using Views. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Answering Queries using Views Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Materialisierte Sichten Answering Queries Using Views Query Containment Ableitbarkeit
MehrData Warehousing. Weitere Buzzwörter: OLAP, Decision Support, Data Mining
Data Warehousing Weitere Buzzwörter: OLAP, Decision Support, Data Mining Wichtige Hinweise Zu diesem Thema gibt es eine Spezialvorlesung im Sommersemester Hier nur grober Überblick über Idee und einige
MehrVorlesung Wissensentdeckung in Datenbanken
Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Uwe Ligges Informatik LS 8 22.04.2010 1 von 26 Gliederung 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der
MehrVorlesung Wissensentdeckung in Datenbanken
Gliederung Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Claus Weihs 14.07.2009 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der Cube-Operator 5 Implementierung
MehrAbfragen (Queries, Subqueries)
Abfragen (Queries, Subqueries) Grundstruktur einer SQL-Abfrage (reine Projektion) SELECT [DISTINCT] {* Spaltenname [[AS] Aliasname ] Ausdruck} * ; Beispiele 1. Auswahl aller Spalten SELECT * ; 2. Auswahl
MehrInformationsintegration
Informationsintegration Data Warehouse (= Materialisierte Integration) Ulf Leser Sebastian Wandelt Inhalt dieser Vorlesung Data Warehouses OLAP versus OLTP Multidimensionale Modellierung ETL Prozess Vergleich:
MehrKapitel 8: Data Warehouse 1
Objektverwaltung höherer Ordnung (OHO) SS 23 Kapitel 8: Data Warehouse Kap. 8 Data Warehouse 8. Was ist ein Data Warehouse, Motivation? 8.2 Data Cube und SQL-Operationen 8.3 Cube-Operationen 8.4 Physischer
MehrOracle Indexing Primer
Oracle Indexing Primer Data Warehousing and Data Mining Patrick Schäfer Berlin, 18. Dezember 2017 patrick.schaefer@hu-berlin.de Vorlesung: Übung: https://hu.berlin/vl_dwhdm17 https://hu.berlin/ue_dwhdm17
MehrData Cube. 1. Einführung. 2. Aggregation in SQL, GROUP BY. 3. Probleme mit GROUP BY. 4. Der Cube-Operator. 5. Implementierung des Data Cube
Data Cube 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator 5. Implementierung des Data Cube 6. Zusammenfassung und Ausblick Dank an Hanna Köpcke! 1 On-line Analytical
MehrOnline Kurse Modulbeschreibungen
Online Kurse Modulbeschreibungen K0100 SQL Basics M0101 DB Theorie Dieses Modul führt in die Thematik von Datenbanken und deren grundlegenden Begriffen und Konzepten ein. Es werden Fragen beantwortet,
MehrDeveloping SQL Data Models MOC 20768
Developing SQL Data Models MOC 20768 In diesem Kurs lernen Sie das Implementieren von multidimensionale Datenbanken mithilfe der SQL Server Analysis Services (SSAS) und durch das Erstellen von tabellarische
MehrData Warehouse Technologien
Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............
MehrWiederholung VU Datenmodellierung
Wiederholung VU Datenmodellierung VU Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester
MehrFrühjahrsemester 2011. Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil
Frühjahrsemester Data Warehousing Kapitel 5: Data Warehousing H. Schuldt Wiederholung aus Kapitel 5. Einführung Tresgros Tresgros Tresgros Filiale Muttenz Filiale Allschwil Filiale Liestal Anfragen: Welches
MehrEs geht also im die SQL Data Manipulation Language.
1 In diesem Abschnitt wollen wir uns mit den SQL Befehlen beschäftigen, mit denen wir Inhalte in Tabellen ( Zeilen) einfügen nach Tabelleninhalten suchen die Inhalte ändern und ggf. auch löschen können.
Mehrmit konventionellen Datenbanksystemen konventionellen Datenbanksystemen
Stream-Verwaltung mit konventionellen Datenbanksystemen Christian Rensch.06.005 Seminar Data Streams Thema Verwaltung von Datenströmen in konventionellen Datenbanksystemen optimiert auf Daten geringer
MehrAnfragen an multidimensionale Daten
Anfragen an multidimensionale Daten Seminar: Data Warehousing im Sommersemester 2005 Lehrstuhl für Datenbanken und Informationssysteme Betreuer: David Wiese 20. Juni 2005 Inhaltsverzeichnis 1. Einleitung...
MehrDatenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken
Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken 17. V. 2017 Outline 1 Organisatorisches 2 SQL 3 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 4 Objekt-relationale Datenbanken Beispiel
MehrDatenbanken Unit 9: OLAP, OLTP, Data Warehouse Ranking Algorithmen
Datenbanken Unit 9: OLAP, OLTP, Data Warehouse Ranking Algorithmen 28. V. 2018 Outline 1 Organisatorisches 2 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 3 Ranking 4 SQL Organisatorisches Ergebnisse
MehrInformatik II Vorlesung am D-BAUG der ETH Zürich. Vorlesung 12, 2017 Datenbanksysteme: Datendefinition in SQL, Kompliziertere Datenbankabfragen
Informatik II Vorlesung am D-BAUG der ETH Zürich Vorlesung 12, 2017 Datenbanksysteme: Datendefinition in SQL, Kompliziertere Datenbankabfragen Datendefinition (DDL) in SQL Anlegen einer Tabelle create
MehrInformatik II Vorlesung am D-BAUG der ETH Zürich. Vorlesung 12, Datenbanksysteme: Datendefinition in SQL, Kompliziertere Datenbankabfragen
Informatik II Vorlesung am D-BAUG der ETH Zürich Vorlesung 12, 30.5.2016 Datenbanksysteme: Datendefinition in SQL, Kompliziertere Datenbankabfragen Datendefinition (DDL) in SQL Datentypen character (n),
MehrInhaltsverzeichnis. vii.
vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt 2 1.2 OLTP versus OLAP 4 1.2.1 OLAP-versus OLTP-Transaktionen 5 1.2.2 Vergleich von OLTP und OLAP 6 1.2.3 Abgrenzung: DBMS-Techniken
MehrVeit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien
Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...
MehrSeminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing
Seminar in der Seminarreihe Business Intelligence 1 OLAP und Datawarehousing OLAP & Warehousing Die wichtigsten Produkte Die Gliederung Produkt Bewertung & Vergleiche Die Marktentwicklung Der aktuelle
MehrDatenbanken zur Entscheidungsunterstützung - Data Warehousing. Prof. Dr. T. Kudraß 1
Datenbanken zur Entscheidungsunterstützung - Data Warehousing Prof. Dr. T. Kudraß 1 Einführung Zunehmender Bedarf nach Analyse aktueller und historischer Daten Identifizierung interessanter Patterns Entscheidungsfindung
MehrTeil II: Architektur eines Data-Warehouse-Systems... 57
O:/Wiley/Reihe_Dummies/9783527714476_Gerken/3d/ftoc.3d from 08.08.2018 14:02:02 Auf einen Blick Einleitung... 19 Teil I: Was ist ein Data Warehouse?... 25 Kapitel 1: Ein Beispiel zur Einführung..... 27
MehrChristian Kurze BI-Praktikum IBM WS 2008/09
Einführung in die multidimensionale Datenmodellierung e mit ADAPT BI-Praktikum IBM WS 2008/09 1 Gliederung Einführung multidimensionale Datenmodellierung 1. Multidimensionales Modell BI-Praktikum IBM WS
MehrWS 2010/11 Datenbanksysteme Fr 15:15 16:45 R 1.008. Vorlesung #5. SQL (Teil 3)
Vorlesung #5 SQL (Teil 3) Fahrplan Besprechung der Übungsaufgaben Rekursion Rekursion in SQL-92 Rekursion in DBMS- Dialekten (Oracle und DB2) Views (Sichten) - gespeicherte Abfragen Gewährleistung der
MehrData Cubes PG Wissensmangement Seminarphase
PG 402 - Wissensmangement Seminarphase 23.10.2001-25.10.2001 Hanna Köpcke Lehrstuhl für Künstliche Intelligenz Universität Dortmund Übersicht 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit
MehrWiederholung VU Datenmodellierung
Wiederholung VU Datenmodellierung VL Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester
MehrDaten-Definitionssprache (DDL) Bisher: Realwelt -> ERM -> Relationen-Modell -> normalisiertes Relationen-Modell. Jetzt: -> Formulierung in DDL
Daten-Definitionssprache (DDL) Bisher: Realwelt -> ERM -> Relationen-Modell -> normalisiertes Relationen-Modell Jetzt: -> Formulierung in DDL Daten-Definitionssprache (DDL) DDL ist Teil von SQL (Structured
MehrInhaltsverzeichnis. Bernd Müller, Harald Wehr. Java Persistence API 2. Hibernate, EclipseLink, OpenJPA und Erweiterungen ISBN:
Inhaltsverzeichnis Bernd Müller, Harald Wehr Java Persistence API 2 Hibernate, EclipseLink, OpenJPA und Erweiterungen ISBN: 978-3-446-42693-1 Weitere Informationen oder Bestellungen unter http://www.hanser.de/978-3-446-42693-1
MehrOracle OLAP 11g: Performance für das Oracle Data Warehouse
Oracle OLAP 11g: Performance für das Oracle Data Warehouse Marc Bastien Oracle BI Presales Agenda Performanceprobleme in Oracle DWH: gibt s das überhaupt? Mögliche Gründe und Lösungen
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining OLAP Operationen Ein konzeptionelles MDDM Aggregierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Operationen im multidimensionalen Datenmodell
MehrData Warehousing. Modellierung im DWH Das multidimensionale Datenmodell. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Modellierung im DWH Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Zusammenfassung: Hubs and Spokes Mart 1 Mart 2 Mart 3 Mart 4 DWH Quelle 1 RDBMS Quelle
MehrFrühjahrsemester 2010. Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil
Frühjahrsemester Data Warehousing Kapitel 5: Data Warehousing H. Schuldt Wiederholung aus Kapitel 5. Einführung Tresgros Tresgros Tresgros Filiale Muttenz Filiale Allschwil Filiale Liestal Anfragen: Welches
Mehr7. XML-Datenbanksysteme und SQL/XML
7. XML-Datenbanksysteme und SQL/XML Native XML-DBS vs. XML-Erweiterungen von ORDBS Speicherung von XML-Dokumenten Speicherung von XML-Dokumenten als Ganzes Generische Dekomposition von XML-Dokumenten Schemabasierte
MehrVorlesung Wissensentdeckung in Datenbanken
Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Claus Weihs 21.04.2015 1 von 40 Gliederung 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der Cube-Operator
MehrNutzung der Oracle Database InMemory Option für SAP BW
Nutzung der Oracle Database InMemory Option für SAP BW Schlüsselworte Oracle, SAP-BW, InMemory, Star-Schema. Jörn Bartels Oracle München Einleitung In SAP BW wurde bisher ein erweitertes Snow Flake Schema
MehrDieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird.
Thomas Studer Relationale Datenbanken: Von den theoretischen Grundlagen zu Anwendungen mit PostgreSQL Springer, 2016 ISBN 978-3-662-46570-7 Dieser Foliensatz darf frei verwendet werden unter der Bedingung,
MehrSQL/OLAP und Multidimensionalität in der Lehre
SQL/OLAP und Multidimensionalität in der Lehre Vortrag auf der DOAG 2008 Prof. Dr. Reinhold von Schwerin Hochschule Ulm, Fakultät für Informatik 1. Dezember 2008 Prof. Dr. Reinhold von Schwerin SQL/OLAP
MehrDas Multidimensionale Datenmodell
Das Multidimensionale Datenmodell Konzeptuelle Modellierung Umsetzung des Modells Beispiel ER-Modell 2 / 36 Probleme ER-Modellierung Keine Unterscheidung Klassifikation, Attribute, Kenngrößen Dimension
MehrData Warehousing. Architektur Komponenten Prozesse. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Architektur Komponenten Prozesse Ulf Leser Wissensmanagement in der Bioinformatik Zusammenfassung letzte Vorlesung Aufbau eines Data Warehouse Redundante, transformierte Datenhaltung Asynchrone
Mehr3.17 Zugriffskontrolle
3. Der SQL-Standard 3.17. Zugriffskontrolle Seite 1 3.17 Zugriffskontrolle Datenbanken enthalten häufig vertrauliche Informationen, die nicht jedem Anwender zur Verfügung stehen dürfen. Außerdem wird man
MehrSQL als Zugriffssprache
SQL als Zugriffssprache Der Select Befehl: Aufbau Select- und From-Klausel Where-Klausel Group-By- und Having-Klausel Union Join-Verbindung Order-By-Klausel Der Update-Befehl Der Delete-Befehl Der Insert-Befehl
Mehr