Data Warehousing. Modellierung im DWH Das multidimensionale Datenmodell. Ulf Leser Wissensmanagement in der Bioinformatik

Größe: px
Ab Seite anzeigen:

Download "Data Warehousing. Modellierung im DWH Das multidimensionale Datenmodell. Ulf Leser Wissensmanagement in der Bioinformatik"

Transkript

1 Data Warehousing Modellierung im DWH Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik

2 Zusammenfassung: Hubs and Spokes Mart 1 Mart 2 Mart 3 Mart 4 DWH Quelle 1 RDBMS Quelle 2 IMS Quelle 3 Textfile Jahresumsatz: Pro Monat Januar: Februar Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

3 DWH Architektur Data Warehouse Manager Analysewerkzeuge Qrt l. Qrt l. Qrt l. Qrt l. Ost West Nord Metadaten Quelle 1 RDBMS Staging Area Mart 2 Quelle 2 IMS Staging Area Cube Mart 1 Datenquellen Basisdaten Abgeleitete Sichten Arbeitsbereich Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

4 DWH Prozesse O t W e E xtraction T ransformation L oad View Maintenance Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

5 Parameter von Extraktionskomponenten Extraktor Komponente zum Extrahieren der Daten aus den Quellen Wann liefert der Extraktor die Daten? Periodisch Synchron Ereignisgesteuert Welche Daten liefert der Extraktor? Kompletten Datenbestand (Snapshot) Alle Änderungen (Logfile) Nettoänderungen zu fix. Zeitpunkten (Snapshot-Diff) In welcher Art liefert der Extraktor die Daten SQL Befehle (synchron/logfile: Replication) Flatfiles Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

6 Transformationen in Staging Area Benutzte SQL Effiziente mengenorientierte Berechnungen möglich Vergleiche über Zeilen hinaus möglich Schlüsseleigenschaft, Namensduplikaterkennung,... Vergleiche mit Daten in Basisdatenbank möglich Duplikate, Plausibilität (Ausreißer), Konsistenz (Artikel-Ids) Typisch: Tagging von Datensätzen durch Prüf-Regeln UPDATE sales SET price=price/mwst; UPDATE sales SET cust_name= (SELECT cust_name FROM customer WHERE id=cust_id);... UPDATE sales SET flag1=false WHERE cust_name IS NULL;... INSERT INTO DWH SELECT * FROM sales WHERE f1=true & f2=true &... Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

7 BULK Uploads Für große Datenmengen einzige ausreichend performante Schnittstelle Kritischer Prozess Load-Vorgänge blockieren i.d.r. die komplette DB (Schreibzugriff auf komplette Tabelle) Konsistenz, Trigger, ICs i.d.r. deaktiviert Indexaktualisierung Update oder Insert? (Upsert!) Performance von LOAD oft limitierender Faktor Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

8 Inhalt dieser Vorlesung Das Multidimensionale Datenmodell (MDDM) Grundidee Formale Definition der Modellelemente Beispiel Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

9 MDDM Grundidee Unterscheidung von Fakten(Measures) Gemessene Werte Dimensionen Beschreibung der Messwerte in Raum, Zeit, Organisation,... Klassifikationshierarchien Dimensionen haben hierarchische Struktur Metapher: Würfel (Cube) bzw. Hypercube Fakten: Punkte im multidimensionalen Raum Analyse durch Operationen auf dem Cube Dimensionen erhöhen/verringern Auswahl von Subwürfeln (Flächen, Punkten,...) Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

10 Beispiel Verkäufe von Autos pro Marke, Kontinent und Jahr gemessen in Euro Measures: Verkäufe in Euro Dimensionen Automarke Kontinent Jahr Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

11 Beispiel: Auswahl (Slicing) Verkäufe von Peugeot pro Jahr und Kontinent Verkäufe in Asien pro Jahr und Marke Jahr Asien Südamerika Kontinent BMW Peugeot VW Ford Automarke Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

12 Dimensionen Eindeutige Strukturierung des Datenraums Hoffentlich orthogonal Abhängigkeiten zwischen Dimensionen bereiten an vielen Stellen Probleme später Eine Dimension hat ein Schema Tag, Woche, Jahr Landkreis, Land, Staat Produktgruppe, Produktklasse, Produktfamilie... und Werte (1, 2, 3,..., 31), (1,... 52), (1900,..., 2003) (...), (Berlin, NRW, Department-1,...), (BRD, F,...) Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

13 Dimension Dimension Top Jahr Quartal I II III IV I II III IV Klassifikationsstufen Monat Jan Feb Mar Okt Nov Dez Tag Klassifikationsknoten Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

14 Produkthierarchien Aus: Geppert, ETZ Zürich, Vorlesung Data Warehouse Elemente einer Stufe können geordnet sein Geordnet: Zeit Ungeordnet: Produkte Elemente sind immer über Hierarchie angeordnet Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

15 Formale Definition Ziel Operationen auf einem MDDM sind Aggregationen / Verdichtungen Aus dem Modell muss man ersehen können, welche Verdichtungen sinnvoll sind und welche nicht Tools bieten dann nur die sinnvollen Operationen an Optimierer können die Informationen für schnellere Anfragen benutzen Mit E/R nicht erreichbar zu wenig Semantik Konzern Sparte Region Bereich Unternehmen Abteilung Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

16 Klassifikationsschema Definition. Ein Klassifikationsschema K (einer Dimension D) ist ein 5-Tupel {k 0, k 1,... k n },, M, stufe(), knoten()) mit Menge von Klassifikationsstufen {k 0,... k n } Menge M von Klassifikationsknoten Halbordnung auf {k 0,... k n } mit Größtem Element k n : k i, 0 i n-1: k n k i Stufe() weist jedem Klassifikationsknoten genau eine Klassifikationsstufe zu Knoten()=stufe -1 () berechnet für eine Klassifikationsstufe die Menge aller ihr zugeordneten Klassifikationsknoten Bemerkung Die Halbordnung überträgt sich natürlich auf Klassifikationsknoten Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

17 Erläuterung Klassifikationsstufen Die Klassifikationsstufen sind die Schemaelemente der Dimension Das größte Element k n ist artifiziell es steht für alles, also die Verdichtung in einen einzelnen Wert Wir nennen es TOP Interpretation von : Funktionale Abhängigkeit Aggregierbarkeit Tag bestimmt Monat bestimmt Jahr bestimmt TOP TOP Produkt Produktfamilie Produktgruppe TOP Asus M2400N Notebooks Büroelektronik TOP Beachte: Halbordnung ist immer zyklusfrei Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

18 Beispiel Ordnung Tag Monat Monat Quartal Quartal Jahr Tag Woche Woche Jahr Alle Top Keine Ordnung Quartal? Woche Monat? Woche Transitivität Tag Jahr Quartal Monat Top Jahr Tag Tatsächlich? Woche Saison Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

19 Knotenattribute Name Staat... Name Depot Manager Logistics Bundesland Region Name... Name Address Jede Klassifikationsstufe hat eine Menge von Attributen, die Knotenattribute Shop Supplier Facilities Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

20 Erläuterung Klassifikationsknoten Klassifikationsknoten Klassifikationsknoten sind die Werte der Schemaelemente (Stufen) einer Dimension Jeder Knoten ist über die Funktion stufe() genau einer Stufe zugeordnet Kein Produkt darf zu zwei Produktgruppen gehören Die größte Stufe TOP hat nur einen Knoten TOP M zerfällt also in die disjunkten Menge knoten(k i ) Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

21 Beispiel Top Top Jahr Quartal I II III IV I II III IV Monat Jan Feb Mar Okt Nov Dez Tag Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

22 Klassifikationspfade Definition. Ein Klassifikationspfad P in einem Klassifikationsschema K ist eine Menge von Klassifikationsstufen {p 0,..., p m } mit {p 0,...,p m-1 } {k 0,..., k n-1 } p m = k n p i, 1 i m: p i-1 p i Die Länge des Pfades ist P =m+1 Der Klassifikationslevel von p i in P ist i Bedeutung Ein Pfad ist damit eine voll geordnete Teilmenge von {k 1,..., k n } Jeder Pfad beinhaltet das größte Element TOP Zweck: Verdichtung ist nur entlang von Klassifikationspfaden sinnvoll Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

23 Beispielpfade Klassifikationsschema Pfad 1 Pfad 2 Top Top Top Jahr Jahr Jahr Quartal Woche Quartal Woche Monat Monat Tag Tag Tag Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

24 Klassifikationsstufen und Pfade Level 4 Top Level 3 Top Der Klassifikationslevel einer Stufe ist nur eindeutig in einem Pfad Der Level des größten Elements TOP ist nicht konstant Level 3 Level 2 Level 1 Jahr Quartal Monat Level 2 Level 1 Jahr Woche Level 0 Tag Level 0 Tag Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

25 Klassifikationshierarchie Definition. Die Klassifikationshierarchie K P zu einem Klassifikationsschema K und Pfad P ist der Baum mit Knoten N und Kanten E wie folgt: N = U knoten( pi ) p P i M E = ( n, n ) 1 2 n, n 1 2 N n j : n 1 1 n 2 knoten ( p ) ( ) j n2 knoten p j + 1 Beachte Klassifikationshierarchie = Knotenhierarchie in einem Pfad Jede Klassifikationshierarchie ist balanciert: Alle Pfade Wurzel- Blatt haben die selbe Länge P Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

26 Dimension Definition. Eine Dimension D=(K, {P 1,...,P j }) besteht aus Einem Klassifikationsschema K Einer Menge von Pfaden P i aus K Jedes k K muss in mindestens einem Pfad in D enthalten sein Bemerkungen Für jedes k K gibt es mindestens einen Pfad, nämlich k TOP D muss nicht alle Pfade enthalten, die es in K gibt Designentscheidung Schreibweise: D.k bezeichnet die Klassifikationsstufe k aus D Jedes D.k kann in mehreren Pfaden vorkommen Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

27 Granularität Definition. Gegeben eine Menge U von n Dimensionen D 1,..., D n. Eine Granularität G über U ist eine Menge {D 1.k k1,...,d n.k kn } für die gilt k ki ist eine Klassifikationsstufe in D i Es gibt keine funktionalen Abhängigkeiten zwischen den Klassifikationsstufen D 1.k k1,..., D n.k kn Bemerkungen Beispiel: Nicht gleichzeitig Dimensionen Zeit und Fiskalisches Jahr in einer Granularität betrachten Mit einer Granularität legt man fest, in welcher Detailstufe Fakten in den einzelnen Dimensionen beschrieben werden Abkürzung: Lässt man in U eine Dimension D i weg, mein dies implizit D i.top Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

28 Halbordnung auf Granularitäten Definition. Auf der Menge aller Granularitäten zu einer Menge U von Dimensionen ist eine Halbordnung < wie folgt definiert Sei G 1 ={D 11.k k11,...,d n1.k kn1 } und G 2 ={D 12.k k12,...,d n2.k kn2 } Ordne die Dimensionen in G 1 und G 2 beliebig, aber gleich Es gilt G 1 <G 2 genau dann wenn Benutzung i: D i1.k ki1 D i2.k 2i2 oder D i1.k ki1 =D i2.k ki 2 Beschreibung der Transformation von Granularitäten Anfrageoptimierung: Wiederverwendung von Aggregaten Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

29 Bereich Beispiel Region Zeit TOP Top Top Konzern Staat Jahr Sparte Bundesland Monat Abteilung Shop Tag (B.Sparte, R.Shop, Z.Tag) < (B.Sparte, R.Shop, Z.Monat) < (B.Sparte, R.Top, Z.Monat) < (B.Top, R.Top, Z.Top) (B.Sparte, R.Staat, Z.Tag)? (B.Konzern, R.Shop, Z.Tag) Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

30 Würfelschema Definition. Ein Würfelschema WS=(G,F) besteht aus Einer Granularität G Einer Menge F von unterschiedlichen Fakten F i Definition. Ein Würfel W ist eine Instanz eines Würfelschema (G,F) W = dom( G) dom( F) = knoten( D. k )... knoten( D dom( F ) dom( F Bemerkung Die Werte dom(g) geben die Koordinaten der Werte dom(f) an Verhältnis Würfelschema zu Würfel ist wie Relationenschema zu Relation. k ) 1 k1 n kn 1 j ) Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

31 Kein Würfelschema Autoverkäufe pro Zeit (Monat, Jahr), Händler und Region (Kreis, Land) Drei Dimensionen Monat Jahr Händler Kreis Land Jahr Monat Land Kreis Händler Aber: EU Recht! Händler Land Jahr Monat Land Kreis Händler Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

32 Kein Würfelschema Autoverkäufe pro Zeit (Monat, Jahr), Händler und Region (Kreis, Land) Drei Dimensionen Monat Jahr Händler Jahr Land Kreis Land Monat Kreis Händler Aber: EU Recht! Händler Land Modellierung ist anwendungsabhängig Jahr Land Monat Kreis Händler Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

33 Semantik von Kanten Die Hierarchie von Klassifikationsstufen wird durch funktionale Abhängigkeiten bestimmt Das beinhaltet zunächst keine Bestimmung der Semantik der Kanten Bereich Komm.Elektronik Land Brandenburg Top Güter Hauptabt. Mobilfunk Kreis Potsdam P.gruppe Kleidung Abteilung Dualband Stadt Golm Produkt Hose Part-Of Topologisch IS-A Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

34 Ein längeres Beispiel Wir bauen ein DWH zur Verwaltung von Lagerbeständen Fakten Bestand und Delta von Artikeln Dimensionen Zeit Klassifikationsstufen: Monat, Quartal, Woche, Jahr Ort Klassifikationsstufen: Region, Land Produkt Klassifikationsstufen: Artikel, Artikelgruppe, Bereich Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

35 Klassifikationsschema Halbordnung Top Jahr Jahr Quartal Quartal Monat Jahr Woche Top Land Land Region Top Bereich Bereich Artikelgruppe Artikelgruppe Artikel Struktur der Dimensionen Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

36 Pfade P 1 : Top Jahr Quartal Monat P 2 : Top Jahr Woche P 3 : Top Land Region P 4 : Top Bereich Artikelgruppe Artikel Entlang der Pfade sind Verdichtungen im Modell sinnvoll Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

37 Klassifikationsknoten Jahr 1997, 1998, 1999 Quartal I, II, III, IV (pro Jahr) Woche 1-52 (pro Jahr) Monate 1-3 (pro Quartal I), 4-6 (pro Quartal II),... Land Deutschland, Frankreich, Großbritannien,... Region Bayern, Berlin,..., Departament1, Departament2,... Bereich Kleidung, Nahrung, Elektronik,... Artikelgruppe Oberbekleidung, Unterbekleidung, Spirituosen, Kindernahrung, Kleingeräte, TV/Video,... Artikel... Alle möglichen Ausprägungen der Klassifikationsstufen Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

38 Klassifikationshierarchien 1 Klassifikationshierarchie zu P 1 Top I II III IV Jan Feb Mar... Okt Nov Dez Klassifikationshierarchie zu P 2 Top Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

39 Klassifikationshierarchien 2 Klassifikationshierarchie P 3 Top BRD F GB Bayern... Bremen... Wales... N-Irland Klassifikationshierarchie P 4 Top Nahrung Kleidung Elektronik Milchwaren... Spirituosen... Kleingeräte... TV/Video Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

40 Dimensionen Dimension ZEIT ({Monat, Quartal, Woche, Jahr}, {P 1, P 2 }) Dimension ORT ({Region, Land}, {P 3 }) Dimension PRODUKT ({Artikel, Artikelgruppe, Bereich}, {P 4 }) Dimensionen umfassen Stufen und Pfade Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

41 Granularität, Würfel Mögliche Granularitäten G 1 = (Zeit.Woche, Ort.Land, Produkt.Artikel) G 2 = (Zeit.Jahr, Ort.Gebiet, Produkt.TOP) Halbordnung: (Zeit.Woche, Ort.Gebiet, Produkt.Artikel) < (Zeit.Jahr, Ort.Gebiet, Produkt.Bereich) < (Zeit.Jahr, Ort.Top, Produkt.Bereich) < (Zeit.ZOP, Ort.Top, Produkt.Top) =? Würfelschema Granularität plus Menge von Fakten (F 1 =Bestand, F 2 =Delta) Würfel: Instanz des Würfelschemas Operationen auf Würfeln verändern die Granularität Ziel: Nur sinnvolle Operationen zulassen Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

42 Zusammenfassung Dimension Top Jahr Quartal I II III IV I II III IV Klassifikationsstufen Monat Jan Feb Mar Okt Nov Dez Tag Klassifikationsknoten Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

Data Warehousing. Modellierung im DWH Das multidimensionale Datenmodell. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Modellierung im DWH Das multidimensionale Datenmodell. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Modellierung im DWH Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Zusammenfassung: Hubs and Spokes Mart 1 Mart 2 Mart 3 Mart 4 DWH Quelle 1 RDBMS Quelle

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik DWH Grobarchitektur: Hubs and Spokes Abgeleitete Sichten Mart 1 Mart 2 Mart 3 Mart 4

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Vom Spreadsheet zum Würfel Multidimensionales Datenmodell (MDDM)

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Vom Spreadsheet zum Würfel Multidimensionales Datenmodell (MDDM)

Mehr

Data Warehousing. Multidimensionale Modellierung. Modellierung im DWH. Wissensmanagement in der. Bioinformatik. Ulf Leser

Data Warehousing. Multidimensionale Modellierung. Modellierung im DWH. Wissensmanagement in der. Bioinformatik. Ulf Leser Data Warehousing Modellierung im DWH Multidimensionale Modellierung Ulf Leser Wissensmanagement in der Bioinformatik Zusammenfassung: Hubs and Spokes Mart 1 Mart 2 Mart 3 Mart 4 DWH Quelle 1 RDBMS Quelle

Mehr

Data Warehousing. Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Klassifikationsschema Definition Ein Klassifikationsschema

Mehr

Data Warehousing. Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Begriffe Klassifikationsschema Jahr Stufen einer Dimension

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining OLAP Operationen Ein konzeptionelles MDDM Aggregierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Operationen im multidimensionalen Datenmodell

Mehr

Multidimensionale Modellierung

Multidimensionale Modellierung Multidimensionale Modellierung Vorlesung: Übung: Patrick Schäfer Berlin, 27. November 2017 patrick.schaefer@hu-berlin.de https://hu.berlin/vl_dwhdm17 https://hu.berlin/ue_dwhdm17 Grundlagen Fakten (Kennzahlen/Messgrößen):

Mehr

Informationsintegration

Informationsintegration Informationsintegration Data Warehouse (= Materialisierte Integration) Ulf Leser Sebastian Wandelt Inhalt dieser Vorlesung Data Warehouses OLAP versus OLTP Multidimensionale Modellierung ETL Prozess Vergleich:

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining OLAP Operationen Ein konzeptionelles MDDM Aggregierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Operationen im multidimensionalen Datenmodell

Mehr

Datenbanksysteme I Data Warehouses Felix Naumann

Datenbanksysteme I Data Warehouses Felix Naumann Datenbanksysteme I Data Warehouses 13.7.2009 Felix Naumann Überblick 2 Einsatzgebiete OLAP versus OLTP Multimensionale i l Modellierung OLAP Operationen Relationale Implementierung Folien zu DWH: Ulf Leser

Mehr

Datenbanksysteme I Data Warehouses Felix Naumann

Datenbanksysteme I Data Warehouses Felix Naumann Datenbanksysteme I Data Warehouses 5.7.2010 Felix Naumann Überblick 2 Einsatzgebiete OLAP versus OLTP Multimensionale i l Modellierung OLAP Operationen Relationale Implementierung Neue Architekturen Folien

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Architektur und Komponenten von Data Warehouses Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Architektur Komponenten ETL Ulf Leser: Data Warehousing

Mehr

Data Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2004 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

Anfragen an multidimensionale Daten

Anfragen an multidimensionale Daten Anfragen an multidimensionale Daten Alexander Heidrich - BID8 09.06.2005 Hintergrundbild: http://www.csc.calpoly.edu/~zwood/teaching/csc471/finalproj02/afternoon/mfouquet/cube.jpg Inhaltsübersicht Motivation

Mehr

Data Warehousing. Architektur Komponenten Prozesse. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Architektur Komponenten Prozesse. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Architektur Komponenten Prozesse Ulf Leser Wissensmanagement in der Bioinformatik Zusammenfassung letzte Vorlesung Aufbau eines Data Warehouse Redundante, transformierte Datenhaltung Asynchrone

Mehr

Kapitel 6. Vorlesung: PD Dr. Peer Kröger

Kapitel 6. Vorlesung: PD Dr. Peer Kröger Kapitel 6 Einführung in Data Warehouses Vorlesung: PD Dr. Peer Kröger Dieses Skript basiert auf den Skripten zur Vorlesung Datenbanksysteme II an der LMU München Dieses Skript basiert auf den Skripten

Mehr

Data Warehousing. Ausführung von OLAP Operationen. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Ausführung von OLAP Operationen. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Ausführung von OLAP Operationen Ulf Leser Wissensmanagement in der Bioinformatik Variante 1 - Snowflake Year id year Productgroup id pg_name Month Id Month year_id Day Id day month_id

Mehr

Oracle9i Data Warehouse Komponenten im praktischen Einsatz

Oracle9i Data Warehouse Komponenten im praktischen Einsatz Oracle9i Data Warehouse Komponenten im praktischen Einsatz Thomas Gutacker TechSpring GmbH 10. März 2004 Inhalt Data Warehouse Grundlagen Architektur des Projektes Umsetzung mit Oracle9i-Komponenten Data

Mehr

Anfragesprachen für On-Line Analytical Processing (OLAP)

Anfragesprachen für On-Line Analytical Processing (OLAP) Anfragesprachen für On-Line Analytical Processing (OLAP) Seminar Business Intelligence Teil I: OLAP & Data Warehousing René Rondot rondot@informatik.uni-kl.de Universität Kaiserslautern Anfragesprachen

Mehr

1 Business-Intelligence-Architektur 1

1 Business-Intelligence-Architektur 1 D3kjd3Di38lk323nnm xi 1 Business-Intelligence-Architektur 1 1.1 Data Warehouse....................................... 1 1.2 OLAP und mehrdimensionale Datenbanken.................. 4 1.3 Architekturvarianten....................................

Mehr

Übung zur Einführung in die Wirtschaftsinformatik Cognos Powerplay als Beispiel für ein DSS

Übung zur Einführung in die Wirtschaftsinformatik Cognos Powerplay als Beispiel für ein DSS Übung zur Einführung in die Wirtschaftsinformatik 2006-05 - 10 Cognos Powerplay als Beispiel für ein DSS 1 Entscheidungsunterstützungssysteme (EUS) Decision Support Systems (DSS) EUS sollen das gemeinsame

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Architektur und Komponenten von Data Warehouses Ulf Leser Wissensmanagement in der Bioinformatik Data Warehouse Redundante Datenhaltung DWH kann unabhängig von Quellen

Mehr

Repetitorium. Data Warehousing und Data Mining 11/12. Sebastian Wandelt 13./16. Februar 2012

Repetitorium. Data Warehousing und Data Mining 11/12. Sebastian Wandelt 13./16. Februar 2012 Repetitorium Data Warehousing und Data Mining 11/12 Sebastian Wandelt 13./16. Februar 2012 Inhalt Data Warehousing und Data Mining auf 40 Slides Weder in-, noch exklusiv! Subjektive Zusammenfassung pro

Mehr

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem. Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Architektur und Komponenten von Data Warehouses Ulf Leser Wissensmanagement in der Bioinformatik Bücher im Internet bestellen Backup Durchsatz Loadbalancing Portfolio Umsatz

Mehr

Themenblock: Erstellung eines Cube

Themenblock: Erstellung eines Cube Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen

Mehr

6.2 Datenmodellierung

6.2 Datenmodellierung Umsetzung des multidimensionalen Modells Interne Verwaltung der Daten durch - Relationale Strukturen (Tabellen) Relationales OLAP (ROLAP) Vorteile: Verfügbarkeit, Reife der Systeme - Multidimensionale

Mehr

Geoinformation Abbildung auf Tabellen

Geoinformation Abbildung auf Tabellen Folie 1 von 32 Geoinformation Abbildung auf Tabellen Folie 2 von 32 Abbildung auf Tabellen Übersicht Motivation des relationalen Datenmodells Von Objekten zu Tabellen Abbildung von Objekten Schlüssel Abbildung

Mehr

Data Warehousing. Komponenten Prozesse. Architektur. Wissensmanagement in der. Bioinformatik. Ulf Leser

Data Warehousing. Komponenten Prozesse. Architektur. Wissensmanagement in der. Bioinformatik. Ulf Leser Data Warehousing Architektur Komponenten Prozesse Ulf Leser Wissensmanagement in der Bioinformatik Zusammenfassung letzte Vorlesung 1 Aufbau eines Data Warehouse Redundante, transformierte Datenhaltung

Mehr

Data Warehousing. Speicherung multidimensionaler Daten. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Speicherung multidimensionaler Daten. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Speicherung multidimensionaler Daten Ulf Leser Wissensmanagement in der Bioinformatik Beispiel Z.Tag Z.Monat 4.1.1999 B.Abteilung 4 1999 B.Sparte 3.1.1999 3 1999 2.1.1999 1.1.1999 Skoda.Reparatur

Mehr

Vorlesung Wissensentdeckung in Datenbanken

Vorlesung Wissensentdeckung in Datenbanken Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Uwe Ligges Informatik LS 8 22.04.2010 1 von 26 Gliederung 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der

Mehr

Wiederholung VU Datenmodellierung

Wiederholung VU Datenmodellierung Wiederholung VU Datenmodellierung VL Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester

Mehr

Vorlesung Wissensentdeckung in Datenbanken

Vorlesung Wissensentdeckung in Datenbanken Gliederung Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Claus Weihs 14.07.2009 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der Cube-Operator 5 Implementierung

Mehr

Business Intelligence & Reporting. Michael Cordes Holger Oehring Matthias Rein

Business Intelligence & Reporting. Michael Cordes Holger Oehring Matthias Rein Business Intelligence & Reporting Michael Cordes Holger Oehring Matthias Rein Ziele Einführung Business Intelligence / Front Room Online Analytical Processing (OLAP) Arten des Reporting & Nutzergruppen

Mehr

Exadata und In-Memory Datenbewirtschaftung und Analyse Extrem mit Exadata und InMemory (Erfahrungsbericht)

Exadata und In-Memory Datenbewirtschaftung und Analyse Extrem mit Exadata und InMemory (Erfahrungsbericht) Exadata und In-Memory Datenbewirtschaftung und Analyse Extrem mit Exadata und InMemory (Erfahrungsbericht) Christian Haag, DATA MART Consulting Consulting Manager Oracle DWH Team Inhalt Thematik (Einordnung

Mehr

Wiederholung VU Datenmodellierung

Wiederholung VU Datenmodellierung Wiederholung VU Datenmodellierung VU Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester

Mehr

Berechnung von Kennzahlen mit der SQL Model Clause

Berechnung von Kennzahlen mit der SQL Model Clause Berechnung von Kennzahlen mit der Thomas Mauch 12.07.2018 DOAG BASEL BERN LAUSANNE ZÜRICH DÜSSELDORF FRANKFURT A.M. FREIBURG I.BR. HAMBURG MÜNCHEN STUTTGART WIEN 1 AGENDA 1. Einführung 2. Syntax 3. Performance

Mehr

Datenqualität-Der GQM- Ansatz und das DWQ- Projekt

Datenqualität-Der GQM- Ansatz und das DWQ- Projekt Datenqualität-Der GQM- Ansatz und das DWQ- Projekt Guy Hermann Ngassa Imperfektion und erweiterte Konzepte im Data Warehousing 2 Überblick Einleitung Data-Warehouse-Qualität-Projekt (DWQ-Projekt) Bezug

Mehr

Inhaltsverzeichnis. 1 Einleitung 1. 2 Aufbau von Data-Warehouse-Systemen 15. Lehner, Wolfgang Datenbanktechnologie für Data-Warehouse-Systeme 2003

Inhaltsverzeichnis. 1 Einleitung 1. 2 Aufbau von Data-Warehouse-Systemen 15. Lehner, Wolfgang Datenbanktechnologie für Data-Warehouse-Systeme 2003 1 Einleitung 1 1.1 Betriebswirtschaftlicher Ursprung des Data Warehousing 2 1.2 Statistischer Ursprung des Data Warehousing 5 1.3 Fòderativer Ursprung des Data Warehousing 7 1.4 Definition eines Data-Warehouse-Systems

Mehr

Data Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de

Data Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de Data Warehouses Sommersemester 2011 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen Data Warehouse Architektur Data-Warehouse-System Teilsichten

Mehr

Das Multidimensionale Datenmodell

Das Multidimensionale Datenmodell Das Multidimensionale Datenmodell Konzeptuelle Modellierung Umsetzung des Modells Beispiel ER-Modell 2 / 36 Probleme ER-Modellierung Keine Unterscheidung Klassifikation, Attribute, Kenngrößen Dimension

Mehr

Data Cubes PG Wissensmangement Seminarphase

Data Cubes PG Wissensmangement Seminarphase PG 402 - Wissensmangement Seminarphase 23.10.2001-25.10.2001 Hanna Köpcke Lehrstuhl für Künstliche Intelligenz Universität Dortmund Übersicht 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit

Mehr

Kapitel 7 Grundlagen von Data

Kapitel 7 Grundlagen von Data LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS DATABASE Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2014 Kapitel 7 Grundlagen von Data Warehouses Vorlesung: PD

Mehr

Überblick Felix Naumann. Zugriffsrechte Zugriffsrechte erzeugen Zugriffsrechte prüfen Zugriffsrechte vergeben Zugriffsrechte entziehen

Überblick Felix Naumann. Zugriffsrechte Zugriffsrechte erzeugen Zugriffsrechte prüfen Zugriffsrechte vergeben Zugriffsrechte entziehen Datenbanksysteme I Zugriffskontrolle (kleiner Einschub) 18.1.2007 Felix Naumann Überblick 2 Zugriffsrechte Zugriffsrechte erzeugen Zugriffsrechte prüfen Zugriffsrechte vergeben Zugriffsrechte entziehen

Mehr

Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing

Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing Seminar in der Seminarreihe Business Intelligence 1 OLAP und Datawarehousing OLAP & Warehousing Die wichtigsten Produkte Die Gliederung Produkt Bewertung & Vergleiche Die Marktentwicklung Der aktuelle

Mehr

Datensicherheit. 8. Datensicherheit

Datensicherheit. 8. Datensicherheit 8. Anforderungen an ein DBMS Identifikation und Authentisieren von Benutzern Autorisierung und Zugriffskontrolle Aufzeichnung von sicherheitsrelevanten Aktionen eines Benutzers typische Schwachstellen

Mehr

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining 2 Eigenschaften eines Data Warehouse Referenzarchitektur Integrierte Sicht auf beliebige Daten aus verschieden Datenbanken

Mehr

ISU 1. Ue_08/02_Datenbanken/SQL. 08 Datenbanken. Übung. SQL Einführung. Eckbert Jankowski. www.iit.tu-cottbus.de

ISU 1. Ue_08/02_Datenbanken/SQL. 08 Datenbanken. Übung. SQL Einführung. Eckbert Jankowski. www.iit.tu-cottbus.de 08 Datenbanken Übung SQL Einführung Eckbert Jankowski www.iit.tu-cottbus.de Datenmodell (Wiederholung, Zusammenfassung) Objekte und deren Eigenschaften definieren Beziehungen zwischen den Objekten erkennen/definieren

Mehr

Datenbanken Grundlagen und Design

Datenbanken Grundlagen und Design Frank Geisler Datenbanken Grundlagen und Design 3., aktualisierte und erweiterte Auflage mitp Vorwort 15 Teil I Grundlagen 19 i Einführung in das Thema Datenbanken 21 i.i Warum ist Datenbankdesign wichtig?

Mehr

5.2 Entity-Relationship-Modell

5.2 Entity-Relationship-Modell 5.2 Entity-Relationship-Modell Mod-5.8 Entity-Relationship-Modell, ER-Modell (P. Chen 1976): Kalkül zur Modellierung von Aufgabenbereichen mit ihren Objekten, Eigenschaften und Beziehungen. Weitergehende

Mehr

Data Cube. 1. Einführung. 2. Aggregation in SQL, GROUP BY. 3. Probleme mit GROUP BY. 4. Der Cube-Operator. 5. Implementierung des Data Cube

Data Cube. 1. Einführung. 2. Aggregation in SQL, GROUP BY. 3. Probleme mit GROUP BY. 4. Der Cube-Operator. 5. Implementierung des Data Cube Data Cube 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator 5. Implementierung des Data Cube 6. Zusammenfassung und Ausblick Dank an Hanna Köpcke! 1 On-line Analytical

Mehr

Erfolg mit Oracle BI?

Erfolg mit Oracle BI? Erfolg mit Oracle BI? Typische Fehlerszenarien und deren Lösung Gerd Aiglstorfer G.A. itbs GmbH Das Thema 2 Oracle BI (OBIEE)? Das war eine Fehlentscheidung! Viel zu umständlich! Wenig Flexibilität & teure

Mehr

Kapitel DB:IV (Fortsetzung)

Kapitel DB:IV (Fortsetzung) Kapitel DB:IV (Fortsetzung) IV. Logischer Datenbankentwurf mit dem relationalen Modell Das relationale Modell Integritätsbedingungen Umsetzung ER-Schema in relationales Schema DB:IV-46 Relational Design

Mehr

Themenblock: Data Warehousing (I)

Themenblock: Data Warehousing (I) Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining Agenda Einführung Data Warehouses Online Transactional Processing (OLTP) Datenmanipulation mit SQL Anfragen mit SQL Online

Mehr

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Dr. Thomas Neumann

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Dr. Thomas Neumann TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Dr. Thomas Neumann Blatt Nr. 10 Übung zur Vorlesung Einsatz und Realisierung von Datenbanksystemen im SoSe15 Moritz Kaufmann (moritz.kaufmann@tum.de)

Mehr

Seminar 2. SQL - DML(Data Manipulation Language) und. DDL(Data Definition Language) Befehle.

Seminar 2. SQL - DML(Data Manipulation Language) und. DDL(Data Definition Language) Befehle. Seminar 2 SQL - DML(Data Manipulation Language) und DDL(Data Definition Language) Befehle. DML Befehle Aggregatfunktionen - werden auf eine Menge von Tupeln angewendet - Verdichtung einzelner Tupeln yu

Mehr

Das relationale Modell (Teil 1)

Das relationale Modell (Teil 1) Vorlesung #2 Das relationale Modell (Teil 1) Fahrplan WS 2010/11 Feedback Vorlesung#1 Das relationale Modell Einordnung (wir überspringen die Modellierung, das kommt im 4. Semester Datenmanagement ) Definition,

Mehr

Datenbanken Unit 4: Das Relationale Modell & Datenintegrität

Datenbanken Unit 4: Das Relationale Modell & Datenintegrität Datenbanken Unit 4: Das Relationale Modell & Datenintegrität 15. III. 2016 Outline 1 Organisatorisches 2 SQL 3 Relationale Algebra Notation 4 Datenintegrität Organisatorisches Erster Zwischentest: nach

Mehr

Multidimensionale Konzepte zur Controlling- Unterstützung in kleinen und mittleren Unternehmen

Multidimensionale Konzepte zur Controlling- Unterstützung in kleinen und mittleren Unternehmen Tatjana Tegel Multidimensionale Konzepte zur Controlling- Unterstützung in kleinen und mittleren Unternehmen Deutscher Universitäts-Verlag Inhaltsverzeichnis Abkürzungsverzeichnis 1 Einleitung 2 Merkmale

Mehr

OLAP und Data Warehouses

OLAP und Data Warehouses OLP und Data Warehouses Überblick Monitoring & dministration Externe Quellen Operative Datenbanken Extraktion Transformation Laden Metadaten- Repository Data Warehouse OLP-Server nalyse Query/Reporting

Mehr

Einleitung. ROLLUP, CUBE und GROUPING. Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002)

Einleitung. ROLLUP, CUBE und GROUPING. Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Betrifft Autör: GROUPING_ID Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Quelle Aus dem Oracle9i Data Warehousing Guide und den Kursen New Features Oracle9i

Mehr

Klausur Datenbanken II

Klausur Datenbanken II Klausur Datenbanken II 8.3.2001 Name Vorname Semester Matrikelnr Aufgabe Punkte maximal 1 8 2 8 3 3 4 3 5 4 6 6 7 6 8 6 9 [Zusatz] [4] Summe 44 Punkte erreicht Bitte geben Sie die Lösungen möglichst direkt

Mehr

ZWISCHEN ALBTRAUM UND OPTIMALER PERFORMANCE

ZWISCHEN ALBTRAUM UND OPTIMALER PERFORMANCE ZWISCHEN ALBTRAUM UND OPTIMALER PERFORMANCE Indexierungsstrategie im Data Warehouse Dani Schnider, Trivadis AG DOAG Konferenz, Nürnberg BASEL BERN LAUSANNE ZÜRICH DÜSSELDORF FRANKFURT A.M. FREIBURG I.BR.

Mehr

SQL-basierte SCD2-Versionierung hierarchischer Strukturen

SQL-basierte SCD2-Versionierung hierarchischer Strukturen SQL-basierte SCD2-Versionierung hierarchischer Strukturen Meik Truschkowski nobilia-werke J. Stickling GmbH & Co. KG Verl Projektleiter Business Intelligence und Data Warehousing 1 SQL-basierte SCD2-Versionierung

Mehr

Daten Bank. 4. Vorlesung

Daten Bank. 4. Vorlesung Daten Bank 4. Vorlesung Bisher von bis Person (0,n) lebt_in (0,n) Ort AusweisNr. Name Vorname PLZ Ortsname SQL: create insert select Dr. Karsten Tolle PRG2 SS 2015 2 Heute von bis Person (0,n) lebt_in

Mehr

Übung Blatt 5. Materialized Views. Ulf Leser Wissensmanagement in der Bioinformatik

Übung Blatt 5. Materialized Views. Ulf Leser Wissensmanagement in der Bioinformatik Übung Blatt 5 Materialized Views Ulf Leser Wissensmanagement in der Bioinformatik Achtung Die Tabellen, Views, Indexe etc. von Aufgabe 4 noch nicht löschen! Ulf Leser: DWH und DM, Übung, Sommersemester

Mehr

Logische Modelle für OLAP. Burkhard Schäfer

Logische Modelle für OLAP. Burkhard Schäfer Logische Modelle für OLAP Burkhard Schäfer Übersicht Einführung in OLAP Multidimensionale Daten: Hypercubes Operationen Formale Grundlagen Zusammenfassung Einführung in OLAP Verfahren zur Analyse großer

Mehr

Inhaltsverzeichnis. vii.

Inhaltsverzeichnis. vii. vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt 2 1.2 OLTP versus OLAP 4 1.2.1 OLAP-versus OLTP-Transaktionen 5 1.2.2 Vergleich von OLTP und OLAP 6 1.2.3 Abgrenzung: DBMS-Techniken

Mehr

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D.

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. Blatt Nr. 07 Übung zur Vorlesung Grundlagen: Datenbanken im WS15/16 Harald Lang, Linnea Passing (gdb@in.tum.de)

Mehr

4. Objektrelationales Typsystem Kollektionstypen. Nested Table

4. Objektrelationales Typsystem Kollektionstypen. Nested Table Nested Table Bei einer Nested Table handelt es sich um eine Tabelle als Attributwert. Im Gegensatz zu Varray gibt es keine Beschränkung bei der Größe. Definition erfolgt auf einem Basistyp, als Basistypen

Mehr

Prakt. Datenbankprogrammierung. Sommersemester 2005

Prakt. Datenbankprogrammierung. Sommersemester 2005 Prakt. Datenbankprogrammierung Sommersemester 2005 A,2: Hierarchische Anfragen Martin-Luther-Universität Halle, Institut für Informatik, Datenbanken Christian Goldberg Wann ist eine hierarchische Anfrage

Mehr

Performanceoptimierung mit Exadata Verarbeitung extremer Datenmengen mit PL/SQL basierter Datenbewirtschaftung (Erfahrungsbericht)

Performanceoptimierung mit Exadata Verarbeitung extremer Datenmengen mit PL/SQL basierter Datenbewirtschaftung (Erfahrungsbericht) Performanceoptimierung mit Exadata Verarbeitung extremer Datenmengen mit PL/SQL basierter Datenbewirtschaftung (Erfahrungsbericht) Christian Haag, DATA MART Consulting Consulting Manager Oracle DWH Team

Mehr

Data Warehousing. DWH Projekte. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. DWH Projekte. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing DWH Projekte Ulf Leser Wissensmanagement in der Bioinformatik Inhalt DWH Projekte Spezifika Die kritischen Punkte Warum scheitern DWH Projekte? Ulf Leser: Data Warehousing, Vorlesung,

Mehr

Datenbanksysteme 2009

Datenbanksysteme 2009 Datenbanksysteme 2009 Kapitel 17: Data Warehouse Oliver Vornberger Institut für Informatik Universität Osnabrück 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen

Mehr

Daten Bank. 4. Vorlesung. Dr. Karsten Tolle PRG2 SS 2014

Daten Bank. 4. Vorlesung. Dr. Karsten Tolle PRG2 SS 2014 Daten Bank 4. Vorlesung Dr. Karsten Tolle PRG2 SS 2014 Bisher von bis Person (0,n) (0,n) lebt_in Ort AusweisNr. Name Vorname PLZ Ortsname SQL: create insert select Dr. Karsten Tolle PRG2 SS 2014 2 Heute

Mehr

Datenbanksysteme 2 Frühjahr-/Sommersemester 2014 28. Mai 2014

Datenbanksysteme 2 Frühjahr-/Sommersemester 2014 28. Mai 2014 Lehrstuhl für Praktische Informatik III Prof. Dr. Guido Moerkotte Email: moer@db.informatik.uni-mannheim.de Marius Eich Email: marius.eich@uni-mannheim.de Datenbanksysteme 2 8. Übungsblatt Frühjahr-/Sommersemester

Mehr

Kapitel 2: Ein abstraktes Geo-Datenmodell

Kapitel 2: Ein abstraktes Geo-Datenmodell LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Kapitel 2: Ein abstraktes Geo-Datenmodell Skript zur Vorlesung Geo-Informationssysteme Wintersemester 2011/12 Ludwig-Maximilians-Universität

Mehr

Data Warehouse Technologien

Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............

Mehr

Kapitel 2: Ein abstraktes Geo-Datenmodell

Kapitel 2: Ein abstraktes Geo-Datenmodell LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS DATABASE Kapitel 2: Ein abstraktes Geo-Datenmodell Skript zur Vorlesung Geo-Informationssysteme Wintersemester 2013/14 Ludwig-Maximilians-Universität

Mehr

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...

Mehr

Summarization-based Aggregation

Summarization-based Aggregation Summarization-based Aggregation Daten Generalisierung: Prozess, der Anwendungsdaten schrittweise von niedrigen auf höhere konzeptuelle Level aggregiert Conceptual levels 2 3 4 5 example: all federal states

Mehr

Fehlertoleranz und Robustheit von ETL-Prozessen Wie gestalten wir Abläufe möglichst widerstandsfähig. Christian Borghardt I BI Consultant

Fehlertoleranz und Robustheit von ETL-Prozessen Wie gestalten wir Abläufe möglichst widerstandsfähig. Christian Borghardt I BI Consultant Fehlertoleranz und Robustheit von ETL-Prozessen Wie gestalten wir Abläufe möglichst widerstandsfähig Christian Borghardt I BI Consultant Über uns areto consulting gmbh Echter Business Intelligence Spezialist

Mehr

Vergessene (?) SQL- und PL/SQL- Funktionen

Vergessene (?) SQL- und PL/SQL- Funktionen Vergessene (?) SQL- und PL/SQL- Funktionen Folge 1 Vortrag DOAG-Regiogruppe Freiburg/Südbaden 29.01.13 bulk collect (1) Aufgabenstellung: ca. 50.000 eingelesene Werte an Hand einer ID auf eine vorhandene

Mehr

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein 1 Definitionen 1.1 Datenbank Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert Integriert, selbstbeschreibend, verwandt 1.2 Intension/Extension Intension: Menge der Attribute Extension:

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Speicherung multidimensionaler Daten Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Relationales OLAP (ROLAP) Snowflake-, Star- und Fullfactschema

Mehr

Daten- Historisierung. im DWH. Dr. Kurt Franke debitel AG. Historisierung.

Daten- Historisierung. im DWH. Dr. Kurt Franke debitel AG. Historisierung. Daten- im DWH Dr. Kurt Franke debitel AG Kurt.Franke@de.debitel.com Dr. Kurt Franke, debitel AG D.O.A.G. SIG Datawarehouse - 17.06.2008 Folie 1 Zeitbezug von Datensätzen Eventbezogene Daten Datensets mit

Mehr

Datenbank-Tuning. Folien zum Datenbankpraktikum Wintersemester 2009/10 LMU München

Datenbank-Tuning. Folien zum Datenbankpraktikum Wintersemester 2009/10 LMU München Kapitel 7 Datenbank-Tuning Folien zum Datenbankpraktikum Wintersemester 2009/10 LMU München 2008 Thomas Bernecker, Tobias Emrich unter Verwendung der Folien des Datenbankpraktikums aus dem Wintersemester

Mehr

WS 2013/14. Diskrete Strukturen

WS 2013/14. Diskrete Strukturen WS 2013/14 Diskrete Strukturen Prof. Dr. J. Esparza Lehrstuhl für Grundlagen der Softwarezuverlässigkeit und theoretische Informatik Fakultät für Informatik Technische Universität München http://www7.in.tum.de/um/courses/ds/ws1314

Mehr

Wir bauen uns ein Data Warehouse mit MySQL

Wir bauen uns ein Data Warehouse mit MySQL Wir bauen uns ein Data Warehouse mit MySQL Oli Sennhauser FromDual GmbH Uster / Schweiz Schlüsselworte MySQL, DWH, Data Warehouse, ETL, BI, Business Intelligence, OLAP Einleitung MySQL Datenbanken verbreiten

Mehr

Medizininformatik Software Engineering

Medizininformatik Software Engineering Vorlesung Software Engineering Inhaltsverzeichnis 1. Einleitung 2. Software und Medizinprodukt 3. Vorgehensmodelle 4. Strukturierter Entwurf von Echtzeitsystemen 4.1 Echzeit, was ist das? 4.2 Einführung

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Speicherung multidimensionaler Daten Ulf Leser Wissensmanagement in der Bioinformatik Dimension Dimension Top Jahr 1997 1998 1999 2000 Quartal I II III IV I II III IV Klassifikationsstufen

Mehr