Data-Warehouse-Technologien

Ähnliche Dokumente
Index- und Zugriffsstrukturen für. Holger Brämer, 05IND-P

Oracle 9i Einführung. Performance Tuning. Kurs. Teil 12 Materialized Views. Universität Hannover. Praxisbeispiel. Migration.

Data Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik

SQL. Fortgeschrittene Konzepte Auszug

Materialized Views. Jan-Peter Timmermann. DOAG Regiotreffen Hamburg: Materialized Views Seite 1

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien

6. Sichten, Integrität und Zugriffskontrolle. Vorlesung "Informa=onssysteme" Sommersemester 2015

Urs Meier Art der Info Technical Info (Februar 2002) Aus unserer Projekterfahrung und Forschung

Data Warehouse Technologien

Andreas Heuer Gunter Saake Kai-Uwe Sattler. Datenbanken. kompakt

Performanter Aufbau von Materialized Views im ETL-Prozess Vorgehen und ein Framework für den OWB. Reinhard Mense Geschäftsführer ARETO Consulting

Datenmanagement in Android-Apps. 16. Mai 2013

Agenda. Einführung MS SQL Server Integration Services (SSIS) Oracle Data Warehouse Builder (OWB) Zusammenfassung Quellen. Einführung SSIS OWB

Datenbank und Informationssysteme

Bibliografische Informationen digitalisiert durch

1. Übungsblatt. Besprechung: (Gruppe A), 3.11 (Gruppe B)

Data Warehouse Technologien

Dynamisches SQL. Folien zum Datenbankpraktikum Wintersemester 2009/10 LMU München

Datawarehouses, Materialized Views, Materialized View Logs, Query Rewrite

mit Musterlösungen Prof. Dr. Gerd Stumme, Dipl.-Inform. Christoph Schmitz 11. Juni 2007

Modul Datenbanksysteme 2 Prüfung skizzenhaft SS Aug Name: Note:

Universität Duisburg-Essen Informationssysteme Prof. Dr.-Ing. N. Fuhr. Praktikum Datenbanken / DB2 Woche 8: Trigger, SQL-PL

3.17 Zugriffskontrolle

Einleitung Projektion Selektion Join Mengenop. Vollst.keit. Einleitung Projektion. Selektion Join. Vollst.keit. Einleitung Projektion Selektion Join

Universität Stuttgart Abteilung Anwendersoftware Steht für Embedded SQL in Java. - Java-Methoden als SQL Stored-Procedures

Übung 7 DBMS-FUNKTIONALITÄTEN UND DATENIMPORT

Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum:

Ausarbeitung Datenbanken II. Index- und Zugriffsstrukturen für Data-Warehousing

Grundzüge und Vorteile von XML-Datenbanken am Beispiel der Oracle XML DB

Aufgabe 1: [Logische Modellierung]

DB2 Codepage Umstellung

Kapitel 3: Datenbanksysteme

Der SAS DataStep und die Prozedur SQL Cellent Finance Solutions GmbH Seite: 1

Datenbanksysteme I. Klausur zum Praktikum. Mehrere Professoren prüfen mit genau einem Beisitzer genau einen Studenten.

Relationales Modell: SQL-DDL. SQL als Definitionssprache. 7. Datenbankdefinitionssprachen. Anforderungen an eine relationale DDL

Mengenvergleiche: Alle Konten außer das, mit dem größten Saldo.

IVS Arbeitsgruppe Softwaretechnik Abschnitt Management komplexer Integrationslösungen

PostgreSQL in großen Installationen

Interaktive Webseiten mit PHP und MySQL

Datenbankenseminar: SAP Reporting Vergleich ABAP vs. Quick View. Dipl. WiFo Sven Adolph

Datenbanken. Prof. Dr. Bernhard Schiefer.

Datenbanken (WS 2015/2016)

Ausgangspunkt. Datenintegration. Ziel. Konflikte. Architekturen. Transparenz

SQL: statische Integrität

Datenbank-Implementierungstechniken

Views in SQL. 2 Anlegen und Verwenden von Views 2

mit konventionellen Datenbanksystemen konventionellen Datenbanksystemen

Vorlesung Datenbankmanagementsysteme

Universität Augsburg, Institut für Informatik WS 2006/2007 Dr. W.-T. Balke 27. Nov M. Endres, A. Huhn, T. Preisinger Lösungsblatt 5

SQL für Trolle. mag.e. Dienstag, Qt-Seminar

Die Anweisung create table

Performance by Design Wie werden performante ETL-Prozesse erstellt?

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006

Datenbanksysteme 1. Organisation. Prof. Stefan F. Keller. Ausgabe Copyright 2005 HSR SS 2005

SQL structured query language

DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER

Erstellen einer Datenbank. Datenbankabfragen

Allgemeines zu Datenbanken

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D.

Anfrageoptimierung Ausführungspläne, Hints, Statistikinformationen, IDEs

Nachtrag: Farben. Farbblindheit. (Light und Bartlein 2004)

Innovator 11 excellence. Import eines DB-Schemas mit Direktzugriff auf ein RDBMS via JDBC. HowTo. Udo Ende.

Einteilung von Datenbanken

Die Entwicklung des Open-Source. Source-Tools. zum Datenbankabgleich von Karsten Panier. Inhalt

Referentielle Integrität

Datenbanksysteme 2 Frühjahr-/Sommersemester Mai 2014

Fachgruppentreffen. GI-Fachgruppe Datenbanksysteme

Datenbankstammtisch. Replikation in heterogenen Datenbankumgebungen am Beispiel des Sybase Replication Servers. 1. Februar 2006

Universität Augsburg, Institut für Informatik Wintersemester 2011/2012 Prof. Dr. W. Kießling 03. Feb Semesterklausur

Fallbeispiel Zahlungsverkehr

Klausur Interoperabilität

Datenbanktechnologie für Data-Warehouse-Systeme

Datenbanken und Informationssysteme

Zeitlich abhängig von OWB?

Materialized Views Praktischer Einsatz vor und in 12c

Bedingungen über Werte Statische Integrität. CHECK-Klausel

SAP HANA Einsatzmöglichkeiten und Potenziale

Datenbanken: Datenintegrität.

Grundlagen Datenbanken Sommersemester 2008

11 Inhaltsübersicht. c M. Scholl, 2005/06 Informationssysteme: 11. Inhaltsübersicht 11-1

MIN oder MAX Bildung per B*Tree Index Hint

PostgreSQL und memcached

Options- und Freitext-Modul Update-Anleitung

Transkript:

Data-Warehouse-Technologien Prof. Dr.-Ing. Kai-Uwe Sattler 1 Prof. Dr. Gunter Saake 2 1 TU Ilmenau FG Datenbanken & Informationssysteme 2 Universität Magdeburg Institut für Technische und Betriebliche Informationssysteme Wintersemester 2010/11 Sattler / Saake Data-Warehouse-Technologien Wintersemester 2010/11 0 1

Organisatorisches Überblick 1 Einführung & Grundbegriffe 2 Data-Warehouse-Architektur 3 Modellierung von Data Warehouses 4 Extraktion, Transformation und Laden 5 Datenqualität und Data Cleaning 6 Index- und Speicherungsstrukturen 7 Anfragen an Data Warehouses 8 Anfrageverarbeitung und -optimierung 9 Materialisierte Sichten Sattler / Saake Data-Warehouse-Technologien Wintersemester 2010/11 1 2

Organisatorisches Zeiten, Ablauf, etc. Dozent: Gunter Saake Infos (Zeiten, Räume) & Folienkopien unter http://wwwiti.cs.uni-magdeburg.de/iti_db/lehre/dw/index.html Übungen Übungsleiter: Martin Kuhlemann Scheinkriterien etc. Martin Kuhlemann Prüfung mündliche Prüfung (wenn unter 35 Prüfungen) Feedback, Fragen,... Sprechzeiten: ALG 110, Fr 10:30-11:15 Uhr Sattler / Saake Data-Warehouse-Technologien Wintersemester 2010/11 1 3

Organisatorisches Literatur W. Lehner. Datenbanktechnologie für Data-Warehouse-Systeme. dpunkt.verlag, Heidelberg, 2003 W.H. Inmon. Building the Data Warehouse. Wiley & Sons, New York, 1996 A. Bauer, H. Günzel. Data Warehouse Systeme Architektur, Entwicklung, Anwendung. 2. Auflage, dpunkt.verlag, Heidelberg, 2004 G. Saake, A. Heuer, K. Sattler. Datenbanken: Implementierungstechniken. 2. Auflage, mitp-verlag, Bonn, 2005 R. Kimball, L. Reeves, M. Ross, W. Thornthwaite. The Data Warehouse Lifecycle Toolkit Wiley & Sons, New York, 1998 Sattler / Saake Data-Warehouse-Technologien Wintersemester 2010/11 1 4

Teil II Einführung

Einführung Einführung 1 Motivation 2 Anwendungen 3 Abgrenzung 4 Begriff Data Warehouse 5 DW-Architektur 6 Benchmarks Sattler / Saake Data-Warehouse-Technologien Wintersemester 2010/11 2 1

Einführung Motivation Szenario: Getränkemarkt Umsatz, Portfolio Werbung Sattler / Saake Data-Warehouse-Technologien Wintersemester 2010/11 2 2

Einführung Motivation DB-Schema Produkt (0,*) geliefert von Lieferant kauft (0,*) Menge Kunde Sattler / Saake Data-Warehouse-Technologien Wintersemester 2010/11 2 3

Materialisierte Sichten Materialisierte Sichten in DBMS Materialisierte Sichten in Oracle Syntax CREATE MATERIALIZED VIEW matview BUILD IMMEDIATE REFRESH COMPLETE ENABLE QUERY REWRITE AS SELECT...FROM...WHERE...GROUP BY... Füllen der Sicht BUILD IMMEDIATE (sofort) BUILD DEFERRED (explizit zum späteren Zeitpunkt) Aktualisierungszeitpunkte: REFRESH ON COMMIT (Änderung der Basisrelation), REFRESH ON DEMAND (explizite Aktualisierung, z.b. über dbms_mview.refresh) Sattler / Saake Data-Warehouse-Technologien Wintersemester 2010/11 12 87

Materialisierte Sichten Materialisierte Sichten in DBMS Materialisierte Sichten in Oracle /2 Aktualisierungsstrategie COMPLETE: vollständig FAST: Deltas über View-Log NEVER: keine Aktualisierung FORCE: wenn möglich FAST, sonst COMPLETE View-Logs: Log-Tabellen mit Änderungsoperationen (über Trigger auf Basisrelationen) CREATE MATERIALIZED VIEW LOG ON base-table WITH SEQUENCE, ROWID (attributes) INCLUDING NEW VALUES Sattler / Saake Data-Warehouse-Technologien Wintersemester 2010/11 12 88

Materialisierte Sichten Materialisierte Sichten in DBMS Materialisierte Sichten in Oracle /3 Restriktionen für FAST (u.a.) Alle Basisrelationen mit View-Logs Zu jedem Aufruf AGG(expr) korrespondierendes COUNT(expr) alle Gruppierungsattribute in SELECT-Klausel Einschränkungen bei OUTER JOIN sowie komplexeren Gruppierungen Sattler / Saake Data-Warehouse-Technologien Wintersemester 2010/11 12 89

Materialisierte Sichten Materialisierte Sichten in DBMS Materialisierte Sichten in Oracle /4 Verwendung existierender Tabellen als materialisierte Sicht CREATE MATERIALIZED VIEW matview ON PREBUILT TABLE sum_table... Summary Advisor als Administrator-Werkzeug für Auswahl von materialisierten Sichten Sattler / Saake Data-Warehouse-Technologien Wintersemester 2010/11 12 90

Materialisierte Sichten Materialisierte Sichten in DBMS Oracle: Rewriting Oracle versucht Rewriting auf mehrere Arten Text Match Full Text Match und Partial Text Match Rein syntaktischer Match Groß-/ Kleinschreibung Leerzeichen Reihenfolge von Bedingungen Keine logische Implikation, kein Mapping, etc. General Query Rewrite Nicht anwendbar bei Complex materialized views Unterschiedliche Methoden ja nach Art des MV Viele Einschränkungen Dokumentation Sattler / Saake Data-Warehouse-Technologien Wintersemester 2010/11 12 91

Materialisierte Sichten Materialisierte Sichten in DBMS Materialisierte Sichten in IBM DB2 Syntax CREATE SUMMARY TABLE matview AS ( SELECT...FROM...WHERE...GROUP BY... ) DATA INITIALLY DEFERRED REFRESH DEFERRED Explizites Füllen der mat. Sicht REFRESH TABLE matview Weitere Aktualisierungsstrategien möglich Sattler / Saake Data-Warehouse-Technologien Wintersemester 2010/11 12 92

Materialisierte Sichten Materialisierte Sichten in DBMS SQL Server Indexierung von Sichten Materialisierung der betroffenen Daten Automatische Aktualisierung bei Änderung der Basisdaten CREATE VIEW Verkäufe2002 AS SELECT Stadt, Verkäufe, V.ZeitID, V.GeographieID FROM Verkauf V, Zeit Z, Geographie G WHERE V.ZeitID = Z.ZeitID AND Z.Jahr = 2002 AND V.GeographieID = G.GeographieID; CREATE UNIQUE CLUSTERED INDEX V2000_IDX ON Verkäufe2002(ZeitID, GeographieID); Sattler / Saake Data-Warehouse-Technologien Wintersemester 2010/11 12 93