Themenblock: Erstellung eines Cube



Ähnliche Dokumente
Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL

SQL Tutorial. SQL - Tutorial SS 06. Hubert Baumgartner. INSO - Industrial Software

Mengenvergleiche: Alle Konten außer das, mit dem größten Saldo.

DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER

SQL/ETL. Praktikum: Data Warehousing und. Praktikum Data Warehousing und Mining, Sommersemester 2010

IV. Datenbankmanagement

OLAP und Data Warehouses

SQL structured query language

SQL für Trolle. mag.e. Dienstag, Qt-Seminar

Data Warehouse Technologien

Universität Augsburg, Institut für Informatik WS 2006/2007 Dr. W.-T. Balke 27. Nov M. Endres, A. Huhn, T. Preisinger Lösungsblatt 5

DBS ::: SERIE 5. Join Right Semi- Join Left Semi-Join Projektion Selektion Fremdschlüssel. Kreuzprodukt

Datenbanken SQL Einführung Datenbank in MySQL einrichten mit PhpMyAdmin

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien

Nachtrag: Farben. Farbblindheit. (Light und Bartlein 2004)

Bibliografische Informationen digitalisiert durch

Referenzielle Integrität SQL

Vorlesung Datenbankmanagementsysteme

Fortgeschrittene OLAP Analysemodelle

Index- und Zugriffsstrukturen für. Holger Brämer, 05IND-P

Kapitel 3: Datenbanksysteme

SQL. strukturierte Datenbankabfragesprache eine Datenbanksprache zur. Structured Query Language:

Data Warehouse Definition (1)

Das Multidimensionale Datenmodell

7. Übung - Datenbanken

Datenbanksysteme 2 Frühjahr-/Sommersemester Mai 2014

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Oracle 10g Einführung

SQL und MySQL. Kristian Köhntopp

105.3 SQL-Datenverwaltung

Wiederholung VU Datenmodellierung

Wiederholung VU Datenmodellierung

5.3 Datenänderung/-zugriff mit SQL (DML)

SQL: statische Integrität

Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum:

Aufgabe 1: [Logische Modellierung]

Labor 3 - Datenbank mit MySQL

Seminar 2. SQL - DML(Data Manipulation Language) und. DDL(Data Definition Language) Befehle.

SQL (Structured Query Language) Schemata Datentypen

WS 2010/11 Datenbanksysteme Fr 15:15 16:45 R Vorlesung #3. SQL (Teil 1)

Relationales Modell: SQL-DDL. SQL als Definitionssprache. 7. Datenbankdefinitionssprachen. Anforderungen an eine relationale DDL

Arbeiten mit einem lokalen PostgreSQL-Server

Einführung in SQL. Sprachumfang: Indizes. Datensätzen. Zugriffsrechten

3.17 Zugriffskontrolle

Übung Datenbanken in der Praxis. Datenmodifikation mit SQL

SQL-Befehlsliste. Vereinbarung über die Schreibweise

Views in SQL. 2 Anlegen und Verwenden von Views 2

Auf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort... 13

Die Anweisung create table

Inhaltsverzeichnis. Vorwort Kapitel 1 Einleitung... 15

Hetero-Homogene Data Warehouses

6. Sichten, Integrität und Zugriffskontrolle. Vorlesung "Informa=onssysteme" Sommersemester 2015

Auf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort 13

mit Musterlösungen Prof. Dr. Gerd Stumme, Dipl.-Inform. Christoph Schmitz 11. Juni 2007

Das SQL-Schlüsselwort ALL entspricht dem Allquantor der Prädikatenlogik

Create-Table-Befehl. CREATE TABLE Tabellenname ( { Spalte { Datentyp Gebietsname } [ Spaltenbedingung [ ] ] Tabellenbedingung }

Informatik 12 Datenbanken SQL-Einführung

Inhaltsverzeichnis. Vorwort 13. Kapitel 1 Einleitung 15

Referentielle Integrität

Whitepaper. Produkt: combit Relationship Manager. Datensatzhistorie mit dem SQL Server 2000 und combit GmbH Untere Laube Konstanz

Referentielle Integrität

Sructred Query Language

SQL. SQL: Structured Query Language. Früherer Name: SEQUEL. Standardisierte Anfragesprache für relationale DBMS: SQL-89, SQL-92, SQL-99

Pivotieren. Themenblock: Anfragen auf dem Cube. Roll-up und Drill-down. Slicing und Dicing. Praktikum: Data Warehousing und Data Mining. Produkt.

Inhalt. 1. MySQL-Einführung Datenbankentwurf 27

SQL SQL. SQL = Structured Query Language (SEQUEL) IBM San Jose Research Laboratory SYSTEM R. Grundlagen der Programmierung 2

4. Datenbanksprache SQL

Relationales Datenbanksystem Oracle

6. Datenintegrität. Integritätsbedingungen

Marketing Intelligence Vorstellung der Softwarekomponenten. Josef Kolbitsch Manuela Reinisch

Benutzerverwaltung, Sichten und Datenintegrität

OPERATIONEN AUF EINER DATENBANK

SQL SQL. SQL = Structured Query Language (SEQUEL) IBM San Jose Research Laboratory SYSTEM R. Grundlagen der Datenbanksysteme I

Daten-Definitionssprache (DDL) Bisher: Realwelt -> ERM -> Relationen-Modell -> normalisiertes Relationen-Modell. Jetzt: -> Formulierung in DDL

Datenbanken: Datenintegrität.

Schlüssel bei temporalen Daten im relationalen Modell

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH

3. Das Relationale Datenmodell

Data Warehousing und Data Mining

Datenmanagement in Android-Apps. 16. Mai 2013

2 Datenbanksysteme, Datenbankanwendungen und Middleware... 45

Konstante Relationen

SQL. DDL (Data Definition Language) Befehle und DML(Data Manipulation Language)

Data-Warehouse-Technologien

Vorwort zur 5. Auflage Über den Autor... 16

Kampagnenmanagement mit Siebel Marketing/Oracle BI ein Praxisbericht

Grundzüge und Vorteile von XML-Datenbanken am Beispiel der Oracle XML DB

Semantische Integrität (auch: Konsistenz) der in einer Datenbank gespeicherten Daten als wichtige Anforderung

Unterabfragen (Subqueries)

SQL Intensivpraktikum SS 2008

Sichten II. Definition einer Sicht. Sichten. Drei-Ebenen-Schema-Architektur. Vorteile Vereinfachung von Anfragen Strukturierung der Datenbank

Einführung in SQL. 1. Grundlagen SQL. Structured Query Language. Viele Dialekte. Unterteilung: i. DDL (Data Definition Language)

<Insert Picture Here> Oracle Datenbank Einführung Ulrike Schwinn

Multidimensionale Modellierung

SQL. Fortgeschrittene Konzepte Auszug

Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH

Transkript:

Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining

Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen Menge von Grundoperationen Produkt Oracle Datenbank 2

Relationenname Relationenmodell Attribut Stadt Name CID Population Paris FR 2153000 Tokyo JA 8022000 Hamburg GM 1706000 Stockholm SW 704000 Seoul KS 10776000 Berlin GM 3472000 Relationenschema Relation Tupel Attributwert 3

Primärschlüssel Schlüssel Identifiziert ein Tupel eindeutig Fremdschlüssel Referenziert von einem Tupel auf ein anderes Tupel 4

Eigenschaften SQL die Sprache für relationale Datenbanken mengenorientiert & deklarativ Konstrukte zur Datenmanipulation CREATE, INSERT, UPDATE, DELETE Konstrukt für Datenabfragen SELECT 5

Datentypen Zeichenketten CHARACTER(N), CHAR(n) VARCHAR(n) Zahlen INTEGER, INT NUMERIC(p, s) FLOAT Datum und Uhrzeit DATE 6

Anlegen von Relationen SQL - Create Syntax CREATE TABLE <Relation> ( ) <Attribut><Datentyp>, PRIMARY KEY (<Attribut>) FOREIGN KEY <Attribut> REFERENCES <Relation>(<Attribut>) 7

SQL Insert und Update Einfügen von Tupeln in Relation Syntax INSERT INTO <Relation> VALUES (<Datum1>, '<Datum2>', ) Ändern von Tupeln Syntax UPDATE <Relation> SET <Attribut> = <Datum> WHERE <Attribut> = <Datum> 8

SQL - Delete Löschen von Tupeln aus einer Relation Syntax DELETE FROM <Relation> WHERE <Attribut> = <Datum> Löschen von Realtionen Syntax DELETE FROM <Relation> 9

Anfragen - Grundgerüst Anfragen an den Datenbestand Syntax SELECT <Attribut>, FROM <Relation> WHERE <Selektionsbedingung> GROUP BY <Attribut> 10

Projektion Auswahl von Spalten einer Relation Syntax SELECT <Attribut>, FROM <Relation> Name Paris Tokyo Hamburg Stockholm Seoul Berlin CID FR JA GM SW KS GM Population 2153000 8022000 1706000 704000 10776000 3472000 11

Anfragen - Selektion Auswahl von Tupeln einer Relation Syntax SELECT * FROM <Relation> WHERE <Selektionsbedingung> Name Paris Tokyo Hamburg Stockholm Seoul Berlin CID FR JA GM SW KS GM Population 2153000 8022000 1706000 704000 10776000 3472000 12

Anfragen - Verbund Kombination mehrerer Relationen Syntax SELECT <Attribut>, FROM <Relation1>, <Relation2> WHERE <Relation1>.<Attribut> = <Relation2>.<Attribut> 13

Anfragen Aggregatfunktionen Berechnung von Aggregaten auf Relationen Syntax SELECT <Aggregat>(<Attribut>) AS <Name> FROM <Relation> Wichtige Aggregatfunktionen: COUNT SUM MIN MAX AVG 14

Anfragen Gruppierung Gruppierung von gleichen Attributwerten Syntax SELECT <Attribut> FROM <Relation> GROUP BY <Attribut> HAVING <Gruppenbedingung> 15

Anfragen - Mengenoperationen Mengenoperationen auf Anfrageergebnissen (SELECT <Attribut>, FROM <Relation>) INTERSECT UNION MINUS (SELECT <Attribut>, FROM <Relation>) 16

Vorgehen bei der Definition von Anfragen FROM Ausgangsrelationen WHERE GROUP BY HAVING SELECT Selektion von Tupeln, die der Bedingung genügen Gruppierung von Tupeln gemäß gleicher Attributwerte Selektion von Gruppen, die der Bedingung genügen Projektion der gewählten Attribute 17

isql*plus SQL mit Oracle Webinterface zur Eingabe von SQL-Befehlen URL: http://i40fs3:5560/isqlplus Anmeldung mit Benutzername, Passwort Datenbank: dwm ( Connect-Bezeichner ) 18

Data Warehousing mit Oracle Enterprise Manager Informationen zur Systemperformanz Administrationsaufgaben Teilbereich Warehouse Benutzung URL: http://i40fs3:5504/em Anmeldung mit Benutzername, Passwort 19

Der Enterprise Manager 20

Beobachtungen Sichten I Gleiche Teile von Relation häufig benutzt (Teil-)Anfragen treten sehr häufig auf Anfragen sehr komplex Lösung (materialisierte) Sichten Vorgehen Anfrageergebnisse werden gespeichert 21

Performanz Sichten II Berechnung häufiger Zwischenergebnisse entfällt Zusätzliche Indexe über materialisierten Sichten Zugriff durch weniger User Keine kontinuierlichen Updates Materialisierte Sichten im Data Warehouse Speicherung des Ergebnisses von Data Cleaning Analyse historischer Entwicklung des Datenbestands 22

Sichten sind: Sichten III das Ergebnis einer SELECT-Anweisung "virtuelle" Relationen Syntax CREATE [MATERIALIZED] VIEW <Viewname> AS <Anfrage> 23

Zu Erreichen über Materialisierte Sichten Administration -> Warehouse -> Materialized Views 24

Einsatzbereiche Datenbanken Tagesgeschäft Transaktionsorientierte Datenzugriffe Erfassen von Daten Lesezugriffe auf Daten OLTP (Online Transactional Processing) Datenbanken Entscheidungsunterstützung Konsolidierung von Daten Betrachtung und Analyse von (aggregierten) Daten OLAP (Online Analytical Processing) Data Warehouse 25

Überblick Extraktion Transformation Laden Data Warehouse Analyse Data Mining Operative Datenbanken Reporting OLAP Server Data Mart 26

ETL-Prozess Extraktion Datenquelle Laden Basisdatenbank Data Warehouse Transformation Analyse 27

Data Warehouse - Eigenschaften Repository aus heterogenen Quellen Daten meist aggregiert materialisierten Sichten auf Originaldaten Multidimensionales Datenmodell Datenwürfel Entsprechenden Operationen 28

Data Mart Kleines Data Warehouse für bestimmte Zielgruppe z.b. Finanzabteilung, Produktentwicklung, speziell aufbereitete Teil-Daten schnellere Verfügbarkeit bei Anfragen bessere Transparenz für den Anwender 29

Data Cube Einführung Hilfsmittel zur Veranschaulichung von Daten verschiedene Aspekte auf gleiche Weise zugreifbar Einsatz bei OLAP Anwendungen Kennzahlen Elemente eines Würfels Dimensionen Beschreiben Daten Ermöglichen Zugriff auf Kennzahlen Können Hierarchien sein Dimension Kennzahl 30

Data Cube Beispiel Jahr Quartal Monat Tag Produkt. Zeit Umsatz Geographie 31

Relationale Umsetzung: Anforderungen Beibehaltung der Semantik z.b. Hierarchien Effiziente Verarbeitung von Anfragen Einfache Pflege z.b. beim Nachladen von Daten 32

Relationale Umsetzung: Faktentabelle Umsetzung des Datenwürfels ohne Hierarchien Kennzahlen, Dimensionen Spalten Zellen Tupel Jahr Quartal Produkt Monat Tag Produkt BMW 3er Zeit 01.02.2005 Geographie Karlsruhe Umsatz 6.000 BMW 7er 04.06.2005 Mannheim 3.254. BMW 1er 03.07.2005 Mannheim 726 Zeit Umsatz Geographie 33

Relationale Umsetzung: Star Schema gängiger Schematyp für Data Warehouses Beschreibung der Dimensionen durch: Dimension Tables Je eine Relation pro Dimension Nicht in dritter Normalform Hierarchien führen zu Redundanz Vorteil Performanz 34

Relationale Umsetzung: Star Schema - Beispiel Produkt Zeit Geographie Umsatz Jahr Quartal Produkt BMW 3er BMW 7er 01.02.2005 04.06.2005 Karlsruhe Mannheim 6.000 3.254 Monat Tag BMW 1er 03.07.2005 Mannheim 726 Tag Monat Quartal Jahr. 01.01.2005 02.01.2005 Januar Januar Q1 Q1 2005 2005 03.01.2005 Januar Q1 2005 Zeit Umsatz Geographie 35

Relational Umsetzung: Snowflake Schema Verfeinerung des Star Schemas Mehrere Dimension Tables pro Dimension Relation pro Ebene einer Hierarchie Normalisiert Höherer Join-Aufwand bei Anfragen Keine Redundanz 36

Relational Umsetzung: Snowflake - Beispiel Jahr Quartal Monat Tag Produkt Produkt BMW 3er BMW 7er BMW 1er Zeit 01.02.2005 04.06.2005 03.07.2005 Geographie Karlsruhe Mannheim Mannheim Umsatz 6.000 3.254 726 Tag Bezeichnung Monat_ID. 01.01.2005 02.01.2005 Neujahr Namenstag Adelhard 1 1 03.01.2005 Namenstag Adula 1 Zeit Geographie Umsatz Monat_ID 1 2 Bezeichnung Januar Februar Quartal_ID Q1 Q1 3 März Q1 37

Vorgehen Dimensionen mit Oracle Namen vergeben Anlegen von Ebenen aus Relation nach Star Schema Hierarchische Anordnung der Ebenen 38

Dimensionen Anlegen von Hierarchieebenen Zu Erreichen über Administration->Warehouse->Dimensions 39

Dimensionen Anordnung der Ebenen 40

Zu Erreichen über Cube mit Oracle erstellen Administration->Warehouse->Cubes 41

Cube um Dimensionen erweitern 42

Cube um Kennzahlen erweitern 43

Beispieldaten Faktentabelle Sales Dimensionstabellen Promotions, Times, Products, Customers, Channels Sind im Starschema Promotions Sales Channels Times Products Customers 44

Beispieldaten Beschreibung Faktentabelle Sales Kennzahlen + Fremdschlüssel zu Dimensionstabellen Dimensionstabellen Promotions beschreibt Werbeaktionen Products Produktbeschreibungen Customers Times Daten über die Kunden Zeitabschnitte 45