Kapitel 6. Vorlesung: PD Dr. Peer Kröger

Ähnliche Dokumente
Kapitel 6 Einführung in Data Warehouses

Einführung in Data Warehouses

OLAP und Data Warehouses

Data Warehousing und Data Mining

Einführungsveranstaltung: Data Warehouse

WAHLPFLICHTBEREICH WIRTSCHAFTSINFORMATIK 'DATA WAREHOUSE'

Data Warehousing. Kapitel 1: Data-Warehousing-Architektur. Folien teilweise übernommen von Matthias Gimbel

MIS by Franziska Täschler, Winformation GmbH Ausgabe 01/2001

Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube

Data Warehousing: Anwendungsbeispiel

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH

Vertrautmachen mit Daten

Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH)

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Informationssysteme: Neuere Konzepte Teil II

Objektorientierte Datenbanken

Data Warehouse und Data Mining

Data Warehouse Grundlagen

Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen

Inhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Multidimensionales Datenmodell

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Mala Bachmann September 2000

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier

Data-Warehouse-Systeme

fi Data Warehouse: Sammlung von Technologien zur Unterstützung von Entscheidungsprozessen fi Herausforderung an Datenbanktechnologien

Business Intelligence Data Warehouse. Jan Weinschenker

Inhaltsverzeichnis. vii.

Data Warehouse ??? Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle

Kapitel 2 Terminologie und Definition

Kapitel 17: Date Warehouse

Marketing Intelligence Vorstellung der Softwarekomponenten. Josef Kolbitsch Manuela Reinisch

Online Analytical Processing

Zusammenspiel von Business Intelligence mit betrieblicher Anwendungssoftware Falk Neubert, Universität Osnabrück

Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen Fragen Vertiefung Modellierung

Kapitel 4: Data Warehouse Architektur

Data Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Marketing Intelligence Übersicht über Business Intelligence. Josef Kolbitsch Manuela Reinisch

Multidimensionales Datenmodell, Cognos

Data Warehouse Technologien

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien

Kapitel II. Datenbereitstellung 2004 AIFB / FZI 1. Vorlesung Knowledge Discovery

Kap. 6 Data Warehouse

Betriebliche Anwendungen

OLTP: Online Transaction Processing

Kapitel 2 Transaktionsverwaltung

eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator

Christian Kurze BI-Praktikum IBM WS 2008/09

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft

Themenblock: Erstellung eines Cube

Management Support Systeme

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

SAP Business Intelligence

Business Intelligence. Data Warehouse / Analyse Sven Elvers

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Logische Modellierung von Data Warehouses

Eine Einführung in OLAP

Data Warehouse Definition (1)

Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing

Folien zum Textbuch. Kapitel 6: Managementunterstützungssysteme. Teil 2: Textbuch-Seiten

Business Intelligence im Krankenhaus

10. Vorlesung: Datenorganisation SS 2007

Business Intelligence Aufgabenstellung

Das Multidimensionale Datenmodell

Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH

Gliederung Datenbanksysteme

Friedrich-Schiller-Universität Jena

Contents. Datenanalysemethoden im analytischen CRM. Data Warehouse - OLAP Version: July 17, Datenanalysemethoden im analytischen CRM

Kapitel 6 Anfragebearbeitung

2 Wasist OLAP? Was ist OLAP? 2.1 Dasmultidimensionale Datenmodell. 2.2 Dimension. Seite21 VERLAG FÜR CONTROLLINGWISSEN AG V C W. Controllers-Werkzeug

DW Data Warehousing Funktionsweise, Einsatz- und Problemfelder

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII

Themenblock: Data Warehousing (I)

Data Warehouse (DWH) / (Business Intelligence, BI )

Thema 02: Effiziente Auswertungen von RFIDgenerierten Daten mit Hilfe von Main- Memory-Datenbanken

Inhaltsverzeichnis. Teil I OLAP und der Microsoft SQL-Server 1. 1 Theoretische Grundlagen 3

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL

Data Warehousing. Matthias Conrad 97I1. DB Oberseminar

Data Warehouses. Data Warehouse Architektur ... Sommersemester Melanie Herschel

Erfolgreiche Unternehmensführung durch den Einsatz von Corporate Performance Management

Data Warehousing und Data Mining

OLAP mit dem SQL-Server

Kapitel 6 Managementunterstützungssysteme und Business Intelligence

Ausarbeitung im Fach Datenbanken II

Datenbanksysteme II. Vorlesung: PD Dr. Peer Kröger

OLAP Einführung und Überblick

OLAP und der MS SQL Server

Komponenten und Architekturen von Analytischen Informationssystemen

Kapitel II. Datenbereitstellung. II. Datenbereitstellung. II.1 Grundlagen. II. Datenbereitstellung. Collect Initial Data. II.

Modellierung von OLAP- und Data- Warehouse-Systemen

Datenbanktechnologie für Data-Warehouse-Systeme

Data Warehouse. für den Microsoft SQL SERVER 2000/2005

Grundlagen von Rasterdaten

Data Warehousing. DWH Projekte. Ulf Leser Wissensmanagement in der Bioinformatik

5 Data Warehouses und Data Mining

eevolution Business Intelligence

good. better. outperform.

Transkript:

Kapitel 6 Einführung in Data Warehouses Vorlesung: PD Dr. Peer Kröger Dieses Skript basiert auf den Skripten zur Vorlesung Datenbanksysteme II an der LMU München Dieses Skript basiert auf den Skripten zur Vorlesung Datenbanksysteme II an der LMU München von Prof. Dr. Christian Böhm (Sommersemester 2007), PD Dr. Peer Kröger (Sommersemester 2008) und PD Dr. Matthias Schubert (Sommersemester 2009) http://www.dbs.ifi.lmu.de/cms/datenbanksysteme_ii_13

6 Einführung in Data Warehouses Übersicht 6.1 Einleitung 6.2 Datenmodellierung 6.3 Anfragebearbeitung 2

6 Einführung in Data Warehouses Übersicht 6.1 Einleitung 6.2 Datenmodellierung 6.3 Anfragebearbeitung 3

6.1 Einleitung Zwei Arten von DB-Anwendungen Online Transaction Processing (OLTP) - Routinetransaktionsverarbeitung - Realisierung des operationalen Tagesgeschäfts wie Buchen eines Flugs Verarbeitung einer Bestellung Ein- und Verkauf von Waren - Charakteristik: Arbeitet auf dem jüngsten, aktuellsten Zustand der Daten Änderungstransaktionen (kurze Lese-/Schreibzugriffe) Zugriff auf sehr begrenzte Datenmenge Sehr kurze Antwortzeiten erwünscht (ms-s) - OLTP-Datenbanken optimieren typischerweise den logischen und physischen DB-Entwurf hinsichtlich dieser Charakteristik 4

6.1 Einleitung Zwei Arten von DB-Anwendungen (cont.) Online Analytical Processing (OLAP) - Bilden Grundlage für strategische Unternehmensplanung (Decision Support) - Anwendungen wie Entwicklung der Auslastung der Transatlantik-Flüge über die letzten 2 Jahre? Auswirkungen spezieller Marketingaktionen auf Verkaufszahlen der Produkte? Voraussichtliche Verkaufszahl eines Produkts im nächsten Monat? - Charakteristik: Arbeitet mit historischen Daten (lange Lesetransaktionen) Zugriff auf sehr große Datenmengen Meist Integration, Konsolidierung und Aggregation der Daten Mittlere Antwortzeiten akzeptabel (s-min) - OLAP-Datenbanken optimieren typischerweise den logischen und physischen h DB-Entwurf fhinsichtlich i htli hdieser Charakteristik 5

6.1 Einleitung Zwei Arten von DB-Anwendungen (cont.) OLTP- und OLAP-Anwendungen sollten nicht auf demselben Datenbstand ausgeführt werden - Unterschiedliche Optimierungsziele beim Entwurf - Komplexe OLAP-Anfragen könnten die Leistungsfähigkeit der OLTP-Anwendungen beeinträchtigen Data Warehouse - Datenbanksystem, indem alle Daten für OLAP-Anwendungen in konsolidierter Form gesammelt werden - Integration von Daten aus operationalen DBs aber auch aus Dateien (Excel, ), - Daten werden dabei oft in aggregierter Form gehalten - Enthält historische Daten - Regelmäßige Updates (periodisch) 6

6.1 Einleitung Operationales DBS vs. Data Warehouse operationales DBS Data Warehouse Ziel Abwicklung des Geschäfts Analyse des Geschäfts Focus auf Detail-Daten aggregierten Daten Versionen nur aktuelle Daten gesamte Historie der Daten DB-Größe ~ 1 GB ~ 1 TB DB-Operationen Updates und Anfragen nur Anfragen Zugriffe pro Op. ~ 10 Datensätze ~ 1.000.000 Datensätze Leistungsmaß Durchsatz Antwortzeit 7

6.1 Einleitung Data Warehouses Begriff: A Data Warehouse is a subject-oriented, integrated, non- volatile, and time variant collection of data to support management decisions [W.H. Inmon, 1996] 8

6.1 Einleitung Data Warehouses (cont.) Begriff: A Data Warehouse is a subject-oriented oriented, integrated, non-volatile, and time variant collection of data to support management decisions [W.H. Inmon, 1996] Fachorientierung (subject-oriented) - System dient der Modellierung eines spezifischen Anwendungsziel (meist Entscheidungsfindung in Unternehmen) - System enthält nur Daten, die für das Anwendungsziel nötig sind. Für das Anwendungsziel irrelevante Daten werden weggelassen. 9

6.1 Einleitung Data Warehouses (cont.) Begriff: A Data Warehouse is a subject-oriented, integrated, non-volatile, and time variant collection of data to support management decisions. [W.H. Inmon, 1996] Fachorientierung (subject-oriented) - System dient nicht der Erfüllung einer Aufgabe (z.b. Verwlatung von Personaldaten) -System dient der Modellierung eines spezifischen Anwendungsziel Integrierte Datenbasis (integrated) - Verarbeitung der Daten aus unterschiedlichen Datenquellen 10

6.1 Einleitung Data Warehouses (cont.) Begriff: A Data Warehouse is a subject-oriented, integrated, non-volatile,, and time variant collection of data to support management decisions. [W.H. Inmon, 1996] Nicht-flüchtige Datenbasis (non-volatile) - Stabile, persistente Datenbasis - Daten im Data Warehouse werden nicht mehr entfernt oder geändert 11

6.1 Einleitung Data Warehouses (cont.) Begriff: A Data Warehouse is a subject-oriented, integrated, non-volatile, and time variant collection of data to support management decisions [W.H. Inmon, 1996] Nicht-flüchtige Datenbasis (non-volatile) - Stabile, persistente Datenbasis - Daten im Data Warehouse werden nicht mehr entfernt oder geändert Historische Daten (time variant) - Vergleich der Daten über die Zeit möglich - Speicherung über längeren Zeitraum 12

6.1 Einleitung Architektur eines Data Warehouse operationale DB operationale DB operationale DB flat files spread sheets Einzelne Abteilungen OLTP Integration Initiales Laden und periodische Auffrischung des Data Warehouse Management Data Warehouse OLAP Decision Support Systems (DSS) Executive Information Systems (EIS) Data Mining 13

6.1 Einleitung Data Warehouses und Data Marts Manchmal kann es sinnvoll sein, nur eine inhaltlich beschränkte Sicht auf das Data Warehouse bereitzustellen (z.b. für eine Abteilung) => Data Mart - Gründe: Eigenständigkeit, Datenschutz, Lastenverteilung, - Realisierung: Verteilung der DW-Datenbasis - Klassen: Abhängige Data Marts: Verteilung eines bestehenden DWs => Analysen auf DM konsistent t zu Analysen auf gesamten DW Unabhängige Data Marts: unabhängig voneinander entstandene kleine DWs, nachträgliche Integration zum globalen DW => unterschiedliche Analysesichten 14

6 Einführung in Data Warehouses Übersicht 6.1 Einleitung 6.2 Datenmodellierung 6.3 Anfragebearbeitung 15

6.2 Datenmodellierung Motivation Datenmodell sollte bzgl. Analyseprozess optimiert werden Datenanalyse im Entscheidungsprozess - Betriebswirtschaftliche Kennzahlen stehen im Mittelpunkte (z.b. Elö Erlöse, Gewinne, Verluste, Umsätze, ) => Fakten - Betrachtung dieser Kennzahlen aus unterschiedlichen Perspektiven (z.b. zeitlich, regional, produktbezogen, ) => Dimensionen - Unterteilung der Auswertungsdimensionen möglich (z.b. zeitlich: Jahr, Quartal, Monat; regional: Bundesländer, Bezirke, Städte/Gemeinden; ) => Hierarchien, Konsolidierungsebenen 16

6.2 Datenmodellierung Kennzahlen/Fakten Kennzahlen/Fakten - Numerische Messgrößen - Beschreiben betriebswirtschaftliche Sachverhalte Beispiele: Umsatz, Gewinn, Verlust, Typen - Additiv: (additive) Berechnung ng zwischen sämtlichen Dimensionen möglich (z.b. Bestellmenge eines Artikels) - Semi-additiv: (additive) Berechnung möglich mit Ausnahme temporaler Dimension(z.B. Lagerbestand, Einwohnerzahl) - Nicht-Additiv: keine additive Berechnung möglich (z.b. Durchschnittswerte, prozentuale Werte, ) 17

6.2 Datenmodellierung Dimensionen Dimension - Beschreibt mögliche Sicht auf die assoziierte Kennzahl - Endliche Menge von d 2 Dimensionselementen (Hierarchieobjekten), die eine semantische Beziehung aufweisen - Dient der orthogonalen Strukturierung des Datenraums Beispiele: Produkt, Geographie, Zeit 18

6.2 Datenmodellierung Hierarchien in Dimensionen Dimensionselemente sind Knoten einer Klassifikationshierarchie Klassifikationsstufe beschreibt Verdichtungsgrad Darstellung von Hierarchien in Dimensionen über Klassifikationsschema Formen - Einfache Hierarchien: höhere Ebene Land enthält die aggregierten Werte genau einer niedrigeren Hierarchiestufe - Parallele Hierarchien: innerhalb einer Dimension sind mehrere verschiedene Arten der Gruppierung möglich Stadt Filiale Jahr Monat Quartal Woche Tag 19

6.2 Datenmodellierung Data-Cubes Grundlage der multidimensionalen Datenanalyse: Datenwürfel (Data-Cube) Kanten des Cubes: Dimensionen Zellen des Cubes: ein oder mehrere Kennzahlen (als Funktion der Dimension) Anzahl der Dimensionen: Dimensionalität des Cubes Visualisierung - 2 Dimensionen: Tabelle - 3 Dimensionen: Würfel - >3 Dimensionen: Multidimensionale Domänenstruktur 20

6.2 Datenmodellierung Beispiel: 3D Data-Cube Katego orie ikel Art rodukt P Region Filiale Stadt Kennzahl: Umsatz Bundesland 21

6.2 Datenmodellierung Standardoperationen zur Datenanalyse Pivotisierung/Rotation - Drehen des Data-Cube durch Vertauschen der Dimensionen - Datenanalyse aus verschiedenen Perspektiven - Beispiel: Produkt Zeitraum Produkt Region Zeitraum Region 22

6.2 Datenmodellierung Standardoperationen zur Datenanalyse (cont.) Roll-Up - Erzeugen neuer Informationen durch Aggregierung der Daten entlang der Klassifikationshierarchie in einer Dimension (z.b. Tag => Monat => Quartal => Jahr) - Dimensionalität bleibt erhalten Drill-Down - Komplementär zu Roll-Up - Navigation von aggregierten Daten zu Detail-Daten entlang der Klassifikationshierarchie Drill-Across - Wechsel von einem Cube zu einem anderen 23

6.2 Datenmodellierung Standardoperationen zur Datenanalyse (cont.) - Beispiel: Roll-Up, Drill-Down Down Produkt Produkt 1. Quartal Drill-Down 2. Quartal 2006 3. Quartal 2007 Roll-Up 4. Quartal Summe Summe Zeitraum Region Zeitraum Region 24

6.2 Datenmodellierung Standardoperationen zur Datenanalyse (cont.) Slice und Dice - Erzeugen individueller Sichten - Slice: - Dice: Herausschneiden von Scheiben aus dem Cube (z.b. alle Werte eines Quartals) Verringerung der Dimensionalität Herausschneiden eines Teil-Cubes (z.b. Werte bestimmter Produkte und Regionen) Erhaltung der Dimensionalität Veränderung der Hierarchieobjekte 25

6.2 Datenmodellierung Standardoperationen zur Datenanalyse (cont.) - Beispiel: Slice Summe Elektro Haushalt Kosmetik Produkt Slice Haushalt Kosmetik Summe Elektro Produkt 2006 2006 2007 2007 Summe Summe Region Region 26