Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten



Ähnliche Dokumente
Aufgabe 1: [Logische Modellierung]

Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann

Hetero-Homogene Data Warehouses

Logische Datenmodellierung zur Abbildung mehrdimensionaler Datenstrukturen im SAP Business Information Warehouse

Installationsanleitung. triomis vat calculator for Dynamics CRM 2011

Database Exchange Manager. Infinqa IT Solutions GmbH, Berlin Stralauer Allee Berlin Tel.:+49(0) Fax.:+49(0)

Business Intelligence Praktikum 1

1 Lieferantenbewertung

Dokumentation zum Löschen von Produkten und/oder Preisen im Handelsplatz

Kampagnenmanagement mit Siebel Marketing/Oracle BI ein Praxisbericht

SEPA Lastschriften. Ergänzung zur Dokumentation vom Workshop Software GmbH Siemensstr Kleve / /

How-to: Webserver NAT. Securepoint Security System Version 2007nx

Sehr geehrte Faktor-IPS Anwender,

Bedienungsanleitung für den Online-Shop

Allgemeines zu Datenbanken

C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

FIS: Projektdaten auf den Internetseiten ausgeben

Keine Disketteneinreichung ab 1. Februar 2014

Wichtige Information zur Verwendung von CS-TING Version 9 für Microsoft Word 2000 (und höher)

Es gibt zwei Wege die elektronischen Daten aus Navision zu exportieren.

Auswertung von Flächen in bestehenden 2D- AutoCAD Zeichnungen

GS-Buchhalter/GS-Office 2015 Saldovorträge in folgenden Wirtschaftsjahren erfassen

Neuer Releasestand Finanzbuchhaltung DAM-EDV E Inhaltsverzeichnis. 1. Neuerungen Schnittstelle Telebanking mit IBAN und BIC...

Schnittstelle Drittmeldepflicht Ab ImmoTop

Seminar C16 - Datenmodellierung für SAP BW

4. BEZIEHUNGEN ZWISCHEN TABELLEN

Der Schutz von Patientendaten

Webseitenintegration. Dokumentation. v1.0

BUILDNOTES TOPAL FINANZBUCHHALTUNG

Business Intelligence Praktikum 1

ERP Cloud Tutorial. E-Commerce ECM ERP SFA EDI. Backup. Materialbuchungen erfassen und importieren.

Ist Excel das richtige Tool für FMEA? Steve Murphy, Marc Schaeffers

Logistikmanagement aus Kundensicht, ein unterschätztes Potenzial

So importieren Sie einen KPI mithilfe des Assistenten zum Erstellen einer Scorecard

Anforderungen an die HIS

Standard XPersonenstand - Version Verbindliche Handlungsanweisungen

Vermeiden Sie es sich bei einer deutlich erfahreneren Person "dranzuhängen", Sie sind persönlich verantwortlich für Ihren Lernerfolg.

Web2Lead. Konfiguration

Parkraumverwaltung. Im Hauptmenü anklicken: Fuhrparkmanagement. Copyright by rw data 2012 Bedienungsanleitung Parkraumverwaltung Seite 1 von 13

Varial Kundeninformation

CKL Bewertung PLUS. für Microsoft Dynamics NAV. AugenbliCKLlich Durchblick: Die Bewertung zum Bilanzstichtag. Software, die sich rechnet.

Prof. Dr. Arnd Wiedemann Finanz- und Bankmanagement Universität Siegen

Persönliches Adressbuch

Diese Programm ist für Hausverwaltungen, Kleingärtner Vereine gedacht und besteht eigentlich aus drei Programmen:

Verwaltung der Projekte

Produktvariationen Informationsblatt für Lieferanten

SF-RB. Modul Provisionsabrechnung & Planung Reiseagentenprovisionsabrechnung & Planung. SF-Software Touristiksoftware

Performance by Design Wie werden performante ETL-Prozesse erstellt?

Wissensdatenbankeintrag zur Classic Line Version CL 4.4 und SNC >= 5.2 WDB Artikel:

Keine Disketteneinreichung ab 1. Februar 2014

Ihre Interessentendatensätze bei inobroker. 1. Interessentendatensätze

Werbemittelverwaltung

MORE Profile. Pass- und Lizenzverwaltungssystem. Stand: MORE Projects GmbH

SJ OFFICE - Update 3.0

UpToNet Workflow Workflow-Designer und WebClient Anwendung

Hilfe und Support. Statische Hilfe. Inhaltsverzeichnis der Hilfetexte. Reihe TextGrid-Tutorials

Lizenzierung von StarMoney 8.0 bzw. StarMoney Business 5.0 durchführen

Schritt für Schritt zur Krankenstandsstatistik

Übungen zur Softwaretechnik

How to do? Projekte - Zeiterfassung

BÜRO MAYER GmbH & Co. KG

Kreditkarten-Vergleich von Kassensturz in Zusammenarbeit mit comparis.ch Vergleich der Gesamtkosten

1. Erreichen Sie, dass im Feld KdNr (Kunden-Nummer) nur 4-stellige Zahlen eingetragen

Was ist das Tekla Warehouse

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

Access [basics] Rechnen in Berichten. Beispieldatenbank. Datensatzweise berechnen. Berechnung im Textfeld. Reporting in Berichten Rechnen in Berichten

Copyright 2014 Delta Software Technology GmbH. All Rights reserved.

DER BESSER INFORMIERTE GEWINNT!

Educase. Release Notes 1.7: Neue Funktionen und Verbesserungen. Base-Net Informatik AG Wassergrabe 14 CH-6210 Sursee

GEORG-WWW. Online-Kundenmodul. Handbuch-Online-Kunden.docx 1

Marketing Intelligence Vorstellung der Softwarekomponenten. Josef Kolbitsch Manuela Reinisch

Artenkataster. Hinweise zur Datenbereitstellung. Freie und Hansestadt Hamburg. IT Solutions GmbH. V e r s i o n

IBIS Professional. z Dokumentation zur Dublettenprüfung

Arbeitsschritte EAÜ Leistungserbringer Einnahmen erfassen

Datenübernahme easyjob 3.0 zu easyjob 4.0

impact ordering Info Produktkonfigurator

desk.modul : Intercompany

Access Grundlagen für Anwender. Andrea Weikert 1. Ausgabe, 1. Aktualisierung, Juli inkl. zusätzlichem Übungsanhang ACC2010-UA

Online-Fanclub-Verwaltung

Arbeiten mit Standorten und Freimeldungen

Klausurteilnehmer. Wichtige Hinweise. Note: Klausur Informatik Programmierung, Seite 1 von 8 HS OWL, FB 7, Malte Wattenberg.

Bearbeiten elektronische Rechnungen (Invoices)

PRESman. Presentation Manager. Reduzieren Sie nachhaltig die Kosten für das. Erstellen, Verwalten und Verteilen Ihrer

XQueue Product Sheet - Seiten Editor

Anleitung für den Datenaustausch mit mobile.de

SOL-IT wawicube. Berechnen. Lenken. Überblicken.

Christian Kurze BI-Praktikum IBM WS 2008/09

Anleitung zur Excel-Anwendung Basisprämienberechnung

Anleitung OpenCms 8 Webformular Auswertung

LAS PROGRAMM- ANPASSUNGEN

Das Black-Scholes Marktmodell

DeutschlandLAN IP Voice/Data Ihre IP-Adresse einfach mitnehmen. Stand: September 2015

Software Release Notes

E-Government Applikation Wasserschutzgebiete Prüfdienst

Erstellung eines Verfahrensverzeichnisses aus QSEC

Datenbanksysteme 2 Frühjahr-/Sommersemester Mai 2014

Leitfaden zur Durchführung eines Jahreswechsels in BüroWARE 5.x

Business Intelligence im Krankenhaus

Installationsanleitung Maschinenkonfiguration und PP s. Release: VISI 21 Autor: Anja Gerlach Datum: 18. Dezember 2012 Update: 18.

Transkript:

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Michael Hahne T&I GmbH Workshop MSS-2000 Bochum, 24. März 2000 Folie 1

Worum es geht... Data Warehouse-Modellierung Modellierung auf logischer und physischer Ebene Fragestellung: Modellierung für relationale Zielsysteme Star-Schema-Modellierung Wie kann durch das Modellierungswerkzeug ERwin die Modellierung des Data Warehouse-Modells, die Dokumentation des Data Warehouse, die Implementierung des Data Warehouse-Modells und die spätere Wartung des Data Warehouse unterstützt und erleichtert werden? Folie 2

Gliederung I Sicht des Data Warehouse-Modellierers bzw. Designers (logische/physikalische Modellierungsebene) Abbildung der Strukturen Unterstützung durch das Werkzeug II Sicht des Data Warehouse-Administrators bzw. Implementierers (physikalische Modellierungsebene) Optimierungspotentiale der Zieldatenbanken Größenberechnung und -vorhersage III Dokumentation und Metadaten IV Fazit Folie 3

Gliederung I Sicht des Data Warehouse-Modellierers bzw. Designers (logische/physikalische Modellierungsebene) Abbildung der Strukturen Unterstützung durch das Werkzeug II Sicht des Data Warehouse-Administrators bzw. Implementierers (physikalische Modellierungsebene) Optimierungspotentiale der Zieldatenbanken Größenberechnung und -vorhersage III Dokumentation und Metadaten IV Fazit Folie 4

Modellierungsmethodik in ERwin IDEF1X IE DM logical physical Folie 5

Dimensionale Modelle in ERwin Erwin modelliert im Prinzip ein Star Schema. Dafür werden erweiterte Funktionen zur Verfügung gestellt. Es werden drei Rollen unterschieden, die eine Tabelle in einem dimensionalen Modell in ERwin wahrnehmen kann: Folie 6

Gliederung I Sicht des Data Warehouse-Modellierers bzw. Designers (logische/physikalische Modellierungsebene) Abbildung der Strukturen Unterstützung durch das Werkzeug II Sicht des Data Warehouse-Administrators bzw. Implementierers (physikalische Modellierungsebene) Optimierungspotentiale der Zieldatenbanken Größenberechnung und -vorhersage III Dokumentation und Metadaten IV Fazit Folie 7

Rollen von Tabellen in dimensionalen Modellen Die Rolle, die eine Tabelle in einem dimensionalen Modell einnimmt, kann manuell vergeben werden oder nach den folgenden Regeln automatisch ermittelt werden: Faktentabelle (fact table): keine Vaterbeziehung Dimensionstabelle (dimension table): keine Beziehungen zu irgendeiner Tabelle oder eine Vaterbeziehung zu einer Faktentabelle oder eine Vater- und eine Kindbeziehung snow-flaked Dimensionstabelle (outrigger table) eine Vaterbeziehung zu einer Dimensionstabelle Folie 8

Beispielmodell Folie 9

Hierarchien in Dimensionen Die Dimensionselemente haben Beziehungen untereinander. Die resultierenden Strukturen: Flache Strukturen Bäume Wälder Parallele Hierarchien (multiple Verdichtungswege) Im Star-Schema gibt es zwei grundsätzliche Möglichkeiten der Abbildung von Hierarchien: Implizit über Attribute in der Dimensionstabelle Explizit über modellierte Beziehungen Folie 10

Produktdimension Warenhauptgruppe Warengruppe Produkt Folie 11

Hierarchien über Attribute Eine Differenzierung zwischen Hierarchie-Attributen und normalen Attributen ist nicht erkennbar Folie 12

Hierarchien durch modellierte Beziehungen Folie 13

Snow Flaking Folie 14

Minidimension Folie 15

Kennzahlen: Faktentabelle vs. Dimension Folie 16

Gliederung I Sicht des Data Warehouse-Modellierers bzw. Designers (logische/physikalische Modellierungsebene) Abbildung der Strukturen Unterstützung durch das Werkzeug II Sicht des Data Warehouse-Administrators bzw. Implementierers (physikalische Modellierungsebene) Optimierungspotentiale der Zieldatenbanken Größenberechnung und -vorhersage III Dokumentation und Metadaten IV Fazit Folie 17

m:n-beziehungen Erwin kann m:n-beziehungen automatisch auflösen und generiert eine assoziierte Tabelle. In einem dimensionalen Modell ist diese assoziierte Tabelle eine Faktentabelle Anwendungsbeispiel: factless fact table Folie 18

Überlagerungstabelle Folie 19

slowly changing dimensions Dimensionstabellen im Star Schema sind zunächst statisch. Im Zeitablauf ändern sich jedoch z. B. Kundendaten etc. Es gibt drei Arten der Historienverfolgung : Typ I: Der neue Datensatz überschreibt den alten (-> keine Historienverfolgung) Typ II: Ein zusätzlicher Datensatz wird angelegt (komplette Historienverfolgung, erfordert generalisierten Schlüssel) Typ III: Neue Felder werden angelegt: originale und aktuelle (keine Zwischenwerte mehr vorhanden) Diese Eigenschaft einer Dimensionstabelle wird in ERwin gepflegt und dient der Dokumentation über den Berichts- Generator. Folie 20

Gliederung I Sicht des Data Warehouse-Modellierers bzw. Designers (logische/physikalische Modellierungsebene) Abbildung der Strukturen Unterstützung durch das Werkzeug II Sicht des Data Warehouse-Administrators bzw. Implementierers (physikalische Modellierungsebene) Optimierungspotentiale der Zieldatenbanken Größenberechnung und -vorhersage III Dokumentation und Metadaten IV Fazit Folie 21

Wartung des Modells Data Warehouse complete compare Modell Folie 22

Gliederung I Sicht des Data Warehouse-Modellierers bzw. Designers (logische/physikalische Modellierungsebene) Abbildung der Strukturen Unterstützung durch das Werkzeug II Sicht des Data Warehouse-Administrators bzw. Implementierers (physikalische Modellierungsebene) Optimierungspotentiale der Zieldatenbanken Größenberechnung und -vorhersage III Dokumentation und Metadaten IV Fazit Folie 23

Parallelisiserung Zur Steigerung der Performance von Data Warehouse- Systemen werden vielfach Mechanismen der parallelen Verarbeitung herangezogen. Bei Datenbanken ist Platten-I/O der ausschlaggebende Faktor und damit gewinnt das physikalische Design an Bedeutung. Die Unterstützung parallelen Platten-I/Os wird von Datenbanken z. B. in Form von Partitionierung von Tabellen angeboten. Diese Features sind über ERwin im physikalischen Modell einstellbar. Folie 24

Gliederung I Sicht des Data Warehouse-Modellierers bzw. Designers (logische/physikalische Modellierungsebene) Abbildung der Strukturen Unterstützung durch das Werkzeug II Sicht des Data Warehouse-Administrators bzw. Implementierers (physikalische Modellierungsebene) Optimierungspotentiale der Zieldatenbanken Größenberechnung und -vorhersage III Dokumentation und Metadaten IV Fazit Folie 25

Größenberechnung (Volumetrics) Durch Volumetrics wird die Größe von Tabellen, Indizes und physikalischen Datenbank-Speicherobjekten berechnet und über eine Zeitachse vorhergesagt. #Zeilen in Tabelle Wachstum pro Monat Maximale Größe Datentypen Größe bei var. DT Volumetrics/ Berechnung Berichts- Generator/ Report- Browser %NULL bei opt. Folie 26

Gliederung I Sicht des Data Warehouse-Modellierers bzw. Designers (logische/physikalische Modellierungsebene) Abbildung der Strukturen Unterstützung durch das Werkzeug II Sicht des Data Warehouse-Administrators bzw. Implementierers (physikalische Modellierungsebene) Optimierungspotentiale der Zieldatenbanken Größenberechnung und -vorhersage III Dokumentation und Metadaten IV Fazit Folie 27

Datenpumpe innerhalb der Referenzarchitektur Endbenutzer Data Marts MDB ROLAP Externe Daten Zentrales Data Warehouse Operative Vorsysteme Folie 28

Dokumentation von Data Warehouse-Datenquellen Quelldatenbanken zur Dokumentation des Uploads. Struktur der Quelldaten kann manuell erfaßt werden Über Reverse-Engineering Funktionalität kann die Quelldatenstruktur direkt importiert werden Keine Programmfunktionalität zum Datentransfer Nur Dokumentationscharakter Folie 29

Dokumentation von Data Warehouse-Regeln Es können Regeln definiert werden, denen die Tabellen eines dimensionalen Modells genügen sollen: Refresh-Regeln Update-Regeln Backup-Regeln Recovery-Regeln Archiving-Regeln Purge-Regeln Diese Regeln dienen nur der Dokumentation der hinter den Strukturen liegenden Funktionalität zur Wartung eines Data Warehouse. Folie 30

Dokumentation mit Report-Generator html Modell Berichtsschablone Bericht RPTwin csv dde Generate Reports export Folie 31

Gliederung I Sicht des Data Warehouse-Modellierers bzw. Designers (logische/physikalische Modellierungsebene) Abbildung der Strukturen Unterstützung durch das Werkzeug II Sicht des Data Warehouse-Administrators bzw. Implementierers (physikalische Modellierungsebene) Optimierungspotentiale der Zieldatenbanken Größenberechnung und -vorhersage III Dokumentation und Metadaten IV Fazit Folie 32

Fazit Durch das Modellierungswerkzeug ERwin kann die Modellierung des Data Warehouse-Modells, die Dokumentation des Data Warehouse, die Implementierung des Data Warehouse-Modells und die spätere Wartung des Data Warehouse unterstützt und erleichtert werden! Folie 33