Vollständig generisches DWH für kleine und mittelständische Unternehmen



Ähnliche Dokumente
Kampagnenmanagement mit Siebel Marketing/Oracle BI ein Praxisbericht

teamsync Kurzanleitung

desk.modul : ABX-Lokalisierung

mobilepoi 0.91 Demo Version Anleitung Das Software Studio Christian Efinger Erstellt am 21. Oktober 2005

Feiertage in Marvin hinterlegen

OWB 10.2 Experts im Einsatz: Automatisierung von Designschritten bei der Bayer Healthcare AG. Referent: Lutz Bauer, Senior Systemberater, MT AG

Fördercontrolling im öffentlichen Bereich Aspekte beim Aufbau eines DWH. Software mit Format.

Performance by Design Wie werden performante ETL-Prozesse erstellt?

360 - Der Weg zum gläsernen Unternehmen mit QlikView am Beispiel Einkauf

Generische Core Data Warehouse (DWH) - Layer

MySQL Installation. AnPr

Synchronisations- Assistent

Dokumentation TELAU Post Mobile Billitem Converter

Oracle Warehouse Builder 3i

Stand: Adressnummern ändern Modulbeschreibung

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

ACHTUNG: Voraussetzungen für die Nutzung der Funktion s-exposé sind:

SOLISYON GMBH TOBIAS GRUBER BEN WEISSMAN. Analyse von Dimensions-Schlüsselfehlern bei der Aufbereitung von SSAS Datenbanken

Leere Zeilen aus Excel-Dateien entfernen

BlueEvidence Services in Elexis

Elexis-BlueEvidence-Connector

Downloadfehler in DEHSt-VPSMail. Workaround zum Umgang mit einem Downloadfehler

P&P Software - Adressexport an Outlook 05/29/16 14:44:26

WARY Notariat Urkundenrolle V2013

LDAP Konfiguration nach einem Update auf Version 6.3 Version 1.2 Stand: 23. Januar 2012 Copyright MATESO GmbH

Hinweise zum Update des KPP Auswahltools (Netzwerkinstallation) auf Version 7.2

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Anleitung über den Umgang mit Schildern

Datenübernahme von HKO 5.9 zur. Advolux Kanzleisoftware

Zwischenablage (Bilder, Texte,...)

saprima - Scenario- und Budgetplanung

STRATO Mail Einrichtung Mozilla Thunderbird

Handbuch. NAFI Online-Spezial. Kunden- / Datenverwaltung. 1. Auflage. (Stand: )

Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum:

STRATO Mail Einrichtung Android 4.4

MIN oder MAX Bildung per B*Tree Index Hint

Anzeige von eingescannten Rechnungen

Serienbrieferstellung in Word mit Kunden-Datenimport aus Excel

Adlerblick So gewinnen Sie einen Überblick über ein DWH Dr. Andrea Kennel InfoPunkt Kennel GmbH CH-8600 Dübendorf Schlüsselworte Einleitung

Aktualisierung zum Buch Windows und PostgreSQL

Whitepaper. Produkt: combit Relationship Manager. Datensatzhistorie mit dem SQL Server 2000 und combit GmbH Untere Laube Konstanz

MORE Profile. Pass- und Lizenzverwaltungssystem. Stand: MORE Projects GmbH

Vorbereitung auf die SEPA-Umstellung

Kursangebot gesammelt einlesen

INNER WHEEL DEUTSCHLAND

Graphen in Apex von Thomas Hernando.

Ihr IT-Administrator oder unser Support wird Ihnen im Zweifelsfall gerne weiterhelfen.

Lokale Installation von DotNetNuke 4 ohne IIS

STRATO Mail Einrichtung Apple Mail 8

Sichere Anleitung Zertifikate / Schlüssel für Kunden der Sparkasse Germersheim-Kandel. Sichere . der

Online Bestellsystem Bedienungsanleitung

Update-Anleitung für SFirm 3.1

Arbeitsgruppen innerhalb der Website FINSOZ e.v.

Oracle-Statistiken im Data Warehouse effizient nutzen

Lehrer: Einschreibemethoden

Bedienerhandbuch Toleranztabellen Version 1.2.x. Copyright Hexagon Metrology

Internet online Update (Mozilla Firefox)

Lizenzierung von StarMoney 10 bzw. StarMoney Business 7 durchführen

Erfahrungen mit Hartz IV- Empfängern

2.5.2 Primärschlüssel

Dokumentation. estat Version 2.0

ecaros2 Installer procar informatik AG 1 Stand: FS 09/2012 Eschenweg Weiterstadt

Funktionsübersicht. Beschreibung der zentralen Funktionen von PLOX

Mind Mapping am PC. für Präsentationen, Vorträge, Selbstmanagement. von Isolde Kommer, Helmut Reinke. 1. Auflage. Hanser München 1999

Data Quality Management: Abgleich großer, redundanter Datenmengen

Vorgehensweise bei Lastschriftverfahren

Erstellen von x-y-diagrammen in OpenOffice.calc

10.6 Programmier-Exits für Workitems

Lizenzierung von SharePoint Server 2013

Updateanleitung für SFirm 3.1

MS Outlook Integration

Projektmanagement in Outlook integriert

Pasolfora Database Appliance PDA

TERRA Kasse Backup Service

Bei der Anlage von Pauschalen ist folgendes zu beachten!!!!!!!!

LineQuest-Leitfaden LineQuest Dialog-Portal. Generieren der LineQuest-Auswertungsdatei

Einer Outlook-Gruppe weitere Computer hinzufügen

Dynamisches SQL. Folien zum Datenbankpraktikum Wintersemester 2009/10 LMU München

Sage Start Zahlungsmethoden Anleitung. Ab Version

Oracle SQL Tutorium - Wiederholung DB I -

HOW TO Heat Mapping mit EasyMap

Stepperfocuser 2.0 mit Bootloader

Electronic Systems GmbH & Co. KG

Fakultät für Informatik & Wirtschaftsinformatik DB & IS II - SS Metadaten

Bundesverband Flachglas Großhandel Isolierglasherstellung Veredlung e.v. U g -Werte-Tabellen nach DIN EN 673. Flachglasbranche.

Urs Meier Art der Info Technical Info (Februar 2002) Aus unserer Projekterfahrung und Forschung

TimeSafe Zeiterfassung. Version 2.1 (September 2008)

Datenbanken SQL Einführung Datenbank in MySQL einrichten mit PhpMyAdmin

Shopware-Plugin. Statusverwaltung. Version RHIEM Intermedia GmbH. General Manager: Franz Rhiem Dr.-Ing Stefan Rhiem René Tanzer

Information zum SQL Server: Installieren und deinstallieren. (Stand: September 2012)

Anlage eines neuen Geschäftsjahres in der Office Line

Kurz-Anleitung Veranstaltungskalender AHG

Schrittweise Anleitung zur Installation von Zertifikaten der Bayerischen Versorgungskammer im Mozilla Firefox ab Version 2.0

Ist Excel das richtige Tool für FMEA? Steve Murphy, Marc Schaeffers

Xesar. Die vielfältige Sicherheitslösung

xtmail Suite for SAP xtmail Suite for SAP

engdax.pearlchain Die reißfeste Perlenkette Stabile Verarbeitung von DELJIT SYNCRO 3

Advoware mit VPN Zugriff lokaler Server / PC auf externe Datenbank

Persönliches Adressbuch

Transkript:

Vollständig generisches DWH für kleine und mittelständische Unternehmen Marc Werner Freiberufler Berlin Schlüsselworte: Wirtschaftlichkeit, Kostenreduzierung, Metadaten, Core Data Warehouse, Slowly Changing Dimensions ( SCD I - III ), Oracle Warehouse Builder, Codegenerierung von: DDL, DML, OWB Mappings, Navision, Microsoft Axapta, Oracle ebusiness Suite, Tcl, OMBPLUS, SQL, PL/SQL, Change Data Capture ( CDC ) Einleitung Data Warehouse ( DWH ) - Systeme sind groß angelegte Projekte mit sehr hohem Analyse, Design - und Implementationsaufwand. Aufwende von 1 bis 2 Mann - Jahren bis zur Fertigstellung der ersten beiden Ausbaustufen sind keine Seltenheit und gestatten es in der Regel nur großen Unternehmen diese Vorhaben umzusetzen. In dem hier life demonstrierten Framework zur Generierung/Befüllung der zentralen, technischen Schicht ( Core Layer: normalisiertes Datenmodell, inkl. künstlicher Schlüssel und verschiedener Historisierungsverfahren ) eines Data Warehouse ( DWH ) ist mittels konsequenter Metadatenanreicherung -und Auswertung, Codegeneratoren und einigen vereinfachenden Designmaßnahmen eine Inbetriebnahme nach 1-2 Mann - Monaten unabhängig von der Anzahl der anzubindenden Quell Tabellen erreicht. Auch im laufenden Betrieb entstehen durch diesen Ansatz - bei den meisten der im DWH nachzuziehenden Änderungen ( durch Datenmodelländerungen der OLTP Systeme: Navision, Axapta, SAP, Oracle ebusiness Suite, etc. aus denen geladen wird ) - lediglich marginale Aufwende durch Einsatz von Codegeneratoren. Die generierten Datenmodelle des Frameworks bringen für den weiteren Ausbau und strategische Betrachtungen des DWH keinerlei Einschränkungen.

Funktionsumfang Quellsystem A Trigger / CDC Data Warehouse E T L Datamarts Quellsystem B Trigger / CDC Staging Area E T L Core Layer ------------------ -künstl. Schlüssel, - historisiert - 3. NF Einkauf Projects HR Abb. 1: Orange markiert: Vom Framework generierte Bereiche Die Generatoren erzeugen die Staging Area, die technische Schicht ( Core Layer ) eines Data Warehouse und alle ETL Routinen zum Befüllen. Die Datenmodelle ( Spaltennamen, Datentypen ) der Staging Area und Core Layer werden dabei mittels 1 zentralen SQL direkt aus den Quell Tabellen abgeleitet/generiert. Die technische Schicht ( Core Layer ) erhält dabei die gängigen DWH - Features: 3. NF künstl. Schlüssel Historisierungen ( gemäß Slowly Changing Dimension I - III ) Löschflags Folgender Code wird generiert: komplettes DDL ( Datenmodelle: Stage und Core Schicht ) kompletter ETL Code ( als OMBPLUS/Tcl -Code, welcher die Mappings im Oracle Warehouse Builder anlegt ) : 1. Quell Tabellen Staging Area 2. Staging Area Core Layer

Change Data Capture ( CDC ) bzw. Trigger - Code auf Quelltabellen zur Ermittlung der ins Data Warehouse nachzuladenen Delta's Synchronisationscode ( DDL, DML ) bei Datenmodelländerungen an den Quelltabellen, die im Data Warehouse nachgezogen werden müssen Fachliche Datenmodelle ( Star/Snowflake ) werden nicht generiert. Für Tabellen, die aufgrund Ihrer Größe und Ihres Wachstums partitioniert werden müssen muss die Partitionierung manuell hinterlegt werden ( wird nicht generiert ). Die derzeitigen Codegeneratoren erzeugen Code für Oracle RDBMS Version 8.x 11.2. Generierungsprozess Bevor mit der Generierung des Codes begonnen werden kann muss hinterlegt werden welche Tabellen aus den Quellsystemen ( Quell Tabellen ) ans DWH angebunden werden sollen Zu jeder an das DWH anzubindenden Quell - Tabelle müssen ein paar Mindesteinstellungen ( Metadaten ) hinterlegt werden: eindeutiger Bezeichner: <BaseName> ( max. 26 Zeichen ), aus dem alle generierten Objektnamen ( DWH Tabellen, OWB-Mappings, Trigger etc. ) abgeleitet werden Welche Historisierung Welcher Extraktionsmechanismus aus den Quell DB's ( periodischer Abzug der geänderten Datensätze / Jedes Mal Komplettabzug ) Primary oder Unique Key ( Normalerweise nicht manuell einzupflegen, da in Quell-DB angelegt ) Diese Metadatenverwaltung geschieht von Beginn der Analysephase an ( 1. Treffen mit Fachbereich ) direkt auf einer Datenbank in 2 zentralen Steuertabellen ( Erstaufnahme in Excel, dann Übertragung via ODBC / External Table in die Steuertabelle in der Datenbank ). Es entsteht kein Wust von Exceltabellen und unstrukturierten Worddokumenten in denen diese entscheidenden Informationen verstreut herumliegen. In diesem Anforderungsbeispiel: - alle Spalten der Quell - Tabellen werden übernommen - keine der Quelltabellen hat einen Namen mit mehr als 26 Zeichen und kein Tabellenname kommt mehrfach vor BaseName = Quelltabellenname - alle Tabellen eines Schemas oder eines Patterns im Namen, nach SCD II zu historisieren - via Change Data Capture ( CDC ) Delta-zu-Laden - alle Quell - Tabellen haben PK/UK dauert der Aufbau dieser Metadaten gerade einmal 10 Minuten durch Ausführung dieser beiden SQL s, die je nachdem in welcher DB die Metadaten abgelegt werden sollen, via DB-Link die Steuertabellen mit allen an das DWH anzubindenden Tabellen ( SRC_TBLS4DWH ) und den zugehörigen eindeutigen Schlüsseln ( DCLG_NATKEYS ) füllen: insert into SRC_TBLS4DWH ( basename, db, owner, table_name, LOAD_MECHAN, DELTA_MECHAN, ) select table_name,'db_1', owner, table_name, 'SCD2', 'CDC',... from all_tables@source_database_1 where owner in (... ) ;

insert into DCLG_NATKEYS ( basename, col, dwh_system ) select c1.table_name, column_name, 'DWH_PROTOTYPE_1' from all_cons_columns c1, all_constraints c2 where constraint_type = 'P' and c1.owner in (... ) and c1.constraint_name = c2.constraint_name ; Ab diesem Moment ist die Analysephase für diese erste Menge an Tabellen ( 1. Ausbaustufe des DWH ) abgeschlossen und es werden nur noch Codegeneratoren customized, gestartet und der entstandene Code deployed bzw. Oracle Warehouse Builder ( OWB ) Metadaten synchronisiert. Im Vortrag wird im Rahmen einer Demo schrittweise dieser Generierungsprozess gezeigt ausgehend von ein paar simulierten Kundenanforderungen. Darin kommt sowohl die Erst Installation inkl. Initial Befüllung des DWH, als auch die Synchronisation des DWH mit Änderungen auf den Quellsystemen vor.

Verwaltung der Codefragmente / Metadaten Nach Abschluss des Generierungsprozess der aus diesen zyklischen Einzelschritten besteht: - Feststellung Release X auf den Quelldatenmodellen - Generierung und Deployment DWH Datenmodelle ( Staging Area, Core Layer ) - Import/Synchronisation des Oracle Warehouse Builder ( OWB ) - Repository - Generierung und Deployment OWB Mappings ( OMB_PLUS ) sind ALLE Metadaten und Codefragmente zentral in einer Steuertabelle in der Datenbank verfügbar. Hier ein Ausschnitt ( SELECT einiger Spalten dieser Tabelle ) : Abb. 2: Vom Framework generierter und in DB Tabelle abgelegter Code Damit kann der Code jedes generierten DWH System flexibel gesichert und in andere Ziel Datenbanken deployed werden.

Legende: Spalte Bedeutung Erläuterungen BASENAME DWH weit eindeutiger Bezeichner für die angebundene Quell Tabelle Basis aller generierten Objektnamen im DWH LOAD_MECHAN Historisierung bzw. Löschflag: Ja/Nein, Falls Ja verschiedene Verfahren ( Historisierungen nach Kimball ) DELTA_MECHAN CDC: Change Data Capture ( Deletes / Inserts / Updates auf der Quell Tabelle werden protokolliert und übertragen TS: Es soll ein Trigger, der einen Zeitstempel auf der Quelltabelle setzt für den Delta-Abzug verwendet werden FULL: Es werden jedes Mal alle Datensätze übertragen und abgeglichen STA_CREATE DDL für die zugehörige Staging Tabelle DWH_CREATE DDL für die zugehörige Core Layer Tabelle SEQ_* TRIGG_OR_CDC OMB_PLUS DDL für die Künstlichen Schlüssel Je nach Wahl in Spalte DELTA_MECHAN steht hier der Code für den Trigger oder CDC Installation auf der Quell Tabelle Tcl - Code, der die OWB Mappings anlegt Bsp.: SCD3 ist eine Kimball SCD II Historisierung mit zusätzlichem Löschflag für Datensätze, die im Quellsystem gelöscht wurden Kontaktadresse: Marc Werner Freiberufler Lychener Str. 10 D-10437 Berlin Telefon: +49 (0) 1721068289 E-Mail marc-werner@gmx.net Internet: http://www.gulp.de/profil/mw73.html