DQM Data Quality Manager. DOAG Hochschul-Regionaltreffen Münster Johannes Tomasoni

Ähnliche Dokumente
"Hier kann ich mich weiterentwickeln!"

DOAG Hochschul-Community Ulm

Continuous Delivery mit Orcas

Informationsmanagementpraktikum

Oracle Snap Management Utility Snap mir eine. Marco Schwab, DOAG 2017,

DOAG SIG Day E-Business Suite

BESSER WERDEN DURCH ERSE

Tobias Braunschober DAS GENERISCHE DWH WENIGER CODE WENIGER KOSTEN

Scrum für Business Intelligence Projekte erfolgreich nutzen. Es begrüßt Sie Thomas Löchte

EU-DSGVO im DWH Praxisbericht aus der Versicherungsbranche

Erfolg mit Oracle BI?

Oracle Warehouse Builder Wie finde ich den richtigen Nachfolger?

Erfolgreiches BI durch schlanke Tools und starke Fokussierung Markus Kolp Alec Shalashou

Exadata und In-Memory Datenbewirtschaftung und Analyse Extrem mit Exadata und InMemory (Erfahrungsbericht)

Deployment mit OMB*Plus Carsten Herbe & Oliver Gehlert metafinanz Informationssysteme GmbH

Fehlerbehandlung mittels DML Error Logging

UNSER EINGESPIELTES EXPERTENTEAM INFORMATICA POWERCENTER UND BANKENWISSEN WIRD FREI AB JANUAR 2019

SQL-basierte SCD2-Versionierung hierarchischer Strukturen

Criteria API Komplexe SQL-Queries mit Eclipselink bauen 1

Kleine Helferlein. Jens Behring its-people. Copyright its-people

OXO³ technische Aspekte der Oracle EMEA internen BI Implementierung

DWH Automation - Steigerung von Qualität, Effektivität und Transparenz in der DWH Implementierung und dem Betrieb. Referent: Raphael Henneke

Berechnung von Kennzahlen mit der SQL Model Clause

Vorgehensmodelle für Big Data Initiativen. DOAG 2014 Nürnberg

Unsere Vorträge auf der DOAG 2015

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004

Fehlertoleranz und Robustheit von ETL-Prozessen Wie gestalten wir Abläufe möglichst widerstandsfähig. Christian Borghardt I BI Consultant

Jochen Heinz, BI/DWH-Experte

Weiterbildung. Modul: Business Analytics - Angewandte Datenanalyse Inhaltliches Konzept. Weitere Informationen:

BUSINESS INTELLIGENCE (BI) MIT PENTAHO. Schneller, höher, weiter!

ZWISCHEN ALBTRAUM UND OPTIMALER PERFORMANCE

DWH Szenarien.

TOAD und Performance Tuning

Data Warehouse in der Telekommunikation

Die Nutzung von Webservices in der Oracle Datenbank. 11 März 2010

Wir bauen uns ein Data Warehouse mit MySQL

Aufbau eines Kennzahlensystems in der Logistik mit Oracle BI

Präsentation der Bachelorarbeit

DWH-Schnittstellen auf Knopfdruck Teil 1. Thomas Knauber, Postbank Systems AG

Klare Sicht für. klare Entscheidungen. Wir lösen das für Sie.

Budget gerecht in agilen Projekten

Aufbau einer komplett automatischen Business Intelligence-Umgebung

ETL-Industrialisierung mit dem OWB Mapping Generator. Irina Gotlibovych Senior System Beraterin

Entwicklung und Deployment. Stefan Raabe DOAG Konferenz

Datenmodellierung im Zeitalter agiler Softwareentwicklung

Neues zur Oracle Lizenzierung (Michael Paege, OPITZ CONSULTING Hamburg, DOAG Competence Center Lizenzen)

SAP Analytics für KMU. Oktober 2017

Vorgehensmodell. Vorgehensmodell für die Prozessautomatisierung mit der Oracle BPM Suite 11g

- Architektur & Integration -

SQL als ETL Tool. DOAG Konferenz Nürnberg 2014 Christian König, CGI Business Intelligence Expert 18. November CGI Group Inc.

O-BIEE Einführung mit Beispielen aus der Praxis

Dr. Gernot Schreib, b.telligent GmbH & Co.KG DATENFLÜSSE IM DWH EINSATZ VON 3 RD -PARTY SOFTWARE

Agile BI Was ist das eigentlich? Hochschule Ulm - V. Herbort & Prof. Dr. R. von Schwerin

DQ02: Datenqualität im Data Warehouse. Ein Seminar der DWH academy

Oracle9i Data Warehouse Komponenten im praktischen Einsatz

Datenbanksuchmaschine

Criteria API: Komplexe SQL Queries mit Eclipslink bauen

Mandora Business Solutions

Oracle BI Publisher - PDF und einiges mehr

simply sophisticated Integration von SAP und Non SAP Lösungen Marktüberblick, Techniken, Möglichkeiten & Probleme

Revisionssichere Optimierung der Datenqualität DOAG 2016

Studierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen

SQL Server 2012 und SharePoint im Unternehmenseinsatz. Referent Daniel Caesar

Divide et impera Session-Management im ETL

Agenda joinit für 7-IT

Datenbewirtschaftung mit ORACLE Tools - Die Wahl des richtigen Tools -

Firstwaters GmbH. Unternehmen. Personalbedarf. Bewerbung. Unternehmensberatung für Banken und andere Finanzdienstleistungsunternehmen.

Eclipse und EclipseLink

DWH Automatisierung mit Data Vault 2.0

Das modulare DWH Modell

Formatierte Berichte Excel-Dateien mittels PL/SQL erzeugen. Robert Marz its-people

DOAG SIG Day. E-Business Suite und SOA: Was ist heute schon möglich? Thomas Karle PROMATIS software GmbH. Frankfurt 26. April 2007

Vorlesung Methodische Grundlagen des Software-Engineering im Sommersemester 2013

Erfahrungsbericht aus der Praxis: Vom PoC über Workshops bis zur Implementierung

Für Querdenker Was ODI anders macht als OWB und umgekehrt

Big Data & Advanced Analytics Anwendungsfälle Beispiele für Analysen auf Basis strukturierter & unstrukturierter Daten

Erfahrungen aus dem Betatest Oracle Database 11g

Formulare. Definition. Definition & Beispiele P-IT. Fach: Klasse: TD1. Datum: (Freitag) Agenda zu HTML und PHP

Reporting Lösungen für APEX wähle Deine Waffen weise

GDI-Business-Line 3.x

IBM Cognos Analytics 11 Self-Service dann aber richtig!

19. DOAG-Konferenz Data Profiling: Erste Erfahrungen mit dem OWB 10g R2 Mannheim, Detlef Apel

MICROSOFT DYNAMICS SYSTEM- INTEGRATION

Neue Wege zur Oracle-Migration

Neue Welten: Externe Daten mit APEX nutzen

Betrachtung der neuen OLAP Ansätze von Oracle 10g

GESTERN OWB, HEUTE ODI

Berater für Business Intelligence und Data Warehousing

Assistent/in Business Intelligence (m/w) (Berlin) Assistent/in Business Intelligence (m/w) (Raum HD/MA)

Herzlich Willkommen zum

Übung 5. Implementierung einer Datenbank. Prof. Dr. Andreas Schmietendorf 1. Übung 5

Vom operativen Reporting zur Analyse Der Weg zu einer ganzheitlichen Sicht auf die IT-Services Swiss Forum,

PRG2 Folien Zicari Teil 5. Einführung in Datenbanken SS 2007

Anpassungsfähige. Software Lösungen. Nicht nur leere Worte! Einsatz von Fast Edit bei Raiffeisen International. Wien, IBM Forum, am 24.9.

Prozessbasiertes Master Data Management für intralogistische Systeme. Thomas Karle PROMATIS software GmbH Berlin, 9. Mai 2012

Profil Andreas Seiler

THEMA: SAS DATA INTEGRATION STUDIO FÜR MEHR TRANSPARENZ IM DATENMANAGEMENT EVA-MARIA KEGELMANN

DB-Housekeeping. DB-Housekeeping in den Datenbanken der Karstadt-Filialen. Christian Treptau. Stand: housekeeping 1

DATENQUALITÄT IM DWH IST AUTOMATISCH AUCH GLEICH BESSER?

Transkript:

DQM Data Quality Manager DOAG Hochschul-Regionaltreffen Münster 03.12.2009 Johannes Tomasoni

Die Informationsfabrik Gründungsjahr: 2000 Sitz in Münster 15 angestellte Mitarbeiter: Wirtschaftsinformatiker, Informatiker, Mathematiker oder Ingenieure Experten für: Business Intelligence, Datenintegration und Informationsmanagement Unsere Kunden sind Banken, Finanzdienstleiter und Industrieunternehmen 2

Die Informationsfabrik Datenbewirtschaftung und Datenintegration [mit Informatica PowerCenter] Individuelle Business Intelligence Lösungen [mit der Cognos Toolpalette] Entwicklung, Vertrieb und Customizing von STAS CONTROL CPM [Controlling Software] IT Consulting für Softwareprojekte: Konzeption, Implementierung und Test Coaching, Training, Expertisen 3

Agenda Einführung DQM Regeln DQM in der Praxis Implementierung Diskussion 4

Agenda Einführung DQM Regeln DQM in der Praxis Implementierung Diskussion 5

Einführung Wofür steht DQM? Was ist DQM? Wozu Datenqualität? Wieso muss man das managen? 6

DQM - Anwendungsgebiete Datenintegration Daten auf Konsistenz und Korrektheit prüfen Vortest ob Daten in andere Systeme übernommen werden können Vorstufe zur Bereinigung der Daten Kundendaten - Adressprüfung Erfassung von Vertragsdaten / Konten Überschreitung von Schwellwerten Betrugserkennung Welche Kunden haben überdurchschnittlich viele Schadensfälle mit überdurchschnittlicher Schadenshöhe gemeldet? Qualitätssicherung Welche Lieferanten liefern häufiger Produkte mit höherem Ausschuss als vereinbart? Controlling Welche Unternehmensbereiche liegen in den KPI s hinter dem Plan? 7

DQM in a nutshell Aufgabe von DQM Hinterlegung von wiederholbaren Regeln auf Datenbestand Ergebnis wird auf Instanzebene geloggt Umsetzung Aus Regel wird SQL-Statement erzeugt Filter erzeugen zusätzliche WHERE-Bedingung Ergebnis des SQL-Statements beinhaltet Regelbrüche (Regelverstöße) Regelformulierung Wertebereich 0bis1 auf Attribut Prod.Risiko.WS Problembeschreibung Tabellenspalte Prod.Risiko.WS muss zwischen 0 und 1 sein Code-Generierung SELECT ProRisiko.ID, FROM Prod.Risiko ProRisiko WHERE ProRisiko.WS NOT BETWEEN 0 AND 1; 8

Agenda Einführung DQM Regeln DQM in der Praxis Implementierung Diskussion 9

DQM Regelbaum Aufbau Regeln werden über (Regel)Konnektoren beliebig verschachtelt Komplexe Bäume Filter(bäume) für jede Regel definierbar Ausführung von Regeln Regelkonnektoren (rekursiv) Logging (via LogGruppe) Definierte Gruppe von Attributen Bei Regelverstoß werden alle Attribute geloggt Filterkonnektor Regelkonnektor 10

DQM Regeln - Übersicht NotNullRegel UniqueRegel Längenregel Datentypregel Wertelistenregel Wertebereichregel Abhängigkeitsregel Integritätsregel Aggregationsprüfung 11

DQM Regel: Aggregationsprüfung Prüfe, ob zwei aggregierte Werte miteinander übereinstimmen (Analytical SQL) Regelverstoß: Erfolgreich: Werte stimmen nicht überein Werte stimmen überein Bsp.: Eine Bank möchte alle Kunden identifizieren, die ihren Dispo-Kredit über einen Zeitraum von 3 Tagen überziehen. Konto Kontonr 111 222 222 222 222 Der Auswertung liegen zwei Kontotabellen zugrunde: Kundennr 11100 22200 22200 22200 22200 Saldo -25-11 -14-49 -2 Datum 04.03.2008 02.03.2008 03.03.2008 04.03.2008 05.03.2008 Dispo Konto 111 222 222 222 222 Kundennr 11100 22200 22200 22200 22200 Dispo -10-5 -5-5 -5 Datum 04.03.2008 02.03.2008 03.03.2008 04.03.2008 05.03.2008 12

Agenda Einführung DQM Regeln DQM in der Praxis Implementierung Diskussion 13

Anwendungsbeispiel: Datenintegration Datenintegration Risikomanagementsystem ETL ETL 14

Anwendungsbeispiel: Datenintegration ETL ETL 15

Anwendungsbeispiel: Fondssparen Störfälle beim Fondssparen Welche Kunden haben nach Abbuchung des Fondsparbetrags das Konto überzogen? 16

DQM im DWH-Kontext 17

Agenda Einführung DQM Regeln DQM in der Praxis Implementierung Diskussion 18

Architektur 19

DQM-Core Regeldefinitionen Attribute Auswertungsergebnisse Auswertungslogik Query-Engine Auswertungssteuerung 20

Prüfvorgang Attribute, Log-Gruppe und Regeln definieren Regelprüfung starten Durchlaufnr. wird erzeugt (falls nicht übergeben) Abfrage wird mit Query-Engine erstellt Ausführung der Abfrage Ergebnisse werden geloggt Bei Regelverstoß werden Daten entsprechend der Log-Gruppe gespeichert. Ergebnisse interpretieren bzw. weiterverarbeiten 21

Wieso Umsetzung in Oracle PL/SQL? Weite Verbreitung von Oracle Unsere Kunden setzen alle Oracle ein Verbreitete Programmiersprache im DWH-Umfeld Nahtlose Einbettung in bestehende Systeme Keine neuen Server (HW & SW) notwendig Technologie bei DBAs bekannt Vereinfacht Einführung Revision lässt sich schneller überzeugen Packages & Procedures lassen sich von gängigen ETL- & Reporting-Tools aufrufen. einfache Einbettung in Datenintegrations-& BI-Prozesse 22

DQM-GUI 23

DQM-GUI 24

DQM-GUI 25

Agenda Einführung DQM Regeln DQM in der Praxis Implementierung Diskussion 26

Diskussion Fragen und Diskussion 27

Ihr Ansprechpartner Bleiben wir in Kontakt: Johannes Tomasoni Consulting Scheibenstraße 117 48153 Münster Telefon +49 251 919979 64 Telefax +49 251 919979 74 jtomasoni@informationsfabrik.com www.informationsfabrik.com 28