DATENQUALITÄT IM DWH IST AUTOMATISCH AUCH GLEICH BESSER?

Ähnliche Dokumente
Datawarehouse Architekturen. Einheitliche Unternehmenssicht

Performanceoptimierung mit Exadata Verarbeitung extremer Datenmengen mit PL/SQL basierter Datenbewirtschaftung (Erfahrungsbericht)

Zeitgemäße Verfahren für ganzheitliche Auswertungen

Strategie und Self Service BI im Unternehmen. Gegensätze miteinander kombinieren

Software EMEA Performance Tour Juni, Berlin

Die Möglichkeiten des digitalen Zeitalters nutzen zum. Vorteil der Kunden. Ein großer Schritt in die Zukunft das neue Online-

Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH

Sage 200 BI Installationsanleitung Cubes & Datawarehouses Manuelle Installation ohne SRSS/Sage Cockpit. Version

Einführung in das Scrum Framework & welche 10 Praktiken helfen, Scrum wirklich gut zu machen

Best Practices: BI mit Open-Source-Tools

Scaling Scrum Nexus professionell umsetzen

CASE STUDY Bosch setzt im Automotive Aftermarket bei KFZ-Diagnosegeräten auf das Datenbank- system Transbase Embedded

DWH Szenarien.

lññáåé=iáåé===pìééçêíáåñçêã~íáçå=

[ 01 ] Bosch treibt Vernetzung in den Werkstätten voran Mobilität des Autofahrers im Fokus

Wertvolle Einblicke in die Gamer-Welt bei ProSiebenSat.1 Games

Konzeption eines Master-Data-Management-Systems. Sven Schilling

Technologischen Rahmenbedingungen und Werkzeuge für eine wertschöpfende Controller-Rolle

Business Intelligence Herausforderungen bei der Implementierung

Vertriebssteuerung & Controlling Konkrete Vertriebsziele, passend zur Unternehmensstrategie

Systemvoraussetzungen CMIAXIOMA Release 15.0

Systemvoraussetzungen CMIAXIOMA Release 15.0

Formatierte Berichte Excel-Dateien mittels PL/SQL erzeugen. Robert Marz its-people

Prozedurale Datenbank- Anwendungsprogrammierung

Jochen Kindig. Cognos 8 Performance Maximierung

Load Strategy Datenmodell DQ-Check-Methoden DWH-Probleme? Datenqualität aus der Sicht des One-DWH s Franz Hopfenwieser AGENDA 26 PT AGENDA

arcplan Edge V.2.7 in 30 min von 0 auf 100 Stefan Koch VP Product Management 31. März 2011

Bosch BEA 750 Abgas-Messsystem Innovative Lösungen für eine saubere Umwelt

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria

Electronic Service Leistungen und Angebote Werkstatt Deutschland

Aktuelle Herausforderungen und Strategien des Remanufacturing von Automobilteilen Peter Bartel / Robert Bosch GmbH

Studierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen

Alltrucks. Gemeinsamkeit macht stark. Ihr Partner für die Nutzfahrzeug-Werkstatt.

Anleitung zum Prüfen von WebDAV

ETL in den Zeiten von Big Data

Profil Andreas Seiler

Die Alternative zum Web-Form Modell

Massive Automatisierung von Software-Tests. In einem agilen Automotive Projekt

MANN-FILTER Perfect parts. Perfect service. Grün auf gelb

Von Bäumen, Früchten und Gärtnern - warum agile Prinzipien auch im BI Umfeld funktionieren. Es begrüßt Sie Thomas Löchte

Eine saubere Sache: Emissions-Analyse von Bosch

TRACK II Datenmanagement Strategien & Big Data Speicherkonzepte BI Operations Erfolgsfaktoren für einen effizienten Data Warehouse Betrieb

Fachhochschule Ludwigshafen am Rhein Hochschule für Wirtschaft Fachbereich III Studiengang Wirtschaftsinformatik

BI-Kongress 2016 COMBINED THINKING FOR SUCCESS - BI & S/4HANA

Vollständig generisches DWH für kleine und mittelständische Unternehmen

Oracle Warehouse Builder 3i

Die Oracle BI Trilogie von Trivadis

Solvency II Komplexität bewältigen

Apparo Fast Edit Daten-Management in einer BI-Umgebung. Dateneingabe-Workflows

Testmanagement in IT-Projekten

Test Driven Development

Automatisiertes UI Testing. Mark Allibone, , #2

Performance by Design Wie werden performante ETL-Prozesse erstellt?

Neue Strategien und Innovationen im Umfeld von Kundenprozessen

Arbeiten mit amtlichen und offenen Daten - NAS. Move Your Official Data Organized

Agiles Requirements Management mit agosense.fidelia

Systemvoraussetzungen CMIAXIOMA Release 16.0

Genial einfach. ESI[tronic] 2.0 die professionelle Diagnose-Software von Bosch

Mobile.de realisiert Erstellung von Händlerdokumenten mit Talend

DIE DATEN IM ZENTRUM: SAS DATA MANAGEMENT

Der HL7 basierte Standard für einen elektronischen Pflegebericht. Ursula Hübner Daniel Flemming Carsten Giehoff

Mini-FAQ v1.3 CMS-50E. Fingerpulsoximeter

Common Rail Injektoren prüfen, zerlegen und jetzt μ-genau reparieren

Systemvoraussetzungen 13.3

Software-Tipps zum Anfertigen schriftlicher Arbeiten

BI WIKI START-UP YOUR DWH PARTIZIPATIVE BI IM ZEITALTER VON BIG DATA

Service Training und Technische Hotline von Bosch: Sichern Sie sich einen echten Wettbewerbsvorteil

Nachhaltigkeit managen

Erik Purwins, Unit Manager BI Europäische TDWI-Konferenz, München

FHH meets economy. Tobias Klug Dipl.-Wirt.-Inf. (FH), Alumnus FH Hannover. Hannover, 21. Januar Januar 2010 bit GmbH

Christine Hansen, Fabrizio Fresco, Patrick Malcherek

Projektname: Beispiel für ein IT-Konzept

Agile Softwareentwicklung in der Versicherungs-IT Fehlschlag oder Heilsbringer?

Erfahrungsbericht Agile Entwicklung einer BI Anwendung für das Meldewesen

Big-Data-Technologien - Überblick - Prof. Dr. Jens Albrecht

Auswertung Bereitschaftsdienste mit Time-Intelligence Solutions

INVEST projects. Besseres Investitionscontrolling mit INVESTprojects

Travian Games nutzt Pentaho Datenintegration und Business Analytics zur Optimierung des Spieldesigns

Compliance Suite. Roadmap & Entwicklungsschwerpunkte Sven Feddersen, Bosch Software Innovations GmbH

good. better. outperform.

IBM Software. Rational Quality Manager Testing Discipline. Rational Team Concert Development Discipline

Unternehmensweites DQ Controlling auf Basis von BI-Werkzeugen. Doreen Hartung, TIQ Solutions GmbH 6. GIQMC, Bad Soden,

OLVENCY II. Standard Reporting für Versicherungsunternehmen SOLVENCY II. ConVista Consulting

Agile Methoden als Erfolgsfaktor für BI und Big Data Projekte. Best Practices aus unseren Projekten. Dr. Stefan Igel Karlsruhe,

SQL Server 2008 R2 Neuerungen

Definition von KPIs für das operative HR Business für den Geschäftsbereich Chassis Systems Control, Robert Bosch GmbH

Deutsch, Englisch (gut) Fachinformatiker für Anwendungsentwicklung

Data Warehouse Grundlagen

Ausgangspunkt. Datenintegration. Ziel. Konflikte. Architekturen. Transparenz

Agenda. Einführung MS SQL Server Integration Services (SSIS) Oracle Data Warehouse Builder (OWB) Zusammenfassung Quellen. Einführung SSIS OWB

Service Transition. Martin Beims. WKV SS13 Karsten Nolte. Mittwoch, 19. Juni 13

BI around the world - Globale Reporting Lösungen bei Continental Automotive

Release Automation für Siebel

Komplexe Excel-Berichte mit APEX und jxls erstellen

1001 Möglichkeiten eine Staging Area zu füllen. Sven Bosinger its-people GmbH

Oracle BI EE mit großen Datenmengen

OWB Referenzarchitektur, Releasemanagement und Deployment. Carsten Herbe metafinanz - Informationssysteme GmbH

Advanced Monitoring von ETL-Prozessen. Sven Bosinger its-people

Solvency II. Komplexität bewältigen

mit der neuen Microsoft BI-Plattform

Transkript:

DATENQUALITÄT IM DWH IST AUTOMATISCH AUCH GLEICH BESSER? Edgar Kaemper Robert Bosch GmbH AA-AS/EIS3-EU Plochingen

Umfeld: Unternehmen und Geschäftsbereich Geschäftsbereich Automotive Aftermarket (AA) Angebot für Handel und Werkstätten weltweit komplette Diagnose- und Werkstatttechnik umfassendes Kfz- und Nfz-Ersatzteilsortiment (Neuteile, instandgesetzte Austauschteile, Reparaturlösungen) Produktportfolio von AA Erzeugnisse der Bosch Erstausrüstung eigenentwickelte und -gefertigte Aftermarket-spezifische Produkte und Dienstleistungen. Über 18 000 Mitarbeiter in 150 Ländern weltweiter Logistikverbund (650.000 verschiedene Ersatzteile) Werkstattkonzepte Bosch Service (rund 16.500 Betriebe weltweit) AutoCrew mit über 800 Betrieben 2

Umfeld: Unternehmen und Geschäftsbereich Automotive Service Solutions (AA/AS) Prüf- und Werkstatttechnik Software für Diagnose Service-Training technische Informationen und Serviceleistungen http://bosch-automotive-aftermarket.com/de/home/ 3

Umfeld: Branche Die wachsende Anzahl und die steigende Komplexität der im Fahrzeug installierten Systeme und Komponenten bedeutet, dass Service-Werkstätten einen Zugang zu breitem Wissen haben müssen. Informationssysteme (z.b. ESI[tronic]) müssen das Fahrzeugmodell erkennen und umfassende Informationen für die Werkstätten liefern. 4

Einführung: Architektur des CDW 5

Datenqualitäts-Konzept Source 1 Auslieferung Daten? Source 2 ETL CDW Automated Testing Source DQ DQ CDW QS Reporting 6

Datenqualitäts-Konzept Eingangskontrolle : QS Reports der Datenquellen Source 1 Auslieferung Daten? Source 2 ETL CDW Automated Testing Source DQ DQ CDW QS Reporting 7

Datenqualitäts-Konzept Reject im ETL: Sicherung Datenmodel Sicherung Datenformate Source 1 Technische Datenqualität Auslieferung Daten? Source 2 ETL CDW Automated Testing Source DQ DQ CDW QS Reporting 8

Datenqualitäts-Konzept Domain Experten: Fachliche Datenqualität Inhalte (Datenquellen/Lieferanten) Source 1 Definition Testfälle Auslieferung Daten? Source 2 ETL CDW Automated Testing Source DQ DQ CDW QS Reporting 9

Datenqualitäts-Konzept Testframework: Technische Datenqualität Komplexe Regeln Source 1 Automatisierung Auslieferung Daten? Source 2 ETL CDW Automated Testing Source DQ DQ CDW QS Reporting 10

Testframework: Prozess 11

Testframework: Datenmodell 12

Testframework: Datenmodell Signifikanz (für Berechnungsmodel zur Freigabe der Daten) Daten sind falsch Es fehlen Daten Testcase Typen (automatische Bewertung der Testcases mit Grenzwerten): absolutes Maximum not OK (Wenn x Datensätze nicht OK sind, dann ist der Testcase nicht bestanden.) relatives Maximum not OK (Wenn x % der Datensätze nicht OK sind, dann ist der Testcase nicht bestanden.) absolutes Minimum OK (Wenn x Datensätze OK sind, dann ist der Testcase bestanden.) relatives Minimum OK (Wenn x % der Datensätze OK sind, dann ist der Testcase bestanden.) Vergleich Anzahl zum letzten Datenstand: (Wenn min x % mehr Datensätze, dann ist der Testcase bestanden.) 13

Testframework: Funktionen Testcase: Einlesen aus Datei via External Table Testresult: Anlegen Ändern: Update Records getestet, Records OK, Records nicht OK, Details zu Fehlern, Ende und Dauer Bewertung: Berechnung auf Basis der Grenzwerte ob passed oder not passed Testresultset Anlegen Ändern: Timestamps und Dauer Je Testcase eine Procedure, die den Testcase abarbeitet 14

Testframework: weitere Schritte What else? Automatische Datenfreigabe ETL Test Release Get the lead (Fein-)Justierung Grenzwerte Regelwerk/Berechnung QS Ampel close gap Mehr Testfälle Aber: Wie viele Testfälle sind genug? 15

Testcases: Erläuterungen X-Achse: verschiedene ETL Ladeläufe über die Zeit Y-Achse: Anzahl der im Testcase getesteten Datensätze Unterer Teil der Säule: Anzahl Datensätze, die den Testcase nicht bestanden haben Oberer Teil der Säule: Anzahl Datensätze, die den Testcase bestanden haben Blaue Linie: Grenzwert für den Testcase Farbe der Säule: Grüne Farbe: Testcase wurde bestanden Rote Farbe, Testcase wurde nicht bestanden 16

Testcase 1: Besser ist noch nicht gut genug nicht erfolgreich Verbesserungen erreicht Grenzwert zu anspruchsvoll? 17

Testcase 2: Alles OK Grenzwert anspruchsvoll immer erfüllt wachsende Datenmengen 18

Testcase 3: Es lohnt sich inzwischen erfolgreich Weiterhin Records not OK Grenzwert zu einfach? 19

Testcase 4: Der Ausreißer Paradebeispiel für automatisches Testen Absicherung der erreichten Qualität 20

Testcase 5: Besser geht immer immer erfolgreich weiter verbessert Aufwand? 21

Fazit Einfaches Framework Einfach, aber offen für Erweiterungen Jeder ETL Entwickler kann damit und daran arbeiten Mit PL/SQL nah an der Datenbank Performance 22

Fazit Einfaches Framework Einfach, aber offen für Erweiterungen Jeder ETL Entwickler kann damit und daran arbeiten Mit PL/SQL nah an der Datenbank Performance Visualisierung Start mit einfachem ASCII Report für Product Owner Nach Aufbau Reporting Umgebung Nutzung auch für QS Reporting Transparenz der Datenqualität 23

Fazit Einfaches Framework Einfach, aber offen für Erweiterungen Jeder ETL Entwickler kann damit und daran arbeiten Mit PL/SQL nah an der Datenbank Performance Visualisierung Start mit einfachem ASCII Report für Product Owner Nach Aufbau Reporting Umgebung Nutzung auch für QS Reporting Transparenz der Datenqualität Prozesse 24 Domain Experten finden und etablieren Datenqualität ist kein Selbstläufer

Fazit Einfaches Framework Einfach, aber offen für Erweiterungen Jeder ETL Entwickler kann damit und daran arbeiten Mit PL/SQL nah an der Datenbank Performance Visualisierung Start mit einfachem ASCII Report für Product Owner Nach Aufbau Reporting Umgebung Nutzung auch für QS Reporting Transparenz der Datenqualität Automatisch = besser? Nicht automatisch, aber es hilft ungemein. Prozesse 25 Domain Experten finden und etablieren Datenqualität ist kein Selbstläufer

VIELEN DANK Edgar Kaemper Robert Bosch GmbH Automotive Aftermarket AA-AS/EIS3-EU Postfach 11 29 73201 Plochingen www.bosch.com Edgar.Kaemper@de.bosch.com