Datenqualität erfolgreich steuern



Ähnliche Dokumente
erfolgreich steuern Datenqualität rä dpunkt.verlag Ldwi Praxislösungen für Business-Intelligence-Projekte Rüdiger Eberlein Edition TDWI

2.1 Ist-Anwendungslandschaften Programme zur Gestaltung von Anwendungslandschaften

PQM - Prozessorientiertes Qualitätsmanagement

PQM - Prozessorientiertes Qualitätsmanagement Leitfaden zur Umsetzung der neuen ISO 9001

Basiswissen Software-Projektmanagement

Enterprise Architecture Management - einfach und effektiv

Multiproj ektmanagement

Christoph Puls. Zielorientiertes Management. von Logistikdienstleistungen in. Netzwerken kooperierender. Unternehmen

Basiswissen Software-Projektmanagement

Datenqualitätsmanagement im Customer Relationship Management

PQM- Prozessorientiertes Qualitätsmanagement

Kleine Wirtschaftsprüfungsunternehmen

xiii Inhaltsverzeichnis 1 Einführung 1

Neues aus dem TDWI Germany e.v.

Qualitätsmanagement nach ISO/TS 16949

Qualitätsmanagement für Dienstleistungen

IT-basierte Kennzahlenanalyse im Versicherungswesen

Geschäftsprozessmanagement in der Praxis

Agile Softwareentwicklung

Der IT Security Manager

DATENQUALITÄT ERFOLGREICH STEUERN. detlef APEL wolfgang BEHME rüdiger EBERLEIN christian MERIGHI

Datenqualität erfolgreich steuern

Entwicklung und Erprobung innovativer Produkte - Rapid Prototyping

Multiplikatorverfahren in der Unternehmensbewertung

Managementprozesse und Performance

Java Web Services in der Praxis

Serviceorientierung und partnerschaftliches Handeln im B26-Vertrieb

Software Engineering

Gradle. Ein kompakter Einstieg in das moderne Build-Management-System ---> Mit einem Geleitwort von Hans Dockter, Erfinder von Gradle

Business Communication Architecture Blueprint

Web Analytics & Web Controlling

Strategisches und operatives Kundenbeziehungs- Controlling 38

Data Mining für die industrielle Praxis

SQL Server 2012 und SharePoint im Unternehmenseinsatz. Referent Daniel Caesar

Beck-Wirtschaftsberater im dtv Rating. Wie Sie Ihre Bank überzeugen. von Prof. Dr. Ottmar Schneck

Einstieg in Business Intelligence mit Microsoft SharePoint 2010

Das Projektmanagement-Office

3D-Architektur-Visualisierung

Peter Adolph. Die finanzielle Berichterstattung von Herstellerleasing nach International Financial Reporting Standards (IFRS) Verlag Dr.

Inhaltsverzeichnis. Hermann J. Schmelzer, Wolfgang Sesselmann. Geschäftsprozessmanagement in der Praxis


Dr. Nadine Amende. Nutzenmessung der. geografischen. Informationsvisualisierung. in Verbindung mit der. Informationssuche

Patrick Bartsch. Verbesserung. der Patientensicherheit. im Krankenhaus

Berufswunsch Fotograf - Edition ProfiFoto

Nichtparametrische Datenanalyse

Methodische objektorientierte Softwareentwicklung

Schulungspaket QM. Prozesse optimieren Methoden einführen Kundenzufriedenheit erhöhen. Bearbeitet von Anja Kranefeld

Datenbank-Programmierung mit Visual Basic 2012 (Buch + E-Book)

Betriebliche Kennzahlen

Software modular bauen

Akquisitionsfinanzierungen

Geschäftsprozessmanagement in der Praxis

Unternehmenskooperation für kleine und mittelständische Unternehmen

Standardisierte Integration und Datenmigration in heterogenen Systemlandschaften am Beispiel von Customer Relationship Management

Inhaltsverzeichnis 1 Einleitung 2 Ansätze in Forschung und Praxis

Lean Startup. Schnell, risikolos und erfolgreich Unternehmen gründen. von Eric Ries. 1. Auflage FinanzBuch 2012

Mehr Selbstständigkeit für Menschen mit Autismus

Bachelorarbeit. Grundlagen im Dienstleistungsunternehmen. Mit Qualitätsmanagement und Kundenorientierung zum Erfolg. Tobias Müller

Entwurf. Anwendungsbeginn E DIN EN (VDE ): Anwendungsbeginn dieser Norm ist...

Wertorientiertes Supply Chain Management

Inhalt. I. Theorie. Seite Vorwort...9 Abkürzungen...11 Einleitung...13

TYPO3 4.3 für Webautoren

Inhaltsübersicht... V. Inhaltsverzeichnis... VI. Abbildungsverzeichnis... XIII. Tabellenverzeichnis... XVII. Abkürzungsverzeichnis...

Praxiswissen Softwaretest Test Analyst und Technical Test Analyst

Investitionsentscheidungen institutioneller Investoren für Private-Equity- Gesellschaften

NBD-Prognosemodelle im Kundenbeziehungsmanagement

Business Intelligence für Controller

INHALTSVERZEICHNIS. Geleitwort. Inhaltsübersicht

16.4 Wiederverwendung von COTS-Produkten

Inhaltsverzeichnis. Abbildungsverzeichnis Tabellenverzeichnis

Big Data - Fluch oder Segen?

Zertifizierung nach DIN ENIS09000

Vom Geschäftsprozess zum Workflow

Grundlagen der Unternehmensführung

Management von Service-Level-Agreements

Gegenüberstellung ISO 9001:2015 ISO 9001:2008

Forschungsbereich Value-based Customer Relationship Management (CRM)

Transfer von Prozessen des Software-Produktlinien Engineering in die Elektrik/Elektronik- Architekturentwicklung von Fahrzeugen

Inhaltsverzeichnis XIII

Wissensmanagement. Grundlagen, Methoden und technische Unterstützung. von Franz Lehner. 2., überarbeitete Auflage. Hanser München 2008

Hybride Finanzierung im Internationalen Steuerrecht Six

Information zur Revision der ISO Sehr geehrte Damen und Herren,

Praxishandbuch BPMN. Incl. BPMN 2.0. von Jakob Freund, Bernd Rücker, Thomas Henninger. 1. Auflage. Hanser München 2010

IT-Outsourcing-Entscheidungen

Administrations-KVP, die Prozessanalyse

Mit einem Geleitwort von Prof. Dr. Helmut Krcmar

Motivation: Datenqualitätsprobleme in der Praxis (1/2) Mars Climate Orbiter. Chinesische Botschaft in Belgrad

Architekturplanung und IS-Portfolio-

Lohnsteuer. von Christiane Dürr. 1. Auflage. HDS-Verlag Weil im Schönbuch Verlag C.H. Beck im Internet: ISBN

SERVICE LEVELS IN DER LOGISTIK

Inhaltsverzeichnis. Dirk Stähler, Ingo Meier, Rolf Scheuch, Christian Schmülling, Daniel Somssich

WPM - Wertstromorientiertes Prozessmanagement

Microsoft Outlook 2010 auf einen Blick

Integriertes Condition Monitoring

CENIT EIM Innovations-Tag, 09. Juni 2015 Empower Your Digital Business! Migrationslösungen der CENIT AG

Prozessorientierte Organisation des Metadatenmanagements für Data-Warehouse-Systeme

Future Digital Business

Transkript:

Edition TDWI Datenqualität erfolgreich steuern Praxislösungen für Business-Intelligence-Projekte von Detlef Apel, Wolfgang Behme, Rüdiger Eberlein, Christian Merighi 3., überarbeitete und erweiterte Auflage dpunkt.verlag GmbH Heidelberg 2015 Verlag C.H. Beck im Internet: www.beck.de ISBN 978 3 86490 042 6 Zu Leseprobe schnell und portofrei erhältlich bei beck-shop.de DIE FACHBUCHHANDLUNG

xiii Teil I 1 1 Datenqualität 3 1.1 Daten................................................ 3 1.2 Qualität............................................... 5 1.3 Datenqualität........................................... 7 1.4 Datenqualitätsmanagement............................... 11 1.5 Zusammenfassung...................................... 17 2 Ausprägungen und Ursachen schlechterdatenqualität 19 2.1 Geschäftstreiber........................................ 20 2.2 Ausprägungen schlechter Datenqualität...................... 24 2.3 Ursachen schlechter Datenqualität.......................... 27 2.4 Beispiel: Finanzdienstleister............................... 34 2.5 Empfehlungen......................................... 36 3 Auswirkungen schlechter Datenqualität 37 3.1 Datenqualitätskosten.................................... 38 3.2 Gesetzliche Anforderungen................................ 45 3.3 Business-Case-Betrachtungen.............................. 49 3.4 Empfehlungen......................................... 52 4 Organisation 53 4.1 Aufbauorganisation..................................... 53 4.2 Ablauforganisation...................................... 63 4.3 Empfehlungen......................................... 67

xiv 5 Referenzarchitektur für Business-Intelligence-Anwendungen 69 5.1 Referenzarchitektur...................................... 69 5.1.1 Datenquellen und Datenströme...................... 71 5.1.2 Datenintegration................................. 72 5.1.3 Datenhaltung................................... 73 5.1.4 Informationsbereitstellung.......................... 73 5.1.5 Anwender und Rollen............................. 74 5.1.6 Operative Anwendungen und Prozesse................ 74 5.1.7 Querschnittsprozesse.............................. 74 5.2 Problemstellen und Lösungsansätze hinsichtlich der Datenqualität.. 75 5.2.1 Datenquellen.................................... 75 5.2.2 Datenintegration................................. 76 5.2.3 Datenhaltung................................... 79 5.2.4 Informationsbereitstellung.......................... 80 5.3 Architektur für Datenqualitätsmanagement.................... 81 5.4 Serviceorientierte Architektur.............................. 83 5.5 Master Data Management................................. 85 5.5.1 Architektur..................................... 86 5.5.2 Umsetzung..................................... 89 5.6 Empfehlungen.......................................... 90 6 Big Data 91 6.1 Definitionen von Big Data................................. 91 6.1.1 Fachlich-datenbezogene Sicht....................... 93 6.1.2 Gartner-Sicht.................................... 94 6.1.3 Technisch-infrastrukturelle Sicht..................... 95 6.2 Bedeutung der Datenqualität bei Big Data..................... 95 6.3 Herausforderung externe Daten............................. 97 6.4 Herausforderung unstrukturierte Daten....................... 99 6.5 Herausforderung Geschwindigkeit.......................... 100 6.6 Herausforderung Volumen............................... 101 6.7 Empfehlungen......................................... 102 7 Kennzahlen zur Messung der Datenqualität 103 7.1 Anwendungsmöglichkeiten von Kennzahlen.................. 104 7.2 Messpunkte für Datenqualität............................. 106 7.3 DQ-Metriken......................................... 109 7.4 Kennzahlen für ausgewählte Datenqualitätskriterien............ 112 7.5 Kennzahlenbaum....................................... 114 7.6 Kennzahlenformular.................................... 115 7.7 Empfehlungen......................................... 116

xv Teil II 117 8 Verbesserung der Datenqualität imquellsystem 123 8.1 Vorbeugung vor neuen Datenqualitätsproblemen.............. 124 8.2 Empfehlungen........................................ 129 9 Data Profiling 131 9.1 Data-Profiling-Prozess.................................. 132 9.1.1 Schritt 1: Integration der Daten.................... 133 9.1.2 Schritt 2: Analyse der integrierten Daten............. 133 9.1.3 Schritt 3: Darstellung der Ergebnisse................ 134 9.1.4 Schritt 4: Fachliche Bewertung der Ergebnisse......... 134 9.2 Zusammensetzung des Data-Profiling-Teams................. 135 9.3 Vorgehensweise beim Data Profiling....................... 136 9.4 Data-Profiling-Verfahren zur Analyse von Attributen........... 137 9.4.1 Standardanalysen auf Attributebene................. 137 9.4.2 Analyse der Attribute mit Geschäftsregeln............ 150 9.5 Data-Profiling-Verfahren zur Analyse von Datensätzen......... 158 9.5.1 Analyse auf Schlüsselattribute..................... 158 9.5.2 Analyse auf abgeleitete Werte...................... 161 9.5.3 Analyse von Datensätzen mit Geschäftsregeln......... 162 9.6 Data-Profiling-Verfahren zur Analyse von Tabellen............ 163 9.6.1 Analyse von Tabellen auf referenzielle Abhängigkeiten.. 163 9.6.2 Analyse von Tabellen mit Geschäftsregeln............ 168 9.7 Empfehlungen........................................ 174 10 Erfolgreiche Datenvalidierung und -filterung 175 10.1 Validierung auf vier Ebenen.............................. 175 10.2 Filterung fehlerhafter Daten.............................. 176 10.3 Validierung bei Extraktion oder Laden...................... 180 10.4 Arten der Datenvalidierung.............................. 182 10.5 Erstellung der Validierungsregeln und Speicherung der Ergebnisse. 184 10.6 Empfehlungen........................................ 185 11 Standardisierung und Bereinigung 187 11.1 Standardisierung....................................... 187 11.2 Datenbereinigung...................................... 189 11.3 Standardisierung und Bereinigung im ETL-Prozess............. 217 11.4 Verfahren für nicht zu bereinigende Daten................... 218 11.5 Empfehlungen........................................ 218

xvi 12 Datenanreicherung 219 12.1 Wirtschaftsinformationen................................ 219 12.2 Geografische Informationen.............................. 222 12.3 Soziodemografische Informationen......................... 224 12.4 Haushaltsbildung...................................... 225 12.5 Standards zur Klassifizierung von Waren und Dienstleistungen.... 226 12.6 Branchenklassifizierung.................................. 229 12.7 Empfehlungen......................................... 232 13 Verbesserung der Datenqualität in der Bereitstellung und Visualisierung 233 13.1 Bereitstellung der Daten.................................. 233 13.2 Visualisierung der Information............................ 235 13.3 Empfehlungen......................................... 251 14 Wertschöpfung durch Metadaten 253 14.1 Metadaten: Begriff und Strukturierung...................... 253 14.2 Metadatenarchitekturen................................. 255 14.3 Metadatenmanagement.................................. 258 14.4 Metadatenkategorien.................................... 260 14.5 Probleme bei der Erstellung: Motivation und Aktualität......... 265 14.6 Nutzung von Metadaten................................. 265 14.7 Empfehlungen......................................... 268 15 Data Quality Monitoring 269 15.1 DQ-Planung.......................................... 270 15.2 DQ-Assessment........................................ 271 15.3 DQ-Phasenkonzepte.................................... 274 15.4 Methoden............................................ 277 15.5 Verantwortlichkeiten.................................... 283 15.6 Empfehlungen......................................... 283 16 Produktauswahl und -integration 285 16.1 Anbieter und Produkte.................................. 285 16.2 Auswahlkriterien im Überblick............................ 287 16.3 Funktionale Kriterien................................... 287 16.4 Integration............................................ 291 16.5 Einbeziehung der Fachbereiche............................ 293 16.6 Sprachen und Länder.................................... 293 16.7 Einbindung in DQM-Prozesse............................. 294 16.8 Empfehlungen......................................... 294

xvii Teil III 295 17 Datenqualitätsmanagement in einer Studie 301 17.1 Analyse des Istzustands................................. 302 17.2 Entwurf des Sollkonzepts................................ 311 17.3 Bewertung........................................... 316 17.4 Umsetzungsplanung.................................... 317 17.5 Empfehlungen........................................ 317 18 Datenqualitätsmanagement in der Spezifikation 319 18.1 Spezifikation der Schnittstellen............................ 319 18.2 Definition der Rollen in der Datenorganisation............... 320 18.3 Festlegung der Datenqualitätsziele......................... 322 18.4 Bezeichnung und Definition der Objekte.................... 325 18.5 Festlegung der Geschäftsregeln............................ 327 18.6 Messung der Qualität von Definitionen und Geschäftsregeln..... 329 18.7 Data Profiling in der Spezifikation......................... 329 18.8 Entwurf des Systems.................................... 330 18.9 Empfehlungen........................................ 333 19 Datenqualitätsmaßnahmen in der Konstruktionsphase 335 19.1 Übertragung der Datenqualitätsziele........................ 335 19.2 Konventionen und Richtlinien............................ 336 19.3 Entwurf des Systems.................................... 337 19.4 Erstellung eines Prototypen.............................. 343 19.5 Empfehlungen........................................ 343 20 Steuerung der Datenqualität in der Realisierung 345 20.1 Einhaltung der Konventionen, Richtlinien und Konzepte........ 345 20.2 Data Profiling in der Realisierung.......................... 346 20.3 Einbindung der Datenverantwortlichen und Benutzer.......... 347 20.4 Realisierung der Datenqualitätsmaßnahmen.................. 348 20.5 Durchführung von Tests................................. 349 20.6 Empfehlungen........................................ 349 21 Steuerung der Datenqualität im Betrieb 351 21.1 Monitoring und Berichtswesen............................ 352 21.2 Ausbildung........................................... 353 21.3 Empfehlungen........................................ 353

xviii Anhang 355 Abkürzungen 357 Literatur 359 Index 367