Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann



Ähnliche Dokumente
Professionelle Seminare im Bereich MS-Office

Content Management System mit INTREXX 2002.

MORE Profile. Pass- und Lizenzverwaltungssystem. Stand: MORE Projects GmbH

Schnittstelle DIGI-Zeiterfassung

AZK 1- Freistil. Der Dialog "Arbeitszeitkonten" Grundsätzliches zum Dialog "Arbeitszeitkonten"

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

How to do? Projekte - Zeiterfassung

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

Softwareentwicklungspraktikum Sommersemester Feinentwurf

Integration mit. Wie AristaFlow Sie in Ihrem Unternehmen unterstützen kann, zeigen wir Ihnen am nachfolgenden Beispiel einer Support-Anfrage.

Kostenstellen verwalten. Tipps & Tricks

Fachdidaktik der Informatik Jörg Depner, Kathrin Gaißer

LSF-Anleitung für Studierende

BSV Ludwigsburg Erstellung einer neuen Internetseite

Seite 1 von 14. Cookie-Einstellungen verschiedener Browser

In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access. Die Grundlagen der Datenbanken.

Lavid-F.I.S. Ablaufbeschreibung für. Arbeitszeiterfassung. Lavid-F.I.S.

Mit dem Tool Stundenverwaltung von Hanno Kniebel erhalten Sie die Möglichkeit zur effizienten Verwaltung von Montagezeiten Ihrer Mitarbeiter.

Konzepte der Informatik

Data Quality Management: Abgleich großer, redundanter Datenmengen

In diesem Tutorial lernen Sie, wie Sie einen Termin erfassen und verschiedene Einstellungen zu einem Termin vornehmen können.

Das System für Ihr Mitarbeitergespräche

Stellvertretenden Genehmiger verwalten. Tipps & Tricks

Einführung in das Arbeiten mit MS Excel. 1. Bearbeitungs

Modellierung als agiles Mittel zur Anforderungsdefinition. REConf 2010, München, 17. März 2010

Ordner Berechtigung vergeben Zugriffsrechte unter Windows einrichten

Hilfe zur Urlaubsplanung und Zeiterfassung

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Kampagnenmanagement mit Siebel Marketing/Oracle BI ein Praxisbericht

Was ist neu in Sage CRM 6.1

Requirements Lifecycle Management (RLM)

Alle alltäglichen Aufgaben können auch über das Frontend durchgeführt werden, das in den anderen Anleitungen erläutert wird.

MdtTax Programm. Programm Dokumentation. Datenbank Schnittstelle. Das Hauptmenü. Die Bedienung des Programms geht über das Hauptmenü.

MOBILE ANLAGENINVENTUR: NUR ZEITERSPARNIS?

Einleitung... 2 Eingeben der Daten... 2 Datenabgleich... 3 Zusammenfassung... 5

Veröffentlichen von Apps, Arbeitsblättern und Storys. Qlik Sense Copyright QlikTech International AB. Alle Rechte vorbehalten.

Teaser-Bilder erstellen mit GIMP. Bildbearbeitung mit GIMP 1

FORUM HANDREICHUNG (STAND: AUGUST 2013)

GRS SIGNUM Product-Lifecycle-Management

Business Intelligence Praktikum 1

FreePDF XP. Dokumentation

GSM: Airgap Update. Inhalt. Einleitung

PVS Grobkonzept: Strukturelle und funktionale Erweiterungen bei der Verwaltung der Arbeitszeit und der organisatorischen Zuordnung

Installation und Dokumentation juris Smarttags 1.0

Übungen Workflow Management. Blatt 2

Partitionieren in Vista und Windows 7/8

Arbeiten mit UMLed und Delphi

Requirements Engineering für IT Systeme

Über die Internetseite Hier werden unter Download/aktuelle Versionen die verschiedenen Module als zip-dateien bereitgestellt.

Anleitung OpenCms 8 Webformular Auswertung

Hilfedatei der Oden$-Börse Stand Juni 2014

Excel Fortgeschrittene Techniken. Peter Wies. 1. Ausgabe, März 2013 EX2013F

Typisierung des Replikationsplan Wirries, Denis Datenbankspezialist

Subpostfächer und Vertretungen für Unternehmen

falego das Fallmanagement für ISO 9001ff zertifizierte Startercenter NRW - Version

Microsoft Update Windows Update

Access Grundlagen für Anwender. Susanne Weber. 1. Ausgabe, 1. Aktualisierung, Juni 2013

Der vorliegende Konverter unterstützt Sie bei der Konvertierung der Datensätze zu IBAN und BIC.

1. EINLEITUNG 2. GLOBALE GRUPPEN Globale Gruppen anlegen

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Benutzerhandbuch. Leitfaden zur Benutzung der Anwendung für sicheren Dateitransfer.

PTV VISWALK TIPPS UND TRICKS PTV VISWALK TIPPS UND TRICKS: VERWENDUNG DICHTEBASIERTER TEILROUTEN

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Netzwerkeinstellungen unter Mac OS X

Agile Vorgehensmodelle in der Softwareentwicklung: Scrum

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

Kurzeinführung Excel2App. Version 1.0.0

Beispiel überschießendes Kindergeld:

Zusatzmodul Lagerverwaltung

Verkaufen Sie doch wo Sie wollen. Ihr einfacher Weg zu mehr Umsatz und dauerhaft steigendem Erfolg im E-Business

Werbemittelverwaltung

Viele Bilder auf der FA-Homepage

I N F O R M A T I O N V I R T U A L I S I E R U N G. Wir schützen Ihre Unternehmenswerte

Virtual Roundtable: Business Intelligence - Trends

Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang

Individuelle Formulare

Konzentration auf das. Wesentliche.

Die TYPO3-Extension Publikationen

FTP-Leitfaden RZ. Benutzerleitfaden

Task: Nmap Skripte ausführen

Dokumentation. Black- und Whitelists. Absenderadressen auf eine Blacklist oder eine Whitelist setzen. Zugriff per Webbrowser

Verwaltung der Projekte

Lizenzierung von System Center 2012

EasyWk DAS Schwimmwettkampfprogramm

teischl.com Software Design & Services e.u. office@teischl.com

ArchivCam / MotionCam

SEPA Lastschriften. Ergänzung zur Dokumentation vom Workshop Software GmbH Siemensstr Kleve / /

Bundesverband Flachglas Großhandel Isolierglasherstellung Veredlung e.v. U g -Werte-Tabellen nach DIN EN 673. Flachglasbranche.

Vorgehensweise bei Lastschriftverfahren

Excel Pivot-Tabellen 2010 effektiv

SEMINAR Modifikation für die Nutzung des Community Builders

Die Online-Meetings bei den Anonymen Alkoholikern. zum Thema. Online - Meetings. Eine neue Form der Selbsthilfe?

Ihre Interessentendatensätze bei inobroker. 1. Interessentendatensätze

Version Deutsch In diesem HOWTO wird beschrieben wie Sie Ihr vorhandenes PMS-System mit der IAC-BOX verbinden und konfigurieren.

FlowFact Alle Versionen

Anleitung für die Registrierung und das Einstellen von Angeboten

1 Einleitung. Lernziele. automatische Antworten bei Abwesenheit senden. Einstellungen für automatische Antworten Lerndauer. 4 Minuten.

SMART Newsletter Education Solutions April 2015

Transkript:

Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann Andreas Ditze MID GmbH Kressengartenstraße 10 90402 Nürnberg a.ditze@mid.de Abstract: Data Lineage ist als Konzept in Business Intelligence Systemen unabdingbar, um z.b. die Verwendung bzw. Verfolgung von Attributen über die verschiedenen Ebenen einer Data Warehouse Infrastruktur zu ermöglichen. Ausgehend von den Attributen des fachlichen Datenmodells über die Spalten des physischen Datenbankmodells der operativen Systeme werden die Informationen über die Data Warehouse Schicht bis zur Data Mart Schicht per Data Lineage verfolgt. Diese Konzepte, Mechanismen und entsprechende Werkzeugunterstützung lassen sich nahezu 1:1 auf die Traceability-Anforderungen eines Requirements Engineering & Management anwenden. Der Beitrag zeigt anhand von kleinen Praxisbeispielen die Vergleichbarkeit der beiden Konzepte auf und stellt eine entsprechende Werkzeugunterstützung vor.

1 Einleitung Traceability ist extrem hilfreich, aber auch aufwendig aufzubauen und damit teuer in der Erstellung und im Unterhalt. Deshalb müssen effektive und effiziente Methoden und Werkzeuge zum Aufbau und Pflege der für eine Traceability notwendigen Abhängigkeiten zwischen den Ergebnisartefakten aufgebaut und genutzt werden. Dabei ist es besonders wichtig, dass die Abhängigkeiten möglichst automatisch während des Entwicklungsprozesses erstellt bzw. abgeleitet und gepflegt werden. Dieser Beitrag wird anhand einer modellbasierten Vorgehensweise und einer Anlehnung an das Konzept des Data Lineage aus dem Business Intelligence Umfeld aufzeigen, wie in der Praxis und unter Verwendung eines entsprechenden Modellierungswerkzeugs Traceability genutzt wird. Data Lineage (oder auch Datenherkunft) ist sinngemäß die Fragestellung, zu gegebenen (meist) aggregierten Datensätzen die ursprünglichen Datensätze zu bestimmen, aus denen sie entstanden sind. Für Ergebnisartefakte in Softwareentwicklungsprozessen gilt ähnliches. Auch hier möchte man wissen, aufgrund welcher Anforderung eine bestimmte Softwarekomponente oder funktion entstanden ist, bzw. welcher Testfall sich auf welche Anforderung von welchem Stakeholder bezieht. Warum also nicht die gleichen Mechanismen und Techniken dafür einsetzen? 2 Data Lineage als Grundprinzip Zur Verfolgung der Datensätze über die verschiedenen Ebenen einer Data- Warehouse-Architektur werden die jeweiligen Attribute auf den unterschiedlichen Ebenen mit Abhängigkeiten verbunden. Zusätzlich kann die Abhängigkeit noch mit einer Transformationsregel erweitert werden. Mit einem einfachen Abhängigkeitsgraphen kann so die Datenherkunft jedes einzelnen Attributs eines Datensatzes bestimmt werden. Abbildung 1: Data Lineage für die Basis-Kennzahl "Betrag Geleistete Stunden" Die Abbildung 1 zeigt die Verfolgung der Zusammensetzung und Herkunft einer Basis-Kennzahl Betrag Geleistete Stunden. Ausgehend von den links dargestellten Attributen Stunden und Stundenstatz aus der Ladetabelle gelstunden über die historisierten Tabellen der Data-Warehouse-Schicht bis zur Faktentabelle und der Kennzahl aus der Data-Mart-Schicht.

Dieses Grundprinzip lässt sich auch in der Softwareentwicklung anwenden, nur das hier die Art der Elemente vielfältiger ist. Es handelt sich nicht nur um Attribut von Entitäten, Spalten von Tabellen oder Würfeln, sondern um unterschiedlichste Instanzen der verschiedenen Metamodelle (u.a. UML 2, BPMN 2). Meist sogar noch ergänzt um textuelle Artefakte wie funktionale Anforderungen, Abnahmekriterien, Risiken und Testfälle. Dadurch ergeben sich eine Reihe von möglichen Beziehungen und Abhängigkeiten, die entweder von Hand im Rahmen der Modellierung explizit erzeugt oder implizit durch die Metamodell- Beziehungen hergestellt werden. Zwei Beispiele für implizite Metamodell-Beziehungen sind die Owned Element Beziehung (Ownership) eines UML-Attributes zur UML-Klasse oder einem BPMN- Task zum BPMN-Prozess. Diese Beziehungen werden nicht durch Abhängigkeiten modelliert sondern werden im Rahmen der Modellbildung erstellt. Beispiele für explizite Abhängigkeiten sind die manuelle Zuordnung von Anforderungen zu Anwendungsfällen, UML-Klassen zu BPMN-Datenobjekten oder Rollen bzw. Organisationseinheiten zu BPMN-Lanes bzw. BPMN-Pools. Beispielhaft soll dies an einem Übersichtsschaubild (sog. Whiteboard-Diagramm) für ein kleines Modellierungsprojekt gezeigt werden: Abbildung 2: Übersichtsschaubild mit allen Abhängigkeiten zwischen den Modellelementen Die Abbildung 2 zeigt die unterschiedlichen Modellierungsartefakte und die verschiedene Beziehungen (explizit oder implizit erstellt) untereinander. Jede Beziehung (Abhängigkeit) kann in einer Traceability-Analyse zur Verfolgung über die verschiedenen Modellierungsebenen genutzt werden. So entsteht z.b. ein Traceability-Pfad von einer funktionalen Anforderung UML-Anwendungsfall BPMN-Kollaboration BPMN-Prozess BPMN-Task

BPMN-Datenassoziation BPMN-Datenobjekt Geschäftsobjekt UML- Klasse ER-Entität DB-Tabelle Datenbank. Über diesen Pfad kann direkt die Frage beantwortet werden, welche Datenbank von der Änderung einer Anforderung betroffen ist (in Pfeilrichtung) bzw. welcher Geschäftsprozess vom Ausfall einer Datenbank betroffen ist und welcher Stakeholder informiert werden muss (entgegen der Pfeilrichtung). Neben der Darstellung in Abbildung 2 mit vollständigen Diagrammen in der jeweiligen Modellierungsnotation ist auch eine Darstellung als einfacher Abhängigkeitsgraph möglich. Dieser Graph stellt nur die einzelnen Modellelemente (z.b. Anforderung, Geschäftsobjekt, Klassenattribut, Entitätsattribut) mit ihren Abhängigkeiten dar und ermöglich damit eine schnelle Verfolgung der Auswirkung einer Änderung. Abbildung 3: Dynamischer Abhängigkeitsgraph für beliebige Modellelemente Mit Hilfe der in Abbildung 3 gezeigten Darstellungsmöglichkeit wird Traceability sowohl beim Erstellen der Abhängigkeiten als auch bei der Pflege und Auswertung beherrschbar. Viele der Abhängigkeiten entstehen implizit beim Modellieren oder durch einfache Drag-&-Drop-Aktionen bzw. automatisierte Modell-zu-Modell- Transformationen. Die nachfolgende Abbildung 4 zeigt eine spezielle Applikation ( Beamer ), die zur interaktiven Erstellung und Verwaltung von Abhängigkeiten zwischen unterschiedlichen Quellen und Zielen geeignet ist. Dabei können verschiedene sog. Abbildungsthemen definiert werden, bei denen die Auswahl von Quell- und Zielelementen und der dazwischen anzulegenden Abhängigkeit vordefiniert wird.

Ein beispielhaftes Abbildungsthema ist das Mapping von Attributen der Entitäten des konzeptionellen Datenmodells auf Spalten von Tabellen eines physischen Datenbankmodells. Dabei werden als Quelle die Attribute und Entitäten des konzeptionellen Datenmodells angezeigt und als mögliche Ziele die bereits vorhandenen Spalten und Tabellen des physischen Datenbankmodell. Nun kann entweder eine Verbindung (Abhängigkeit) zwischen bereits vorhandenen Modellelementen hergestellt werden oder man erzeugt aus einem Quellelement ein neues Zielelement und verbindet beide gleichzeitig mit einer entsprechenden Abhängigkeit. Vorhandene Abhängigkeiten werden durch eine grüne Verbindungslinie zwischen dem Quell- und Zielelement im oberen Bereich der Applikation angezeigt und zusätzlich in der Bearbeitungsliste (unterer Bereich) aufgelistet. Abbildung 4: Der "Beamer" - eine interaktive Applikation für Abhängigkeiten In der Bearbeitungsliste der Beamer -Applikation (unterer Bereich in Abbildung 4) wird durch eine entsprechende Einfärbung der Einträge deren Aktualität gekennzeichnet. So werden Einträge, bei denen das Modellelement der Quelle ein jüngeres Änderungsdatum hat als das Ziel-Modellelement rot eingefärbt. Dadurch können auch bei einer großen Anzahl an vorhandenen Abhängigkeiten die notwendigen Anpassungen nach einer Änderung des Quellmodells schnell ermittelt werden.

Hierzu kann die Bearbeitungsliste, wie in Abbildung 5 dargestellt, auch entsprechend gefiltert werden. Mit den im Beitrag gezeigten Beispielen sollen die verschiedenen Unterstützungsmöglichkeiten eines modernen Abbildung 5: Filterauswahl der Bearbeitungsliste Modellierungswerkzeugs beim Aufbau und Pflege der Abhängigkeiten zwischen Modellelementen vorgestellt werden. Der Anwender erstellt im Rahmen des Modellierungsprozess durch verschiedenste manuelle, teilautomatische oder vollautomatische Verfahren entweder implizit oder explizit die unterschiedlichen Abhängigkeitsbeziehungen zwischen den Quell- und Zielmodellelemente. Diese Abhängigkeiten können mit den dargestellten Funktionalitäten ausgewertet und gepflegt und damit nutzbar gemacht werden. 3 Fazit Traceability ist in einer modellbasierten Vorgehensweise beim Einsatz von modernen Modellierungswerkzeugen mit unterschiedlichen Darstellungs- und Auswertungsfunktionalitäten effizient und effektiv einsetzbar. Quelle für alle Abbildungen: Modellierungsplattform Innovator