AKAD Hochschule Stuttgart Wirtschaftsinformatik. Assignment. Arten und Rolle von Metadaten in Business Intelligence-Lösungen



Ähnliche Dokumente
Business Intelligence

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

Data Quality Management: Abgleich großer, redundanter Datenmengen

pro4controlling - Whitepaper [DEU] Whitepaper zur CfMD-Lösung pro4controlling Seite 1 von 9

Kampagnenmanagement mit Siebel Marketing/Oracle BI ein Praxisbericht

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

Titel BOAKdurch Klicken hinzufügen

Allgemeines zu Datenbanken

Bachelor Prüfungsleistung

Benutzerhandbuch MedHQ-App

Survival Guide für Ihr Business Intelligence-Projekt

Eigenen WSUS Server mit dem UNI WSUS Server Synchronisieren

MORE Profile. Pass- und Lizenzverwaltungssystem. Stand: MORE Projects GmbH

Anleitung über den Umgang mit Schildern

Er musste so eingerichtet werden, dass das D-Laufwerk auf das E-Laufwerk gespiegelt

Netzwerkeinstellungen unter Mac OS X

Marketing Intelligence Schwierigkeiten bei der Umsetzung. Josef Kolbitsch Manuela Reinisch

Data Mining-Projekte

Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann

Umstieg auf Microsoft Exchange in der Fakultät 02

Beschaffung mit. Auszug aus dem Schulungshandbuch: Erste Schritte im UniKat-System

Virtual Roundtable: Business Intelligence - Trends

Einführung und Motivation

Requirements Engineering für IT Systeme

Content Management System mit INTREXX 2002.

Tutorial: Wie kann ich Dokumente verwalten?

ARCHIV- & DOKUMENTEN- MANAGEMENT-SERVER PAPIER ARCHIVIEREN

Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER

Präsentation zum Thema XML Datenaustausch und Integration

(1) Mit dem Administrator Modul werden die Datenbank, Gruppen, Benutzer, Projekte und sonstige Aufgaben verwaltet.

teischl.com Software Design & Services e.u. office@teischl.com

Auszug aus der Auswertung der Befragung zur Ermittlung der IT-Basiskompetenz

Business Intelligence Data Warehouse. Jan Weinschenker

Kapitel 4 Die Datenbank Kuchenbestellung Seite 1

ACL-Skript: GDPdU-Datenübernahme

I. Allgemeine Zugangsdaten für den neuen Server: II. Umstellung Ihres Windows Arbeitsplatzrechners

teamsync Kurzanleitung

Die Beschreibung bezieht sich auf die Version Dreamweaver 4.0. In der Version MX ist die Sitedefinition leicht geändert worden.

Seminar C02 - Praxisvergleich OLAP Tools

Semantic Web Technologies I! Lehrveranstaltung im WS10/11! Dr. Andreas Harth! Dr. Sebastian Rudolph!

Techniken wissenschaftlichen Arbeitens. Studiengang Wirtschaftsingenieurwesen

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

etutor Benutzerhandbuch XQuery Benutzerhandbuch Georg Nitsche

Autorisierung. Sicherheit und Zugriffskontrolle & Erstellen einer Berechtigungskomponente

Version 1.0 Datum Anmeldung... 2

Einrichtung eines VPN-Zugangs

Artenkataster. Hinweise zur Datenbereitstellung. Freie und Hansestadt Hamburg. IT Solutions GmbH. V e r s i o n

Proseminar: Website-Managment-System. NetObjects Fusion. von Christoph Feller

In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access. Die Grundlagen der Datenbanken.

WS 2002/03. Prof. Dr. Rainer Manthey. Institut für Informatik III Universität Bonn. Informationssysteme. Kapitel 1. Informationssysteme

Skriptenverkauf Datenmodell. Lars Trebing, 4. Juli 2008

How-to: Webserver NAT. Securepoint Security System Version 2007nx

Installation & Konfiguration AddOn Excel Export Restriction

Ihre Interessentendatensätze bei inobroker. 1. Interessentendatensätze

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Integration mit. Wie AristaFlow Sie in Ihrem Unternehmen unterstützen kann, zeigen wir Ihnen am nachfolgenden Beispiel einer Support-Anfrage.

Serviceanforderung online

Datenbanken. Prof. Dr. Bernhard Schiefer.

HIER GEHT ES UM IHR GUTES GELD ZINSRECHNUNG IM UNTERNEHMEN

Kleines Handbuch zur Fotogalerie der Pixel AG

1. Adressen für den Serienversand (Briefe Katalogdruck Werbung/Anfrage ) auswählen. Die Auswahl kann gespeichert werden.

Local Control Network Technische Dokumentation

Adressen und Kontaktinformationen

Anwendungshinweise zur Anwendung der Soziometrie

Sicher auf Erfolgskurs. Mit Ihrem Treuhand-Betriebsvergleich

MIT NEUEN FACHTHEMEN

UserManual. Handbuch zur Konfiguration einer FRITZ!Box. Autor: Version: Hansruedi Steiner 2.0, November 2014

How to do? Projekte - Zeiterfassung

360 - Der Weg zum gläsernen Unternehmen mit QlikView am Beispiel Einkauf

my.ohm Content Services Autorenansicht Rechte

Pädagogik. Melanie Schewtschenko. Eingewöhnung und Übergang in die Kinderkrippe. Warum ist die Beteiligung der Eltern so wichtig?

Archiv - Berechtigungen

Arbeiten Sie gerne für die Ablage?

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

ACDSee Pro 2. ACDSee Pro 2 Tutorials: Übertragung von Fotos (+ Datenbank) auf einen anderen Computer. Über Metadaten und die Datenbank

Änderungsbeschreibung HWS32 SEPA Überweisungen

Lizenzierung von SharePoint Server 2013

THEMA: "SAS STORED PROCESSES - SCHNELL GEZAUBERT" HELENE SCHMITZ

.htaccess HOWTO. zum Schutz von Dateien und Verzeichnissen mittels Passwortabfrage

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Nach der Anmeldung im Backend Bereich landen Sie im Kontrollzentrum, welches so aussieht:

Welche Bereiche gibt es auf der Internetseite vom Bundes-Aufsichtsamt für Flugsicherung?

Dieser Ablauf soll eine Hilfe für die tägliche Arbeit mit der SMS Bestätigung im Millennium darstellen.

Leitfaden #1a. "zanox Publisher-Statistik" (next generation)

Fragenkatalog zum Kurs 1666 (Datenbanken in Rechnernetzen) Kurstext von SS 96

Prozessorientiertes Asset Management und Mobile Workforce (unter Android)

Proxy. Krishna Tateneni Übersetzer: Stefan Winter

Anleitung zum online Datenbezug. Inhalt:

Individuelle Formulare

Einleitende Bemerkungen

Anleitung zum Herunterladen von DIN-Vorschriften außerhalb des internen Hochschulnetzes

Was ist neu in Sage CRM 6.1

Einleitung: Frontend Backend

Business Intelligence Praktikum 1

Freigabemitteilung Nr. 39. Neue Funktionen adresse zurücksetzen / ändern Kennung ändern Anlegen von OCS (elektr. Postfach) Mailbenutzern

crm-now/ps Webforms Webdesigner Handbuch Erste Ausgabe

WinWerk. Prozess 4 Akonto. KMU Ratgeber AG. Inhaltsverzeichnis. Im Ifang Effretikon

Benutzerhandbuch. Leitfaden zur Benutzung der Anwendung für sicheren Dateitransfer.

Transkript:

AKAD Hochschule Stuttgart Wirtschaftsinformatik Assignment Arten und Rolle von Metadaten in Business Intelligence-Lösungen zum Seminar BIN01 am 11.11.2011 in Stuttgart von Manfred Schiefers Pflasteräckerstr. 44 70186 Stuttgart Immatrikulationsnummer 360 828

INHALTSVERZEICHNIS 1 Einleitung 1 1.1 Business Intelligence, Data Warehouse, Metadaten 1 1.2 Ziel dieser Arbeit 1 2 Metadaten allgemein 1 3 Arten von Metadaten 2 3.1 Technische und betriebswirtschaftliche Metadaten 2 3.2 Operationale und DSS-Metadaten 2 3.3 Passive und aktive Metadaten 3 3.4 Wie beschreiben Metadaten? 3 3.4.1 Inhaltliche Beschreibung 3 3.4.2 Strukturelle Beschreibung 3 3.4.3 Semantische Beschreibung 4 3.4.4 Formale Beschreibung 4 3.4.5 Pragmatische Beschreibung 4 4 Rolle der Metadaten im Business Intelligence 5 4.1 Metadaten für Hardware, Netze oder Datenstrukturen 5 4.2 Metadaten zur Filterung 5 4.3 Metadaten zur Harmonisierung 6 4.4 Metadaten zur Aggregation 6 4.5 Metadaten zur Anreicherung 7 4.6 Metadaten zum Datenzugriff 7 5 Schlussbetrachtungen 8 Literaturverzeichnis eidesstattliche Erklärung II IV I

1 Einleitung 1.1 Business Intelligence, Data Warehouse, Metadaten Wissen im Unternehmen gilt als wichtiger Produktionsfaktor. Hieraus resultiert Wissensmanagement als Herausforderung für die IT. Business Intelligence (BI) im engeren Sinne umfasst analyseorientierte Anwendungen zur Aufbereitung und Präsentation multidimensional organisierter Daten unter Verwendung von Verfahren wie Slice, Dice sowie Color Coding [vgl. Gluchowski 2007, Seite 90]. Aus inhomogenen, internen und externen Daten soll erfolgskritisches Wissen generiert werden. Stimmige Datenbereitstellung spielt dabei eine wesentliche Rolle und spiegelt sich im Begriff Data Warehousing wider [vgl. Gluchowski 2007, Seite 117]. Dabei sollen Daten aus operativen IT-Systemen (z.b. ERP) gesammelt und analytischen Informationssystemen zugeführt werden. Derartige Nutzdaten (Problemdaten) stehen im Gegensatz zu sog. Metadaten. Letztere dienen zur Beschreibung der erstgenannten bezüglich Typ, Wertebereich, Kontext usw. usw. [vgl. Gluchowski 2007, Seite 123]. 1.2 Ziel dieser Arbeit Es soll vorliegend n i c h t in das Gebiet Business Intelligence eingeführt werden. Entsprechende Basiskenntnisse werden beim Leser vorausgesetzt. Vielmehr ist Gegenstand dieser Ausarbeitung die Klärung der Fragestellungen: Welche Arten von Metadaten sind für BI-Lösungen wichtig und welche Rolle spielen diese im BI? 2 Metadaten allgemein Die griechische Vorsilbe Meta sagt aus auf einer höheren Ebene befindlich [vgl. Kemper 2009, Seite 47]. Metadaten sind Daten über Daten. Sie enthalten klassifizierende und beschreibende Angaben zu den eigentlichen Nutzdaten. Frühe Bemühungen, sinnvolle Datenattribute zusammenzustellen, finden sich bereits in DIN 66232 von 1985 [vgl. Gabriel 1996, Seite 111]. Typisches Beispiel sind Karteikarten in einer Bücherei: Die Metadaten zu einem Buch sind Name des Autors, die Auflage, das Erscheinungsjahr, der Verlag und die ISBN. Ebenso bekannt sind Metatags in HTML-Dokumenten, die für Suchmaschinen Informationen bereitstellen sollen: <META NAME="GENERATOR" CONTENT="OpenOffice.org 2.3 (Win32)"> 1

[vgl. Schweibenz 2002, Seite 204]. Die Ablage solcher Metadaten erfolgt in einem sog. Repositorium, einer separaten Datenbank [vgl. Navrade 2008, Seite 25]. 3 Arten von Metadaten Zur Klassifizierung von Metadaten bietet die einschlägige Literatur vielfältige Varianten an. Nachfolgend sollen nur einige davon vorgestellt werden. 3.1 Technische und betriebswirtschaftliche Metadaten Technische Metadaten berücksichtigen die administrativen Eigenschaften von Daten. Hier geht es um Datenbankschemata in logischer/physischer Hinsicht [vgl. Schmidt 2008, Seite 65]. Bei relationalen Datenbanken beschäftigt sich die logische Datenmodellierung mit der Überführung des ER-Modells in Tabellenstrukturen. Die physische Modellierung betrifft Dinge wie Performanzüberwachung, Bildung von Indizes und die physische Datenablage in einem DBMS. Weitere Beispiele für technische Metadaten stellen Datenherkunft (Quellsysteme) sowie den jeweiligen Ladezeitpunkt der Daten dar [vgl. Navrade 2008, Seite 25]. Betriebswirtschaftliche oder auch fachliche Metadaten tragen dazu bei, dass von Anwenderseite her die Problemdaten der Basissysteme richtig interpretiert und Missverständnisse vermieden werden. Hierzu gehören Berechnungsvorschriften für Kennzahlen, Fachbegriffe, Datumsformate und Maßeinheiten [vgl. Navrade 2008, Seite 25]. Wesentlicher Punkt ist dabei die Eindeutigkeit der Definition von Unternehmensfachbegriffen [vgl. Winter 2000, Seite 372]. 3.2 Operationale und DSS-Metadaten Operationale Metadaten betreffen Informationen zu den operationalen Quelldatensystemen, deren Datenstrukturen (Feldbezeichnungen) sowie zum Transformationsprozess [vgl. Holthuis 1999, Seite 98]. Ebenso wird sich mit der Dateiorganisation des Ursprungssystems befasst. Weiterhin spielt die Zieldatenquelle eine Rolle, d.h. wo stehen die Daten nach erfolgter Transformation [vgl. Schuster 2005, Seite 88]. DSS-Metadaten zielen auf das eigentliche Decision Support System (analytisches Informationssystem) ab. Sie können als Schnittstelle zwischen dem Data Warehouse und den Frontend-Tools verstanden werden [vgl. Schuster 2005, Seite 88]. 2

3.3 Passive und aktive Metadaten Diese Unterscheidung bezieht sich auf die Nutzung. Passive Metadaten dokumentieren in erster Linie die ihnen zugrunde liegende Daten sowie deren Verhältnis zur Umwelt. Sie dienen zur Speicherung der Definitionen. Definiert werden Struktur, Entwicklungsprozess und Datenverwendung. Nutzer passiver Metadaten sind alle im BI-Umfeld Tätigen: Anwender, Administratoren, Entwickler [vgl. Kemper 2009, Seite 48]. Aktive Metadaten hingegen stellen Methoden dar, die auf Daten ausgeführt werden [vgl. Huthmann 2007, Seite 8]. Transformationsregeln für den ETL- Vorgang können als gleichfalls aktive Metadaten verstanden werden. Aktive Metadaten können zur Laufzeit interpretiert werden und werden so genutzt, um auf Transformations- und Analyseprozesse Einfluss zu nehmen [vgl. Kemper 2009, Seite 49]. 3.4 Wie beschreiben Metadaten? 3.4.1 Inhaltliche Beschreibung Hierbei werden Objekte interpretiert beschrieben. Nichttextuelle Objekte wie z.b. Fotografien erhalten zusätzliche textuelle Angaben. Diese müssen manuell erfasst werden. Eine automatisierte Extraktionsmöglichkeit entfällt somit [vgl. Schmitt 2005, Seite 88]. Als Beispiel kann das Passfoto einer Person mit den Attributen Name und Kontaktdaten (Email, Adresse usw.) versehen werden. Diese können dann in Form eines Datensatzes in einer relationalen Datenbank gespeichert werden [vgl. Schmitt 2005, Seite 89]. 3.4.2 Strukturelle Beschreibung Strukturelle Beschreibung von Nutzdaten ist wesentlich für die Funktionalität und Handhabbarkeit einer Datenbank. Dabei liegen folgende Aspekte im Fokus: Welche Datentypen werden unterstützt, mit welchen Feldlängen. Handelt es sich um Kann- oder Mussfelder? Ist der Wertebereich eingegrenzt? Ebenso können Regeln für Plausibilitätsprüfungen vorgesehen werden. Ein weiterer Gesichtspunkt stellt die Mehrsprachigkeit bezüglich der Begrifflichkeiten dar [vgl. Kretzschmar 2004, Seite 85]. Mit zu Datenstrukturen gehört auch die Beschreibung des Aufbaus von Datenbanktabellen hinsichtlich zugehöriger Attribute und deren Primärschlüssel. 3

3.4.3 Semantische Beschreibung Semantik bei den Metadaten betrifft sog. Ontologien, Modelle von Begriffsstrukturen und -zusammenhängen. Das Hintergrundwissen eines Fachgebiets kann damit zur Wissensorganisation verwendet werden [vgl. KIT 2009, Seite 139]. Hierbei werden u.a. auch sog. Synonyme und Homonyme verwendet [vgl. Pellegrini, 2006, Seite 342]. Bei Homonymen hat ein Wort mehrere Bedeutungen ( Bank als Sitzgelegenheit vs. Bank als Geldinstitut). Bei Synonymen haben mehrere Worte die gleiche Bedeutung (Kredit = Anleihe = Darlehen). Ontologien berücksichtigen wenn-dann- Beziehungen: Das Wort AUDI weist auf eine Automarke hin, gleichfalls besteht aber auch ein Zusammenhang zur Stadt Ingolstadt [vgl. Werres 2009, Seite 17]. 3.4.4 Formale Beschreibung Mit formalen Metadaten werden die äußeren Merkmale eines Informationsobjekts bzw. dessen Darstellungsform beschrieben. Sie stehen im Gegensatz zu den inhaltsbeschreibenden Metadaten [vgl. Wolf 2007, Seite 235]. Dies kann am Beispiel des Informationsobjekts Pressemeldung verdeutlicht werden: Die Schlagzeile (Überschrift) als ein Element einer Pressemeldung stellt in textueller Form eine rein inhaltliche Beschreibung dar. Diese kann man zu Katalogisierungszwecken heranziehen. Besagte Pressemeldung kann in gedruckter Form, als Fax, als txt-datei oder auch als PDF-Dokument vorliegen. Derartige Einteilungen möglicher Darstellungsformen werden als formale Metadaten bezeichnet [vgl. Spörrer 2009, Seite 35]. 3.4.5 Pragmatische Beschreibung Bei Pragmatischen Metadaten geht es um die Nutzbarkeit, (rechtliche) Voraussetzungen der Verfügbarkeit und um die Kosten der Beschaffung von Daten. Weiterhin gehören Metadaten navigatorischer Art dazu (Zugriffspfade, Verlinkungen) [vgl. Lange 2005, Seite 208]. Über die gemeinsame Nutzbarkeit von Daten gibt u.a. die Spezifikation ISO 11179 Auskunft [vgl. Voß 2003, Seite 379]. Enthalten Datenbanken urheberechtlich geschütztes Material bzw. personenbezogene Daten, so ist der Betreiber dafür verantwortlich, dass Missbrauch unterbunden wird [Knudsen 2005, Seite 59]. In Metadaten können Flags zur Kennzeichnung von Daten hinsichtlich derartiger Sensibilität dienen. 4

4 Rolle der Metadaten im Business Intelligence Metadaten werden im BI unterschiedliche Rollen zugewiesen. Je nach Funktion dienen sie der Beschreibung der Hardware, der Steuerung des Transformationsprozesses innerhalb des ETL oder der Organisation von Zugriffsrechten. Der Transformationsprozess zwischen operativen und dispositiven Systemen ist dabei wesentlicher Bestandteil von ETL (Extraktion Transformation Laden) [vgl. Kemper 2009, Seite 25]. Teilprozesse des Transformationsprozesses sind Filterung, Harmonisierung, Aggregation und Anreicherung. Jede der nachfolgend beschriebenen Metadaten-Rollen enthält durchgängig die Komponente Verantwortlichkeit [vgl. Kemper 2009, Seite 48]. 4.1 Metadaten für Hardware, Netze oder Datenstrukturen Diese Metadaten beziehen sich auf die operativen Datenbestände. Geregelt wird die Fragestellung nach Quellen bzw. Alternativquellen. D.h. wo sind gesuchte Daten physisch abgelegt. Weiterhin interessiert auch noch, wie oft diese Daten geändert werden (Änderungsfrequenz). Nicht zuletzt werden Informationen zu den Datenstrukturen benötigt [vgl. Kemper 2009, Seite 48]. Besondere Herausforderung stellen in diesem Zusammenhang Verteilte heterogene Systeme dar. Datenbestände liegen auf unterschiedlichen Servern, auf unterschiedlichen Partitionen und in verschiedenen Verzeichnispfaden. Für den Zugriff werden entsprechende IP-Adressen, Port- Nummern, Zugangsberechtigungen, sowie Accounts mit Kennwörtern benötigt. Datenstrukturen sind bestimmt durch Dateisysteme mit spezifischen Zeichencodes und durch Datenformate (angefangen von flachen Textdateien auf File-Servern bis hin zu Dateien in Datenbanksystemen. 4.2 Metadaten zur Filterung Extrakte aus operativen Datenbeständen werden bei der Filterung bereinigt, inhaltliche und syntaktische Mängel werden beseitigt. Hierzu werden Metadaten über Extraktionswerkzeuge, Mappingtabellen und Bereinigungsregeln benötigt [vgl. Kemper 2009, Seite 48]. Mappings stellen Zuordnungsmöglichkeiten dar, die heterogene Datenschemata in Übereinstimmung bringen sollen. 5

ETL-Werkzeuge halten in einem Repositorium Bereinigungsregeln. Syntaktische Mängel sollen dabei über Formatanpassungen eliminiert werden (z.b. einheitlich Str. statt Strasse bei Adressangaben). Mängel, wie fehlende oder nichtplausible Werte (Ausreißer) sowie unnötige Redundanzen sollen bereits vor der Übernahme rechtzeitig über Bereinigungsregeln erkannt und entfernt werden. Ebenso kann festgelegt werden, bis zu welchem Erfassungstag Daten als veraltet gelten sollen. Bis zu einem bestimmten Grenzdatum werden diese dann nicht mehr übernommen. Fehler können allgemein klassifiziert werden in solche, die automatisch erkannt, und solche, die einer manuellen Bearbeitung bedürfen. 4.3 Metadaten zur Harmonisierung Derartige Metadaten dienen zur Bildung der gewünschten Granularität (d.h. dem geforderten Detaillierungsgrad). Dies geschieht zum einen zunächst durch Anwendung syntaktischer Harmonisierungsregeln. Ziel ist die Einheitlichkeit der Formate. Betroffen sind hier z.b. Datumsformate (generell 25.04.2011 statt 25.04.11) oder Maßeinheiten (m 2 statt qm). Im Anschluss erfolgt noch eine weitere Harmonisierung im semantischen (betriebswirtschaftlichen) Sinne [vgl. Kemper 2009, Seite 48]. Gewünscht ist dabei u.a. ein übereinstimmender Zeitbezug der Daten (z.b. Umsätze pro Jahr, pro Monate usw.). Ebenso müssen Geldbeträge zum Zwecke der Vergleichbarkeit in einer gemeinsamen Basiswährung wie etwa dem zur Verfügung stehen. 4.4 Metadaten zur Aggregation Die gefilterten und harmonisierten Daten werden nun einem weiteren Schritt zugeführt. Ziel ist jetzt die Schaffung und Gruppierung verschiedener Verdichtungsebenen. Metadaten über Dimensionshierarchisierungen bilden dabei die Grundlage [vgl. Kemper 2009, Seite 48]. Es werden hier unterschiedliche Verdichtungsstrukturen abgebildet. Dies kann gleichzeitig nach verschiedenen Kriterien geschehen. Beispiel: Gliederung nach Kunde Kundengruppe Gesamt aber auch gleichfalls nach Produkt Produktgruppe Gesamt. Man spricht auch dann von sog. Parallelen Hierarchien [vgl. Kemper 2009, Seite 36]. Aus Performanzgründen werden derartig aggregierte Daten oft redundant erzeugt und zur Verfügung gestellt, um im Bedarfsfall einen schnellen Zugriff zu gewährleisten. 6

4.5 Metadaten zur Anreicherung Die bisher aufbereiteten Daten sollen nachträglich ergänzt ( angereichert ) werden. Hierbei geht es um betriebswirtschaftliche Kenngrößen, die aus den vorhandenen Daten resultieren [vgl. Kemper 2009, Seite 48]. Bei gegebenen Umsatzerlösen und bekannten variablen Kosten kann z.b. zusätzlich der Deckungsbeitrag berechnet werden. Die gewonnenen Ergebnisse werden in die bisherige Datenbasis integriert. Ein Vermischung verschiedener Schichten aus harmonisierten mit aggregierten Daten (s.o.) ist dabei möglich [vgl. Kemper 2009, Seite 37]. Die dahinter stehenden Berechnungsformeln zur Gewinnung dieser zusätzlichen Kenngrößen stellen in diesem Fall die Metadaten dar. Weitere einfache Beispiele könnte auch die Berechnung von Bruttobeträgen aufgrund verschiedener Umsatzsteuersätze oder auch die Berechnung des Alters von Mitarbeitern anhand des Geburtsdatums darstellen. Derart bereits vorausberechnetes Datenmaterial erlaubt kurze Antwortzeiten bei entsprechenden Abfragen. Auch kann durch diese gezielt anwendungsübergreifende Berechnung von konsistenten Ergebniswerten ausgegangen werden, die somit dem etablierten betriebswirtschaftlichem Instrumentarium im Unternehmen genügen [vgl. Kemper 2009, Seite 38]. 4.6 Metadaten zum Datenzugriff Beim Zugriff auf Daten sollen benutzerspezifische Anforderungen, aber auch Berechtigungen berücksichtigt werden. Metadaten in Form von Rollenprofilen regeln diesen Sachverhalt [vgl. Kemper 2009, Seite 48]. Informationen, die nicht für jeden Benutzer bestimmt sind, werden im Zugriff so entsprechend eingeschränkt. Die Zuteilung, der in den Metadaten dokumentierten Rechte, ist dann letztendlich an ein Benutzerkonto gebunden [vgl. Steiner 2009, Seite 165]. Es ist aber auch eine Trennung der direkten Verbindung von Benutzer und Rechten möglich. Erreicht wird dies durch Verwendung von sog. Rollen, die sich an den geschäftlichen Benutzerrollen orientieren bzw. an der betrieblichen Funktion des Mitarbeiters. Einer so definierten Gruppe steht eine ausgewählte Rechtemenge gegenüber, die in einer Zugriffkontrollmatrix festgelegt wird [vgl. Maur 2003, Seite 139]. Datenzugriffe als solche werden überdies protokolliert. Außer der Kontrolle des Zugriffs hat die Protokollierung bzw. Aufzeichnung in Logs von Vorgängen noch einen weiteren Aspekt. Gleichermaßen 7

liefern solche Metadaten dem Anwender Informationen, die die Datenqualität dokumentieren sollen. Diese bieten Hinweise zum Hergang des Transformationsprozesses beginnend ab der Datenquelle. Durch entsprechende Aufzeichnungen in Bezug auf die Harmonisierungs- bzw. Anreicherungsvorgänge wird eine Transparenz hinsichtlich geforderter Aktualität und Vollständigkeit gewährleistet [vgl. Kemper 2009, Seite 50]. 5 Schlussbetrachtungen Die Literaturrecherche zeigt, die Kategorisierungs- und klassifizierungsbemühungen zum Metadatenbegriff sind mannigfaltig. Diese werden meist auf sehr hohem und abstrakten Niveau betrieben, wobei selten praktische Anwendungsbeispiele zu finden sind. Dennoch ergibt sich abschließend nachfolgendes Fazit: Unerlässlich ist eine einheitliche Fachterminologie, die Missverständnisse oder Fehldeutungen unterbinden soll. Zum abgestimmten Begriffsverständnis tragen hierbei Metadaten über Bezeichnungen und Abgrenzungen wesentlich bei. Es soll sich dabei an der gängigen Terminologie des Unternehmens organisationsweit orientiert werden [vgl. Kemper 2009, Seite 50]. Diese Funktion der Bedeutungsspezifikation kann als die eine Hauptaufgabe der Metadaten innerhalb des Business Intelligence angesehen werden. Der zweite große Bereich gilt der Administration des Systems. Administratoren sowie Entwickler brauchen insbesondere technisch orientierte Metadaten. Diese stellen Informationen über die eigentliche Datenquelle, Regel für den Transformationsprozess und letztendlich zum Datenmodell des Data Warehouse zur Verfügung. Mit der Verwendung von Metadaten wird nicht zuletzt dem Paradigma der Trennung von Schema und Instanz, welches allgemein beim Einsatz von Datenbanken gefordert wird, Rechnung getragen. Je höher sich dabei der Grad der Übereinstimmung des abstrahierten Weltausschnitts gegenüber der Realität darstellt, desto besser ist die gelieferte Datenqualität. Man könnte auch sagen, durch Metadaten werden statische Nutzdaten erst zur Information. 8

LITERATURVERZEICHNIS [Gabriel, 1996] GABRIEL, Roland, RÖHRS, Heinz-Peter: Datenbanksysteme: Konzeptionelle Datenmodellierung u. Datenbankarchitekturen, Springer, 1996 [Gluchowski, 2007] GLUCHOWSKI, Peter, GABRIEL, Roland, CHAMONI, Peter, DITTMAR Carsten: Management Support Systeme und Business Intelligence: Computergestützte Informationssysteme für Fach- und Führungskräfte, Springer, 2007 [Holthuis, 1999] HOLTHUIS, Jan: Der Aufbau von Data Warehouse-Systemen: Konzeption - Datenmodellierung - Vorgehen, DUV, 1999 [Huthmann, 2007] HUTHMANN, Andreas: Metadaten und Datenqualität in Data Warehouses, GRIN Verlag, 2007 [Kemper, 2009] KEMPER, Hans-Georg, BAARS, Henning, MEHANNA, Walid: Business Intelligence: Grundlagen und praktische Anwendungen: Eine Einführung in die IT-basierte Managementunterstützung, Vieweg+Teubner, 2009 [KIT, 2009] Karlsruher Institut für Technologie: KIT scientific reports, KIT Scientific Publishing, 2009 [Knudsen, 2005] KNUDSEN, Björn, LAUBER, Anne: Schutz wissenschaftlicher Leistungen an Hochschulen und Forschungseinrichtungen: Urheber-, Marken-, Patent- und Internetrecht, Springer, 2005 [Kretzschmar, 2004] KRETZSCHMAR, Oliver, DREYER, Roland: Medien- Datenbank- und Medien-Logistik-Systeme: Anforderungen und praktischer Einsatz, Oldenbourg Wissenschaftsverlag, 2004 [Lange, 2005] LANGE, Norbert de: Geoinformatik in Theorie und Praxis, Springer, 2005 [Maur, 2003] MAUR, Eitel von: Data Warehouse Management: das St. Galler Konzept zur ganzheitlichen Gestaltung der Informationslogistik, Springer, 2003 II

[Navrade, 2008] NAVRADE, Frank: Strategische Planung mit Data- Warehouse-Systemen, Gabler Verlag, 2008 [Pellegrini, 2006] PELLEGRINI, Tassilo: Semantic Web: Wege zur vernetzten Wissensgesellschaft, Springer, 2006 [Schmidt, 2008] SCHMIDT-VOLKMAR, Pascal: Betriebswirtschaftliche Analyse auf operationalen Daten, Gabler Verlag, 2008 [Schmitt, 2005] SCHMITT, Ingo: Ähnlichkeitssuche in Multimedia- Datenbanken, Oldenbourg Wissenschaftsverlag, 2005 [Schuster, 2005] SCHUSTER, Katrin: E-Consulting, Oldenbourg Wissenschaftsverlag, 2005 [Schweibenz, 2002] SCHWEIBENZ, Werner, THISSEN, Frank: Qualität Im Web: Benutzerfreundliche Webseiten durch Usability Evaluation, Springer, 2002 [Spörrer, 2009] SPÖRRER, Stefan: Content-Management-Systeme: Begriffsstruktur und Praxisbeispiel, Kölner Wissenschaftsverlag, 2009 [Steiner, 2009] STEINER, René: Grundkurs Relationale Datenbanken: Einführung in die Praxis der Datenbankentwicklung für Ausbildung, Studium und IT-Beruf, Vieweg+Teubner, 2009 [Voß, 2003] VOß, Britta: Digitaler Campus.: Vom Medienprojekt zum nachhaltigen Medieneinsatz in der Hochschule, Waxmann Verlag, 2003 [Werres, 2009] WERRES, Thomas: Semantic Web-Architektur und Status Quo, GRIN Verlag, 2009 [Winter, 2000] WINTER, Robert: Data Warehousing 2000: Methoden, Anwendungen, Strategien, Birkhäuser, 2000 [Wolf, 2007] WOLF, Petra: Führungsinformationen für das Kommunalmanagement, DUV, 2007 III

EIDESSTATTLICHE ERKLÄRUNG Ich versichere, dass ich das beiliegende Assignment selbstständig verfasst, keine anderen als die angegebenen Quellen und Hilfsmittel benutzt sowie alle wörtlich oder sinngemäß übernommenen Stellen in der Arbeit gekennzeichnet habe. (Ort, Datum) (Unterschrift) IV