Logische Modellierung von Data Warehouses

Größe: px
Ab Seite anzeigen:

Download "Logische Modellierung von Data Warehouses"

Transkript

1 Logische Modellierung von Data Warehouses Vertiefungsarbeit von Karin Schäuble aus Lörrach BERUFSAKADEMIE LÖRRACH STAATLICHE STUDIENAKADEMIE UNIVERSITY OF COOPERATIVE EDUCATION Ausbildungsbereich Wirtschaft Betreuender Dozent: Prof. Dr. Jürgen Treffert Abgabetermin: Kurs: WWI01B Fachrichtung Wirtschaftsinformatik Unternehmen tk3 AG

2 Ehrenwörtliche Erklärung Ich versichere hiermit, dass ich meine Vertiefungsarbeit mit dem Thema Logische Modellierung von Data Warehouses selbstständig verfasst und keine anderen als die angegebenen Quellen und Hilfsmittel benutzt habe. Rheinfelden, Karin Schäuble Logische Modellierung von Data Warehouses Seite 2 von 32

3 Inhaltsverzeichnis Seite Ehrenwörtliche Erklärung...2 Abkürzungsverzeichnis...4 Abbildungsverzeichnis...5 Tabellenverzeichnis Einleitung Motivation Ziel der Arbeit Vorgehen Abgrenzung und Grundlagen Abgrenzung Datenbankmodellierung vs. Datenmodellierung Semantische vs. Logische vs. Physische Modellierungsebene OLTP vs. OLAP Grundlagen Normalisierung Aggregation Anforderung an die Modellierung Logische Modellierung Methoden Star-Schema Galaxy-Schema Fact-Constellation-Schema Snowflake-Schema Software-Tool Zusammenfassung und Ausblick...29 Quellenverzeichnis...16 Karin Schäuble Logische Modellierung von Data Warehouses Seite 3 von 32

4 Abkürzungsverzeichnis DV DWH ERP ETL FASMI MIS OLAP OLTP UML Datenverarbeitung Data Warehouse Enterprise Resource Planning Extraction, Transformation and Loading Fast analysis of shared management information Management Information System On-Line Analytical Processing On-Line Transactional Processing Unified Model Language Karin Schäuble Logische Modellierung von Data Warehouses Seite 4 von 32

5 Abbildungsverzeichnis Seite Abbildung 1: Subprozesse der Transformation...11 Abbildung 2: Ebenen der DWH-Modellierung Abbildung 3: Verschiedene Aggregationsstufen am Beispiel der Umsatzwerte Abbildung 4: Beispiel eines Star-Schemas Abbildung 5: Dimensionstabelle Verkäufer Abbildung 6: Dimensionstabelle Modelle Abbildung 7: Fakttabelle eines Star-Schema Abbildung 8: Beispiel eines Galaxy-Schema Abbildung 9: Beispiel eines Fact Constellation-Schema Abbildung 10: Beispiel eines Snowflake-Schema Abbildung 11: Power Designer Abbildung 12: Data Warehouse Entwicklung Karin Schäuble Logische Modellierung von Data Warehouses Seite 5 von 32

6 Tabellenverzeichnis Seite Tabelle 1: Unterschied OLTP - OLAP Tabelle 2: Unnormalisierte Relation Tabelle 3: Relation in erster Normalform Tabelle 4: Relation in zweiter Normalform Tabelle 5: Relation in dritter Normalform Karin Schäuble Logische Modellierung von Data Warehouses Seite 6 von 32

7 1 Einleitung In der heutigen Zeit der schnell wachsenden Märkte und stetigem Konkurrenzdruck werden Informationen immer wichtiger, vor allem seit der weltweiten Vernetzung über das Internet, das Menschen an vielen Orten dieser Welt den Zugriff auf nahezu unbegrenzte Mengen an Informationen ermöglicht. Auch Unternehmen können sich dieser Entwicklung nicht entziehen, d.h. fortschrittliche Unternehmen müssen an der Vernetzung teilnehmen und diese nutzen, um sich erfolgreich auf dem Markt behaupten zu können. Zahlreiche Unternehmen befinden sich daher in einer Orientierungsphase, welche Systeme für sie sinnvoll einsetzbar sind. Sie wollen die für sie relevanten Informationen nutzbar machen und Arbeitsprozesse erleichtern. Viele Unternehmen haben bereits Wege gefunden, wie sie die Vernetzung einsetzen und daraus Vorteile gewinnen können. Ein Beispiel sind Enterprise Resource Planning (ERP) Systeme, integrierte IT- Systeme, die die Disposition der innerbetrieblichen Ressourcen gestalten und optimieren. Nachdem mittlerweile weitgehend eine flächendeckende Versorgung mit betrieblicher Basisdatenverarbeitung gewährleistet ist, verschiebt sich der Fokus zunehmend auf die entscheidungsgerechte Versorgung betrieblicher Führungskräfte. Ein Beispiel hierfür ist das Data Warehouse. Die Menge an verfügbaren Informationen und die stattfindende Vernetzung sind die idealen Voraussetzungen für dieses System, in dem Informationen zusammengetragen, gespeichert und für Auswertungen verwendet werden. Dabei erfordern immer schnellere Märkte entsprechende (Re-) Aktionszeiten. Informierte und kritische Kunden erfordern ein flexibleres Angebot, das besser auf deren individuelle Bedürfnisse zugeschnitten ist. Um in diesem Umfeld richtige Entscheidungen treffen zu können, benötigen die Verantwortlichen aussagekräftige Fakten. Durch ein Data Warehouse sollen die bislang im Unternehmen brachliegenden Unmengen von Daten und Informationen in bare Münze umgewandelt werden, indem man versucht die wichtigen Informationen herauszufiltern und diese zu unternehmens-relevantem Wissen anreichert, so dass sie eine Wissensgrundlage bilden, auf der sich gesicherte strategische Entscheidungen fällen lassen. Daher wird die Extraktion von verwertbarem Wissen aus Daten wird immer wichtiger. Die Data Warehouse- Idee ist nicht ganz neu: Der Begriff Management- Information- System (MIS) wurde bereits Ende der sechziger Jahre geprägt und ist seither unter wechselnden Bezeichnungen Gegenstand intensiver Bemühungen in Wissenschaft und Praxis. Karin Schäuble Logische Modellierung von Data Warehouses Seite 7 von 32

8 EINLEITUNG Mangelte es früher neben der technischen Infrastruktur vor allem daran, dass keine ausreichende, elektronisch verfügbare und skalierbare Datenbasis vorhanden war, geht es in den meisten Unternehmen heute vor allem um die Frage, das vorhandene Potenzial zu erschließen, möglichst bevor es einem der Wettbewerber gelingt. Das Data Warehousing der 90er Jahre zielte in erster Linie darauf ab, alle entscheidungsrelevanten Informationen verfügbar zu machen, die bereits an irgendeiner Stelle im Unternehmen elektronisch gespeichert sind. Nicht zuletzt durch die zunehmende Verbreitung der geschäftsprozessorientierten Transaktionssysteme ist in Unternehmen ein großes Volumen an potenziell entscheidungsrelevanten Informationen vorhanden. Idealerweise sollen in einem Data Warehouse darüber hinaus auch Informationen aus externen Informationssystemen integriert werden. Was sich im Laufe der MIS- Bemühungen der 70er Jahre zunächst als Utopie abzeichnete, nämlich das Konzept einer völligen Integration in eine EDV-Lösung mit Zugriff auf eine Datenbank, erhält durch den Fortschritt in der Informationstechnologie im Gewand des Data Warehousing eine Renaissance. Entscheidender Unterschied dabei ist allerdings, dass es sich beim Data Warehouse erstens um redundant gehaltene Daten handelt, die von den Quellsystemen losgelöst sind, und zweitens, dass es sich nur um einen Teil der Daten handelt, der dem jeweiligen Analysezweck dient. Auf dieser Datenbasis setzen dann funktionsspezifische und benutzeradäquat gestaltete Management-Informations-Systeme bzw. analytische Informationssysteme aus anderen betrieblichen Bereichen auf. 1.1 Motivation Die aktuelle Marktsituation ist durch eine hohe Dynamik und einen harten Wettbewerb geprägt. Zudem hat die Komplexität des unternehmerischen Planens und Handelns stark zugenommen. Dies erfordert von Unternehmen schnelle und flexible Reaktionen auf Änderungen am Markt. Daher sind Informationen zu einem wichtigen Wettbewerbsfaktor geworden. Eine gute Informationsversorgung wird deswegen immer wichtiger, da man durch frühzeitige Erkenntnisse einen Wettbewerbsvorteil erlangen kann. Ein neuer Lösungsansatz, um die Datenflut im Unternehmen zu beherrschen, ist das Data Warehouse- Konzept, das den Entscheidern eine einheitliche Datenbasis für die Analyse zur Verfügung stellt. Die Daten liegen schon durch die operativen Systeme in Unternehmen vor, es gilt sie nur noch aufzubereiten, mit externen Daten zu erweitern und dann zu analysieren. Ein wichtiger Faktor bei der Data Warehouse Modellierung stellt die logische Modellierung dar. Data Warehouses setzen meistens auf relationale Datenbanken auf, da es sich um ausgereifte und gut erforschte Produkte handelt, die sich in den meisten Unternehmen schon bewährt haben. Jedoch wurden die relationalen Datenbanken nie mit dem Ziel entwickelt, um große Datenmengen für Analysezwecke zu verwalten. Die Standardoperatoren greifen zeilenweise auf die Tabelleneinträge zu. Daher unterstützen konventionelle relationale Abfragewerkzeuge die Navigation durch multidimensionale Strukturen nur im geringen Umfang, weswegen kann es zu sehr langen Antwortzeiten bei Analysen kommen. Karin Schäuble Logische Modellierung von Data Warehouses Seite 8 von 32

9 EINLEITUNG Somit wird bei der Data Warehouse Modellierung ein alternativer Ansatz benötigt, der den Anforderungen analysierender Systeme gerecht wird und die relationalen Systeme um eine multidimensionale Funktionalität erweitert, so dass man die multidimensionalen Abfragewerkzeuge für die Analyse benutzen kann. 1.2 Ziel der Arbeit Wie in der Motivation schon erwähnt, sind die relationalen Datenbanken nicht darauf ausgelegt, die Daten für die Analyse multidimensional darzustellen. Deswegen zieht man sich Methoden und Techniken zu Hilfe, mit denen man die Relationen um die multidimensionale Funktionalität erweitern kann Ziel dieser Arbeit ist es die Vor- und Nachteile der einzelnen Methoden herauszuarbeiten, um feststellen zu können, welches Schema für die meisten Betriebe am sinnvollsten wäre. 1.3 Vorgehen In Kapitel 2 werde ich zuerst das Thema von anderen möglichen Themen abgrenzen und auf Grundlagen eingehen, die man für das Verständnis des 4. Kapitels benötigt. Kapitel 3 beschreibt die Anforderungen an die logische Modellierung, die dann in Kapitel 4 genauer behandelt werden. Es werden die Methoden und Techniken betrachtet, die die relationalen Systeme um die multidimensionale Funktionalität erweitern. Kapitel 5 bildet dann den Schluss, indem die Ergebnisse zusammengefasst werden. Karin Schäuble Logische Modellierung von Data Warehouses Seite 9 von 32

10 2 Abgrenzung und Grundlagen 2.1 Abgrenzung Datenbankmodellierung vs. Datenmodellierung Bei der Modellierung eines Data Warehouses muss man zwischen der Modellierung der Daten und der Modellierung der Datenbankstruktur unterscheiden. Die Modellierung der Grundstruktur bildet die Grundlage für die Spezifikation der Funktionen des zu entwickelnden Systems und ist die Vorlage für die technische Realisierung. Mit Modellierung der Daten hat die Datenbankstruktur der Data Warehouse Entwicklung nichts zu tun, es bildet nur das Basissystem, dass dann nach der Realisierung mit den modellierten Daten gefüllt wird. Die Modellierung der Daten ist neben der Modellierung der Datenbankstruktur ein sehr wichtiger Bestandteil eines Data Warehouse Projektes, da von dem Prozess die Genauigkeit und Richtigkeit der Analysen abhängt. Die Datenmodellierung wird oft auch als Extraction, Transformation and Loading - Process (ETL) bezeichnet und verschlingt in den meisten Fällen 80% der gesamten Projektlaufzeit. ETL ist der Begriff für den selektiven Zugriff auf Daten in Kombination mit Transformationen und mathematischen Verknüpfungen. Der Datenmodellierungsprozess besteht aus drei Phasen. In der ersten Phase, der Extraktion, findet die Selektierung eines Ausschnittes der operativen Daten und die Bereitstellung für die Transformation statt. Dieser Abschnitt wird oft auch als Filterung bezeichnet. Neben der Extraktion der Daten aus operativen Systemen werden bei der Filterung syntaktische und inhaltliche Defekte bereinigt 1. Darauf folgt die Transformationsphase, die sich mit der Anpassung der Daten an vorgegebene Schemata- und Qualitätsanforderungen beschäftigt. Diese Phase lässt sich in Subprozesse unterteilen, in die Filterung, Harmonisierung, Verdichtung und Anreicherung. Die Daten werden hinsichtlich Kodierungen, Synonymen und Homonymen abgestimmt, was als Harmonisierung bezeichnet wird. Danach werden teilweise die Daten verdichtet und angereichert. Darunter versteht man die Bildung und Speicherung betriebswirtschaftlicher Kenngrößen aus gefilterten 1 [ChGl99] vgl. Seite 80 Karin Schäuble Logische Modellierung von Data Warehouses Seite 10 von 32

11 ABGRENZUNG UND GRUNDLAGEN und harmonisierten Daten. Diese bereinigten, gefilterten und angereicherten Daten werden in der dritten Phase, der Loadphase, physikalisch in die Datenbank eingebracht. In der Loadphase wird also folglich die Grundstruktur, die bei der Modellierung festgelegt wurde, mit den bereinigten, verdichteten und angereicherten Daten gefüllt. Abbildung 1: Subprozesse der Transformation [ChGl99] Semantische vs. Logische vs. Physische Modellierung Die Datenmodellierung dient zur Festlegung von Grundstrukturen, in denen die Daten gehalten werden. Diese Festlegung wird anhand von Datenmodellen durchgeführt. Ein Datenmodell ist nichts anderes als eine Beschreibungssprache zur Darstellung der Datenstruktur. Zweck dieser Datenmodelle ist die fachliche Darstellung der Informationen als Basis zur Veranschaulichung für die Anwender und Entscheider. Gleichzeitig sollen darin die Daten in detaillierter Form definiert und strukturiert werden. Somit bilden die Datenmodelle die Grundlage für die Spezifikation des zu entwickelnden Systems. Dabei muss man darauf achten, dass die Datenmodellierung von zwei unterschiedlichen Sichtweisen geprägt wird. Zum einen durch die betriebswirtschaftliche Sicht der Anwender und Entscheider, für die das Datenmodell sehr verständlich und leicht zu erfassen sein sollte. Zum anderen von der Sicht der Data Warehouse-Entwickler, die eine möglichst genaue Modellierung und damit einen hohen Detaillierungsgrad benötigen. Diese unterschiedlichen und gegensätzlichen Sichten und Anforderungen an die Modellierung machen die Problematik deutlich, die bei der Datenmodellierung gegeben ist. Karin Schäuble Logische Modellierung von Data Warehouses Seite 11 von 32

12 ABGRENZUNG UND GRUNDLAGEN Um dieser Problematik Folge leisten zu können wird bei der Datenmodellierung zwischen drei Modellierungsebenen unterschieden, zwischen der semantischen, der logischen und der physischen Ebene. 2 Die semantische Ebene dient als Schnittstelle zwischen diesen beiden Gruppen. Dem Anwender wird nur das einfache Modell gezeigt, die technischen Details werden vor dem Anwender verborgen. Auf der semantischen Ebene wird ein Fachkonzept mit der Darstellung der betriebswirtschaftlichen Problemstellung erstellt. Das Konzept dient dann als erster Entwurf, der unabhängig von der zur Datenspeicherung vorgesehenen Datenbanktechnologie ist. Da das Fachkonzept unabhängig von der Datenbanktechnologie ist, ist es frei von technischen Begriffen und eignet sich daher hervorragend als leicht anschauliches Konzept für die Anwender und Entscheider. Das Konzept dient deswegen nicht nur als erster Entwurf, sondern auch zur Begriffserklärung, zur Informationsbedarfsanalyse und zur Dokumentation für die Anwender und Entscheider. Die logische Ebene setzt dieses semantische Datenmodell in den Bereich der DV-technischen Umsetzung um, d. h. die ausschließlich für den Anwender verständlichen Begriffe werden in technische Begriffe umgesetzt. Dieses Modell ist noch unabhängig von der physischen Realisierung, ist aber schon auf die konkret eingerichtete Datenbanktechnologie ausgerichtet. Die physische Ebene wird of als technische Implementierung beschrieben. Sie beschäftigt sich mit der konkreten Umsetzung der logischen Datenmodellierung. Diese Umsetzung ist dementsprechend von dem verwendeten Datenbanksystem abhängig. Ziel ist die Definition von Schnittstellen, Sichten, Zugriffspfade sowie der Speicherstruktur im Hinblick auf die Realisierung einer möglichst hohen System Perfomance in Form von einer möglichst optimalen Verwirklichung der Zugriffs- und Speicherstrukturen. Diese immer konkreter werdende Modellierung wird durch Abbildung 2 sehr deutlich. Als erstes wird ein allgemeines Modell für die Anwender erarbeitet, dass für Jedermann leicht verständlich ist. In der logischen Ebene wird zwar noch unabhängig von der physischen Modellierung modelliert, aber schon im Hinblick auf das relationale Datenmodell, indem man sich für ein bestimmtes Schema entscheidet. Erst in der physischen Ebene werden die Namen und Größen jeder Tabelle in der Datenbank festgelegt. 2 [Lenz03] vgl. Seite 55 Karin Schäuble Logische Modellierung von Data Warehouses Seite 12 von 32

13 ABGRENZUNG UND GRUNDLAGEN Abbildung 2: Ebenen der DWH-Modellierung [Mart98] OLTP vs. OLAP Bei der Datenbankmodellierung muss darauf geachtet werden, ob man für On-line Transactional Processing (OLTP) oder On-line Analytical Processing (OLAP) modelliert, da jedes System unterschiedliche Anforderungen an die Modellierung stellt. Betriebliche Anwendungssysteme, wie Planungs- und Kontrollsysteme, sind so konzipiert, dass sie den täglichen Geschäftsablauf zum Teil automatisieren. Sie werden auch als operative Systeme bezeichnet und unterliegen dem Verarbeitungskonzept OLTP. Aktuelle Daten werden zu laufenden Geschäftsvorfällen anwendungsbezogen hinterlegt. Anwender sind vor allem Sachbearbeiter, die interaktiv in kurzen Zeitintervallen sowohl lesende als auch schreibende Zugriffe auf Einzeldaten transaktionsgeschützt vornehmen. Häufige Transaktionen von kurzer Dauer bestimmen das Tagesgeschäft, wobei auszuführende Transaktionen nur eine begrenzte Datenmenge zu verarbeiten haben. Als zentrale Datenstruktur im OLTP- Bereich gilt eine zweidimensionale Darstellung in Form von Tabellen, die in der Regel in der dritten Normalform vorliegen. Dagegen lassen sich Entscheidungsunterstützungssysteme durch ihr Verarbeitungskonzept OLAP klar von operativen Systemen abgrenzen. Die Daten werden subjektbezogen und verdichtet unter spezieller Berücksichtigung historischer Verlaufsdaten vorgehalten, um Trendanalysen zu ermöglichen. Die Datenaktualisierungen finden nur periodisch durch Abzüge (Snapshots) operativer Systeme statt. Analyserelevante Zugriffe auf OLAP- Daten durch Führungskräfte geschehen ad hoc und eher selten. Im Vergleich zu OLTP- Anwendungen haben Abfragen bei OLAP- Anwendungen eine große Datenmenge zu verarbeiten. Dabei wird meist lesend auf die verfügbaren Daten zugegriffen, wobei aufgrund der Historisierung mit einer mittleren bis langen Karin Schäuble Logische Modellierung von Data Warehouses Seite 13 von 32

14 ABGRENZUNG UND GRUNDLAGEN Antwortzeit gerechnet werden muss. Ziel der Datenverwaltung in OLAP- Systemen ist die Versionierung von Daten über die Zeit hinweg. Die Darstellung der Datenstruktur erfolgt durch bestimmte Schemata multidimensional. Diese Schemata werden in Kapitel 4 genauer vorgestellt. Der Schwerpunkt liegt hier auf der Informationslieferung. Da OLAP-Anfragen komplex sind, beeinträchtigen sie bei paralleler Auswertungen mit den transaktionalen Anwendungen letztere in ihrer Leistung. Diese Unvereinbarkeit hat zur Entwicklung von Data Warehouses geführt. Die Behandlung der Zeit ist eines der wichtigsten Unterscheidungsmerkmale zwischen OLTPund OLAP -Systemen. Bei OLTP- Systemen wird nur der Zeitpunkt der jeweiligen Transaktion erfasst, z.b. Kunde Meier hat am 14. Dezember 1988 um 12:33:21 einen Flug gebucht. Dabei wird die Zeit nicht als Schlüssel modelliert, sondern in Form eines Attributs (Time Stamp) erfasst. Demgegenüber spielt die Zeit, genauer die Auswertungsdimension Zeit, die zentrale Rolle in jedem Data Warehouse-Datenmodell. Ohne die Dimension Zeit kann kein Data Warehouse für kommerzielle Zwecke modelliert werden. Noch einmal zurück zum Beispiel der Buchungstransaktion. Das einfache Attribut Time Stamp wird zu einem umfangreichen Eintrag in der Dimensionstabelle Zeit. Es wird für jeden Eintrag ein eindeutiger Schlüssel generiert. Dadurch werden Zeitreihenanalysen möglich. Die wichtigsten Unterschiede kann man der folgenden Tabelle entnehmen: Zweck OLTP Unterstützung und Abwicklung der Geschäftsprozesse (dient der tägl. Arbeit) transaktionsorientiert OLAP Informationssystem für Entscheidungsunterstützung (dient als Datenspeicher für Analyse) analyseorientiert Datenbankgröße Gigabyte-Bereich Gigabyte/Terabyte-Bereich Modellierung Datenmenge je Transaktion Anwendungs-, funktions- und prozessorientiert Gering subjektorientiert Groß Datenaktualisierung Permanent pro Transaktion Periodisch Abfragekomplexität Niedrig Hoch Operationen Lesen, schreiben, löschen Im wesentlichen nur lesen Alter der Daten Aktuelle (max. 90 Tage) Mehr als 10 Jahre (historisch) Datenquellen Meist eine mehrere Niveau der Daten Detailliert Verdichtet, aufbereitet Ansicht der Daten Tabellen (flach) Multidimensional Normalisierung Wird i. A. eingehalten Weniger wichtig Zugriffsmuster Vorhersehbar Ad hoc Behandlung der Zeit Keinen Schlüssel Dimension Zeit Optimierungsziele Tabelle 1: Unterschied OLTP - OLAP Höherer Durchsatz, sehr kurze Antwortzeiten, hohe Verfügbarkeit Gute Antwortzeiten für komplexe Anfragen, hohe Flexibilität Karin Schäuble Logische Modellierung von Data Warehouses Seite 14 von 32

15 ABGRENZUNG UND GRUNDLAGEN 2.2 Grundlagen Normalisierung Die einzelnen Tabellen einer Datenbank können grundsätzlich unterschiedlich strukturiert sein. Bei ungeschickten Tabellendefinitionen können jedoch unerwünschte Fehlerpotentiale, wie z.b. Lösch-, Einfüge- und Änderungsanomalien auftreten. Die Lösung für dieses Problem liefert die von Codd entwickelte Normalformenlehre, die diejenigen Regeln formalisiert, die die intuitiven Entscheidungen umsichtiger Datenbankentwickler bereits vorher bestimmt haben. Neben der Vermeidung von unerwünschten Anomalien sind die Vermeidung von unnötiger Redundanz, die bessere Übersichtlichkeit für Benutzer und Programmierer, der Zwang zum systematischen Entwurf einer Datenbank und die Verringerung der Notwendigkeit der Umstrukturierung weitere Gründe für die Normalisierung. In den folgenden Abschnitten wird kurz die Umstrukturierung bis zur dritten Normalform geschildert: Eine Relation befindet sich in der ersten Normalform, wenn alle ihre Attribute nur einfache Attributwerte aufweisen, d.h. wenn jedes Datenfeld nur einen Wert besitzt. Unnormalisierte Relation: PersNr Name Vorname AbtNr Abteilung ProjektNr Beschreibung Zeit 1 Lorenz Sophia 1 Personal 2 Verkaufspromotion 83 2 Hohl Tatjana 2 Einkauf 3 Konkurrenzanalyse 29 3 Willschrein Theodor 1 Personal 1, 2, 3 Kundenumfrage, Verkaufspromotion, Konkurrenzanalyse 4 Richter Hans-Otto 3 Verkauf 2 Verkaufspromotion 67 5 Wiesenland Brunhilde 2 Einkauf 1 Kundenumfrage 160 Tabelle 2: Unnormalisierte Relation Relation in der ersten Normalform: PersNr Name Vorname AbtNr Abteilung ProjektNr Beschreibung Zeit 1 Lorenz Sophia 1 Personal 2 Verkaufspromotion 83 2 Hohl Tatjana 2 Einkauf 3 Konkurrenzanalyse 29 3 Willschrein Theodor 1 Personal 1 Kundenumfrage Willschrein Theodor 1 Personal 2 Verkaufspromotion 92 3 Willschrein Theodor 1 Personal 3 Konkurrenzanalyse Richter Hans-Otto 3 Verkauf 2 Verkaufspromotion 67 5 Wiesenland Brunhilde 2 Einkauf 1 Kundenumfrage 160 Tabelle 3: Relation in erster Normalform 140, 92, 110 Karin Schäuble Logische Modellierung von Data Warehouses Seite 15 von 32

16 ABGRENZUNG UND GRUNDLAGEN Wie man in Tabelle 2 sieht, gibt es Tabelleneinträge, die mehrere Werte besitzen. Um die erste Normalform zu erfüllen, müssen diese Werte in eine neue Zeile gebracht werden. Dadurch dass in jedem Datenfeld nur ein Wert stehen darf, nimmt die Redundanz in der ersten Normalform zu. Mit dem Primärschlüssel PersNr. lassen sich die Datensätze nicht mehr eindeutig kennzeichnen, es muss ein neuer Primärschlüssel gefunden werden, der sich in dem Beispiel aus PersNr und ProjektNr zusammensetzt. Eine Relation befindet sich in der zweiten Normalform, wenn sie in der ersten Normalform ist und jedes Nicht-Schlüssel-Attribut vom gesamten Primärschlüssel abhängig ist. In unserem Beispiel ist jedoch nur die Zeit vom gesamten Primärschlüssel abhängig. Name, Vorname, AbtNr und Abteilung sind nur von PersNr abhängig und müssen deswegen ausgegliedert werden (s. Tabelle 4). Relation Firma PersNr ProjektNr Zeit Relation Personal PersNr Name Vorname AbtNr. Abteilung 1 Lorenz Sophia 1 Personal 2 Hohl Tatjana 2 Einkauf 3 Willschrein Theodor 1 Personal 4 Richter Hans-Otto 3 Verkauf 5 Wiesenland Brunhilde 2 Einkauf Relation Projekt ProjektNr Beschreibung 2 Verkaufspromotion 3 Konkurrenzanalyse 1 Kundenumfrage Tabelle 4: Relation in zweiter Normalform Eine Relation befindet sich in der dritten Normalform, wenn sie in der zweiten Normalform ist und die Nichtschlüsselattribute voneinander nicht funktional abhängig sind, d.h. dass sich aus einem Nichtschlüsselattribut kein anderes Nichtschlüsselattribut ableiten lässt. Betrachtet man nun Tabelle 4, stellt man fest, dass sich aus der AbtNr die Abteilung ableiten lässt. Also werden die Attribute AbtNr und Abteilung in eine neue Relation gebracht. 3 Relation Firma Relation Personal Relation Projekt Relation Abt. PersNr ProjektNr Zeit PersNr Name Vorname AbtNr. 1 Lorenz Sophia 1 2 Hohl Tatjana 2 3 Willschrein Theodor 1 4 Richter Hans-Otto 3 5 Wiesenland Brunhilde 2 Tabelle 5: Relation in dritter Normalform ProjektNr Beschreibung 2 Verkaufspromotion 3 Konkurrenzanalyse 1 Kundenumfrage AbtNr. Abteilung 1 Personal 2 Einkauf 3 Verkauf In relativen Datenbanksystemen bringt man die Tabellen in die dritte Normalform, um Redundanzen zu vermeiden. Bei Data Warehouses ist es jedoch nicht erforderlich, die Tabellen 3 vgl. [Hemp02] Karin Schäuble Logische Modellierung von Data Warehouses Seite 16 von 32

17 ABGRENZUNG UND GRUNDLAGEN in die dritte Normalform zu bringen. Aus Gründen der Praktikabilität werden die Tabellen entweder denormalisiert oder die Normalisierung wird erst gar nicht ausgeführt, so dass alle Tabellen in der ersten Normalform vorliegen. Dies führt zu einer Entlastung des Systems, da durch die Denormalisierung eine Reduktion der Datenzugriffe erreicht wurde, und somit zu einer Verbesserung des Antwortverhaltens bei Abfragen. Die Probleme die bei operativen Systemen durch Anomalien auftreten, fallen hier teilweise oder ganz weg, denn der Zugriff auf die Daten erfolgt nur mit einer Lese-Berechtigung. Grundsätzlich tauchen bei Data Warehouses Schemata in denormalisierter und normalisierter Form auf. Ob nun die denormalisierte oder normalisierte Variante für einen Betrieb geeigneter ist, hängt von mehreren Faktoren ab. Diese muss der Betrieb für sich gegeneinander abwägen Aggregation Aggregation ist der Prozess, bei dem die Daten der niedrigeren Ebenen, z.b. alle Tageswerte zu einem Monatswert, zusammengefasst werden. Aggregationen können bei jeder Abfrage neu gebildet oder physisch in den Tabellen abgespeichert werden. Selbst bei perfektem Tuning eines Data Warehouse-Systems benötigt die Summierung von einigen Millionen Zeilen eine gewisse Zeit, angefangen von reinen Lesevorgängen von der Platte bis zur Sortierung der Endergebnisse. Da im allgemeinen aber eine größere Anzahl von Abfragen summierte Daten verlangt, ist eine vorsummierte Datenmenge aus Performanceüberlegungen sehr hilfreich. Die verdichteten Informationen stehen dann allen anderen Anwendern zur weiteren Bearbeitung zur Verfügung, so dass die entsprechenden Abfragen nicht mehrfach (für jede einzelne Anfrage erneut) ausgeführt werden müssen. Obwohl die Aggregation die Struktur eines Data Warehouses übersichtlicher macht und im allgemeinen die Antwortzeit der Abfragen beschleunigt, wird dadurch der Umfang der Datenspeicherung und der Aufwand der Datenverwaltung vergrößert. Die Dauer der Wartung steigt exponentiell mit der Anzahl der Aggregate. Deshalb ist es sehr wichtig zu entscheiden, was und wie zusammengefasst wird und welche Aggregationen erst bei der Abfrage gebildet werden. Durch Auswertungen von Statistiken kann im Betrieb herausgefunden werden, welche Aggregationen häufig genutzt werden und daher physikalisch abgespeichert werden sollten. Karin Schäuble Logische Modellierung von Data Warehouses Seite 17 von 32

18 ABGRENZUNG UND GRUNDLAGEN Abbildung 3: Verschiedene Aggregationsstufen am Beispiel der Umsatzwerte [ScBM99] Betrachtet man Abbildung 3, sieht man den Unterschied zwischen der Datenmenge, wenn man die Detaildaten des Produktes mit dem aggregierten Jahreswert des Produktes vergleicht. Dadurch hat man durch die Aggregation eine geringere Datenmenge die innerhalb einer Abfrage bearbeitet werden muss und somit erhält man performantere Abfragen. Karin Schäuble Logische Modellierung von Data Warehouses Seite 18 von 32

19 3 Anforderungen an die Modellierung Die Auswertung und Analyse von Daten ist eine der Schlüsselkomponenten im Data Warehouse. Da ein Data Warehouse keine eigenen Analyse-Tools besitzt, greift es auf das Technikkonzept OLAP zurück, das eine mehrdimensionale Sicht auf Daten und damit schnellere und komplexere Anfragen zur Entscheidungsunterstützung ermöglicht. Es ist ein Teilaspekt des Data Warehouse- Konzepts, da es sich nur mit der multidimensionalen Darstellung von numerischen Daten beschäftigt. Folglich muss man bei der Data Warehouse Modellierung auch die Anforderungen von OLAP mitbeachten. Codd formulierte zwölf Regeln, die die OLAP- Fähigkeit eines Informationssystems garantieren sollten. Diese Regeln wurden immer wieder erweitert, so dass derzeit ca. 50 Regeln existieren. Diese Regeln wurden von Pendse und Creeth unter dem Akronym FASMI (Fast Analysis of Shared Multidimensional Information) zusammengefasst 4 : - Geschwindigkeit (Fast): Abfragen an das System sollten sehr schnell sein. Bei einfachen und häufig gestellten Abfragen erwartet man eine Antwortzeit von nicht mehr als einer Sekunde, bei komplizierten und ad hoc- Abfragen von nicht mehr als 20 Sekunden. - Analysemöglichkeit (Analysis): Die Datenanalysen sollen mit Hilfe von statistischen Verfahren und Geschäftslogik durchführbar sein und sich in einfacher Form und ohne die Benutzung von anspruchsvollen Programmiersprachen realisieren lassen. - Gemeinsamer Zugriff (Shared): Die von Datenbanken gewohnten Sicherheitsanforderungen sollten erfüllt sein, d.h. es sollte Sicherheitsmechanismen für die Autorisation geben. Dieser Punkt spielt im Hinblick auf die logische Modellierung keine Rolle. - Multidimensionalität (Multidimensional): OLAP- Systeme sollten mehrdimensionale Auswertungen ermöglichen und Hierarchien unterstützen. - Kapazität (Information): 4 vgl. [Denf98] Karin Schäuble Logische Modellierung von Data Warehouses Seite 19 von 32

20 ANFORDERUNGEN AN DIE MODELLIERUNG Um dem Anwender Informationen liefern zu können, sollte der Zugriff auf alle benötigten Daten und abgeleiteten Informationen möglich sein, wobei die Datenherkunft und -menge jedoch keine Rolle spielen darf. 5 Unser Hauptaugenmerk liegt bei dem vierten Gesichtspunkt, der Multidimensionalität. Eine Umsetzungsmöglichkeit des multidimensionalen Datenmodells ist dessen Abbildung auf das relationale Datenmodell des Datenbanksystems. Eine Alternative wäre die direkte multidimensionale Datenspeicherung. Beide Möglichkeiten sind in kommerziellen OLAP- Produkten unterschiedlich realisiert. So gibt es einerseits das etablierte ROLAP (relationales OLAP) mit komplexen SQL-Anweisungen und das jüngere MOLAP (multidimensionales OLAP) mit einer einfacheren Anfrageformulierung. Diese Ausarbeitung konzentriert sich allerdings nur auf die relationale Abbildung multidimensionaler Konstrukte. Bei der Abbildung multidimensionaler Strukturen in ein relationales Datenmodell soll möglichst wenig anwendungsbezogene Semantik des multidimensionalen Modells verloren gehen. Ferner soll eine effiziente Übersetzung multidimensionaler Anfragen eine effiziente Abarbeitung der übersetzten Anfragen durch das relationale Datenbanksystem ermöglichen. Weitere Anforderungen sind: - Flexibilität: Die Datenstruktur soll gegenüber Änderungen flexibel sein. Erweiterungen sollten ohne allzu große Umstrukturierungen möglich sein. Dazu gehört neben der Struktur auch die Flexibilität der Anzahl an Dimensionen und Aggregationsebenen. Auch sollte die Unterstützung verschiedener Sichten auf den Datenbestand möglich sein. - Speicherplatz: Obwohl der Speicherplatz heutzutage nicht mehr so teuer ist wie er auch schon war, sollte darauf geachtet werden, dass sich der Speicherbedarf in Grenzen hält, um die Betriebskosten nicht unnötig in die Höhe zu treiben. - Verständlichkeit: Die Strukturen sollten aus fachlicher Sicht verständlich sein, da die Modellierung eines Schemata die Grundlage für die spätere Implementierung darstellt. - Wartung: Die Wartung der Tabellen sollte nicht zuviel Zeit in Anspruch nehmen. Daraus folgt, dass das Schema nicht zu komplex sein sollte. 5 vgl. [Toto00] und [ChGl99] Karin Schäuble Logische Modellierung von Data Warehouses Seite 20 von 32

Logische Modellierung von Data Warehouses

Logische Modellierung von Data Warehouses Logische Modellierung von Data Warehouses Vertiefungsarbeit von Karin Schäuble Gliederung. Einführung. Abgrenzung und Grundlagen. Anforderungen. Logische Modellierung. Methoden.. Star Schema.. Galaxy-Schema..

Mehr

Online Analytical Processing

Online Analytical Processing Online Analytical Processing Online Analytical Processing Online Analytical Processing (OLAP) ermöglicht die multidimensionale Betrachtung von Daten zwecks E rmittlung eines entscheidungsunterstützenden

Mehr

OLAP und Data Warehouses

OLAP und Data Warehouses OLP und Data Warehouses Überblick Monitoring & dministration Externe Quellen Operative Datenbanken Extraktion Transformation Laden Metadaten- Repository Data Warehouse OLP-Server nalyse Query/Reporting

Mehr

Data Warehouse Grundlagen

Data Warehouse Grundlagen Seminarunterlage Version: 2.10 Version 2.10 vom 24. Juli 2015 Dieses Dokument wird durch die veröffentlicht.. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen sind Warenzeichen

Mehr

Das Multidimensionale Datenmodell

Das Multidimensionale Datenmodell Das Multidimensionale Datenmodell Konzeptuelle Modellierung Umsetzung des Modells Beispiel ER-Modell 2 / 36 Probleme ER-Modellierung Keine Unterscheidung Klassifikation, Attribute, Kenngrößen Dimension

Mehr

Einführungsveranstaltung: Data Warehouse

Einführungsveranstaltung: Data Warehouse Einführungsveranstaltung: 1 Anwendungsbeispiele Berichtswesen Analyse Planung Forecasting/Prognose Darstellung/Analyse von Zeitreihen Performancevergleiche (z.b. zwischen Organisationseinheiten) Monitoring

Mehr

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation 27. Juni 2013 Hinweis Diese Folien ersetzen keinesfalls den Übungsstoff des zugehörigen e-learning-kurses.

Mehr

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher

Mehr

1 Einleitung. Betriebswirtschaftlich administrative Systeme

1 Einleitung. Betriebswirtschaftlich administrative Systeme 1 1 Einleitung Data Warehousing hat sich in den letzten Jahren zu einem der zentralen Themen der Informationstechnologie entwickelt. Es wird als strategisches Werkzeug zur Bereitstellung von Informationen

Mehr

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH Einführung in OLAP und Business Analysis Gunther Popp dc soft GmbH Überblick Wozu Business Analysis mit OLAP? OLAP Grundlagen Endlich... Technischer Background Microsoft SQL 7 & OLAP Services Folie 2 -

Mehr

MIS by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001

MIS by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001 MIS Glossar by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001 Aggregat Data Cube Data Marts Data Mining Data Warehouse (DWH) Daten Decision Support Systeme (DSS)

Mehr

CARL HANSER VERLAG. Karsten Oehler. OLAP Grundlagen, Modellierung und betriebswirtschaftliche Lösungen 3-446-21309-0. www.hanser.

CARL HANSER VERLAG. Karsten Oehler. OLAP Grundlagen, Modellierung und betriebswirtschaftliche Lösungen 3-446-21309-0. www.hanser. CARL HANSER VERLAG Karsten Oehler OLAP Grundlagen, Modellierung und betriebswirtschaftliche Lösungen 3-446-21309-0 www.hanser.de 1 Einleitung Die Entwicklung der Bereitstellung von Informationen zur Entscheidungsunterstützung

Mehr

Modellierung von OLAP- und Data- Warehouse-Systemen

Modellierung von OLAP- und Data- Warehouse-Systemen Andreas Totok Modellierung von OLAP- und Data- Warehouse-Systemen Mit einem Geleitwort von Prof. Dr. Burkhard Huch Deutscher Universitäts-Verlag Inhaltsverzeichnis Abbildungsverzeichnis Tabellenverzeichnis

Mehr

Data Warehouse Technologien

Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............

Mehr

Performance by Design Wie werden performante ETL-Prozesse erstellt?

Performance by Design Wie werden performante ETL-Prozesse erstellt? Performance by Design Wie werden performante ETL-Prozesse erstellt? Reinhard Mense ARETO Consulting Bergisch Gladbach Schlüsselworte: DWH, Data Warehouse, ETL-Prozesse, Performance, Laufzeiten, Partitionierung,

Mehr

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...

Mehr

Strategisches Informationsmanagement auf Basis von Data Warehouse-Systemen

Strategisches Informationsmanagement auf Basis von Data Warehouse-Systemen Strategisches Informationsmanagement auf Basis von Data Warehouse-Systemen SAS PharmaHealth & Academia Gabriele Smith KIS-Tagung 2005 in Hamburg: 3. März 2005 Copyright 2003, SAS Institute Inc. All rights

Mehr

10. Vorlesung: Datenorganisation SS 2007

10. Vorlesung: Datenorganisation SS 2007 10. Vorlesung: Datenorganisation SS 2007 8 Parallele Transaktionen 9 9.1 Drei-Ebenen Ebenen-Architektur 9.2 Verteilte Datenbanken 9.3 Client-Server Server-Datenbanken 9.4 Föderierte Datenbanken 9.5 Das

Mehr

Profilbezogene informatische Bildung in den Klassenstufen 9 und 10. Schwerpunktthema Daten und Datenbanken

Profilbezogene informatische Bildung in den Klassenstufen 9 und 10. Schwerpunktthema Daten und Datenbanken Profilbezogene informatische Bildung in den Klassenstufen 9 und 10 Schwerpunktthema Robby Buttke Fachberater für Informatik RSA Chemnitz Fachliche Einordnung Phasen relationaler Modellierung Fachlichkeit

Mehr

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII Vorwort zur zweiten Auflage...V Vorwort zur ersten Auflage... VIII 1 Management Support Systeme und Business Intelligence Anwendungssysteme zur Unterstützung von Managementaufgaben...1 1.1 Computergestützte

Mehr

Modellbasierte Business Intelligence in der Praxis. Nürnberg, 10.11.2009

Modellbasierte Business Intelligence in der Praxis. Nürnberg, 10.11.2009 Modellbasierte Business Intelligence in der Praxis Nürnberg, 10.11.2009 I N H A L T 1. Warum Modelle für Business Intelligence (BI)? 2. Inhalte von Datenmodellen für BI 3. Inhalte von Prozessmodellen 4.

Mehr

Vorwort zur 5. Auflage... 15 Über den Autor... 16

Vorwort zur 5. Auflage... 15 Über den Autor... 16 Vorwort zur 5. Auflage...................................... 15 Über den Autor............................................ 16 Teil I Grundlagen.............................................. 17 1 Einführung

Mehr

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem. Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen

Mehr

Eignung unterschiedlicher Faktenmodellierungen in Data Warehouse-Systemen

Eignung unterschiedlicher Faktenmodellierungen in Data Warehouse-Systemen Christoph Arnold (B. Sc.) Prof. Dr. Harald Ritz Eignung unterschiedlicher Faktenmodellierungen in Data Warehouse-Systemen AKWI-Tagung, 17.09.2012, Hochschule Pforzheim Christoph Arnold, Prof. Dr. Harald

Mehr

Themenblock: Erstellung eines Cube

Themenblock: Erstellung eines Cube Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen

Mehr

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Prof. Dr. Anett Mehler-Bicher Fachhochschule Mainz, Fachbereich Wirtschaft Prof. Dr. Klaus Böhm health&media GmbH 2011 health&media

Mehr

Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann

Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann Andreas Ditze MID GmbH Kressengartenstraße 10 90402 Nürnberg a.ditze@mid.de Abstract: Data Lineage

Mehr

Datenbanktechnologie für Data-Warehouse-Systeme

Datenbanktechnologie für Data-Warehouse-Systeme Wolfgang Lehner Datenbanktechnologie für Data-Warehouse-Systeme Konzepte und Methoden dpunkt.verlag 1 1.1 1.2 1.3 1.4 1. 5 2 2.1 2.2 2.3 Einleitung 1 Betriebswirtschaftlicher Ursprung des Data Warehousing...

Mehr

Asklepius-DA Die intelligente Technologie für die umfassende Analyse medizinischer Daten Leistungsbeschreibung

Asklepius-DA Die intelligente Technologie für die umfassende Analyse medizinischer Daten Leistungsbeschreibung Asklepius-DA Die intelligente Technologie für die umfassende Analyse medizinischer Daten Leistungsbeschreibung Datei: Asklepius DA Flyer_Leistung_2 Seite: 1 von:5 1 Umfassende Datenanalyse Mit Asklepius-DA

Mehr

Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH)

Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH) Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH) Verteilung und Integration von Informationen im Verkehrsbereich Thema: OLAP in verteilten Data-Warehouse- Umgebungen Vortrag: Christian

Mehr

Business Intelligence

Business Intelligence Business Intelligence Anwendungssysteme (BIAS) Lösung Aufgabe 1 Übung WS 2012/13 Business Intelligence Erläutern Sie den Begriff Business Intelligence. Gehen Sie bei der Definition von Business Intelligence

Mehr

Definition Informationssystem

Definition Informationssystem Definition Informationssystem Informationssysteme (IS) sind soziotechnische Systeme, die menschliche und maschinelle Komponenten umfassen. Sie unterstützen die Sammlung, Verarbeitung, Bereitstellung, Kommunikation

Mehr

eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator

eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator Agenda Was ist Business Intelligence? Was ist OLAP? Unterschied zwischen OLAP und OLTP? Bestandteile

Mehr

2 Datenbanksysteme, Datenbankanwendungen und Middleware... 45

2 Datenbanksysteme, Datenbankanwendungen und Middleware... 45 Vorwort 15 Teil I Grundlagen 19 i Einführung In das Thema Datenbanken 21 I.I Warum ist Datenbankdesign wichtig? 26 i.2 Dateisystem und Datenbanken 28 1.2.1 Historische Wurzeln 29 1.2.2 Probleme bei der

Mehr

Mala Bachmann September 2000

Mala Bachmann September 2000 Mala Bachmann September 2000 Wein-Shop (1) Umsatz pro Zeit und Produkt Umsatz Jan Feb Mrz Q1 Apr 2000 Merlot 33 55 56 144 18 760 Cabernet-S. 72 136 117 325 74 1338 Shiraz 85 128 99 312 92 1662 Rotweine

Mehr

Hetero-Homogene Data Warehouses

Hetero-Homogene Data Warehouses Hetero-Homogene Data Warehouses TDWI München 2011 Christoph Schütz http://hh-dw.dke.uni-linz.ac.at/ Institut für Wirtschaftsinformatik Data & Knowledge Engineering Juni 2011 1 Data-Warehouse-Modellierung

Mehr

Data Warehouse ??? Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle

Data Warehouse ??? Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle ??? Zusammenfassung, Ergänzung, Querverbindungen, Beispiele A.Kaiser; WU-Wien MIS 188 Data Warehouse Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle

Mehr

Relationale Datenbanken Datenbankgrundlagen

Relationale Datenbanken Datenbankgrundlagen Datenbanksystem Ein Datenbanksystem (DBS) 1 ist ein System zur elektronischen Datenverwaltung. Die wesentliche Aufgabe eines DBS ist es, große Datenmengen effizient, widerspruchsfrei und dauerhaft zu speichern

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining 2 Data Warehousing und Data Mining Kapitel 1: Data-Warehousing-Architektur von Geschäftsprozessen Mögliche Fragestellungen Wie entwickelt sich unser Umsatz im Vergleich zum letzten Jahr? In welchen Regionen

Mehr

Umsetzung der Anforderungen - analytisch

Umsetzung der Anforderungen - analytisch Umsetzung der Anforderungen - analytisch Titel des Lernmoduls: Umsetzung der Anforderungen - analytisch Themengebiet: New Economy Gliederungspunkt im Curriculum: 4.2.5.5 Zum Inhalt: In diesem Modul wird

Mehr

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Michael Hahne T&I GmbH Workshop MSS-2000 Bochum, 24. März 2000 Folie 1 Worum es geht...

Mehr

Business Intelligence

Business Intelligence Business Intelligence Anwendung 1 MInf1 HAW Hamburg Betreuender Professor: Prof. Dr. Zukunft by Jason Hung Vuong [12] Gliederung 1. Hamburg Energie Kooperation 2. Motivation 3. Business Intelligence 4.

Mehr

Management Support Systeme

Management Support Systeme Folie 1 Management Support Systeme Literatur zur Vorlesung MSS Gluchowski, Peter; Gabriel, Roland; Chamoni, Peter (1997): Management Support Systeme. Computergestützte Informationssysteme für Führungskräfte

Mehr

Data Warehouse und Data Mining

Data Warehouse und Data Mining Einführungsseminar Data Mining Seminarvortrag zum Thema: Data Warehouse und Data Mining Von gehalten am Betreuer: Dr. M. Grabert Einführung Problemstellung Seite 2 Einführung Unternehmen bekommen eine

Mehr

Einführung. Kapitel 1 2 / 508

Einführung. Kapitel 1 2 / 508 Kapitel 1 Einführung 2 / 508 Einführung Was ist ein Datenbanksystem (DBS)? Ein System zum Speichern und Verwalten von Daten. Warum kein herkömmliches Dateisystem verwenden? Ausfallsicherheit und Skalierbarkeit

Mehr

4 Grundlagen der Datenbankentwicklung

4 Grundlagen der Datenbankentwicklung 4 Grundlagen der Datenbankentwicklung In diesem Kapitel werden wir die Grundlagen der Konzeption von relationalen Datenbanken beschreiben. Dazu werden Sie die einzelnen Entwicklungsschritte von der Problemanalyse

Mehr

Ein Schlüssel ist eine Menge von Attributen (also eines oder mehrere), die eine Datenzeile (Tupel) einer Tabelle eindeutig identifiziert

Ein Schlüssel ist eine Menge von Attributen (also eines oder mehrere), die eine Datenzeile (Tupel) einer Tabelle eindeutig identifiziert Maika Büschenfeldt Datenbanken: Skript 1 1. Was ist eine relationale Datenbank? In Datenbanken können umfangreiche Datenbestände strukturiert abgelegt werden. Das Konzept relationaler Datenbanken soll

Mehr

Multidimensionales Datenmodell, Cognos

Multidimensionales Datenmodell, Cognos Data Warehousing (II): Multidimensionales Datenmodell, Cognos Praktikum: Data Warehousing und Mining Praktikum Data Warehousing und Mining, Sommersemester 2010 Vereinfachte Sicht auf die Referenzarchitektur

Mehr

Teil VI. Datenbanken

Teil VI. Datenbanken Teil VI Datenbanken Überblick 1 Grundlegende Begriffe Motivation 2 Relationale Datenbanksysteme Das Relationale Datenmodell SQL 3 Entwurf von Datenbanken Das Enity Relationship (ER) Modell Abbildung von

Mehr

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria Analyse von unstrukturierten Daten Peter Jeitschko, Nikolaus Schemel Oracle Austria Evolution von Business Intelligence Manuelle Analyse Berichte Datenbanken (strukturiert) Manuelle Analyse Dashboards

Mehr

Kapitel 2 Terminologie und Definition

Kapitel 2 Terminologie und Definition Kapitel 2 Terminologie und Definition In zahlreichen Publikationen und Fachzeitschriften tauchen die Begriffe Data Warehouse, Data Warehousing, Data-Warehouse-System, Metadaten, Dimension, multidimensionale

Mehr

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation Zusammenfassung OPAL 6. Übung Juni 2015 Agenda Hinweise zur Klausur Zusammenfassung OPAL Übungen / Kontrollfragen

Mehr

Intelligence (BI): Von der. Nürnberg, 29. November 2011

Intelligence (BI): Von der. Nürnberg, 29. November 2011 Modelle für Business Intelligence (BI): Von der Anforderung zum Würfel Nürnberg, 29. November 2011 Warum Modelle für Business Intelligence (BI)? Warum Modelle für Business Intelligence (BI)? Bis zur Auswertung

Mehr

IT-basierte Kennzahlenanalyse im Versicherungswesen

IT-basierte Kennzahlenanalyse im Versicherungswesen Angelina Jung IT-basierte Kennzahlenanalyse im Versicherungswesen Kennzahlenreporting mit Hilfe des SAP Business Information Warehouse Diplomica Verlag Angelina Jung IT-basierte Kennzahlenanalyse im Versicherungswesen:

Mehr

BI Konsolidierung: Anspruch & Wirklichkeit. Jacqueline Bloemen. in Kooperation mit

BI Konsolidierung: Anspruch & Wirklichkeit. Jacqueline Bloemen. in Kooperation mit BI Konsolidierung: Anspruch & Wirklichkeit Jacqueline Bloemen in Kooperation mit Agenda: Anspruch BI Konsolidierung Treiber Was sind die aktuellen Treiber für ein Konsolidierungsvorhaben? Kimball vs. Inmon

Mehr

proalpha Geschäftssoftware für den Mittelstand

proalpha Geschäftssoftware für den Mittelstand Whitepaper proalpha Geschäftssoftware für den Mittelstand Januar 2013 proalpha Integrierte Geschäftssoftware für den Mittelstand 2 Herausgegeben von proalpha Software AG Auf dem Immel 8 67685 Weilerbach

Mehr

Marketing Intelligence Architektur und Konzepte. Josef Kolbitsch Manuela Reinisch

Marketing Intelligence Architektur und Konzepte. Josef Kolbitsch Manuela Reinisch Marketing Intelligence Architektur und Konzepte Josef Kolbitsch Manuela Reinisch Übersicht Mehrstufiges BI-System Architektur eines Data Warehouses Architektur eines Reporting-Systems Benutzerrollen in

Mehr

Aufgabe 1: [Logische Modellierung]

Aufgabe 1: [Logische Modellierung] Aufgabe 1: [Logische Modellierung] a) Entwerfen Sie für das von Ihnen entworfene Modell aus Aufgabe 2 des 1. Übungsblattes ein Star-Schema. b) Entwerfen Sie für das vorangegangene Modell einen Teil eines

Mehr

Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH

Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH Dani Schnider Principal Consultant Business Intelligence BI Trilogie, Zürich/Basel 25./26. November 2009 Basel Baden Bern Lausanne Zürich

Mehr

Seminar C16 - Datenmodellierung für SAP BW

Seminar C16 - Datenmodellierung für SAP BW C16: Datenmodellierung für SAP BW Ein Seminar der DWH academy Seminar C16 - Datenmodellierung für SAP BW Dieses Seminar soll einen umfassenden Einblick in die Datenmodellierung beim Einsatz von SAP BW

Mehr

Datawarehouse Architekturen. Einheitliche Unternehmenssicht

Datawarehouse Architekturen. Einheitliche Unternehmenssicht Datawarehouse Architekturen Einheitliche Unternehmenssicht Was ist Datawarehousing? Welches sind die Key Words? Was bedeuten sie? DATA PROFILING STAGING AREA OWB ETL OMB*PLUS SAS DI DATA WAREHOUSE DATA

Mehr

Entscheidungsunterstützungssysteme

Entscheidungsunterstützungssysteme Vorlesung WS 2013/2014 Christian Schieder Professur Wirtschaftsinformatik II cschie@tu-chemnitz.eu Literatur zur Vorlesung Gluchowski, P.; Gabriel, R.; Dittmar, C.: Management Support Systeme und Business

Mehr

Modellbasierte Business Intelligence- Praxiserfahrungen in einem komplexen Data Warehouse Umfeld. München, 26. Januar 2010

Modellbasierte Business Intelligence- Praxiserfahrungen in einem komplexen Data Warehouse Umfeld. München, 26. Januar 2010 Modellbasierte Business Intelligence- Praxiserfahrungen in einem komplexen Data Warehouse Umfeld München, 26. Januar 2010 I N H A L T 1. Warum Modelle für Business Intelligence (BI)? 2. Inhalte von Datenmodellen

Mehr

Zeitgemäße Verfahren für ganzheitliche Auswertungen

Zeitgemäße Verfahren für ganzheitliche Auswertungen Intelligente Vernetzung von Unternehmensbereichen Zeitgemäße Verfahren für ganzheitliche Auswertungen Sächsische Industrie- und Technologiemesse Chemnitz, 27. Juni 2012, Markus Blum 2012 TIQ Solutions

Mehr

3 Bereitstellung von Informationen zur Aufgabenerfüllung

3 Bereitstellung von Informationen zur Aufgabenerfüllung 1 3 Bereitstellung von Informationen zur Aufgabenerfüllung Die Bereitstellung, der auf aufgrund der bisherigen Aufgaben hinsichtlich der Informationsmanagement (siehe Kapitel 1 und 2) benötigten Informationen,

Mehr

30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling

30. Juni 2006 - Technische Universität Kaiserslautern. Paul R. Schilling 30. Juni 2006 - Technische Universität Kaiserslautern Paul R. Schilling ! " #$% & '( ( ) *+, - '. / 0 1 2("$ DATEN SIND ALLGEGENWÄRTIG Bill Inmon, father of data warehousing Unternehmen In einer vollkommenen

Mehr

Von der spezialisierten Eigenentwicklung zum universellen Analysetool. Das Controlling-Informationssystem der WestLB Systems

Von der spezialisierten Eigenentwicklung zum universellen Analysetool. Das Controlling-Informationssystem der WestLB Systems Von der spezialisierten Eigenentwicklung zum universellen Analysetool Das Controlling-Informationssystem der WestLB Systems Begriffe und Definitionen Data Warehouse - Datensammlung oder Konzept?! Data

Mehr

4. Datenabfrage mit QBE 11

4. Datenabfrage mit QBE 11 Informationsbestände analysieren Datenabfrage mit QBE 4. Datenabfrage mit QBE 11 4.1. QBE vs. SQL Relationale Datenbanken haben schon früh den Anspruch gestellt, auch für Nicht- Informatiker nutzbar zu

Mehr

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse

Mehr

Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen Fragen Vertiefung Modellierung

Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen Fragen Vertiefung Modellierung Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation Zusammenfassung OPAL 24. Juni 2014 Agenda Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen

Mehr

Aufbau eines Data Warehouse für den Lebensmitteleinzelhandel

Aufbau eines Data Warehouse für den Lebensmitteleinzelhandel Die Fallstudie aus der Wirtschaftsinformatik: Aufbau eines Data Warehouse für den Lebensmitteleinzelhandel Dipl.-Kfm. Carsten Bange, Dr. Heiko Schinzer, Würzburg 1. Ausgangssituation Der hohe Wettbewerbsdruck

Mehr

Business Intelligence - Wie passt das zum Mainframe?

Business Intelligence - Wie passt das zum Mainframe? Business Intelligence - Wie passt das zum Mainframe? IBM IM Forum, 15.04.2013 Dr. Carsten Bange, Gründer und Geschäftsführer BARC Ressourcen bei BARC für Ihr Projekt Durchführung von internationalen Umfragen,

Mehr

In-Memory & Real-Time Hype vs. Realität: Maßgeschneiderte IBM Business Analytics Lösungen für SAP-Kunden

In-Memory & Real-Time Hype vs. Realität: Maßgeschneiderte IBM Business Analytics Lösungen für SAP-Kunden In-Memory & Real-Time Hype vs. Realität: Maßgeschneiderte IBM Business Analytics Lösungen für SAP-Kunden Jens Kaminski ERP Strategy Executive IBM Deutschland Ungebremstes Datenwachstum > 4,6 Millarden

Mehr

Performanceaspekte in der SAP BI Modellierung

Performanceaspekte in der SAP BI Modellierung Performanceaspekte in der SAP BI Modellierung SAP BW 7.3 & SAP HANA Performance Indizes Aggregate DSO & InfoCube BWA SAP HANA Empfehlung 2 Performance Performance bedeutet, unter gegebenen Anforderungen

Mehr

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken Dateiname: ecdl5_01_00_documentation_standard.doc Speicherdatum: 14.02.2005 ECDL 2003 Basic Modul 5 Datenbank - Grundlagen

Mehr

Unterstützung des PersonalControlling durch flexible IuK-Technologie Präsentation für die Tagung der IuK-Leiter am 23.09.2003

Unterstützung des PersonalControlling durch flexible IuK-Technologie Präsentation für die Tagung der IuK-Leiter am 23.09.2003 Data-Warehouse Unterstützung des PersonalControlling durch flexible IuK-Technologie Präsentation für die Tagung der IuK-Leiter am 23.09.2003 23.09.2003, Folie: 1 Data Warehouse Historie Architekturprinzip

Mehr

Oracle-Statistiken im Data Warehouse effizient nutzen

Oracle-Statistiken im Data Warehouse effizient nutzen Oracle-Statistiken im Data Warehouse effizient nutzen Reinhard Mense ARETO Consulting Köln Schlüsselworte: DWH, Data Warehouse, Statistiken, Optimizer, Performance, Laufzeiten Einleitung Für die performante

Mehr

VisualCockpit. agile business analytics

VisualCockpit. agile business analytics VisualCockpit agile business analytics Agile Business Analytics mit VisualCockpit Für Unternehmen wird es immer wichtiger die gesamte Wertschöpfungskette aus Daten, sowohl für das operative Geschäft als

Mehr

Oracle BI EE mit großen Datenmengen

Oracle BI EE mit großen Datenmengen Oracle BI EE mit großen Datenmengen Christian Casek Riverland Solutions GmbH München Schlüsselworte: Oracle BI EE, Oracle BI Applications, Informatica, RPD, große Datenmengen, Performance, Performanceoptimierung,

Mehr

Data Warehousing mit Oracle

Data Warehousing mit Oracle Data Warehousing mit Oracle Business Intelligence in der Praxis von Claus Jordan, Dani Schnider, Joachim Wehner, Peter Welker 1. Auflage Hanser München 2011 Verlag C.H. Beck im Internet: www.beck.de ISBN

Mehr

Carl-Christian Kanne. Einführung in Datenbanken p.1/513

Carl-Christian Kanne. Einführung in Datenbanken p.1/513 Einführung in Datenbanken Carl-Christian Kanne Einführung in Datenbanken p.1/513 Kapitel 1 Einführung Einführung in Datenbanken p.2/513 Einführung Was ist ein Datenbanksystem (DBS)? Ein System zum Speichern

Mehr

Moderne Data-Warehouse-Architekturen

Moderne Data-Warehouse-Architekturen Moderne Data-Warehouse-Architekturen Autor: Alfred Schlaucher, ORACLE Deutschland GmbH DOAGNews Q3_2004 Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der

Mehr

Christian Kurze BI-Praktikum IBM WS 2008/09

Christian Kurze BI-Praktikum IBM WS 2008/09 Einführung in die multidimensionale Datenmodellierung e mit ADAPT BI-Praktikum IBM WS 2008/09 1 Gliederung Einführung multidimensionale Datenmodellierung 1. Multidimensionales Modell BI-Praktikum IBM WS

Mehr

WAHLPFLICHTBEREICH WIRTSCHAFTSINFORMATIK 'DATA WAREHOUSE'

WAHLPFLICHTBEREICH WIRTSCHAFTSINFORMATIK 'DATA WAREHOUSE' Take control of your decision support WAHLPFLICHTBEREICH WIRTSCHAFTSINFORMATIK 'DATA WAREHOUSE' Sommersemester 2008 Gliederung Business Intelligence und Data Warehousing On-Line Analytical Processing Ziel

Mehr

Survival Guide für Ihr Business Intelligence-Projekt

Survival Guide für Ihr Business Intelligence-Projekt Survival Guide für Ihr Business Intelligence-Projekt Sven Bosinger Solution Architect BI Survival Guide für Ihr BI-Projekt 1 Agenda Was ist Business Intelligence? Leistungsumfang Prozesse Erfolgsfaktoren

Mehr

Raber+Märcker Business Intelligence Lösungen und Leistungen

Raber+Märcker Business Intelligence Lösungen und Leistungen Business Intelligence Raber+Märcker Business Intelligence Lösungen und Leistungen www.raber-maercker.de 2 LEISTUNGEN Business Intelligence Beratungsleistung Die Raber+Märcker Business Intelligence Beratungsleistung

Mehr

(Titel des Berichts)

(Titel des Berichts) (Titel des Berichts) Praxissemesterbericht von (Vorname Name) aus (Geburtsort) Matrikelnummer Anschrift Telefon HTW Aalen Hochschule für Technik und Wirtschaft Betreuender Professor Abgabetermin Angaben

Mehr

Star - Schema. AnPr. Name Klasse Datum. ANPR_StarSchema_v03.docx Seite 1

Star - Schema. AnPr. Name Klasse Datum. ANPR_StarSchema_v03.docx Seite 1 Name Klasse Datum 1 OLAP vs. OLTP In den RDBMS Konfigurationen unterscheidet man zwei verschiedene Grundtypen: OLTP: OnLine Transactional Processing ist für die Transaktionsprozesse und somit zur funktionalen

Mehr

Data Warehouse und Data Mining

Data Warehouse und Data Mining Data Warehouse und Data Mining Marktführende Produkte im Vergleich von Dr. Heiko Schinzer, Carsten Bange und Holger Mertens 2., völlig überarbeitete und erweiterte Auflage -. - Verlag Franz Vahlen München

Mehr

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse?

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse? Ein Beispiel Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse? Dipl.-Kfm. Claus Häberle WS 2015 /16 # 42 XML (vereinfacht) visa

Mehr

Oracle Warehouse Builder 3i

Oracle Warehouse Builder 3i Betrifft Autoren Art der Info Oracle Warehouse Builder 3i Dani Schnider (daniel.schnider@trivadis.com) Thomas Kriemler (thomas.kriemler@trivadis.com) Technische Info Quelle Aus dem Trivadis Technologie

Mehr

Data Warehouse Technologien

Data Warehouse Technologien mitp Professional Data Warehouse Technologien von Veit Köppen, Gunter Saake, Kai-Uwe Sattler 2. Auflage 2014 Data Warehouse Technologien Köppen / Saake / Sattler schnell und portofrei erhältlich bei beck-shop.de

Mehr

Objektorientierte Datenbanken

Objektorientierte Datenbanken OODB 11 Slide 1 Objektorientierte Datenbanken Vorlesung 11 vom 01.07.2004 Dr. Sebastian Iwanowski FH Wedel OODB 11 Slide 2 Inhalt heute: Datenbanken in betriebswirtschaftlichen Anwendungen OTLP (SAP) Data

Mehr

Seminar Data Warehousing. Seminar. Data Warehousing. Thema: Speichermodelle für Data-Warehouse-Strukturen

Seminar Data Warehousing. Seminar. Data Warehousing. Thema: Speichermodelle für Data-Warehouse-Strukturen Seminar Data Warehousing Thema: Speichermodelle für Data-Warehouse-Strukturen Friedrich-Schiller-Universität Jena Fakultät für Mathematik und Informatik Institut für Informatik Lehrstuhl für Datenbanken

Mehr

Kapitel 4: Data Warehouse Architektur

Kapitel 4: Data Warehouse Architektur Data Warehousing, Motivation Zugriff auf und Kombination von Daten aus mehreren unterschiedlichen Quellen, Kapitel 4: Data Warehousing und Mining 1 komplexe Datenanalyse über mehrere Quellen, multidimensionale

Mehr

Einführung. Informationssystem als Abbild der realen Welt

Einführung. Informationssystem als Abbild der realen Welt Was ist ein Datenbanksystem? Anwendungsgrundsätze Betrieb von Datenbanksystemen Entwicklung von Datenbanksystemen Seite 1 Informationssystem als Abbild der realen Welt Modellierung (Abstraktion) Sachverhalte

Mehr

Softwaretool Data Delivery Designer

Softwaretool Data Delivery Designer Softwaretool Data Delivery Designer 1. Einführung 1.1 Ausgangslage In Unternehmen existieren verschiedene und häufig sehr heterogene Informationssysteme die durch unterschiedliche Softwarelösungen verwaltet

Mehr

Datenbanken. Dateien und Datenbanken:

Datenbanken. Dateien und Datenbanken: Dateien und Datenbanken: Professionelle Anwendungen benötigen dauerhaft verfügbare, persistent gespeicherte Daten. Datenbank-Systeme bieten die Möglichkeit, Daten persistent zu speichern. Wesentliche Aspekte

Mehr

BARC-Studie Data Warehousing und Datenintegration

BARC-Studie Data Warehousing und Datenintegration Ergebnisse der BARC-Studie Data Warehouse Plattformen Dr. Carsten Bange BARC-Studie Data Warehousing und Datenintegration Data-Warehouse -Plattformen und Datenintegrationswerkzeuge im direkten Vergleich

Mehr

Datenbanken: Relationales Datenbankmodell RDM

Datenbanken: Relationales Datenbankmodell RDM Das RDM wurde in den 70'er Jahren von Codd entwickelt und ist seit Mitte der 80'er Jahre definierter Standard für Datenbanksysteme! Der Name kommt vom mathematischen Konzept einer Relation: (Sind A, B

Mehr