Seminar Data Warehousing. Seminar. Data Warehousing. Thema: Speichermodelle für Data-Warehouse-Strukturen

Größe: px
Ab Seite anzeigen:

Download "Seminar Data Warehousing. Seminar. Data Warehousing. Thema: Speichermodelle für Data-Warehouse-Strukturen"

Transkript

1 Seminar Data Warehousing Thema: Speichermodelle für Data-Warehouse-Strukturen Friedrich-Schiller-Universität Jena Fakultät für Mathematik und Informatik Institut für Informatik Lehrstuhl für Datenbanken und Informationssysteme Ernst-Abbe-Platz Jena Lehrstuhlinhaber Prof. Dr. Klaus Küspert von Antje Höll Betreuer: Dipl.-Inf. David Wiese

2 Gliederung 1 Einleitung Begriffsdefinition Relationale Speicherung Star Schema Snowflake Schema Mischformen Factless Fact Table Galaxy Schema Fact Constellation Schema Darstellungsarten für Klassifikationshierarchien Horizontale Darstellung Vertikale Darstellung Kombinierte Darstellung Multidimensionale Speicherung Datenstrukturen Speicherung Probleme bei der Array-Speicherung Grenzen der multidimensionalen Datenhaltung HOLAP Vergleich (ROLAP, MOLAP, HOLAP) Fazit Abbildungsverzeichnis Literaturverzeichnis I

3 1 Einleitung Bei einem Data Warehouse System handelt es sich um eine Sammlung von unterschiedlichen Technologien, welche dem geschulten Mitarbeiter (Beispielsweise einem Datenerfasser, Manager, Analytiker, Sachbearbeiter) ermöglicht, dass er seine Entscheidungen schneller und qualitativ besser treffen kann. Von einem solchen System wird erwartet, dass die richtigen Informationen zum richtigen Zeitpunkt am richtigen Ort sind, damit die richtigen Entscheidungen getroffen werden können. Ein Data Warehouse ist ein wichtiges System zur Integration von unterschiedlichen Informationsquellen innerhalb einer Unternehmung. [3] In der Abb.1 ist ein Überblick über eine mögliche Architektur eines Data-Warehouse- Systems gegeben. Abb.1: Das Data-Warehouse-Prinzip [4] Diese Arbeit befasst sich im Rahmen des Seminars Data Warehousing mit den Speichermodellen für die Data-Warehouse-Strukturen. Dabei werden im nachfolgenden Abschnitt die Begriffe Kennzahl, Dimension, Hierarchie und Datenwürfel kurz erklärt. Der dritte Abschnitt befasst sich mit der relationalen Speicherung und es werden mögliche Schemata erläutert, wie man multidimensionale Datenmodelle auf relationale Datenmodelle abbilden kann. Im vierten Abschnitt 1

4 wird die multidimensionale Speicherung vorgestellt. Es werden u.a. Speicherungsmöglichkeiten genannt und einige Grenzen der Datenhaltung aufgezeigt. Abschließend werden die zwei Möglichkeiten zur Speicherung des multidimensionalen Datenmodells und eine Kombination beider Modelle tabellarisch verglichen. 2 Begriffsdefinition Zunächst werden einige Begriffe des multidimensionalen Datenmodells erläutert, die zum besseren Verständnis beitragen sollen. Kennzahlen sind numerische Messgrößen, die betriebswirtschaftliche Sachverhalte beschreiben. Als Beispiele sind hierfür Umsatz, Gewinn, Verlust oder Deckungsbeitrag zu nennen. Eine mögliche Sicht auf die assoziierten Kennzahlen geben Dimensionen. Sie sind eine endliche Menge von n (n 2) Dimensionselementen (Hierarchieobjekten), die eine semantische Beziehung aufweisen und der orthogonalen Strukturierung des Datenraums dienen. Produkt, Geographie und Zeit sind Beispiele für Dimensionen. Um die Hierarchien in den Dimensionen darzustellen, verwendet man ein Klassifikationsschema. Der Datenwürfel, auch Hypercube genannt, besteht aus mehreren Dimensionen zur Identifikation von Kennzahlen. Eine OLAP-Anwendung kann aus einem oder mehreren Datenwürfeln bestehen. 3 Relationale Speicherung Die relationale Speicherung eines multidimensionalen Datenmodells, die auch RO- LAP (relational OLAP) genannt wird, setzt auf herkömmlichen relationalen Datenbanken auf. Somit wird eine multidimensionale Analyse auf einer relationalen Datenbank ermöglicht. Die Daten werden hierbei in Relationen gespeichert, die sich gut als Tabellen visualisieren lassen. Für eine effiziente Abbildung von multidimensionalen Konstrukten auf relationale Datenbankschemata sind einige Anforderungen zu beachten. Zum einen sollten die multidimensionale Anfragen effizient in die entsprechenden relationalen Anfragen zu übersetzten und abzuarbeiten sein. Zum anderen sollte der Verlust an anwendungs- 2

5 bezogener Semantik möglichst gering ausfallen und die Wartbarkeit der relationalen Tabellen einfach und schnell zu realisieren sein. Um die Strukturen eines Datenwürfels abbilden zu können, wird bei der relationalen Speicherung eine Trennung von Struktur und Inhalt vorgenommen. Das heißt, man unterscheidet zwischen Faktentabellen und Dimensionstabellen. Die Faktentabelle ist relativ einfach zu realisieren, da sie den Datenwürfel ohne Klassifikationshierarchien speichert. Dabei werden die Dimensionen des Würfels als Spalten und jede Not Null- Zelle als ein Tupel der Relation aufgefasst. Ein Beispiel für eine Faktentabelle ist in der Abb. 2 dargestellt. Hierbei wird ein Teil der Spalten als Dimensionen und der andere Teil der Spalten als Kennzahlen betrachtet und somit ist der Datenwürfel äquivalent zur resultierenden Tabelle, der Faktentabelle. Abb.2: Dualismus von Würfel und Tabelle [5] Für die Abbildung der Klassifikationshierarchien eignen sich verschiedene Schemata, die nachfolgend beschreiben werden. 3.1 Star Schema Die zentrale Faktentabelle im Star Schema beinhaltet einen Primärschlüssel, der aus den Primärschlüsseln der Dimesionstabellen zusammengesetzt sein kann, und Spalten für die zu analysierenden Geschäftsdaten (Kennzahlen). Im Allgemeinen ist sie die längste Tabelle im Star Schema, da sie sehr viele Tupel enthält. Pro Dimension enthält das Star Schema eine Dimensionstabelle, welche komplett denormalisiert ist. Jede Dimensionstabelle enthält einen Primärschlüssel, die hierarchische Struktur der jeweiligen Dimension und die qualifizierenden Attribute. Die Dimensionstabellen sind im Vergleich zu der Faktentabelle durch die vielen Attribute wesentlich breiter und die Korrelation zur Faktentabelle geschieht mittels Fremdschlüsselbeziehungen. Die 3

6 Abb.3 zeigt die sternförmige Darstellung der Dimensionstabellen um die Faktentabelle, welches dem Schema den Namen gibt. Durch die Denormalisierung liegen in den Dimensionstabellen Redundanzen vor, die zu Änderungsanomalien führen können. Trotzdem führen diese Redundanzen zu einer schnelleren Anfragebearbeitung, da nicht, wie in normalisierten Schemata, erst Joins über mehrere Tabellen gemacht werden müssen. Weitere Vorteile bieten der einfache Aufbau der Dimensionstabellen und die einfache und flexible Darstellung von Klassifikationshierarchien. Abb.3: Beispiel für ein Star Schema [1], S.206 Diese Eigenschaften führen dazu, dass das Star Schema ein verbreitetes Modell für das Data Warehouse Design ist. 3.2 Snowflake Schema Im Gegensatz zum Star Schema sind die Dimensionstabellen hier normalisiert. Das heißt, für jede Klassifikationsstufe wird eine eigene Relation angelegt. Diese Dimensionstabellen enthalten jeweils einen Primärschlüssel und beschreibende Attribute. Die 1:n-Beziehung zwischen zwei übereinander liegenden Klassifikationsstufen wird mittels eines Fremdschlüssels von der tiefer liegenden auf die nächst höhere Stufe dargestellt. In der Abbildung 4 ist eine graphische Darstellungsmöglichkeit des Snowflake Schemas zu sehen. Da diese entfernt an eine Schneeflocke erinnert, bekam diese Art von Schema ihren Namen. 4

7 Die Kennzahlen werden, wie bei dem Star Schema beschrieben, mit Hilfe einer Faktentabelle verwaltet, wobei die Dimensionsspalten aus Fremdschlüsseln auf die Dimensionselemente der niedrigsten Stufe bestehen. Den Primärschlüssel der Faktentabelle bilden alle diese Fremdschlüssel. Abb.4: Beispiel für ein Snowflake Schema [1], S.204 Ein Vorteil dieses Modells ist die Vermeidung von Änderungsanomalien, da die Dimensionstabellen normalisiert sind. Aber durch die höhere Anzahl an Dimensionstabellen wird das Snowflake Schema wesentlich komplexer, was eine aufwendigere Administration, erhöhte Zugriffskosten durch die vielen benötigten Joins und eine schlechtere Performance zur Folge hat. 3.3 Mischformen Welches der beiden Schemata besser geeignet ist, hängt vom Anwendungsprofil ab. In der Realität verwendet man aber häufig Mischformen, um die spezifischen Nachteile von Star und Snowflake Schema zu vermeiden bzw. deren spezifische Vorteile zu nutzen. 5

8 3.3.1 Factless Fact Table Factless Fact Tables enthalten, wie der Name schon sagt, in den Faktentabellen keine Kenngrößen. Dies kann dann eintreten, wenn nur das Auftreten eines bestimmten Ereignisses aufgezeichnet werden soll, z.b. wenn nur das Faktum, dass ein bestimmter Kunde ein bestimmtes Produkt zu einer bestimmten Zeit gekauft hat, von Interesse ist Galaxy Schema Da die Geschäftssituation in der Regel sehr komplex ist, gibt es in einem Unternehmen sehr viele Kenngrößen mit jeweils unterschiedlichen Dimensionen. Für diese Modellierung eignet sich das Galaxy Schema. Es enthält mehrere unabhängige Faktentabellen, die teilweise mit den gleichen Dimensionstabellen verknüpft sind. Diese Faktentabellen entstehen, wenn die Kennzahlen durch unterschiedliche Dimensionen beschrieben werden. In der Abbildung 5 ist dies gut dargestellt, denn die zwei Faktentabellen Einkauf und Verkauf entstehen, weil die Kennzahlen Einkaufsmenge und Verkaufsmenge nicht auf die identischen Dimensionstabellen zugreifen. Abb.5: Beispiel für ein Galaxy Schema [6] Fact Constellation Schema Mit dem Fact Constellation Schema können gegenüber den bisher erläuterten Schemata auch aggregierte Kennzahlen in zusätzlichen Faktentabellen abgespeichert werden. Das Attribut Ebene, welches zur Unterscheidung der Klassifikationsstufen 6

9 in den Dimensionstabellen dient und in einigen Modellen verwendet werden kann, wird hier nicht benötigt. Des Weiteren erreicht man, im Vergleich zur Aggregation in einer Tabelle, eine höhere Performance. Dennoch kann das Schema durch eine Vielzahl von Faktentabellen schnell unübersichtlich werden und schwerer zu handhaben sein. 3.4 Darstellungsarten für Klassifikationshierarchien Im Folgenden werden weitere Möglichkeiten zur denormalisierten Darstellung von Klassifikationen erläutert Horizontale Darstellung Bei der Horizontalen Darstellung werden die Stufen der Klassifikationshierarchie als Spalten in eine denormalisierte Dimensionstabelle modelliert. Damit sind Einschränkungen auf höherer Granularität auch ohne teuere Verbundoperationen (Joins) abarbeitbar. Aber bei Anfragen bestimmter Stufen muss eine Duplikateliminierung erfolgen, die durch die erforderliche Sortierung relativ teuer ist. Die Anordnung der Spalten nebeneinander gibt dem Namen, wie man in der Abb. 6 sehen kann. Produkt_ID Artikel Produktgruppe Produktfamilie Kategorie 1234 Lavamat S Waschmaschinen Waschgeräte weiße Ware 1235 Duett Waschmaschinen Waschgeräte weiße Ware 1236 Novotronic Trockner Waschgeräte weiße Ware 1237 Vento 500 Trockner Waschgeräte weiße Ware Abb.6: Horizontale Darstellung einer Klassifikationshierarchie [1], S Vertikale Darstellung Diese Darstellung verwendet eine denormalisierte Dimensionstabelle mit zwei Attributen, eine Dimensions_ID und eine Eltern_ID, wobei die Dimensions_ID ein Schlüssel ist, der die Beziehung zur Faktentabelle schafft und die Eltern_ID einem Attributwert der Dimensions_ID der nächsthöheren Stufe entspricht (Abb. 7). Da das Tabellenschema keine strukturellen Informationen über das Klassifikationsschema enthält, ist eine Änderung am Klassifikationsschema relativ leicht möglich. Ein Nachteil wäre, dass für Anfragen auf einzelnen Stufen mehrere teure Verbundoperationen (engl. self-join) notwendig sind. 7

10 Dimensions_ID Lavamat S Duett Novotronic Vento 500 Waschmaschinen Trockner Waschgeräte Eltern_ID Waschmaschinen Waschmaschinen Trockner Trockner Waschgeräte Waschgeräte weiße Ware Abb.7: Vertikale Darstellung einer Klassifikationshierarchie [1], S Kombinierte Darstellung Die kombinierte Darstellung verbindet die beiden vorher beschrieben Strategien. Hierbei werden Klassifikationsstufen als Spalten repräsentiert, wobei die Spalten generisch bezeichnet werden (Dimensions_ID, Stufe1_ID, Stufe2_ID,, Stufe (explizite Angabe der Stufenebene)) und die Knoten aller höheren Stufen als Tupel gespeichert. Die Abb. 8 zeigt das Resultat. Dimensions_ID Stufe1_ID Stufe2_ID Stufe3_ID Stufe Lavamat S Waschmaschinen Waschgeräte weiße Ware 0 Duett Waschmaschinen Waschgeräte weiße Ware 0 Novotronic Trockner Waschgeräte weiße Ware 0 Vento 500 Trockner Waschgeräte weiße Ware 0 Waschmaschinen Waschgeräte weiße Ware NULL 1 Trockner Waschgeräte weiße Ware NULL 1 Waschgeräte weiße Ware NULL NULL 2 Abb.8: Kombinierte Darstellung einer Klassifikationshierarchie [1], S Multidimensionale Speicherung Multidimensionale Datenbanken setzen die auf konzeptioneller Ebene dargestellten multidimensionalen Datenstrukturen physisch um. Es wird eine Zellenstruktur gebaut, in der jede Zelle entlang der entsprechenden Dimensionen indiziert werden kann. Solche Systeme, die ihre Daten in einem multidimensionalen Feld speichern, werden auch multidimensional OLAP (MOLAP) genannt. Für die Speicherung werden multidimensionale Datenbankmanagementsysteme (MDBMS) verwendet. 8

11 4.1 Datenstrukturen Da die Dimensionen und Würfel grundlegende Datenbankobjekte eines MDBMS sind, werden sie genauer betrachtet. In Bezug auf die Speicherung sind Dimensionen endlich geordnete Listen von Dimensionswerten, welche die Dimensionselemente auf allen Klassifikationsstufen enthalten. Indem man die Dimensionswerte auf eine Indexmenge abbildet, erreicht man ihre Ordnung. Dadurch sind sie mittels der Ordnungszahl eindeutig identifizierbar und für die spätere Array-Umsetzung wird der Indexzugriff einfacher. Eine Dimension D mit m Dimensionswerten kann man formal als m-tupel darstellen: D = ( x D 1, x D 2,..., x D m ). Einen mehrdimensionalen Würfel kann man durch die Kombination mehrere Dimensionen definieren. Hierbei hilft die Vorstellung, dass die n Dimensionen einen n- dimensionalen Raum aufspannen. Die m verschiedenen Werte einer Dimension teilen diesen Würfel in m verschiedene parallele Ebenen. Der Schnittpunkt von n Ebenen eines n-dimensionalen Würfels bezeichnet eine Zelle, welche die jeweiligen Kennzahlen enthält. Diese Zelle kann eindeutig über ein n-tupel von Dimensionswerten angesprochen werden, wobei der i-te Wert des Tupels ein Wert der Dimension D i ist. Einen Würfel kann folgendermaßen beschreiben werden: W = (( D, D,..., D ),( M : Typ,..., M : Typ )) 1 2 n 1 1 m m D i : Dimensionen, M i :Typ i : Kenngrößen des Würfels mit dem jeweiligen Datentyp Besonders betrachtet werden müssen leere Zellen und dabei vor allem die Ursache warum sie leer sind (z.b. kein Wert verfügbar oder Wert aufgrund der Semantik der Anwendung nicht sinnvoll). Für die verschiedenen Fälle muss dann jeweils ein Symbol zur Darstellung definiert werden. 4.2 Speicherung Die multidimensionale Speicherung basiert im Wesentlichen auf multidimensionalen Arrays. Dabei werden die Zellen eines mehrdimensionalen Würfels sequentiell in ein n-dimensionales Array, dessen Indizes die Koordinaten der Würfelzellen bilden, gespeichert. Dieses Array muss wiederum zum Speichern in eine eindimensionale Liste oder in ein eindimensionales Array überführt werden, was als Linearisierung be- 9

12 zeichnet wird. Es gibt verschiedene Linearisierungsreihenfolgen. In Abb. 9 ist eine Array-Linearisierung für ein dreidimensionales Array dargestellt. Abb.9: Linearisierungsreihenfolge [1], S.236 Allgemein lässt sich daraus folgende Berechnungsvorschrift für den Array-Index der Zelle z(x 1, x 2,, x n ), xi Di, eines Würfels ableiten: Index( z) = x + ( x 1) D + ( x 1) D D ( x 1) D... D n 1 n 1 n = 1 + ( x 1) i 1 i j= 1 j= 1 D j Anhand zweier Beispiele soll die Array-Speicherung genauer verdeutlicht werden. In Abb. 10 ist eine Adressberechnung in einem zweidimensionalen Array dargestellt, wobei die Dimension Produkt die Werteliste (Hosen, Hemden, ) enthält und die Dimension Zeit aus der Werteliste (Januar, Februar, ) besteht. Die jeweiligen Ordnungszahlen stehen in Klammern. Um beispielsweise den Indexwert für die Zelle (Kleider, März) zu errechnen, muss folgende Berechnung erfolgen, die sich aus der allgemeinen Berechnungsvorschrift für den Array-Index ergibt: 1 + ( x 1) + ( x 1) D = = Abb.10: Beispiel für eine Adressberechnung [1], S.236 Abb. 11 illustriert die Adressberechnung in einem dreidimensionalen Datenwürfel. Wie hier die Reihenfolge der Würfelzellen in einem Array ist, wird in der nebenste- 10

13 henden Abbildung gezeigt. Die Berechnung der einzelnen Indexwerte erfolgt mittels dieser Berechnungsvorschrift: Index( z) (( x ( D 1) x ) ( D 1)) x = mit z x0 xn 1 = (,..., ). ALL entspricht hierbei den summierten Werten pro Dimension. Somit ergibt sich beispielsweise für die Zelle (ALL,ALL,ALL) bzw. (5,4,3) ein Indexwert von (5(4 + 1) + 4) (3 + 1)) + 3 = 119. Reihenfolge der Würfelzellen im Array Abb.11: dreidimensionaler Würfel [2], S.37/ Probleme bei der Array-Speicherung Eines der Hauptprobleme bei der Array-Speicherung stellt die Tatsache dar, dass in der Realität die Würfel zumindest auf der Detailebene dünn besetzt sind. Für die Berechnung der Position einer Zelle in einem eindimensionalen Array ist es notwendig, dass für leere Zellen Platz reserviert wird. Somit werden beim Auslesen von vielen Leerzellen, bei gleicher Menge an Seiten, weniger effektive Daten übertragen. Ein weiteres Problem ergibt sich bei ungünstig gewählten Linearisierungsreihenfolgen, da dadurch die Anzahl der Plattenzugriffe beeinflusst wird und somit auch die Anfrageperformance. Dies ist natürlich auch abhängig von der Art der Anfrage. Ziel ist es also, so wenig wie möglich Lesevorgänge zu haben, damit die gewünschten Daten schneller angezeigt werden können. Deshalb ist bei der Definition eines Würfels die Reihenfolge der Dimensionen zu beachten. 11

14 4.3 Grenzen der multidimensionalen Datenhaltung Durch die multidimensionale Speicherung kann man zwar eine hohe Anfragegeschwindigkeit erreichen, aber aufgrund von dünn besetzten Datenräumen kann bei Würfeln mit steigender Größe irgendwann eine Skalierungsgrenze erreicht werden. Ein weiterer Grund ist die vorausgesetzte Ordnung der Dimensionswerte bei der Array-Speicherung, denn dies erschwert zeitliche Änderungen an den Dimensionen. So kann das Einfügen neuer Werte oder neuer Klassifikationsstufen eine vollständige Reorganisation des Würfels bedeuten. Weiterhin gibt es für die MDBMS im Moment noch keinen Standard, wie bei den relationalen DBMS das SQL. Man spricht von so genannten proprietären MDBMS. Eine weitere Grenze stellt das Spezialwissen dar, welches zur Erstellung und Wartung der MDBMS erforderlich ist. Dieses Wissen unterscheidet sich immer noch stark von den Kenntnissen für relationale Datenbanken. 4.4 HOLAP Der Ansatz der hybriden Speicherung (Hybrides OLAP) soll die Vor- und Nachteile der vorher beschriebenen Ansätze verbinden. Die Idee ist hier, Detaildaten, die meist in großer Anzahl vorliegen, in einer relationalen Datenbank zu speichern und aggregierte Daten in multidimensionalen Strukturen abzulegen, um einen schnellen Zugriff auf die oberste Klassifikationsstufen zu gewährleisten, da in den aggregierten Daten keine Nulls enthalten sind. Der Zugriff erfolgt über die multidimensionale Datenbank durch ein multidimensionales Anfragewerkzeug. Bei jeder Anfrage wird individuell entschieden, ob die Daten in der multidimensionalen Welt vorliegen, ob sie in der relationalen Welt vorliegen und von dort gelesen werden müssen oder die dritte Möglichkeit, dass sie nur aus Berechnungen von Daten aus beiden Welten zu gewinnen sind. Die Entscheidungsfindung über den nötigen Beschaffungsweg der Daten ist für den Anwender transparent. Die Art der Verteilung auf relationale bzw. multidimensionale Datenbanken ist anwendungsspezifisch. Dennoch wird dieser Ansatz in der Realität wenig verwendet, da für dessen Entwicklung ein umfassendes Wissen aus beiden Welten notwendig ist und sich der Implementierungsaufwand als sehr aufwendig erweist. 12

15 5 Vergleich (ROLAP, MOLAP, HOLAP) In dieses Kapitel werden die Vor- und Nachteile drei Ansätze tabellarisch gegenübergestellt. ROLAP MOLAP HOLAP Vorteile - verwendet bewährte Datenbanktechnologie - Standard- Abfragesprache (SQL) - beliebige Skalierbarkeit - effiziente Speicherung großer Datenmengen - Antwortzeiten bei kleineren Datenmengen sehr gut - effiziente multidimensionale Speicherstrukturen - meist eigene, multidimensionale Abfragesprache, - vereinigt das Beste aus ROLAP und MO- LAP - MDDB-System greift nicht mehr auf die o- perativen Systeme zu, sondern auf ein relationales DW - zahlreiche erfolgreiche DW-Lösungen basieren auf einer RO- LAP-Architektur i.a. ver- ständlicher als SQL Nachteile - Standard-SQL für multidimensionale Analysen nur bedingt ausreichend - schlechtere Performance (durch Datenredundanz kompensierbar) - proprietäre MDDB- Systeme werden eingesetzt, keine Abfragesprache als Standard definiert - eingeschränktes Datenvolumen - umfangreiche Kenntnisse über RO- LAP und MOLAP - enormer Implementierungs-Aufwand - keine einheitliche OLAP- Abfragesprache - Schnittstelle zu einem RDBMS notwendig - zusätzliche Laderoutinen von RDBMS zum MDBMS 13

16 6 Fazit Für die Speicherung von multidimensionalen Datenstrukturen kann man die relationale oder die multidimensionale Speicherung wählen. Diese beiden Ansätze wurden in dieser Arbeit vorgestellt. Eine generelle Empfehlung, welche Vorgehensweise am Besten geeignet ist, kann man nicht geben. Jedoch kann man sagen, dass sich die relationale Speicherung sehr gut für dünn besetzte Würfel eignet, da sie auf herkömmlich relationale Datenbanken aufbaut, für die große Datenmengen verwalten kann und eine leichte Skalierbarkeit ermöglicht. Das heißt, je größer die zu speichernde Datenmenge, desto eher überwiegen die Vorteile einer ROLAP-Lösung. Im Gegensatz dazu, ist die multidimensionale Speicherung u.a. wegen der Array- Speicherung bei dicht besetzten Würfeln vorzuziehen. 14

17 Abbildungsverzeichnis Seite Abb.1 Das Data-Warehouse-Prinzip 1 Abb.2 Dualismus von Würfel und Tabelle 3 Abb.3 Beispiel für ein Star Schema 4 Abb.4 Beispiel für ein Snowflake Schemas 5 Abb.5 Beispiel für ein Galaxy Schema 6 Abb.6 Horizontale Darstellung einer Klassifikationshierarchie 7 Abb.7 Vertikale Darstellung einer Klassifikationshierarchie 8 Abb.8 Kombinierte Darstellung einer Klassifikationshierarchie 8 Abb.9 Linearisierungsreihenfolge 10 Abb.10 Beispiel für eine Adressberechnung 10 Abb.11 dreidimensionaler Würfel 11 II

18 Literaturverzeichnis [1] Bauer, A; Günzel, H.: Data Warehouse Systeme. Architektur, Entwicklung, Anwendung. Heidelberg: dpunkt.verlag [2] Tam, Y.J.: Datacube: Its implementation and application in OLAP mining. MSc.Thesis, Simon Fraser University, Canada Internetquellen [3] _implementierung.pdf, S.10, [4] ceus-stammtisch pdf, S.8, [5] VL-03---Multidim-Datenmodell.pdf, S.31, [6] WS0203/Thema%2010.pdf, S.14, III

Multidimensionales Datenmodell

Multidimensionales Datenmodell Multidimensionales Datenmodell Grundbegriffe fi Fakten, Dimensionen, Würfel Analyseoperationen fi Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung fi ME/R, ADAPT Relationale

Mehr

Das Multidimensionale Datenmodell

Das Multidimensionale Datenmodell Das Multidimensionale Datenmodell Konzeptuelle Modellierung Umsetzung des Modells Beispiel ER-Modell 2 / 36 Probleme ER-Modellierung Keine Unterscheidung Klassifikation, Attribute, Kenngrößen Dimension

Mehr

Kapitel 6 Einführung in Data Warehouses

Kapitel 6 Einführung in Data Warehouses Kapitel 6 Einführung in Data Warehouses Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2008, LMU München 2008 Dr. Peer Kröger Dieses Skript basiert zu einem Teil auf dem Skript zur Vorlesung

Mehr

Aufgabe 1: [Logische Modellierung]

Aufgabe 1: [Logische Modellierung] Aufgabe 1: [Logische Modellierung] a) Entwerfen Sie für das von Ihnen entworfene Modell aus Aufgabe 2 des 1. Übungsblattes ein Star-Schema. b) Entwerfen Sie für das vorangegangene Modell einen Teil eines

Mehr

Kapitel 7 Grundlagen von Data

Kapitel 7 Grundlagen von Data LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS DATABASE Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2014 Kapitel 7 Grundlagen von Data Warehouses Vorlesung: PD

Mehr

Data Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de

Data Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de Data Warehouses Sommersemester 2011 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen Data Warehouse Architektur Data-Warehouse-System Teilsichten

Mehr

Data Warehouse Technologien

Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............

Mehr

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...

Mehr

Multidimensionales Datenmodell, Cognos

Multidimensionales Datenmodell, Cognos Data Warehousing (II): Multidimensionales Datenmodell, Cognos Praktikum: Data Warehousing und Mining Praktikum Data Warehousing und Mining, Sommersemester 2010 Vereinfachte Sicht auf die Referenzarchitektur

Mehr

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Michael Hahne T&I GmbH Workshop MSS-2000 Bochum, 24. März 2000 Folie 1 Worum es geht...

Mehr

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH Einführung in OLAP und Business Analysis Gunther Popp dc soft GmbH Überblick Wozu Business Analysis mit OLAP? OLAP Grundlagen Endlich... Technischer Background Microsoft SQL 7 & OLAP Services Folie 2 -

Mehr

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining 2 Eigenschaften eines Data Warehouse Referenzarchitektur Integrierte Sicht auf beliebige Daten aus verschieden Datenbanken

Mehr

Modellierung von OLAP- und Data- Warehouse-Systemen

Modellierung von OLAP- und Data- Warehouse-Systemen Andreas Totok Modellierung von OLAP- und Data- Warehouse-Systemen Mit einem Geleitwort von Prof. Dr. Burkhard Huch Deutscher Universitäts-Verlag Inhaltsverzeichnis Abbildungsverzeichnis Tabellenverzeichnis

Mehr

Logische Modellierung von Data Warehouses

Logische Modellierung von Data Warehouses Logische Modellierung von Data Warehouses Vertiefungsarbeit von Karin Schäuble Gliederung. Einführung. Abgrenzung und Grundlagen. Anforderungen. Logische Modellierung. Methoden.. Star Schema.. Galaxy-Schema..

Mehr

Einführung in Data Warehouses

Einführung in Data Warehouses Kapitel l6 Einführung in Data Warehouses Vorlesung: Dr. Matthias Schubert Skript 2009 Matthias Schubert Dieses Skript basiert auf dem Skript zur Vorlesung Datenbanksysteme II von Prof. Dr. Christian Böhm

Mehr

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik ARFA ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik Ralf Leipner Domain Architect Analytics, Risk Management & Finance 33. Berner Architekten

Mehr

Vorwort zur 5. Auflage... 15 Über den Autor... 16

Vorwort zur 5. Auflage... 15 Über den Autor... 16 Vorwort zur 5. Auflage...................................... 15 Über den Autor............................................ 16 Teil I Grundlagen.............................................. 17 1 Einführung

Mehr

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein 1 Definitionen 1.1 Datenbank Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert Integriert, selbstbeschreibend, verwandt 1.2 Intension/Extension Intension: Menge der Attribute Extension:

Mehr

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem. Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen

Mehr

Themenblock: Erstellung eines Cube

Themenblock: Erstellung eines Cube Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen

Mehr

Themenblock: Data Warehousing (I)

Themenblock: Data Warehousing (I) Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining Agenda Einführung Data Warehouses Online Transactional Processing (OLTP) Datenmanipulation mit SQL Anfragen mit SQL Online

Mehr

Motivation. Motivation /2. Dimensionen. Einfache Hierarchien. Hierarchien in Dimensionen. 3. Multidimensionales Datenmodell

Motivation. Motivation /2. Dimensionen. Einfache Hierarchien. Hierarchien in Dimensionen. 3. Multidimensionales Datenmodell 3. Multidimensionales Datenmodell Grundbegriffe Dimensionen, Fakten/Kennzahlen, Würfel Analyseoperationen Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung ME/R, ADAPT, graphbasierte

Mehr

Oracle-Statistiken im Data Warehouse effizient nutzen

Oracle-Statistiken im Data Warehouse effizient nutzen Oracle-Statistiken im Data Warehouse effizient nutzen Reinhard Mense ARETO Consulting Köln Schlüsselworte: DWH, Data Warehouse, Statistiken, Optimizer, Performance, Laufzeiten Einleitung Für die performante

Mehr

Motivation. Dimensionen. Motivation /2. 3. Multidimensionales Datenmodell

Motivation. Dimensionen. Motivation /2. 3. Multidimensionales Datenmodell 3. Multidimensionales Datenmodell Grundbegriffe Dimensionen, Fakten/Kennzahlen, Würfel Analyseoperationen Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung ME/R, ADAPT, graphbasierte

Mehr

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse

Mehr

Raumbezogene Datenbanken (Spatial Databases)

Raumbezogene Datenbanken (Spatial Databases) Raumbezogene Datenbanken (Spatial Databases) Ein Vortrag von Dominik Trinter Alexander Christian 1 Inhalte Was ist ein raumbezogenes DBMS? Modellierung Abfragen Werkzeuge zur Implementierung Systemarchitektur

Mehr

Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben. Die Hypercube-Technologie

Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben. Die Hypercube-Technologie Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben Transbase Hypercube ist eine Transbase -Option, die die innovative Hypercube-Technologie für komplexe analytische Anwendungen (OLAP)

Mehr

Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH)

Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH) Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH) Verteilung und Integration von Informationen im Verkehrsbereich Thema: OLAP in verteilten Data-Warehouse- Umgebungen Vortrag: Christian

Mehr

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation 27. Juni 2013 Hinweis Diese Folien ersetzen keinesfalls den Übungsstoff des zugehörigen e-learning-kurses.

Mehr

Multidimensionales Datenmodell. Motivation. Motivation /2. Grundbegriffe. Analyseoperationen. Notationen zur konzeptuellen Modellierung

Multidimensionales Datenmodell. Motivation. Motivation /2. Grundbegriffe. Analyseoperationen. Notationen zur konzeptuellen Modellierung Multidimensionales Datenmodell Grundbegriffe Dimensionen, Fakten/Kennzahlen, Würfel Analyseoperationen Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung ME/R,ADAPT,graphbasierteAnsätze

Mehr

Data Warehouse Technologien

Data Warehouse Technologien mitp Professional Data Warehouse Technologien von Veit Köppen, Gunter Saake, Kai-Uwe Sattler 2. Auflage 2014 Data Warehouse Technologien Köppen / Saake / Sattler schnell und portofrei erhältlich bei beck-shop.de

Mehr

C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl

C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl Ein Seminar der DWH academy Seminar C09 Einsatz SAP BW im Vergleich zur Best-of-Breed- Produktauswahl Befasst man sich im DWH mit der Auswahl

Mehr

MIS by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001

MIS by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001 MIS Glossar by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001 Aggregat Data Cube Data Marts Data Mining Data Warehouse (DWH) Daten Decision Support Systeme (DSS)

Mehr

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation Zusammenfassung OPAL 6. Übung Juni 2015 Agenda Hinweise zur Klausur Zusammenfassung OPAL Übungen / Kontrollfragen

Mehr

Online Analytical Processing

Online Analytical Processing Online Analytical Processing Online Analytical Processing Online Analytical Processing (OLAP) ermöglicht die multidimensionale Betrachtung von Daten zwecks E rmittlung eines entscheidungsunterstützenden

Mehr

Inhaltsverzeichnis. 1. Fragestellung

Inhaltsverzeichnis. 1. Fragestellung Inhaltsverzeichnis 1. Fragestellung... 1 2. Herleitung zum Thema... 1 3. Das Entity Relationship Modell (ERM)... 2 4. Praktisches Beispiel zum ERM... 7 5. Anhang...Fehler! Textmarke nicht definiert. 1.

Mehr

OLAP und Data Warehouses

OLAP und Data Warehouses OLP und Data Warehouses Überblick Monitoring & dministration Externe Quellen Operative Datenbanken Extraktion Transformation Laden Metadaten- Repository Data Warehouse OLP-Server nalyse Query/Reporting

Mehr

Logische Modelle für OLAP. Burkhard Schäfer

Logische Modelle für OLAP. Burkhard Schäfer Logische Modelle für OLAP Burkhard Schäfer Übersicht Einführung in OLAP Multidimensionale Daten: Hypercubes Operationen Formale Grundlagen Zusammenfassung Einführung in OLAP Verfahren zur Analyse großer

Mehr

Performanceaspekte in der SAP BI Modellierung

Performanceaspekte in der SAP BI Modellierung Performanceaspekte in der SAP BI Modellierung SAP BW 7.3 & SAP HANA Performance Indizes Aggregate DSO & InfoCube BWA SAP HANA Empfehlung 2 Performance Performance bedeutet, unter gegebenen Anforderungen

Mehr

OLAP mit dem SQL-Server

OLAP mit dem SQL-Server Hartmut Messerschmidt Kai Schweinsberg OLAP mit dem SQL-Server Eine Einführung in Theorie und Praxis IIIBibliothek V dpunkt.verlag Teil OLAP undder Microsoft SQL-Server 1 1 Theoretische Grundlagen 3 1.1

Mehr

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher

Mehr

Relationale Datenbanken Datenbankgrundlagen

Relationale Datenbanken Datenbankgrundlagen Datenbanksystem Ein Datenbanksystem (DBS) 1 ist ein System zur elektronischen Datenverwaltung. Die wesentliche Aufgabe eines DBS ist es, große Datenmengen effizient, widerspruchsfrei und dauerhaft zu speichern

Mehr

Entwurf von Datenbanken

Entwurf von Datenbanken Bisher: was sind Datenbanken? Wie funktionieren sie? Im Folgenden: wie entwickle ich eine Datenbank? Was ist eine gute Datenbank? Der Datenbankentwurfsprozess Das Entity Relationship (ER) Modell Abbildung

Mehr

Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing

Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing Seminar in der Seminarreihe Business Intelligence 1 OLAP und Datawarehousing OLAP & Warehousing Die wichtigsten Produkte Die Gliederung Produkt Bewertung & Vergleiche Die Marktentwicklung Der aktuelle

Mehr

Kapitel 3: Eigenschaften von Integrationssystemen. Einordnung von Integrationssystemen bzgl. Kriterien zur Beschreibung von Integrationssystemen

Kapitel 3: Eigenschaften von Integrationssystemen. Einordnung von Integrationssystemen bzgl. Kriterien zur Beschreibung von Integrationssystemen Datenintegration Datenintegration Kapitel 3: Eigenschaften von Integrationssystemen Andreas Thor Sommersemester 2008 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de 1 Inhalt Einordnung

Mehr

Inhaltsverzeichnis. Teil I OLAP und der Microsoft SQL-Server 1. 1 Theoretische Grundlagen 3

Inhaltsverzeichnis. Teil I OLAP und der Microsoft SQL-Server 1. 1 Theoretische Grundlagen 3 vii Teil I OLAP und der Microsoft SQL-Server 1 1 Theoretische Grundlagen 3 1.1 Was ist OLAP?......................................... 3 1.1.1 Business Intelligence............................... 4 1.1.2

Mehr

Datenbanksysteme 2 Frühjahr-/Sommersemester 2014 28. Mai 2014

Datenbanksysteme 2 Frühjahr-/Sommersemester 2014 28. Mai 2014 Lehrstuhl für Praktische Informatik III Prof. Dr. Guido Moerkotte Email: moer@db.informatik.uni-mannheim.de Marius Eich Email: marius.eich@uni-mannheim.de Datenbanksysteme 2 8. Übungsblatt Frühjahr-/Sommersemester

Mehr

2 Datenbanksysteme, Datenbankanwendungen und Middleware... 45

2 Datenbanksysteme, Datenbankanwendungen und Middleware... 45 Vorwort 15 Teil I Grundlagen 19 i Einführung In das Thema Datenbanken 21 I.I Warum ist Datenbankdesign wichtig? 26 i.2 Dateisystem und Datenbanken 28 1.2.1 Historische Wurzeln 29 1.2.2 Probleme bei der

Mehr

6 HANA-optimierte InfoCubes

6 HANA-optimierte InfoCubes 117 HANA-optimierte InfoCubes bilden im»sap BW powered by SAP HANA«das Pendant zu relationalen InfoCubes in BW-Systemen mit relationalen Datenbanksystemen. Obwohl ihr Modell wesentlich auf die spaltenorientierte

Mehr

Eignung unterschiedlicher Faktenmodellierungen in Data Warehouse-Systemen

Eignung unterschiedlicher Faktenmodellierungen in Data Warehouse-Systemen Christoph Arnold (B. Sc.) Prof. Dr. Harald Ritz Eignung unterschiedlicher Faktenmodellierungen in Data Warehouse-Systemen AKWI-Tagung, 17.09.2012, Hochschule Pforzheim Christoph Arnold, Prof. Dr. Harald

Mehr

Performance by Design Wie werden performante ETL-Prozesse erstellt?

Performance by Design Wie werden performante ETL-Prozesse erstellt? Performance by Design Wie werden performante ETL-Prozesse erstellt? Reinhard Mense ARETO Consulting Bergisch Gladbach Schlüsselworte: DWH, Data Warehouse, ETL-Prozesse, Performance, Laufzeiten, Partitionierung,

Mehr

Aufgaben zur fachwissenschaftlichen Prüfung Modul 3 Daten erfassen, ordnen, verarbeiten und austauschen: Schwerpunkt Datenbanken

Aufgaben zur fachwissenschaftlichen Prüfung Modul 3 Daten erfassen, ordnen, verarbeiten und austauschen: Schwerpunkt Datenbanken Aufgaben zur fachwissenschaftlichen Prüfung Modul 3 Daten erfassen, ordnen, verarbeiten und austauschen: Schwerpunkt Datenbanken 30 Wozu dient ein Primärschlüssel? Mit dem Primärschlüssel wird ein Datenfeld

Mehr

Vorlesung Wissensentdeckung in Datenbanken

Vorlesung Wissensentdeckung in Datenbanken Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Uwe Ligges Informatik LS 8 22.04.2010 1 von 26 Gliederung 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der

Mehr

Data Warehouse Grundlagen

Data Warehouse Grundlagen Seminarunterlage Version: 2.10 Version 2.10 vom 24. Juli 2015 Dieses Dokument wird durch die veröffentlicht.. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen sind Warenzeichen

Mehr

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Prof. Dr. Anett Mehler-Bicher Fachhochschule Mainz, Fachbereich Wirtschaft Prof. Dr. Klaus Böhm health&media GmbH 2011 health&media

Mehr

Wirtschaftsinformatik - 1.Tutorium im WS 11/12

Wirtschaftsinformatik - 1.Tutorium im WS 11/12 Wirtschaftsinformatik - 1.Tutorium im WS 11/12 Organisatorisches Planung, Realisierung und Einführung von Anwendungssystemen Analyse und Gestaltung inner- und zwischen-betrieblicher Abläufe: ARIS Ereignisgesteuerte

Mehr

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse

Mehr

OLAP und der MS SQL Server

OLAP und der MS SQL Server OLAP und der MS SQL Server OLAP und der MS SQL Server OLAP-Systeme werden wie umfangreiche Berichtssysteme heute nicht mehr von Grund auf neu entwickelt. Stattdessen konzentriert man sich auf die individuellen

Mehr

Data Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 16 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining operationale DB operationale DB operationale DB Data Warehouse operationale

Mehr

4 Grundlagen der Datenbankentwicklung

4 Grundlagen der Datenbankentwicklung 4 Grundlagen der Datenbankentwicklung In diesem Kapitel werden wir die Grundlagen der Konzeption von relationalen Datenbanken beschreiben. Dazu werden Sie die einzelnen Entwicklungsschritte von der Problemanalyse

Mehr

Teil VI. Datenbanken

Teil VI. Datenbanken Teil VI Datenbanken Überblick 1 Grundlegende Begriffe Motivation 2 Relationale Datenbanksysteme Das Relationale Datenmodell SQL 3 Entwurf von Datenbanken Das Enity Relationship (ER) Modell Abbildung von

Mehr

Einteilung von Datenbanken

Einteilung von Datenbanken Datenbanksysteme (c) A.Kaiser; WU-Wien 1 Einteilung von Datenbanken 1. formatierte Datenbanken 2. unformatierte Datenbanken Information Retrieval Systeme 2 Wozu Datenbanken? Speicherung und Verwaltung

Mehr

Einführung in Datenbanksysteme. H. Wünsch 01.2001

Einführung in Datenbanksysteme. H. Wünsch 01.2001 Einführung in Datenbanksysteme H. Wünsch 01.2001 H. Wünsch 01/2001 Einführung Datenbanken 2 Was sind Datenbanken? Datenbanken sind Systeme zur Beschreibung, Speicherung und Wiedergewinnung von Datenmengen.

Mehr

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse?

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse? Ein Beispiel Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse? Dipl.-Kfm. Claus Häberle WS 2015 /16 # 42 XML (vereinfacht) visa

Mehr

Datenbanktechnologie für Data-Warehouse-Systeme

Datenbanktechnologie für Data-Warehouse-Systeme Wolfgang Lehner Datenbanktechnologie für Data-Warehouse-Systeme Konzepte und Methoden dpunkt.verlag 1 1.1 1.2 1.3 1.4 1. 5 2 2.1 2.2 2.3 Einleitung 1 Betriebswirtschaftlicher Ursprung des Data Warehousing...

Mehr

Hetero-Homogene Data Warehouses

Hetero-Homogene Data Warehouses Hetero-Homogene Data Warehouses TDWI München 2011 Christoph Schütz http://hh-dw.dke.uni-linz.ac.at/ Institut für Wirtschaftsinformatik Data & Knowledge Engineering Juni 2011 1 Data-Warehouse-Modellierung

Mehr

Frühjahrsemester 2011. Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil

Frühjahrsemester 2011. Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil Frühjahrsemester Data Warehousing Kapitel 5: Data Warehousing H. Schuldt Wiederholung aus Kapitel 5. Einführung Tresgros Tresgros Tresgros Filiale Muttenz Filiale Allschwil Filiale Liestal Anfragen: Welches

Mehr

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem Fachbericht zum Thema: Anforderungen an ein Datenbanksystem von André Franken 1 Inhaltsverzeichnis 1 Inhaltsverzeichnis 1 2 Einführung 2 2.1 Gründe für den Einsatz von DB-Systemen 2 2.2 Definition: Datenbank

Mehr

Seminar C16 - Datenmodellierung für SAP BW

Seminar C16 - Datenmodellierung für SAP BW C16: Datenmodellierung für SAP BW Ein Seminar der DWH academy Seminar C16 - Datenmodellierung für SAP BW Dieses Seminar soll einen umfassenden Einblick in die Datenmodellierung beim Einsatz von SAP BW

Mehr

Mala Bachmann September 2000

Mala Bachmann September 2000 Mala Bachmann September 2000 Wein-Shop (1) Umsatz pro Zeit und Produkt Umsatz Jan Feb Mrz Q1 Apr 2000 Merlot 33 55 56 144 18 760 Cabernet-S. 72 136 117 325 74 1338 Shiraz 85 128 99 312 92 1662 Rotweine

Mehr

bersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter

bersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter bersicht Niels Schršter EinfŸhrung GROUP BY Roll UpÔs Kreuztabellen Cubes Datenbank Ansammlung von Tabellen, die einen ãausschnitt der WeltÒ fÿr eine Benutzergruppe beschreiben. Sie beschreiben die funktionalen

Mehr

Model Klausel - Der Excel-Killer von Oracle?

Model Klausel - Der Excel-Killer von Oracle? Model Klausel - Der Excel-Killer von Oracle? Andrea Kennel Trivadis AG Glattbrugg, Schweiz Schlüsselworte: Model Klausel, SQL, Data Warehousing, OLAP Zusammenfassung Ein Data Mart kann als ein Würfel mit

Mehr

Frühjahrsemester 2010. Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil

Frühjahrsemester 2010. Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil Frühjahrsemester Data Warehousing Kapitel 5: Data Warehousing H. Schuldt Wiederholung aus Kapitel 5. Einführung Tresgros Tresgros Tresgros Filiale Muttenz Filiale Allschwil Filiale Liestal Anfragen: Welches

Mehr

Data Warehousing Grundbegriffe und Problemstellung

Data Warehousing Grundbegriffe und Problemstellung Data Warehousing Grundbegriffe und Problemstellung Dr. Andrea Kennel, Trivadis AG, Glattbrugg, Schweiz Andrea.Kennel@trivadis.com Schlüsselworte Data Warehouse, Cube, Data Mart, Bitmap Index, Star Queries,

Mehr

Performance-Optimierung in SAP BW. Helmut Tack

Performance-Optimierung in SAP BW. Helmut Tack Performance-Optimierung in SAP BW Helmut Tack INHALTSVERZEICHNIS Inhaltsverzeichnis Einleitung 9 1 Grundlegende Betrachtungen 13 2 Grundlagen der SAP BW-Datenhaltung 17 2.1 Flache Datenspeicher 21 2.2

Mehr

Inhaltsverzeichnis. 1 Einleitung Motivation und Umfeld Zielsetzung der Arbeit Methodisches Vorgehen und Aufbau der Arbeit 3

Inhaltsverzeichnis. 1 Einleitung Motivation und Umfeld Zielsetzung der Arbeit Methodisches Vorgehen und Aufbau der Arbeit 3 Inhaltsverzeichnis 1 Einleitung 1 1.1 Motivation und Umfeld 1 1.2 Zielsetzung der Arbeit 2 1.3 Methodisches Vorgehen und Aufbau der Arbeit 3 2 Grundlagen des Feuerwehrwesens 5 2.1 Kategorisierung der Feuerwehren

Mehr

Studierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen

Studierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen Praxistag für die öffentliche Verwaltung 2012 Titel Präsentation Studierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen Referenten-Info Gerhard Tschantré, Leiter Controllerdienste

Mehr

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen Fragen Vertiefung Modellierung

Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen Fragen Vertiefung Modellierung Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation Zusammenfassung OPAL 24. Juni 2014 Agenda Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen

Mehr

Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann

Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann Andreas Ditze MID GmbH Kressengartenstraße 10 90402 Nürnberg a.ditze@mid.de Abstract: Data Lineage

Mehr

Inhaltsverzeichnis. vii.

Inhaltsverzeichnis. vii. vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt 2 1.2 OLTP versus OLAP 4 1.2.1 OLAP-versus OLTP-Transaktionen 5 1.2.2 Vergleich von OLTP und OLAP 6 1.2.3 Abgrenzung: DBMS-Techniken

Mehr

Qualitätssicherung bei der mobilen Datenerfassung

Qualitätssicherung bei der mobilen Datenerfassung Qualitätssicherung bei der mobilen Datenerfassung Stephan Mäs Arbeitsgemeinschaft GIS Universität der Bundeswehr München http://www.unibw.de/bauv11/geoinformatik/agis 9. Seminar GIS & Internet 13.-15.

Mehr

Ein Schlüssel ist eine Menge von Attributen (also eines oder mehrere), die eine Datenzeile (Tupel) einer Tabelle eindeutig identifiziert

Ein Schlüssel ist eine Menge von Attributen (also eines oder mehrere), die eine Datenzeile (Tupel) einer Tabelle eindeutig identifiziert Maika Büschenfeldt Datenbanken: Skript 1 1. Was ist eine relationale Datenbank? In Datenbanken können umfangreiche Datenbestände strukturiert abgelegt werden. Das Konzept relationaler Datenbanken soll

Mehr

4. Relationen. Beschreibung einer binären Relation

4. Relationen. Beschreibung einer binären Relation 4. Relationen Relationen spielen bei Datenbanken eine wichtige Rolle. Die meisten Datenbanksysteme sind relational. 4.1 Binäre Relationen Eine binäre Relation (Beziehung) R zwischen zwei Mengen A und B

Mehr

2.5.2 Primärschlüssel

2.5.2 Primärschlüssel Relationale Datenbanken 0110 01101110 01110 0110 0110 0110 01101 011 01110 0110 010 011011011 0110 01111010 01101 011011 0110 01 01110 011011101 01101 0110 010 010 0110 011011101 0101 0110 010 010 01 01101110

Mehr

CAS genesisworld.exchange connect Abgleich von Adressen und Terminen

CAS genesisworld.exchange connect Abgleich von Adressen und Terminen Abgleich von Adressen und Terminen Stand Juni 2004 Was ist CAS genesisworld.exchange connect? Inhalt 1 Was ist CAS genesisworld.exchange connect?... 3 2 Systemvoraussetzungen... 5 2.1 Software...5 2.2

Mehr

Inhaltsübersicht...IX Inhaltsverzeichnis...XI Abbildungsverzeichnis...XVII Tabellenverzeichnis... XXIII Abkürzungsverzeichnis...

Inhaltsübersicht...IX Inhaltsverzeichnis...XI Abbildungsverzeichnis...XVII Tabellenverzeichnis... XXIII Abkürzungsverzeichnis... Inhaltsübersicht...IX Inhaltsverzeichnis...XI Abbildungsverzeichnis...XVII Tabellenverzeichnis... XXIII Abkürzungsverzeichnis... XXV 1 Einführung... 1 1.1 Problemstellung... 1 1.2 Zielsetzung... 3 1.3

Mehr

Business Intelligence & Reporting. Michael Cordes Holger Oehring Matthias Rein

Business Intelligence & Reporting. Michael Cordes Holger Oehring Matthias Rein Business Intelligence & Reporting Michael Cordes Holger Oehring Matthias Rein Ziele Einführung Business Intelligence / Front Room Online Analytical Processing (OLAP) Arten des Reporting & Nutzergruppen

Mehr

Reihungen. Martin Wirsing. in Zusammenarbeit mit Matthias Hölzl und Nora Koch 11/03

Reihungen. Martin Wirsing. in Zusammenarbeit mit Matthias Hölzl und Nora Koch 11/03 Reihungen Martin Wirsing in Zusammenarbeit mit Matthias Hölzl und Nora Koch 11/03 2 Ziele Die Datenstruktur der Reihungen verstehen: mathematisch und im Speicher Grundlegende Algorithmen auf Reihungen

Mehr

3. Das Relationale Datenmodell

3. Das Relationale Datenmodell 3. Das Relationale Datenmodell Das Relationale Datenmodell geht zurück auf Codd (1970): E. F. Codd: A Relational Model of Data for Large Shared Data Banks. Comm. of the ACM 13(6): 377-387(1970) DBMS wie

Mehr

Andreas Heuer Gunter Saake Kai-Uwe Sattler. Datenbanken. kompakt

Andreas Heuer Gunter Saake Kai-Uwe Sattler. Datenbanken. kompakt Andreas Heuer Gunter Saake Kai-Uwe Sattler Datenbanken kompakt Inhaltsverzeichnis Vorwort v 1 Was sind Datenbanken 1 1.1 Warum Datenbanken 1 1.2 Datenbanksysteme 4 1.3 Anforderungen: Die Codd'schen Regeln

Mehr

Christian Kurze BI-Praktikum IBM WS 2008/09

Christian Kurze BI-Praktikum IBM WS 2008/09 Einführung in die multidimensionale Datenmodellierung e mit ADAPT BI-Praktikum IBM WS 2008/09 1 Gliederung Einführung multidimensionale Datenmodellierung 1. Multidimensionales Modell BI-Praktikum IBM WS

Mehr

Seminar C02 - Praxisvergleich OLAP Tools

Seminar C02 - Praxisvergleich OLAP Tools C02: Praxisvergleich OLAP Tools Ein Seminar der DWH academy Seminar C02 - Praxisvergleich OLAP Tools Das Seminar "Praxisvergleich OLAP-Tools" bietet den Teilnehmern eine neutrale Einführung in die Technologien

Mehr

1 Einleitung. Betriebswirtschaftlich administrative Systeme

1 Einleitung. Betriebswirtschaftlich administrative Systeme 1 1 Einleitung Data Warehousing hat sich in den letzten Jahren zu einem der zentralen Themen der Informationstechnologie entwickelt. Es wird als strategisches Werkzeug zur Bereitstellung von Informationen

Mehr

Logische Datenmodellierung zur Abbildung mehrdimensionaler Datenstrukturen im SAP Business Information Warehouse

Logische Datenmodellierung zur Abbildung mehrdimensionaler Datenstrukturen im SAP Business Information Warehouse Logische Datenmodellierung zur Abbildung mehrdimensionaler Datenstrukturen im SAP Business Information Warehouse Vortrag auf der BTW 2003, Leipzig 26.-28.02.2003 Dr. Michael Hahne cundus AG Prokurist,

Mehr

Klassifikation von Integrationskonflikten

Klassifikation von Integrationskonflikten Klassifikation von Integrationskonflikten Christiane Telöken 1 Inhaltsverzeichnis 1. Was bedeutet Integration? 2. Strukturelle Heterogenitätskonflikte 2.1 Konflikte bei bilateralen Korrespondenzen 2.2

Mehr

Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH

Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH Dani Schnider Principal Consultant Business Intelligence BI Trilogie, Zürich/Basel 25./26. November 2009 Basel Baden Bern Lausanne Zürich

Mehr

Ein wesentliches, charakteristisches Merkmal aller Datenbankmanagement

Ein wesentliches, charakteristisches Merkmal aller Datenbankmanagement Anfrageformulierung: Allgemeines Ein wesentliches, charakteristisches Merkmal aller Datenbankmanagement nkmanagement- systeme ist die Unterstützung einer (oder mehrerer) Anfragesprachen. Eine Anfrage ist

Mehr

Kapitel 14 Verteilte DBMS

Kapitel 14 Verteilte DBMS Kapitel 14 Verteilte DBMS 14 Verteilte DBMS 14 Verteilte DBMS...1 14.1 Begriff, Architektur und Ziele verteilter Datenbanksysteme...2 14.2 Verteilungsarten...5 14.2.1 Verteilung der Daten...5 14.2.2 Verteilung

Mehr