Seminar Data Warehousing. Seminar. Data Warehousing. Thema: Speichermodelle für Data-Warehouse-Strukturen

Save this PDF as:
 WORD  PNG  TXT  JPG

Größe: px
Ab Seite anzeigen:

Download "Seminar Data Warehousing. Seminar. Data Warehousing. Thema: Speichermodelle für Data-Warehouse-Strukturen"

Transkript

1 Seminar Data Warehousing Thema: Speichermodelle für Data-Warehouse-Strukturen Friedrich-Schiller-Universität Jena Fakultät für Mathematik und Informatik Institut für Informatik Lehrstuhl für Datenbanken und Informationssysteme Ernst-Abbe-Platz Jena Lehrstuhlinhaber Prof. Dr. Klaus Küspert von Antje Höll Betreuer: Dipl.-Inf. David Wiese

2 Gliederung 1 Einleitung Begriffsdefinition Relationale Speicherung Star Schema Snowflake Schema Mischformen Factless Fact Table Galaxy Schema Fact Constellation Schema Darstellungsarten für Klassifikationshierarchien Horizontale Darstellung Vertikale Darstellung Kombinierte Darstellung Multidimensionale Speicherung Datenstrukturen Speicherung Probleme bei der Array-Speicherung Grenzen der multidimensionalen Datenhaltung HOLAP Vergleich (ROLAP, MOLAP, HOLAP) Fazit Abbildungsverzeichnis Literaturverzeichnis I

3 1 Einleitung Bei einem Data Warehouse System handelt es sich um eine Sammlung von unterschiedlichen Technologien, welche dem geschulten Mitarbeiter (Beispielsweise einem Datenerfasser, Manager, Analytiker, Sachbearbeiter) ermöglicht, dass er seine Entscheidungen schneller und qualitativ besser treffen kann. Von einem solchen System wird erwartet, dass die richtigen Informationen zum richtigen Zeitpunkt am richtigen Ort sind, damit die richtigen Entscheidungen getroffen werden können. Ein Data Warehouse ist ein wichtiges System zur Integration von unterschiedlichen Informationsquellen innerhalb einer Unternehmung. [3] In der Abb.1 ist ein Überblick über eine mögliche Architektur eines Data-Warehouse- Systems gegeben. Abb.1: Das Data-Warehouse-Prinzip [4] Diese Arbeit befasst sich im Rahmen des Seminars Data Warehousing mit den Speichermodellen für die Data-Warehouse-Strukturen. Dabei werden im nachfolgenden Abschnitt die Begriffe Kennzahl, Dimension, Hierarchie und Datenwürfel kurz erklärt. Der dritte Abschnitt befasst sich mit der relationalen Speicherung und es werden mögliche Schemata erläutert, wie man multidimensionale Datenmodelle auf relationale Datenmodelle abbilden kann. Im vierten Abschnitt 1

4 wird die multidimensionale Speicherung vorgestellt. Es werden u.a. Speicherungsmöglichkeiten genannt und einige Grenzen der Datenhaltung aufgezeigt. Abschließend werden die zwei Möglichkeiten zur Speicherung des multidimensionalen Datenmodells und eine Kombination beider Modelle tabellarisch verglichen. 2 Begriffsdefinition Zunächst werden einige Begriffe des multidimensionalen Datenmodells erläutert, die zum besseren Verständnis beitragen sollen. Kennzahlen sind numerische Messgrößen, die betriebswirtschaftliche Sachverhalte beschreiben. Als Beispiele sind hierfür Umsatz, Gewinn, Verlust oder Deckungsbeitrag zu nennen. Eine mögliche Sicht auf die assoziierten Kennzahlen geben Dimensionen. Sie sind eine endliche Menge von n (n 2) Dimensionselementen (Hierarchieobjekten), die eine semantische Beziehung aufweisen und der orthogonalen Strukturierung des Datenraums dienen. Produkt, Geographie und Zeit sind Beispiele für Dimensionen. Um die Hierarchien in den Dimensionen darzustellen, verwendet man ein Klassifikationsschema. Der Datenwürfel, auch Hypercube genannt, besteht aus mehreren Dimensionen zur Identifikation von Kennzahlen. Eine OLAP-Anwendung kann aus einem oder mehreren Datenwürfeln bestehen. 3 Relationale Speicherung Die relationale Speicherung eines multidimensionalen Datenmodells, die auch RO- LAP (relational OLAP) genannt wird, setzt auf herkömmlichen relationalen Datenbanken auf. Somit wird eine multidimensionale Analyse auf einer relationalen Datenbank ermöglicht. Die Daten werden hierbei in Relationen gespeichert, die sich gut als Tabellen visualisieren lassen. Für eine effiziente Abbildung von multidimensionalen Konstrukten auf relationale Datenbankschemata sind einige Anforderungen zu beachten. Zum einen sollten die multidimensionale Anfragen effizient in die entsprechenden relationalen Anfragen zu übersetzten und abzuarbeiten sein. Zum anderen sollte der Verlust an anwendungs- 2

5 bezogener Semantik möglichst gering ausfallen und die Wartbarkeit der relationalen Tabellen einfach und schnell zu realisieren sein. Um die Strukturen eines Datenwürfels abbilden zu können, wird bei der relationalen Speicherung eine Trennung von Struktur und Inhalt vorgenommen. Das heißt, man unterscheidet zwischen Faktentabellen und Dimensionstabellen. Die Faktentabelle ist relativ einfach zu realisieren, da sie den Datenwürfel ohne Klassifikationshierarchien speichert. Dabei werden die Dimensionen des Würfels als Spalten und jede Not Null- Zelle als ein Tupel der Relation aufgefasst. Ein Beispiel für eine Faktentabelle ist in der Abb. 2 dargestellt. Hierbei wird ein Teil der Spalten als Dimensionen und der andere Teil der Spalten als Kennzahlen betrachtet und somit ist der Datenwürfel äquivalent zur resultierenden Tabelle, der Faktentabelle. Abb.2: Dualismus von Würfel und Tabelle [5] Für die Abbildung der Klassifikationshierarchien eignen sich verschiedene Schemata, die nachfolgend beschreiben werden. 3.1 Star Schema Die zentrale Faktentabelle im Star Schema beinhaltet einen Primärschlüssel, der aus den Primärschlüsseln der Dimesionstabellen zusammengesetzt sein kann, und Spalten für die zu analysierenden Geschäftsdaten (Kennzahlen). Im Allgemeinen ist sie die längste Tabelle im Star Schema, da sie sehr viele Tupel enthält. Pro Dimension enthält das Star Schema eine Dimensionstabelle, welche komplett denormalisiert ist. Jede Dimensionstabelle enthält einen Primärschlüssel, die hierarchische Struktur der jeweiligen Dimension und die qualifizierenden Attribute. Die Dimensionstabellen sind im Vergleich zu der Faktentabelle durch die vielen Attribute wesentlich breiter und die Korrelation zur Faktentabelle geschieht mittels Fremdschlüsselbeziehungen. Die 3

6 Abb.3 zeigt die sternförmige Darstellung der Dimensionstabellen um die Faktentabelle, welches dem Schema den Namen gibt. Durch die Denormalisierung liegen in den Dimensionstabellen Redundanzen vor, die zu Änderungsanomalien führen können. Trotzdem führen diese Redundanzen zu einer schnelleren Anfragebearbeitung, da nicht, wie in normalisierten Schemata, erst Joins über mehrere Tabellen gemacht werden müssen. Weitere Vorteile bieten der einfache Aufbau der Dimensionstabellen und die einfache und flexible Darstellung von Klassifikationshierarchien. Abb.3: Beispiel für ein Star Schema [1], S.206 Diese Eigenschaften führen dazu, dass das Star Schema ein verbreitetes Modell für das Data Warehouse Design ist. 3.2 Snowflake Schema Im Gegensatz zum Star Schema sind die Dimensionstabellen hier normalisiert. Das heißt, für jede Klassifikationsstufe wird eine eigene Relation angelegt. Diese Dimensionstabellen enthalten jeweils einen Primärschlüssel und beschreibende Attribute. Die 1:n-Beziehung zwischen zwei übereinander liegenden Klassifikationsstufen wird mittels eines Fremdschlüssels von der tiefer liegenden auf die nächst höhere Stufe dargestellt. In der Abbildung 4 ist eine graphische Darstellungsmöglichkeit des Snowflake Schemas zu sehen. Da diese entfernt an eine Schneeflocke erinnert, bekam diese Art von Schema ihren Namen. 4

7 Die Kennzahlen werden, wie bei dem Star Schema beschrieben, mit Hilfe einer Faktentabelle verwaltet, wobei die Dimensionsspalten aus Fremdschlüsseln auf die Dimensionselemente der niedrigsten Stufe bestehen. Den Primärschlüssel der Faktentabelle bilden alle diese Fremdschlüssel. Abb.4: Beispiel für ein Snowflake Schema [1], S.204 Ein Vorteil dieses Modells ist die Vermeidung von Änderungsanomalien, da die Dimensionstabellen normalisiert sind. Aber durch die höhere Anzahl an Dimensionstabellen wird das Snowflake Schema wesentlich komplexer, was eine aufwendigere Administration, erhöhte Zugriffskosten durch die vielen benötigten Joins und eine schlechtere Performance zur Folge hat. 3.3 Mischformen Welches der beiden Schemata besser geeignet ist, hängt vom Anwendungsprofil ab. In der Realität verwendet man aber häufig Mischformen, um die spezifischen Nachteile von Star und Snowflake Schema zu vermeiden bzw. deren spezifische Vorteile zu nutzen. 5

8 3.3.1 Factless Fact Table Factless Fact Tables enthalten, wie der Name schon sagt, in den Faktentabellen keine Kenngrößen. Dies kann dann eintreten, wenn nur das Auftreten eines bestimmten Ereignisses aufgezeichnet werden soll, z.b. wenn nur das Faktum, dass ein bestimmter Kunde ein bestimmtes Produkt zu einer bestimmten Zeit gekauft hat, von Interesse ist Galaxy Schema Da die Geschäftssituation in der Regel sehr komplex ist, gibt es in einem Unternehmen sehr viele Kenngrößen mit jeweils unterschiedlichen Dimensionen. Für diese Modellierung eignet sich das Galaxy Schema. Es enthält mehrere unabhängige Faktentabellen, die teilweise mit den gleichen Dimensionstabellen verknüpft sind. Diese Faktentabellen entstehen, wenn die Kennzahlen durch unterschiedliche Dimensionen beschrieben werden. In der Abbildung 5 ist dies gut dargestellt, denn die zwei Faktentabellen Einkauf und Verkauf entstehen, weil die Kennzahlen Einkaufsmenge und Verkaufsmenge nicht auf die identischen Dimensionstabellen zugreifen. Abb.5: Beispiel für ein Galaxy Schema [6] Fact Constellation Schema Mit dem Fact Constellation Schema können gegenüber den bisher erläuterten Schemata auch aggregierte Kennzahlen in zusätzlichen Faktentabellen abgespeichert werden. Das Attribut Ebene, welches zur Unterscheidung der Klassifikationsstufen 6

9 in den Dimensionstabellen dient und in einigen Modellen verwendet werden kann, wird hier nicht benötigt. Des Weiteren erreicht man, im Vergleich zur Aggregation in einer Tabelle, eine höhere Performance. Dennoch kann das Schema durch eine Vielzahl von Faktentabellen schnell unübersichtlich werden und schwerer zu handhaben sein. 3.4 Darstellungsarten für Klassifikationshierarchien Im Folgenden werden weitere Möglichkeiten zur denormalisierten Darstellung von Klassifikationen erläutert Horizontale Darstellung Bei der Horizontalen Darstellung werden die Stufen der Klassifikationshierarchie als Spalten in eine denormalisierte Dimensionstabelle modelliert. Damit sind Einschränkungen auf höherer Granularität auch ohne teuere Verbundoperationen (Joins) abarbeitbar. Aber bei Anfragen bestimmter Stufen muss eine Duplikateliminierung erfolgen, die durch die erforderliche Sortierung relativ teuer ist. Die Anordnung der Spalten nebeneinander gibt dem Namen, wie man in der Abb. 6 sehen kann. Produkt_ID Artikel Produktgruppe Produktfamilie Kategorie 1234 Lavamat S Waschmaschinen Waschgeräte weiße Ware 1235 Duett Waschmaschinen Waschgeräte weiße Ware 1236 Novotronic Trockner Waschgeräte weiße Ware 1237 Vento 500 Trockner Waschgeräte weiße Ware Abb.6: Horizontale Darstellung einer Klassifikationshierarchie [1], S Vertikale Darstellung Diese Darstellung verwendet eine denormalisierte Dimensionstabelle mit zwei Attributen, eine Dimensions_ID und eine Eltern_ID, wobei die Dimensions_ID ein Schlüssel ist, der die Beziehung zur Faktentabelle schafft und die Eltern_ID einem Attributwert der Dimensions_ID der nächsthöheren Stufe entspricht (Abb. 7). Da das Tabellenschema keine strukturellen Informationen über das Klassifikationsschema enthält, ist eine Änderung am Klassifikationsschema relativ leicht möglich. Ein Nachteil wäre, dass für Anfragen auf einzelnen Stufen mehrere teure Verbundoperationen (engl. self-join) notwendig sind. 7

10 Dimensions_ID Lavamat S Duett Novotronic Vento 500 Waschmaschinen Trockner Waschgeräte Eltern_ID Waschmaschinen Waschmaschinen Trockner Trockner Waschgeräte Waschgeräte weiße Ware Abb.7: Vertikale Darstellung einer Klassifikationshierarchie [1], S Kombinierte Darstellung Die kombinierte Darstellung verbindet die beiden vorher beschrieben Strategien. Hierbei werden Klassifikationsstufen als Spalten repräsentiert, wobei die Spalten generisch bezeichnet werden (Dimensions_ID, Stufe1_ID, Stufe2_ID,, Stufe (explizite Angabe der Stufenebene)) und die Knoten aller höheren Stufen als Tupel gespeichert. Die Abb. 8 zeigt das Resultat. Dimensions_ID Stufe1_ID Stufe2_ID Stufe3_ID Stufe Lavamat S Waschmaschinen Waschgeräte weiße Ware 0 Duett Waschmaschinen Waschgeräte weiße Ware 0 Novotronic Trockner Waschgeräte weiße Ware 0 Vento 500 Trockner Waschgeräte weiße Ware 0 Waschmaschinen Waschgeräte weiße Ware NULL 1 Trockner Waschgeräte weiße Ware NULL 1 Waschgeräte weiße Ware NULL NULL 2 Abb.8: Kombinierte Darstellung einer Klassifikationshierarchie [1], S Multidimensionale Speicherung Multidimensionale Datenbanken setzen die auf konzeptioneller Ebene dargestellten multidimensionalen Datenstrukturen physisch um. Es wird eine Zellenstruktur gebaut, in der jede Zelle entlang der entsprechenden Dimensionen indiziert werden kann. Solche Systeme, die ihre Daten in einem multidimensionalen Feld speichern, werden auch multidimensional OLAP (MOLAP) genannt. Für die Speicherung werden multidimensionale Datenbankmanagementsysteme (MDBMS) verwendet. 8

11 4.1 Datenstrukturen Da die Dimensionen und Würfel grundlegende Datenbankobjekte eines MDBMS sind, werden sie genauer betrachtet. In Bezug auf die Speicherung sind Dimensionen endlich geordnete Listen von Dimensionswerten, welche die Dimensionselemente auf allen Klassifikationsstufen enthalten. Indem man die Dimensionswerte auf eine Indexmenge abbildet, erreicht man ihre Ordnung. Dadurch sind sie mittels der Ordnungszahl eindeutig identifizierbar und für die spätere Array-Umsetzung wird der Indexzugriff einfacher. Eine Dimension D mit m Dimensionswerten kann man formal als m-tupel darstellen: D = ( x D 1, x D 2,..., x D m ). Einen mehrdimensionalen Würfel kann man durch die Kombination mehrere Dimensionen definieren. Hierbei hilft die Vorstellung, dass die n Dimensionen einen n- dimensionalen Raum aufspannen. Die m verschiedenen Werte einer Dimension teilen diesen Würfel in m verschiedene parallele Ebenen. Der Schnittpunkt von n Ebenen eines n-dimensionalen Würfels bezeichnet eine Zelle, welche die jeweiligen Kennzahlen enthält. Diese Zelle kann eindeutig über ein n-tupel von Dimensionswerten angesprochen werden, wobei der i-te Wert des Tupels ein Wert der Dimension D i ist. Einen Würfel kann folgendermaßen beschreiben werden: W = (( D, D,..., D ),( M : Typ,..., M : Typ )) 1 2 n 1 1 m m D i : Dimensionen, M i :Typ i : Kenngrößen des Würfels mit dem jeweiligen Datentyp Besonders betrachtet werden müssen leere Zellen und dabei vor allem die Ursache warum sie leer sind (z.b. kein Wert verfügbar oder Wert aufgrund der Semantik der Anwendung nicht sinnvoll). Für die verschiedenen Fälle muss dann jeweils ein Symbol zur Darstellung definiert werden. 4.2 Speicherung Die multidimensionale Speicherung basiert im Wesentlichen auf multidimensionalen Arrays. Dabei werden die Zellen eines mehrdimensionalen Würfels sequentiell in ein n-dimensionales Array, dessen Indizes die Koordinaten der Würfelzellen bilden, gespeichert. Dieses Array muss wiederum zum Speichern in eine eindimensionale Liste oder in ein eindimensionales Array überführt werden, was als Linearisierung be- 9

12 zeichnet wird. Es gibt verschiedene Linearisierungsreihenfolgen. In Abb. 9 ist eine Array-Linearisierung für ein dreidimensionales Array dargestellt. Abb.9: Linearisierungsreihenfolge [1], S.236 Allgemein lässt sich daraus folgende Berechnungsvorschrift für den Array-Index der Zelle z(x 1, x 2,, x n ), xi Di, eines Würfels ableiten: Index( z) = x + ( x 1) D + ( x 1) D D ( x 1) D... D n 1 n 1 n = 1 + ( x 1) i 1 i j= 1 j= 1 D j Anhand zweier Beispiele soll die Array-Speicherung genauer verdeutlicht werden. In Abb. 10 ist eine Adressberechnung in einem zweidimensionalen Array dargestellt, wobei die Dimension Produkt die Werteliste (Hosen, Hemden, ) enthält und die Dimension Zeit aus der Werteliste (Januar, Februar, ) besteht. Die jeweiligen Ordnungszahlen stehen in Klammern. Um beispielsweise den Indexwert für die Zelle (Kleider, März) zu errechnen, muss folgende Berechnung erfolgen, die sich aus der allgemeinen Berechnungsvorschrift für den Array-Index ergibt: 1 + ( x 1) + ( x 1) D = = Abb.10: Beispiel für eine Adressberechnung [1], S.236 Abb. 11 illustriert die Adressberechnung in einem dreidimensionalen Datenwürfel. Wie hier die Reihenfolge der Würfelzellen in einem Array ist, wird in der nebenste- 10

13 henden Abbildung gezeigt. Die Berechnung der einzelnen Indexwerte erfolgt mittels dieser Berechnungsvorschrift: Index( z) (( x ( D 1) x ) ( D 1)) x = mit z x0 xn 1 = (,..., ). ALL entspricht hierbei den summierten Werten pro Dimension. Somit ergibt sich beispielsweise für die Zelle (ALL,ALL,ALL) bzw. (5,4,3) ein Indexwert von (5(4 + 1) + 4) (3 + 1)) + 3 = 119. Reihenfolge der Würfelzellen im Array Abb.11: dreidimensionaler Würfel [2], S.37/ Probleme bei der Array-Speicherung Eines der Hauptprobleme bei der Array-Speicherung stellt die Tatsache dar, dass in der Realität die Würfel zumindest auf der Detailebene dünn besetzt sind. Für die Berechnung der Position einer Zelle in einem eindimensionalen Array ist es notwendig, dass für leere Zellen Platz reserviert wird. Somit werden beim Auslesen von vielen Leerzellen, bei gleicher Menge an Seiten, weniger effektive Daten übertragen. Ein weiteres Problem ergibt sich bei ungünstig gewählten Linearisierungsreihenfolgen, da dadurch die Anzahl der Plattenzugriffe beeinflusst wird und somit auch die Anfrageperformance. Dies ist natürlich auch abhängig von der Art der Anfrage. Ziel ist es also, so wenig wie möglich Lesevorgänge zu haben, damit die gewünschten Daten schneller angezeigt werden können. Deshalb ist bei der Definition eines Würfels die Reihenfolge der Dimensionen zu beachten. 11

14 4.3 Grenzen der multidimensionalen Datenhaltung Durch die multidimensionale Speicherung kann man zwar eine hohe Anfragegeschwindigkeit erreichen, aber aufgrund von dünn besetzten Datenräumen kann bei Würfeln mit steigender Größe irgendwann eine Skalierungsgrenze erreicht werden. Ein weiterer Grund ist die vorausgesetzte Ordnung der Dimensionswerte bei der Array-Speicherung, denn dies erschwert zeitliche Änderungen an den Dimensionen. So kann das Einfügen neuer Werte oder neuer Klassifikationsstufen eine vollständige Reorganisation des Würfels bedeuten. Weiterhin gibt es für die MDBMS im Moment noch keinen Standard, wie bei den relationalen DBMS das SQL. Man spricht von so genannten proprietären MDBMS. Eine weitere Grenze stellt das Spezialwissen dar, welches zur Erstellung und Wartung der MDBMS erforderlich ist. Dieses Wissen unterscheidet sich immer noch stark von den Kenntnissen für relationale Datenbanken. 4.4 HOLAP Der Ansatz der hybriden Speicherung (Hybrides OLAP) soll die Vor- und Nachteile der vorher beschriebenen Ansätze verbinden. Die Idee ist hier, Detaildaten, die meist in großer Anzahl vorliegen, in einer relationalen Datenbank zu speichern und aggregierte Daten in multidimensionalen Strukturen abzulegen, um einen schnellen Zugriff auf die oberste Klassifikationsstufen zu gewährleisten, da in den aggregierten Daten keine Nulls enthalten sind. Der Zugriff erfolgt über die multidimensionale Datenbank durch ein multidimensionales Anfragewerkzeug. Bei jeder Anfrage wird individuell entschieden, ob die Daten in der multidimensionalen Welt vorliegen, ob sie in der relationalen Welt vorliegen und von dort gelesen werden müssen oder die dritte Möglichkeit, dass sie nur aus Berechnungen von Daten aus beiden Welten zu gewinnen sind. Die Entscheidungsfindung über den nötigen Beschaffungsweg der Daten ist für den Anwender transparent. Die Art der Verteilung auf relationale bzw. multidimensionale Datenbanken ist anwendungsspezifisch. Dennoch wird dieser Ansatz in der Realität wenig verwendet, da für dessen Entwicklung ein umfassendes Wissen aus beiden Welten notwendig ist und sich der Implementierungsaufwand als sehr aufwendig erweist. 12

15 5 Vergleich (ROLAP, MOLAP, HOLAP) In dieses Kapitel werden die Vor- und Nachteile drei Ansätze tabellarisch gegenübergestellt. ROLAP MOLAP HOLAP Vorteile - verwendet bewährte Datenbanktechnologie - Standard- Abfragesprache (SQL) - beliebige Skalierbarkeit - effiziente Speicherung großer Datenmengen - Antwortzeiten bei kleineren Datenmengen sehr gut - effiziente multidimensionale Speicherstrukturen - meist eigene, multidimensionale Abfragesprache, - vereinigt das Beste aus ROLAP und MO- LAP - MDDB-System greift nicht mehr auf die o- perativen Systeme zu, sondern auf ein relationales DW - zahlreiche erfolgreiche DW-Lösungen basieren auf einer RO- LAP-Architektur i.a. ver- ständlicher als SQL Nachteile - Standard-SQL für multidimensionale Analysen nur bedingt ausreichend - schlechtere Performance (durch Datenredundanz kompensierbar) - proprietäre MDDB- Systeme werden eingesetzt, keine Abfragesprache als Standard definiert - eingeschränktes Datenvolumen - umfangreiche Kenntnisse über RO- LAP und MOLAP - enormer Implementierungs-Aufwand - keine einheitliche OLAP- Abfragesprache - Schnittstelle zu einem RDBMS notwendig - zusätzliche Laderoutinen von RDBMS zum MDBMS 13

16 6 Fazit Für die Speicherung von multidimensionalen Datenstrukturen kann man die relationale oder die multidimensionale Speicherung wählen. Diese beiden Ansätze wurden in dieser Arbeit vorgestellt. Eine generelle Empfehlung, welche Vorgehensweise am Besten geeignet ist, kann man nicht geben. Jedoch kann man sagen, dass sich die relationale Speicherung sehr gut für dünn besetzte Würfel eignet, da sie auf herkömmlich relationale Datenbanken aufbaut, für die große Datenmengen verwalten kann und eine leichte Skalierbarkeit ermöglicht. Das heißt, je größer die zu speichernde Datenmenge, desto eher überwiegen die Vorteile einer ROLAP-Lösung. Im Gegensatz dazu, ist die multidimensionale Speicherung u.a. wegen der Array- Speicherung bei dicht besetzten Würfeln vorzuziehen. 14

17 Abbildungsverzeichnis Seite Abb.1 Das Data-Warehouse-Prinzip 1 Abb.2 Dualismus von Würfel und Tabelle 3 Abb.3 Beispiel für ein Star Schema 4 Abb.4 Beispiel für ein Snowflake Schemas 5 Abb.5 Beispiel für ein Galaxy Schema 6 Abb.6 Horizontale Darstellung einer Klassifikationshierarchie 7 Abb.7 Vertikale Darstellung einer Klassifikationshierarchie 8 Abb.8 Kombinierte Darstellung einer Klassifikationshierarchie 8 Abb.9 Linearisierungsreihenfolge 10 Abb.10 Beispiel für eine Adressberechnung 10 Abb.11 dreidimensionaler Würfel 11 II

18 Literaturverzeichnis [1] Bauer, A; Günzel, H.: Data Warehouse Systeme. Architektur, Entwicklung, Anwendung. Heidelberg: dpunkt.verlag [2] Tam, Y.J.: Datacube: Its implementation and application in OLAP mining. MSc.Thesis, Simon Fraser University, Canada Internetquellen [3] _implementierung.pdf, S.10, [4] ceus-stammtisch pdf, S.8, [5] VL-03---Multidim-Datenmodell.pdf, S.31, [6] WS0203/Thema%2010.pdf, S.14, III

Das Multidimensionale Datenmodell

Das Multidimensionale Datenmodell Das Multidimensionale Datenmodell Konzeptuelle Modellierung Umsetzung des Modells Beispiel ER-Modell 2 / 36 Probleme ER-Modellierung Keine Unterscheidung Klassifikation, Attribute, Kenngrößen Dimension

Mehr

Multidimensionales Datenmodell

Multidimensionales Datenmodell Multidimensionales Datenmodell Grundbegriffe fi Fakten, Dimensionen, Würfel Analyseoperationen fi Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung fi ME/R, ADAPT Relationale

Mehr

Kapitel 6 Einführung in Data Warehouses

Kapitel 6 Einführung in Data Warehouses Kapitel 6 Einführung in Data Warehouses Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2008, LMU München 2008 Dr. Peer Kröger Dieses Skript basiert zu einem Teil auf dem Skript zur Vorlesung

Mehr

Aufgabe 1: [Logische Modellierung]

Aufgabe 1: [Logische Modellierung] Aufgabe 1: [Logische Modellierung] a) Entwerfen Sie für das von Ihnen entworfene Modell aus Aufgabe 2 des 1. Übungsblattes ein Star-Schema. b) Entwerfen Sie für das vorangegangene Modell einen Teil eines

Mehr

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik ARFA ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik Ralf Leipner Domain Architect Analytics, Risk Management & Finance 33. Berner Architekten

Mehr

Kapitel 7 Grundlagen von Data

Kapitel 7 Grundlagen von Data LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS DATABASE Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2014 Kapitel 7 Grundlagen von Data Warehouses Vorlesung: PD

Mehr

2.5.2 Primärschlüssel

2.5.2 Primärschlüssel Relationale Datenbanken 0110 01101110 01110 0110 0110 0110 01101 011 01110 0110 010 011011011 0110 01111010 01101 011011 0110 01 01110 011011101 01101 0110 010 010 0110 011011101 0101 0110 010 010 01 01101110

Mehr

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Michael Hahne T&I GmbH Workshop MSS-2000 Bochum, 24. März 2000 Folie 1 Worum es geht...

Mehr

Oracle-Statistiken im Data Warehouse effizient nutzen

Oracle-Statistiken im Data Warehouse effizient nutzen Oracle-Statistiken im Data Warehouse effizient nutzen Reinhard Mense ARETO Consulting Köln Schlüsselworte: DWH, Data Warehouse, Statistiken, Optimizer, Performance, Laufzeiten Einleitung Für die performante

Mehr

Data Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de

Data Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de Data Warehouses Sommersemester 2011 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen Data Warehouse Architektur Data-Warehouse-System Teilsichten

Mehr

Data Warehouse Technologien

Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............

Mehr

Inhaltsverzeichnis. 1. Fragestellung

Inhaltsverzeichnis. 1. Fragestellung Inhaltsverzeichnis 1. Fragestellung... 1 2. Herleitung zum Thema... 1 3. Das Entity Relationship Modell (ERM)... 2 4. Praktisches Beispiel zum ERM... 7 5. Anhang...Fehler! Textmarke nicht definiert. 1.

Mehr

Modellierung von OLAP- und Data- Warehouse-Systemen

Modellierung von OLAP- und Data- Warehouse-Systemen Andreas Totok Modellierung von OLAP- und Data- Warehouse-Systemen Mit einem Geleitwort von Prof. Dr. Burkhard Huch Deutscher Universitäts-Verlag Inhaltsverzeichnis Abbildungsverzeichnis Tabellenverzeichnis

Mehr

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...

Mehr

Vorwort zur 5. Auflage... 15 Über den Autor... 16

Vorwort zur 5. Auflage... 15 Über den Autor... 16 Vorwort zur 5. Auflage...................................... 15 Über den Autor............................................ 16 Teil I Grundlagen.............................................. 17 1 Einführung

Mehr

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein 1 Definitionen 1.1 Datenbank Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert Integriert, selbstbeschreibend, verwandt 1.2 Intension/Extension Intension: Menge der Attribute Extension:

Mehr

Multidimensionales Datenmodell, Cognos

Multidimensionales Datenmodell, Cognos Data Warehousing (II): Multidimensionales Datenmodell, Cognos Praktikum: Data Warehousing und Mining Praktikum Data Warehousing und Mining, Sommersemester 2010 Vereinfachte Sicht auf die Referenzarchitektur

Mehr

Raumbezogene Datenbanken (Spatial Databases)

Raumbezogene Datenbanken (Spatial Databases) Raumbezogene Datenbanken (Spatial Databases) Ein Vortrag von Dominik Trinter Alexander Christian 1 Inhalte Was ist ein raumbezogenes DBMS? Modellierung Abfragen Werkzeuge zur Implementierung Systemarchitektur

Mehr

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher

Mehr

Relationale Datenbanken Datenbankgrundlagen

Relationale Datenbanken Datenbankgrundlagen Datenbanksystem Ein Datenbanksystem (DBS) 1 ist ein System zur elektronischen Datenverwaltung. Die wesentliche Aufgabe eines DBS ist es, große Datenmengen effizient, widerspruchsfrei und dauerhaft zu speichern

Mehr

Logische Modellierung von Data Warehouses

Logische Modellierung von Data Warehouses Logische Modellierung von Data Warehouses Vertiefungsarbeit von Karin Schäuble Gliederung. Einführung. Abgrenzung und Grundlagen. Anforderungen. Logische Modellierung. Methoden.. Star Schema.. Galaxy-Schema..

Mehr

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining 2 Eigenschaften eines Data Warehouse Referenzarchitektur Integrierte Sicht auf beliebige Daten aus verschieden Datenbanken

Mehr

Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH)

Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH) Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH) Verteilung und Integration von Informationen im Verkehrsbereich Thema: OLAP in verteilten Data-Warehouse- Umgebungen Vortrag: Christian

Mehr

C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl

C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl Ein Seminar der DWH academy Seminar C09 Einsatz SAP BW im Vergleich zur Best-of-Breed- Produktauswahl Befasst man sich im DWH mit der Auswahl

Mehr

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem Fachbericht zum Thema: Anforderungen an ein Datenbanksystem von André Franken 1 Inhaltsverzeichnis 1 Inhaltsverzeichnis 1 2 Einführung 2 2.1 Gründe für den Einsatz von DB-Systemen 2 2.2 Definition: Datenbank

Mehr

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH Einführung in OLAP und Business Analysis Gunther Popp dc soft GmbH Überblick Wozu Business Analysis mit OLAP? OLAP Grundlagen Endlich... Technischer Background Microsoft SQL 7 & OLAP Services Folie 2 -

Mehr

Aufgaben zur fachwissenschaftlichen Prüfung Modul 3 Daten erfassen, ordnen, verarbeiten und austauschen: Schwerpunkt Datenbanken

Aufgaben zur fachwissenschaftlichen Prüfung Modul 3 Daten erfassen, ordnen, verarbeiten und austauschen: Schwerpunkt Datenbanken Aufgaben zur fachwissenschaftlichen Prüfung Modul 3 Daten erfassen, ordnen, verarbeiten und austauschen: Schwerpunkt Datenbanken 30 Wozu dient ein Primärschlüssel? Mit dem Primärschlüssel wird ein Datenfeld

Mehr

Einführung in Data Warehouses

Einführung in Data Warehouses Kapitel l6 Einführung in Data Warehouses Vorlesung: Dr. Matthias Schubert Skript 2009 Matthias Schubert Dieses Skript basiert auf dem Skript zur Vorlesung Datenbanksysteme II von Prof. Dr. Christian Böhm

Mehr

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem. Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen

Mehr

Performanceaspekte in der SAP BI Modellierung

Performanceaspekte in der SAP BI Modellierung Performanceaspekte in der SAP BI Modellierung SAP BW 7.3 & SAP HANA Performance Indizes Aggregate DSO & InfoCube BWA SAP HANA Empfehlung 2 Performance Performance bedeutet, unter gegebenen Anforderungen

Mehr

Performance by Design Wie werden performante ETL-Prozesse erstellt?

Performance by Design Wie werden performante ETL-Prozesse erstellt? Performance by Design Wie werden performante ETL-Prozesse erstellt? Reinhard Mense ARETO Consulting Bergisch Gladbach Schlüsselworte: DWH, Data Warehouse, ETL-Prozesse, Performance, Laufzeiten, Partitionierung,

Mehr

3. Das Relationale Datenmodell

3. Das Relationale Datenmodell 3. Das Relationale Datenmodell Das Relationale Datenmodell geht zurück auf Codd (1970): E. F. Codd: A Relational Model of Data for Large Shared Data Banks. Comm. of the ACM 13(6): 377-387(1970) DBMS wie

Mehr

Themenblock: Erstellung eines Cube

Themenblock: Erstellung eines Cube Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen

Mehr

OLAP und der MS SQL Server

OLAP und der MS SQL Server OLAP und der MS SQL Server OLAP und der MS SQL Server OLAP-Systeme werden wie umfangreiche Berichtssysteme heute nicht mehr von Grund auf neu entwickelt. Stattdessen konzentriert man sich auf die individuellen

Mehr

6 HANA-optimierte InfoCubes

6 HANA-optimierte InfoCubes 117 HANA-optimierte InfoCubes bilden im»sap BW powered by SAP HANA«das Pendant zu relationalen InfoCubes in BW-Systemen mit relationalen Datenbanksystemen. Obwohl ihr Modell wesentlich auf die spaltenorientierte

Mehr

Motivation. Dimensionen. Motivation /2. 3. Multidimensionales Datenmodell

Motivation. Dimensionen. Motivation /2. 3. Multidimensionales Datenmodell 3. Multidimensionales Datenmodell Grundbegriffe Dimensionen, Fakten/Kennzahlen, Würfel Analyseoperationen Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung ME/R, ADAPT, graphbasierte

Mehr

4 Grundlagen der Datenbankentwicklung

4 Grundlagen der Datenbankentwicklung 4 Grundlagen der Datenbankentwicklung In diesem Kapitel werden wir die Grundlagen der Konzeption von relationalen Datenbanken beschreiben. Dazu werden Sie die einzelnen Entwicklungsschritte von der Problemanalyse

Mehr

1. Übungsblatt. Besprechung: 27.10 (Gruppe A), 3.11 (Gruppe B)

1. Übungsblatt. Besprechung: 27.10 (Gruppe A), 3.11 (Gruppe B) DATENBANKEN IN DER PRAXIS: DATA WAREHOUSING Wintersemester 2015/2016 Prof. Dr. Jens Teubner DBIS Group Übung: Dr. Cornelia Tadros ISSI Group Allgemeine Hinweise 1. Übungsblatt Besprechung: 27.10 (Gruppe

Mehr

Information-Design-Tool

Information-Design-Tool Zusatzkapitel Information-Design-Tool zum Buch»HR-Reporting mit SAP «von Richard Haßmann, Anja Marxsen, Sven-Olaf Möller, Victor Gabriel Saiz Castillo Galileo Press, Bonn 2013 ISBN 978-3-8362-1986-0 Bonn

Mehr

Logische Modelle für OLAP. Burkhard Schäfer

Logische Modelle für OLAP. Burkhard Schäfer Logische Modelle für OLAP Burkhard Schäfer Übersicht Einführung in OLAP Multidimensionale Daten: Hypercubes Operationen Formale Grundlagen Zusammenfassung Einführung in OLAP Verfahren zur Analyse großer

Mehr

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse

Mehr

ER-Modell. Entity-Relationship-Model

ER-Modell. Entity-Relationship-Model + ER-Modell Entity-Relationship-Model + Was ist ein Modell? Worte/Zitat aus einem Physikbuch: "Modelle sind also Vorstellungshilfen und Wirklichkeitshilfen, nicht die Wirklichkeit selbst." (Metzler Physik).

Mehr

Themenblock: Data Warehousing (I)

Themenblock: Data Warehousing (I) Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining Agenda Einführung Data Warehouses Online Transactional Processing (OLTP) Datenmanipulation mit SQL Anfragen mit SQL Online

Mehr

4. BEZIEHUNGEN ZWISCHEN TABELLEN

4. BEZIEHUNGEN ZWISCHEN TABELLEN 4. BEZIEHUNGEN ZWISCHEN TABELLEN Zwischen Tabellen können in MS Access Beziehungen bestehen. Durch das Verwenden von Tabellen, die zueinander in Beziehung stehen, können Sie Folgendes erreichen: Die Größe

Mehr

Motivation. Motivation /2. Dimensionen. Einfache Hierarchien. Hierarchien in Dimensionen. 3. Multidimensionales Datenmodell

Motivation. Motivation /2. Dimensionen. Einfache Hierarchien. Hierarchien in Dimensionen. 3. Multidimensionales Datenmodell 3. Multidimensionales Datenmodell Grundbegriffe Dimensionen, Fakten/Kennzahlen, Würfel Analyseoperationen Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung ME/R, ADAPT, graphbasierte

Mehr

Anwendung des Prinzips der Doppik beim Aufbau eines Data Warehouses

Anwendung des Prinzips der Doppik beim Aufbau eines Data Warehouses Anwendung des Prinzips der Doppik beim Aufbau eines Data Warehouses Einführung Einer der Nachteile der Data Warehouse Technologie besteht daran, dass in einem Data Warehouse (DWH ) nur Momentaufnahmen

Mehr

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Prof. Dr. Anett Mehler-Bicher Fachhochschule Mainz, Fachbereich Wirtschaft Prof. Dr. Klaus Böhm health&media GmbH 2011 health&media

Mehr

Professionelle Diagramme mit Excel 2010 erstellen. Peter Wies. 1. Ausgabe, 2. Aktualisierung, März 2014. Themen-Special W-EX2010DI

Professionelle Diagramme mit Excel 2010 erstellen. Peter Wies. 1. Ausgabe, 2. Aktualisierung, März 2014. Themen-Special W-EX2010DI Peter Wies 1. Ausgabe, 2. Aktualisierung, März 2014 Professionelle Diagramme mit Excel 2010 erstellen Themen-Special W-EX2010DI 2 Professionelle Diagramme mit Excel 2010 erstellen - Themen-Special 2 Wichtige

Mehr

Insiderwissen 2013. Hintergrund

Insiderwissen 2013. Hintergrund Insiderwissen 213 XING EVENTS mit der Eventmanagement-Software für Online Eventregistrierung &Ticketing amiando, hat es sich erneut zur Aufgabe gemacht zu analysieren, wie Eventveranstalter ihre Veranstaltungen

Mehr

Datenbanken 16.1.2008. Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt:

Datenbanken 16.1.2008. Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt: Datenbanksysteme Entwicklung der Datenbanksysteme Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt: 1. Generation: In den fünfziger

Mehr

Multidimensionales Datenmodell. Motivation. Motivation /2. Grundbegriffe. Analyseoperationen. Notationen zur konzeptuellen Modellierung

Multidimensionales Datenmodell. Motivation. Motivation /2. Grundbegriffe. Analyseoperationen. Notationen zur konzeptuellen Modellierung Multidimensionales Datenmodell Grundbegriffe Dimensionen, Fakten/Kennzahlen, Würfel Analyseoperationen Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung ME/R,ADAPT,graphbasierteAnsätze

Mehr

Einführung in Datenbanksysteme. H. Wünsch 01.2001

Einführung in Datenbanksysteme. H. Wünsch 01.2001 Einführung in Datenbanksysteme H. Wünsch 01.2001 H. Wünsch 01/2001 Einführung Datenbanken 2 Was sind Datenbanken? Datenbanken sind Systeme zur Beschreibung, Speicherung und Wiedergewinnung von Datenmengen.

Mehr

CAS genesisworld.exchange connect Abgleich von Adressen und Terminen

CAS genesisworld.exchange connect Abgleich von Adressen und Terminen Abgleich von Adressen und Terminen Stand Juni 2004 Was ist CAS genesisworld.exchange connect? Inhalt 1 Was ist CAS genesisworld.exchange connect?... 3 2 Systemvoraussetzungen... 5 2.1 Software...5 2.2

Mehr

Kampagnenmanagement mit Siebel Marketing/Oracle BI ein Praxisbericht

Kampagnenmanagement mit Siebel Marketing/Oracle BI ein Praxisbericht Kampagnenmanagement mit Siebel Marketing/Oracle BI ein Praxisbericht Thomas Kreuzer ec4u expert consulting ag Karlsruhe Schlüsselworte: Kampagnenmanagement Praxisbericht Siebel Marketing Oracle BI - ec4u

Mehr

Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben. Die Hypercube-Technologie

Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben. Die Hypercube-Technologie Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben Transbase Hypercube ist eine Transbase -Option, die die innovative Hypercube-Technologie für komplexe analytische Anwendungen (OLAP)

Mehr

Fachbereich Informatik Praktikumsversuch 4. Prof. Dr. S. Karczewski Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 13.05.2013.

Fachbereich Informatik Praktikumsversuch 4. Prof. Dr. S. Karczewski Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 13.05.2013. Hochschule Darmstadt Data Warehouse Fachbereich Informatik Praktikumsversuch 4 Prof. Dr. S. Karczewski Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 13.05.2013 Data Warehouse Aufgabenstellung Aufgabe1: OLAP-Modellerstellung

Mehr

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation 27. Juni 2013 Hinweis Diese Folien ersetzen keinesfalls den Übungsstoff des zugehörigen e-learning-kurses.

Mehr

Einführung in Data Warehouses

Einführung in Data Warehouses Vorlesung Datebanksysteme II im SoSe 2015 Einführung in Data Warehouses Vorlesung: PD Dr. Peer Kröger Einführung in Data Warehouses Übersicht 1 Einleitung 2 Datenmodellierung 3 Anfragebearbeitung 2 Einführung

Mehr

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse?

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse? Ein Beispiel Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse? Dipl.-Kfm. Claus Häberle WS 2015 /16 # 42 XML (vereinfacht) visa

Mehr

2 Datenbanksysteme, Datenbankanwendungen und Middleware... 45

2 Datenbanksysteme, Datenbankanwendungen und Middleware... 45 Vorwort 15 Teil I Grundlagen 19 i Einführung In das Thema Datenbanken 21 I.I Warum ist Datenbankdesign wichtig? 26 i.2 Dateisystem und Datenbanken 28 1.2.1 Historische Wurzeln 29 1.2.2 Probleme bei der

Mehr

Konzepte der Informatik

Konzepte der Informatik Konzepte der Informatik Vorkurs Informatik zum WS 2011/2012 26.09. - 30.09.2011 17.10. - 21.10.2011 Dr. Werner Struckmann / Christoph Peltz Stark angelehnt an Kapitel 1 aus "Abenteuer Informatik" von Jens

Mehr

Primzahlen und RSA-Verschlüsselung

Primzahlen und RSA-Verschlüsselung Primzahlen und RSA-Verschlüsselung Michael Fütterer und Jonathan Zachhuber 1 Einiges zu Primzahlen Ein paar Definitionen: Wir bezeichnen mit Z die Menge der positiven und negativen ganzen Zahlen, also

Mehr

Produktentwicklung damit sollten Sie rechnen

Produktentwicklung damit sollten Sie rechnen Produktentwicklung damit sollten Sie rechnen 0. Zusammenfassung Wer Produktentwicklung betreiben will, muss in erster Linie sehr viel lesen: Dokumente aus unterschiedlichsten Quellen und in vielen Formaten.

Mehr

Datenbanksysteme 2 Frühjahr-/Sommersemester 2014 28. Mai 2014

Datenbanksysteme 2 Frühjahr-/Sommersemester 2014 28. Mai 2014 Lehrstuhl für Praktische Informatik III Prof. Dr. Guido Moerkotte Email: moer@db.informatik.uni-mannheim.de Marius Eich Email: marius.eich@uni-mannheim.de Datenbanksysteme 2 8. Übungsblatt Frühjahr-/Sommersemester

Mehr

5 Business Intelligence an einem Beispiel: Reporting

5 Business Intelligence an einem Beispiel: Reporting Seite57 5 Business Intelligence an einem Beispiel: Reporting In den folgenden drei Kapiteln sollen die Mçglichkeiten, die OLAP-Datenbanken in der UnternehmenspraxisfürReporting,Analyseund Planung erçffnen,

Mehr

PROSEMINAR ONLINE ALGORITHMEN

PROSEMINAR ONLINE ALGORITHMEN PROSEMINAR ONLINE ALGORITHMEN im Wintersemester 2000/2001 Prof. Dr. Rolf Klein, Dr. Elmar Langetepe, Dipl. Inform. Thomas Kamphans (Betreuer) Vortrag vom 15.11.2000 von Jan Schmitt Thema : Finden eines

Mehr

1 Business-Intelligence-Architektur 1

1 Business-Intelligence-Architektur 1 D3kjd3Di38lk323nnm xi 1 Business-Intelligence-Architektur 1 1.1 Data Warehouse....................................... 1 1.2 OLAP und mehrdimensionale Datenbanken.................. 4 1.3 Architekturvarianten....................................

Mehr

Entwurf von Datenbanken

Entwurf von Datenbanken Bisher: was sind Datenbanken? Wie funktionieren sie? Im Folgenden: wie entwickle ich eine Datenbank? Was ist eine gute Datenbank? Der Datenbankentwurfsprozess Das Entity Relationship (ER) Modell Abbildung

Mehr

Mobile Analytics mit Oracle BI - was steckt in den Apps?

Mobile Analytics mit Oracle BI - was steckt in den Apps? Mobile Analytics mit Oracle BI - was steckt in den Apps? Schlüsselworte Oracle BI, OBIEE, Mobile, Analytics Einleitung Gerd Aiglstorfer G.A. itbs GmbH Eching Oracle erweiterte im Laufe dieses Jahres das

Mehr

OLAP mit dem SQL-Server

OLAP mit dem SQL-Server Hartmut Messerschmidt Kai Schweinsberg OLAP mit dem SQL-Server Eine Einführung in Theorie und Praxis IIIBibliothek V dpunkt.verlag Teil OLAP undder Microsoft SQL-Server 1 1 Theoretische Grundlagen 3 1.1

Mehr

Datenbanken für Online Untersuchungen

Datenbanken für Online Untersuchungen Datenbanken für Online Untersuchungen Im vorliegenden Text wird die Verwendung einer MySQL Datenbank für Online Untersuchungen beschrieben. Es wird davon ausgegangen, dass die Untersuchung aus mehreren

Mehr

1 Mathematische Grundlagen

1 Mathematische Grundlagen Mathematische Grundlagen - 1-1 Mathematische Grundlagen Der Begriff der Menge ist einer der grundlegenden Begriffe in der Mathematik. Mengen dienen dazu, Dinge oder Objekte zu einer Einheit zusammenzufassen.

Mehr

MIS by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001

MIS by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001 MIS Glossar by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001 Aggregat Data Cube Data Marts Data Mining Data Warehouse (DWH) Daten Decision Support Systeme (DSS)

Mehr

Online Analytical Processing

Online Analytical Processing Online Analytical Processing Online Analytical Processing Online Analytical Processing (OLAP) ermöglicht die multidimensionale Betrachtung von Daten zwecks E rmittlung eines entscheidungsunterstützenden

Mehr

Inhaltsverzeichnis. Teil I OLAP und der Microsoft SQL-Server 1. 1 Theoretische Grundlagen 3

Inhaltsverzeichnis. Teil I OLAP und der Microsoft SQL-Server 1. 1 Theoretische Grundlagen 3 vii Teil I OLAP und der Microsoft SQL-Server 1 1 Theoretische Grundlagen 3 1.1 Was ist OLAP?......................................... 3 1.1.1 Business Intelligence............................... 4 1.1.2

Mehr

Übungsblatt 4. Aufgabe 7: Datensicht Fachkonzept (Klausur SS 2002, 1. Termin)

Übungsblatt 4. Aufgabe 7: Datensicht Fachkonzept (Klausur SS 2002, 1. Termin) Übungsblatt 4 Aufgabe 7: Datensicht Fachkonzept (Klausur SS 2002, 1. Termin) Die Saartal Linien beauftragen Sie mit dem Entwurf der Datenstrukturen für ein Informationssystem. Dieses soll zur Verwaltung

Mehr

MindPlan 4. Installations- u. Update-Hinweise. MindPlan 4. Stand: 24. März 2014 Seite: 1/12

MindPlan 4. Installations- u. Update-Hinweise. MindPlan 4. Stand: 24. März 2014 Seite: 1/12 MindPlan 4 Stand: 24. März 2014 Seite: 1/12 Inhalt 1. Informationen zu MindPlan 4... 3 1.1. Neue Funktionen neues Layout... 3 1.2. Lizenzverwaltung (!! Neue Lizenzschlüssel erforderlich!!)... 3 1.2.1.

Mehr

4. Relationen. Beschreibung einer binären Relation

4. Relationen. Beschreibung einer binären Relation 4. Relationen Relationen spielen bei Datenbanken eine wichtige Rolle. Die meisten Datenbanksysteme sind relational. 4.1 Binäre Relationen Eine binäre Relation (Beziehung) R zwischen zwei Mengen A und B

Mehr

2.5. VERBINDUNGSNETZWERKE GESTALTUNGSKRITERIEN DER NETZWERKE TOPOLOGIE ALS GRAPH. Vorlesung 5 TOPOLOGIE: DEFINITIONEN : Sei G = (V, E) ein Graph mit:

2.5. VERBINDUNGSNETZWERKE GESTALTUNGSKRITERIEN DER NETZWERKE TOPOLOGIE ALS GRAPH. Vorlesung 5 TOPOLOGIE: DEFINITIONEN : Sei G = (V, E) ein Graph mit: Vorlesung 5.5. VERBINDUNGSNETZWERKE Kommunikation zwischen den einzelnen Komponenten eines arallelrechners wird i.d.r. über ein Netzwerk organisiert. Dabei unterscheidet man zwei Klassen der Rechner: TOOLOGIE:

Mehr

In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access. Die Grundlagen der Datenbanken.

In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access. Die Grundlagen der Datenbanken. In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access Die Grundlagen der Datenbanken kurspc15 Inhaltsverzeichnis Access... Fehler! Textmarke nicht

Mehr

Data Warehouse Technologien

Data Warehouse Technologien mitp Professional Data Warehouse Technologien von Veit Köppen, Gunter Saake, Kai-Uwe Sattler 2. Auflage 2014 Data Warehouse Technologien Köppen / Saake / Sattler schnell und portofrei erhältlich bei beck-shop.de

Mehr

4 Architektur-Perspektiven (WO)

4 Architektur-Perspektiven (WO) 4 Architektur-Perspektiven (WO) Abb. 4-1: Positionierung des Kapitels im Ordnungsrahmen. Dieses Kapitel befasst sich mit der WO-Dimension des architektonischen Ordnungsrahmens. Es erläutert, auf welchen

Mehr

XINDICE. The Apache XML Project 3.12.09. Name: J acqueline Langhorst E-Mail: blackyuriko@hotmail.de

XINDICE. The Apache XML Project 3.12.09. Name: J acqueline Langhorst E-Mail: blackyuriko@hotmail.de Name: J acqueline Langhorst E-Mail: blackyuriko@hotmail.de 3.12.09 HKInformationsverarbeitung Kurs: Datenbanken vs. MarkUp WS 09/10 Dozent: Prof. Dr. M. Thaller XINDICE The Apache XML Project Inhalt Native

Mehr

Oracle, Datenbank, PowerPoint, Dokumente, PPTX, Automatisierung, Prozess-Automatisierung, smaxt

Oracle, Datenbank, PowerPoint, Dokumente, PPTX, Automatisierung, Prozess-Automatisierung, smaxt Automatische Generierung serialisierter, individualisierter PowerPoint-Präsentationen aus Oracle Datenbanken Andreas Hansel Symax Business Software AG Parkstrasse 22, D-65189 Wiesbaden Schlüsselworte Oracle,

Mehr

Entwurfsbeschreibung der Softwarestudie

Entwurfsbeschreibung der Softwarestudie swp15-lib Entwurfsbeschreibung der Softwarestudie Projektleiter: Christian Blecha Christian Blecha 07.04.2015 Inhaltsverzeichnis 1 Allgemeines 3 2 Produktübersicht 3 3 Grundsätzliche Struktur- und Entwurfsprinzipien

Mehr

Kostenrechnung für Banken. Produktbeschreibung BCS-KR. Transforming Data Into Profit

Kostenrechnung für Banken. Produktbeschreibung BCS-KR. Transforming Data Into Profit Kostenrechnung für Banken Produktbeschreibung BCS-KR Transforming Data Into Profit BCS-KR Produktbeschreibung 2 Die nachfolgend beschriebene Kostenrechnungskomponente BCS-KR wurde mit Banken speziell für

Mehr

Grundlagen der Informatik. Prof. Dr. Stefan Enderle NTA Isny

Grundlagen der Informatik. Prof. Dr. Stefan Enderle NTA Isny Grundlagen der Informatik Prof. Dr. Stefan Enderle NTA Isny 2 Datenstrukturen 2.1 Einführung Syntax: Definition einer formalen Grammatik, um Regeln einer formalen Sprache (Programmiersprache) festzulegen.

Mehr

1 Einleitung. Betriebswirtschaftlich administrative Systeme

1 Einleitung. Betriebswirtschaftlich administrative Systeme 1 1 Einleitung Data Warehousing hat sich in den letzten Jahren zu einem der zentralen Themen der Informationstechnologie entwickelt. Es wird als strategisches Werkzeug zur Bereitstellung von Informationen

Mehr

Ein Schlüssel ist eine Menge von Attributen (also eines oder mehrere), die eine Datenzeile (Tupel) einer Tabelle eindeutig identifiziert

Ein Schlüssel ist eine Menge von Attributen (also eines oder mehrere), die eine Datenzeile (Tupel) einer Tabelle eindeutig identifiziert Maika Büschenfeldt Datenbanken: Skript 1 1. Was ist eine relationale Datenbank? In Datenbanken können umfangreiche Datenbestände strukturiert abgelegt werden. Das Konzept relationaler Datenbanken soll

Mehr

Über Arrays und verkettete Listen Listen in Delphi

Über Arrays und verkettete Listen Listen in Delphi Über Arrays und verkettete Listen Listen in Delphi Michael Puff mail@michael-puff.de 2010-03-26 Inhaltsverzeichnis Inhaltsverzeichnis 1 Einführung 3 2 Arrays 4 3 Einfach verkettete Listen 7 4 Doppelt verkettete

Mehr

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation Zusammenfassung OPAL 6. Übung Juni 2015 Agenda Hinweise zur Klausur Zusammenfassung OPAL Übungen / Kontrollfragen

Mehr

Logische Datenmodellierung zur Abbildung mehrdimensionaler Datenstrukturen im SAP Business Information Warehouse

Logische Datenmodellierung zur Abbildung mehrdimensionaler Datenstrukturen im SAP Business Information Warehouse Logische Datenmodellierung zur Abbildung mehrdimensionaler Datenstrukturen im SAP Business Information Warehouse Vortrag auf der BTW 2003, Leipzig 26.-28.02.2003 Dr. Michael Hahne cundus AG Prokurist,

Mehr

Profilbezogene informatische Bildung in den Klassenstufen 9 und 10. Schwerpunktthema Daten und Datenbanken

Profilbezogene informatische Bildung in den Klassenstufen 9 und 10. Schwerpunktthema Daten und Datenbanken Profilbezogene informatische Bildung in den Klassenstufen 9 und 10 Schwerpunktthema Robby Buttke Fachberater für Informatik RSA Chemnitz Fachliche Einordnung Phasen relationaler Modellierung Fachlichkeit

Mehr

Einteilung von Datenbanken

Einteilung von Datenbanken Datenbanksysteme (c) A.Kaiser; WU-Wien 1 Einteilung von Datenbanken 1. formatierte Datenbanken 2. unformatierte Datenbanken Information Retrieval Systeme 2 Wozu Datenbanken? Speicherung und Verwaltung

Mehr

Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann

Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann Andreas Ditze MID GmbH Kressengartenstraße 10 90402 Nürnberg a.ditze@mid.de Abstract: Data Lineage

Mehr

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken Dateiname: ecdl5_01_00_documentation_standard.doc Speicherdatum: 14.02.2005 ECDL 2003 Basic Modul 5 Datenbank - Grundlagen

Mehr

5.3 Der Tabellenpuffer. aktualität nicht so wichtig ist, Datenkonsistenz aber schon. Zur Verdeutlichung der Datenkonsistenz hilft folgendes Beispiel.

5.3 Der Tabellenpuffer. aktualität nicht so wichtig ist, Datenkonsistenz aber schon. Zur Verdeutlichung der Datenkonsistenz hilft folgendes Beispiel. 5 Pufferung aktualität nicht so wichtig ist, atenkonsistenz aber schon. Zur Verdeutlichung der atenkonsistenz hilft folgendes eispiel. ngenommen ein Internetshop führt eine kleine Preisanpassung während

Mehr

SOLISYON GMBH TOBIAS GRUBER BEN WEISSMAN. Analyse von Dimensions-Schlüsselfehlern bei der Aufbereitung von SSAS Datenbanken

SOLISYON GMBH TOBIAS GRUBER BEN WEISSMAN. Analyse von Dimensions-Schlüsselfehlern bei der Aufbereitung von SSAS Datenbanken WEITER BLICKEN. MEHR ERKENNEN. BESSER ENTSCHEIDEN. Analyse von Dimensions-Schlüsselfehlern bei der Aufbereitung von SSAS Datenbanken SOLISYON GMBH TOBIAS GRUBER BEN WEISSMAN ANALYSE VON OLAP-AUFBEREITUNGSFEHLERN

Mehr

Wirtschaftsrechnen. Leseprobe

Wirtschaftsrechnen. Leseprobe Wirtschaftsrechnen Kapitel 1 Darstellung von Größen 1.1 Größen im Koordinatensystem 1.2 Diagramme und Ihre Verwendung 1.2.1 Säulendiagramm 1.2.2 Balkendiagramm 1.2.3 Punktdiagramm (Streudiagramm) 1.2.4

Mehr

Folge 19 - Bäume. 19.1 Binärbäume - Allgemeines. Grundlagen: Ulrich Helmich: Informatik 2 mit BlueJ - Ein Kurs für die Stufe 12

Folge 19 - Bäume. 19.1 Binärbäume - Allgemeines. Grundlagen: Ulrich Helmich: Informatik 2 mit BlueJ - Ein Kurs für die Stufe 12 Grundlagen: Folge 19 - Bäume 19.1 Binärbäume - Allgemeines Unter Bäumen versteht man in der Informatik Datenstrukturen, bei denen jedes Element mindestens zwei Nachfolger hat. Bereits in der Folge 17 haben

Mehr