Friedrich-Schiller-Universität Jena Fakultät für Mathematik Informatik Lehrstuhl für Datenbanken und Informationssysteme Betreut von: David Wiese

Größe: px
Ab Seite anzeigen:

Download "Friedrich-Schiller-Universität Jena Fakultät für Mathematik Informatik Lehrstuhl für Datenbanken und Informationssysteme Betreut von: David Wiese"

Transkript

1 Friedrich-Schiller-Universität Jena Fakultät für Mathematik Informatik Lehrstuhl für Datenbanken und Informationssysteme Betreut von: David Wiese Seminar Data Warehousing Sommersemester 2005 vorgelegt von: Marcus Wenzel Matrikelnummer: 44277

2 Inhaltsverzeichnis Inhaltsverzeichnis Inhaltsverzeichnis II 1. Einleitung 1 2. Evolutionäre Ansätze der graphischen Konzeption von DWHS Die multidimensionale E/R-Notation Die multidimensionale UML-Notaion muml 5 3. Revolutionäre Ansätze der graphischen Konzeption von DWHS Der Ansatz von Totok Der multidimensional Aggregation Cube (MAC) Das Dimensional Fact Model Graphbasierte Ansätze Vergleich der vorgestellten Modellierungsansätze 18 Literaturverzeichnis III II

3 1. Einleitung Die Bedeutung von Datenerfassung, Datenhaltung und Datenauswertung nimmt mehr und mehr zu. So sind zum Beispiel für ein Unternehmen Verkaufsstatistiken von großem Interesse, welche Hypothesen über zukünftige Verkäufe erlauben. Aus unternehmerischer Sicht unterliegen solche Statistiken dem Kriterium der Wirtschaftlichkeit, das heißt die Kosten müssen vertretbar sein und die Dauer darf nur verantwortbar lang sein, wobei jedoch die zur Analyse herangezogenen Datenmengen immer größer werden. Ein weit verbreiteter Ansatz solche Fragestellungen zu lösen sind Data-Warehouse-Systeme (DWHS). Bei der Entwicklung eines solchen Systems wird ein der Entwicklung von Datenbanksystemen ähnlicher Prozess durchlaufen (Schaubild 1.). Dieser Vergleich liegt nahe, da Data-Warehouses zumeist als relationale Datenbanken realisiert werden. Im Unterschied zu Datenbanken werden in DWHS Daten mehrerer Dimensionen gespeichert, in diesen Dimensionen können Hierarchien existieren. Eine Dimension wäre zum Beispiel die Zeitdimension (Minute-Stunde-Tag-Monat- Jahr). Eine Dimensionsebene ist Element einer Dimension, so ist z.b. ist Minute eine Dimensionsebene der Dimension Zeit. Ein DWHS enthält mehrere Dimensionen, weshalb auf konzeptioneller Ebene ein Modellierungsansatz verwendet werden muss, der diesem Aspekt gerecht wird. Die aus dem Datenbankbereich bekannten Modellierungskonzepte erlauben nur unzureichende multidimensionale Entwürfe. Diese Arbeit bietet einen Einblick in einige der verschiedenen Möglichkeiten der graphischen Konzeption von DWHS. Am Schaubild 1. ist zu sehen, dass im klassischen Entwurf von Datenbanksystemen, allem voran eine Anforderungsanalyse betrieben wird, um das zu entwickelnde System optimal auf die jeweiligen Ansprüche abzustimmen. Diesem Schritt schließt sich der konzeptionelle Entwurf an, in dem losgelöst von der konkreten Umsetzung des Datenbanksystems die Struktur des zu realisierenden Systems beschrieben wird. Nachdem das zu entwickelnde System konzeptioniert ist, wird im 3.Schritt des Datenbankentwurfs dieses Konzept in ein konkretes Datenmodell transportiert (z.b. in das relationale Modell). Den letzten Schritt des Datenbankentwurfs stellt die Implementierung in einem konkreten Datenbankmanagementsystem (z.b. 1

4 DB2 oder Oracle) dar. Man unterscheidet Ansätze des konzeptionellen DWHS- Entwurfs in evolutionäre Ansätze, revolutionäre Ansätze und graphbasierte Ansätze. Evolutionäre Ansätze sind Erweiterungen bestehender Modellierungskonzepte. Von revolutionären Ansätzen spricht man dann, wenn für die Modellierung von DWHS neue Modellierungsarten entwickelt wurden. Im Folgenden wird näher auf die drei Arten der Modellierungsansätze eingegangen und ihre Vertreter vorgestellt. Schaubild 1. Entwicklungsprozess von DB - bzw. DWH - Systemen 2. Evolutionäre Ansätze der graphischen Konzeption von DWHS Unter evolutionären Ansätzen der Modellierung von DWHS versteht man Erweiterungen von aus dem Datenbankbereich bekannten Modellierungskonzepten. Hier werden die Erweiterung des E/R-Modells und die Erweiterung des UML-Modells für den multidimensionalen Fall vorgestellt. 2.1 Die multidimensionale E/R-Notation Die multidimensionale E/R-Notation (me/r) ist eine Erweiterung des bekannten Entity/Relationship-Modells [Chen76]. Sie wurde entwickelt, um multidimensionale Schemata modellieren zu können. Der Erweiterung des E/R-Modells um multidimensionale Semantik lagen 3 wichtige Zielstellungen zugrunde: o Das me/r-modell sollte eine Spezialisierung des E/R-Modells sein, das heißt die neu eingeführten Konstrukte sollten Spezialfälle ursprünglicher E/R-Konstrukte sein um die Flexibilität und Ausdrucksmächtigkeit des E/R- Modells nicht einzuschränken. o Ein E/R-Modellierer sollte ohne große Probleme die neue Notationsweise erlernen und anwenden können. Deshalb musste die Anzahl der erweiterten 2

5 Konstrukte so gering wie möglich sein. Diese Minimalität der Erweiterung sollte es möglich machen, vorhandene Ergebnisse (z.b.: formale Fundierung) über E/R-Modellierung auf den Fall der me/r-notation zu transferieren. o Die multidimensionale Semantik sollte mit der neuen Notation vollständig darstellbar sein, das heißt es sollte eine Unterscheidung zwischen qualifizierenden und quantifizierenden Daten (Klassifikationsschema und Würfelstruktur) möglich sein. Schaubild 2. Das Metamodell des me/r-modells (vgl. [SBHD99]) In Schaubild 2. wird dargestellt in wie weit das me/r-modell die Funktionalität des E/R-Modells um spezialisierte Konstrukte aus einem multidimensionalen Schema abbilden erweitert. Diese spezialisierten Konstrukte sind: o eine spezielle Entitätenmenge (Klassifikationsstufe), o eine spezielle n-äre Faktbeziehungsmenge (Fakten-Relation), o eine spezielle binäre Classification - Beziehungsmenge (binäre Relationen-Menge) um die Klassifikationsstufen zu verbinden. 3

6 Schaubild 3. Notationen des me/r-modells In Schaublid 3. werden die Symbole der erweiterten Konstrukte vorgestellt. Eine Klassifikationsbeziehung verbindet eine Klassifikationsstufe A mit einer Klassifikationsstufe B, diese Verbindung der beiden Klassifikationsstufen symbolisiert eine Abstraktion von A nach B. In Schaubild 4. sieht man zum Beispiel, dass Räume nach Gebäuden, und Tage nach Monaten klassifiziert werden. Sind 2 Klassifikationsstufen direkt miteinander verbunden, so werden sie atomare Klassifikationsstufen genannt. Diejenigen Klassifikationsstufen, die Schaubild 4. Beispielmodellierung in me/r-notation direkt mit der Faktbeziehung verbunden sind, nennt man Basisklassifikationsstufen. Der Graph einer Klassifikationsbeziehung muss azyklisch sein, um unsinnigen Klassifikationen vorzubeugen. Es würde keinen Sinn machen, wenn man von Jahr nach Tag klassifizieren würde. Die Graphen der im Schaubild 4. 4

7 von der Faktbeziehung Vorlesung ausgehenden Klassifikationen sind azyklische gerichtete Graphen (DAG). Eine Faktbeziehung, die n verschiedene Klassifikationsstufen verbindet, stellt einen Fakt der Dimensionalität n dar. Die Kenngrößen der Fakten, die quantifizierenden Daten, werden als Attribute der n-stelligen Faktbeziehung dargestellt und die qualifizierenden Daten werden durch die Klassifikationsstufen dargestellt. In Schaubild 4 wären das zum Beispiel Honorar des Vortragenden, die Länge des Vortrags und die Anzahl der Zuhörer, welche den Vortrag besuchen. Die Klassifikationshierarchien müssen nicht nur wie in Schaubild 4. realisiert werden. So sind zum Beispiel auch parallele Hierarchien möglich. Für die Zeitdimension würde dies zum Beispiel bedeuten, dass man neben Monat eine Klassifikationsstufe Woche mit einer Klassifikationsbeziehung von Tag zu Woche realisieren könnte, dies nennt man Alternativpfad. Des weiteren ist es möglich, dass sich verschiedene Faktbeziehungen eine Klassifikationshierarchie teilen, das heißt in Schaubild 4., dass zum Beispiel eine beliebige Faktbeziehung mit der Klassifikationsstufe Ort verbunden ist. 2.2 Die multidimensionale UML-Notaion muml Eine weitere Möglichkeit des Erstellens multidimensionaler Schemata ist die Verwendung einer Erweiterung von UML, die so genannte multidimensionale UML (muml). Diese Notationsweise entlehnt ihre Semantik und die multidimensionalen Konstrukte der MML (Multidimensional Modelling Language). Ohne das Metamodell von UML verändern zu müssen, ist es möglich mittels der UML-eigenen Erweiterungsmechanismen (Constraints, Eigenschaftswerte (tagged values) und Stereotypen) multidimensionale Schemata zu entwickeln. Besonders der Tagged-Value und der Stereotypen-Mechanismus werden dazu benutzt, die multidimensionalen Konstrukte der MML bereitzustellen. So können mit Hilfe des Tagged-Value Elementeigenschaften definiert werden, die in muml Eigenschaften von MML-Objekten beschreiben, für die keine UML-Notation vorhanden ist. Ein Tagged-Value ist ein Paar, das aus einem Schlüsselwort, dem Tag, und einem dazugehörigen Datenwert besteht. Ein Stereotyp hingegen führt ein neues, von einer bestehenden UML-Klasse abgeleitetes Modellierungskonstrukt ein. Die Struktur dieser bestehenden Klasse 5

8 darf vom Stereotypen jedoch nicht verändert werden. Das zu modellierende konzeptuelle Schema wird in muml mittels des Static-Structure-Diagramms (Klassendiagramm) der UML dargestellt (siehe Schaubild 5.). Mittels Stereotypen stellt muml verschiedene Klassentypen aus der MML für die Darstellung dimensionaler Klassen, Fakt- und Datenklassen bereit. Besondere Eigenschaften von MML-Klassen wie zum Beispiel Berechnungsformeln abgeleiteter Attribute werden durch Elementeigenschaften repräsentiert. Schaubild 5. Graphische Notation der in der muml verwendeten Konstrukte In Schaubild 6. ist die Umsetzung des in Schaubild 3. in me/r-notation dargestellten Beispielszenarios in muml-notation zu sehen. Die Klasse des Typs Fact-Class stellt den Fakt dar. In ihr sind die Kenngrößen zu sehen. Diese Klasse ist durch Faktenbeziehungen mit den Dimensionen verbunden, jede Klassifikationsstufe einer Dimension ist durch eine Klasse vom Typ Dimensional Class modelliert. Durch das Klassenverständnis in UML ist es möglich Klassen in mehreren Dimensionen zu verwenden. So könnte man zum Beispiel noch eine Klassifikationsbeziehung zwischen der Klasse Ort aus Schaubild 6. und Referent modellieren, um eine Relation wohnt_in darzustellen. Es ist auch möglich parallele Hierarchien darzustellen, hierzu bedient man sich einer Besonderheit der MML, die many-to-many Beziehungen innerhalb von Roll-Up-Pfaden (Klassifikationsbeziehungen) zwischen zwei Klassifikationsstufen ermöglicht. So ist es möglich eine neue Klassifikationsstufe Woche oberhalb von Tag neben Monat in der Zeitdimension einzuführen. Diese Verbindung nennt man Shared Roll-Up, sie ermöglicht es parallele Hierarchien darzustellen. Die Dimension kann oberhalb von Woche fortgeführt werden, eine Klassifikationsbeziehung zum Beispiel zu Jahr wäre denkbar, dabei ist jedoch zu beachten, dass eine Woche zwei Jahren angehören kann. Da muml den objektorientierten Ansatz von UML und MML geerbt hat, stehen in muml auch abstrakte Klassen, Vererbung und 6

9 das Kompositionskonstrukt zur Verfügung. Das Kompositionskonstrukt kann dazu genutzt werden eine Abstraktion einer Fakt-Klasse vorzunehmen. In muml ist es auch möglich, mit Hilfe von abstrakten Klassen und des Vererbungskonstruktes, verschiedene Objekttypen in einer Klassifikationsstufe zu unterscheiden und ihnen verschiedene Attribute zuzuordnen. So könnte man verschiedene Veranstaltungstypen modellieren. Die Eigenschaften des multidimensionalen Modells werden von MML durch ein Metamodell beschrieben, mit dem die von muml verwendeten Konstrukte, deren Beziehungen und die Semantik multidimensionaler Schemata spezifiziert werden. Dabei wird eine strikte Trennung zwischen Metamodell, Schema, und Ausprägung berücksichtigt. Dieses Metamodell stellt eine Grundlage für graphische und konzeptuelle Entwicklung multidimensionaler Modellierungsnotationen dar. Schaubild 6. Beispielmodell in muml-notation 3. Revolutionäre Ansätze der graphischen Konzeption von DWHS Unter revolutionären Ansätzen versteht man diejenigen Ansätze zur Entwicklung multidimensionaler Schemata, die nicht auf vorhandene Konzepte aufbauen, sondern Neuentwicklungen sind. Im Folgenden werden hier der Ansatz von Totok, das Dimensional Fact Model und das MAC-Modell vorgestellt. 7

10 3.1. Der Ansatz von Totok Im Gegensatz zu muml und me/r baut der Notationsansatz von Totok nicht auf eine vorhandene Notation oder bestehendes Modell auf. Ein objektorientierter Modellrahmen wird bereitgestellt, dieser Rahmen wir mit UML-Mitteln modelliert. Es ist so möglich, eventuell auftretende Spezialfälle des multidimensionalen Schemas abbilden zu können. Diese Notationsweise verknüpft die Kennzahlen direkt mit den Dimensionselementen und den dazugehörigen Methoden. Wie in Schaubild 7. zu sehen ist, ist die Kenngröße Besucherzahl direkt mit den Dimensionselementen verbunden bezüglich derer sie analysierbar ist. Strukturelle Änderungen werden durch Gültigkeitsregeln behandelt. Die Besucherzahl ist nach den Dimensionen Zeit, der Veranstaltung und dem Ort analysierbar. Die Kenngröße Besucherzahl ist für alle möglichen Kombinationen dieser Verknüpfungen gültig. Schaubild 7. Gültigkeitszuordnung für die Kenngröße Besucherzahl 8

11 3.2. Der multidimensional Aggregation Cube (MAC) Das MAC-Modell benutzt OLAP-nutzerfreundliche Konzepte der Modellierung, dabei beschreibt das MAC-Modell die Informationen als Dimensionsebene (dimension level), Dimensionspfade (dimension paths), Dimensionen (dimensions), Würfel (cubes), Attribute (attributes) und Aggregationsrelationen (drilling relationships). Die graphische Notation dieser Elemente soweit existent ist Schaubild 8. zu entnehmen. Eine Menge von Aggregationsrelationen kann einen Dimensionspfad bilden. Schaubild 8. Ein MAC wird definiert als eine n-äre Relation zwischen Wertebereichen ( domains ) einer oder mehrer Dimensionen. Ein MAC kann eine oder mehrere Kennzahlen besitzen, jede Kennzahl kann als einfaches Attribut der Relation, die durch den MAC repräsentiert wird, dargestellt werden. Eine Instanz eines MAC wird MAC-Zelle oder nur Zelle (cell) genannt. Eine Dimensionsebene kann ein oder mehrere Attribute haben, von denen eine Untermenge den Schlüssel der Dimensionsebene bildet, meistens ist das ein einzelnes Attribut aber es kann auch zusammengesetzte Schlüssel geben. Eine Aggregationsrelation ist eine n-äre Relation zwischen einer Dimensionsebene (Elternteil ( parent ) der Relation) und n-1 Dimensionsebenen (Kinder der Relation). Eine Aggregationsbeziehung muss immer Kinderdimensionsebenen mit einer Elterndimension verbinden. Sie beschreibt wie Ausprägungen einer Dimensionsstufe in eine andere Dimensionsstufe auf gespalten werden. Aggregationsrelationen sollten nicht dazu verwendet werden Beziehungen zwischen Dimensionen darzustellen, daher dürfen Aggregationsrelationen keine Attribute besitzen. Ein Dimensionspfad ist aus einer Menge von Aggregationsrelationen zusammengesetzt. Die einfachste Form ist eine Folge von Aggregationsrelationen, wobei jede Aggregationsrelation jeweils nur eine Kindebene besitzt. Die Kindebene der letzten Aggregationsrelation wird 9

12 als detaillierte Ebene ( detailed level ) des Dimensionspfades bezeichnet. Ist eine Dimensionsebene an mehreren Dimensionspfaden beteiligt, die drill-down- Operation entlang des Pfades ausgeführt auf dem die aktuelle Analyse stattfindet. Ein Dimensionspfad ist der Graph G(P) einer nichtleeren Menge von Aggregationsrelationen P, für den gilt, dass genau ein Knoten ohne eingehende Kanten existiert (Wurzel), G(P) ein gerichteter azyklischer Graph (DAG) ist, er also keine Kreise enthält, nie 2 Aggregationsrelationen in P mit der gleichen Elterndimensi- Schaubild 9. die Dimensionen: Veranstaltung, Lokation, Referenten, Zeit onsstufen verbunden sind. Eine Dimension ist eine nichtleere Menge von Dimensionspfaden. Besitzt eine Dimension mehr als einen Pfad, so muss jeder Dimensionspfad mit mindestens einer Dimensionsebene verbunden sein, die an mindestens einem weiteren Dimensionspfad teil hat. Der in Schaubild 9. abgebildete Graph P3 ist der Graph der Menge der Aggregationsrelationen (z.b.: zwischen Gebäude und Raum) der Lokation Dimensionen P3. Jeder Knoten des Graphen stellt eine Dimensionsstufe, auf dem Dimensionspfad dar, auch wenn diese Dimensionsstufe an mehreren Aggregationsrelationen beteiligt sein sollte, wird nur ein Knoten im Graph dargestellt. Für jede Aggregationsbeziehung in P wird eine gerichtete 10

13 Kante von der Elternebene zur Kindebene dargestellt. Jede der in Schaubild 9. dargestellten Dimensionen besitzt je nur einen Dimensionspfad. Im MAC-Modell ist also auch die Darstellung von parallelen Hierarchien in einer Dimension (z.b.: in der Zeitdimension Tag-Woche,Tag-Monat,Monat-Jahr) möglich. Dimensionen sind im MAC-Modell von zentraler Bedeutung, da sie zur Definition des Würfels (Cubes) benutzt werden. In dieser Definition werden Dimensionen als Mengen von Dimensionswerten betrachtet. Ein Dimensionswert kann eine Ausprägung einer Dimensionsstufe oder eine Menge solcher Ausprägungen sein. Die Menge aller möglichen Dimensionswerte einer Dimension wir als Dimensionswertebereich ( Dimension Domain ) bezeichnet. Der Dimensionswertebereich der Lokations-Dimension aus Schaubild 9. umfasst also Zeit und Datumsangaben. Dimensionswerte sind Eigenschaften nach denen eine multidimensionale Analyse durchgeführt werden kann. Der multidimensionale Aggregationswürfel (MAC) verbindet Eigenschaftswerte mit Kennzahlen ( measures ). Jede Instanz des MAC wird als Zelle ( cell ) bezeichnet. Diese Zellen sind mit Werten für die Würfelattribute gefüllt. Es besteht eine funktionale Abhängigkeit zwischen Kennzahlen und den, sie repräsentierenden Koordinaten. Die N Dimensionswerte, die in einer Zelle abgelegt sind werden Koordinaten der Zelle genannt. Die Instanzen / Zellen eines Würfels können Kennzahlen verschiedener Granularitäten repräsentieren, wenn zwischen Ihnen eine funktionale Abhängigkeit besteht Das Dimensional Fact Model Das Dimensional Fact Model (DFM) ist entwickelt worden um ausgehend von E/R-basiereten Unterlagen über ein bereits existierendes Informationssystem ein konzeptuelles Schema zu erstellen, das dem Nutzer ermöglicht leichter auf dem Schaubild 10. Symbole der DFM-Notation Datenbestand zu navigieren. Das DFM besteht aus einer Menge von Faktensche- 11

14 mata. Diese Faktenschemata (fact schemes) bestehen aus Fakten, Dimensionen und Hierarchien. Definition 1: Sei g=(v,e) ein gerichteter azyklischer Graph, dann ist g genau dann ein Quasi-Baum mit Wurzel v 0 V, wenn jeder andere Knoten v j V von v 0 über mindesten einen gerichteten Graphen erreicht werden kann. Definition 2: Ein Faktenschema (fact schema) f=(m,a,n,r,o,s) M = Menge der Kenngrößen (Measures) A = Menge der Dimensionsattribute (a i A) Dom(a i ) N = Menge der Nicht-Dimensionsattribute R = geordnetes Paar (a i,a j ) mit a i A { a 0 } und a j A N (a i a j ) so dass quasi-tree qt(f)=(a N { a 0 }) R ist ein Quasi-Baum (qt) mit Wurzel a 0. Eine Dimensionsmenge ( dimension pattern ) ist die Menge Dim(f) ={a i A ( a 0, a i ) R}; jedes Element von Dim(f) ist eine Dimension. a 0 ist ein Dummy-Attribut, das den Fakt (z.b.: Vortrag) repräsentiert. Jedes Attribut a i A, das direkt mit dem Fakt verbunden ist, ist eine Dimension und wird mit d i (d i Dim(f)) bezeichnet. Eine Hierarchie einer Dimension d i Dim(f) ist der Quasi-Baum (Quasi-Tree) mit Wurzel in d i, sub(qt(f), d i ). O R Optionale Relationen Der Wertebereich jedes Dimensionsattributs a j, für das gilt (a i, a j ) O enthält den NULL-Wert. S = Menge von Aggregationsausdrücken (Aggregation statements), jeder Aggregationsausdruck besteht aus einem Tripel (m j,d i,ω), wobei m j M, d i Dim(f) und Ω { SUM, COUNT, MIN, MAX, AND, OR,...}(Aggregations- Operator) Das Statement (m j,d i,ω) S gibt an, dass die Kennzahl m j entlang der Dimension d i nach der Operation Ω aggregiert werden kann, existiert kein solches Statement für ein Paar (m j,d i ) so kann m j nicht entlang d i aggregiert werden. 12

15 Im Folgenden wird auf das in Schaubild 11. dargestellte Faktenschema Vortrag eingegangen. Der Fakt Vortrag enthält die Kennzahlen, die entlang der mit Vortrag direkt verbundenen Dimensionen Zeit, Veranstaltung, Lokation und Referent aggregiert werden. Kann eine Kennzahl nach einer Dimension nicht aggregiert werden so ist diese Kennzahl mit einer unterbrochenen Linie mit der betreffenden Dimension verbunden (im Beispiel Besucherzahl kann nicht nach der Veranstaltungsdimension aggregiert werden, sie ist abhängig von Lokation und Zeit). Auch bei dieser Notation ist es möglich parallele Hierarchien darzustellen. Schaubild 11. Faktenschema Vortrag Gehen mehr als ein Dimensionsattribut in ein anderes Dimensionsattribut ein, so wird eine der beiden Verbindungen durch einen Pfeil auf das höhere Dimensionsattribut dargestellt. Nicht-Dimensionsattribute wie zum Beispiel Adresse werden als Strich dargestellt. Es ist im DFM auch möglich Dimensionsattribute zu modellieren, die keine Werte enthalten müssen (sie dürfen NULL sein), so werden diese Dimensionen durch eine optionale Relation mit dem Fakt verbunden. Dies ist z.b. beim Zusatzmaterial der Fall. 4. Graphbasierte Ansätze Da es eine Vielzahl graphbasierter Ansätze gibt, wird hier nicht nur auf einen graphbasierten Ansatz konzeptionelle Schemata umzusetzen, eingegangen, 13

16 sondern vielmehr werden hier die Grundprinzipien der verschiedenen graphbasierten Ansätze vorgestellt. Die Idee hinter der graphbasierten Modellierung ist, einen azyklischen gerichteten Objektgraphen zu finden und diesen dem Nutzer zur Navigation durch den Datenbestand zur Verfügung zu stellen. Die Kanten des Graphen stellen die Beziehungen zwischen den Knoten dar, die Knoten werden nach ihrer Semantik unterschieden. Der erste betrachtete Ansatz, der heißt SUBJECT [ChSh81], unterscheidet 2 grundlegende Knotentypen: o Kategorien -Cluster-Knoten (C-Knoten) Ein C-Knoten zeigt eine Hierarchie / Gruppe von Kategorien an. o Kreuzprodukt -Knoten (X-Knoten) Ein X-Knoten ermöglicht die Vereinigung (Kreuzprodukt) von eingehenden Knoten (C - oder X- Knoten) C-Knoten repräsentieren qualifizierende Informationen, X-Knoten stellen quantifizierende Daten dar. In Schaubild 12. sind 2 Zuordnungsregeln und deren Schaubild 12. Zuordnungsregeln graphbasierter Ansätze Umsetzung im graphbasierten Modell abgebildet. o Funktionale Abhängigkeit Vater-Sohn-Beziehungen werden als Kante zwischen 2 C-Knoten realisiert. o N:M-Beziehung Eine N:M-Beziehung wird unter Verwendung eines X-Knotens (quantifizierende Information) dargestellt. 14

17 Andere graphbasierte Ansätze wie zum Beispiel: GRASS (Graphical Aproach for Statistical Summaries [RaRi87]), STORM (Statistical Object Representation Model [RaSh90], [BEMR94]), ADaS (Aggregate Data Structure [RaBT96]), SAM* (Semantic Association Model [Semantic Association Model [Su83]) oder CSM (Conceptual Semantic Model [BaBa88]) führen weitere Knotentypen ein, von denen im Weiteren einige vorgestellt werden. o Terminale Knoten (t n -Knoten) Terminale Knoten repräsentieren mögliche Werte aus dem Wertebereich des übergeordneten Kategorieattributs (C-Knoten). Die Menge aller t n -Knoten eines Kattegorieattributs ist eine Teilmenge des Schaubild 12a. primitiven Wertebereichs. Schaubild 12a. zeigt 2 mögliche Ausprägungen des Kategorieattributs Jahr. Schaubild 13. Beispiel für den Einsatz von S- und T-Knoten o Summenknoten (S-Knoten) Summen-Knoten werden benutzt um den quantitativen Teil (die Kennzahlen) zu spezifizieren. Die numerischen Werte werden durch Aggregation aus den unterliegenden Objektgraphen berechnet. In Schaubild 13 ist eine Anwendungsmöglichkeit eines S-Knoten abgebildet o Topic-Knoten (T-Knoten) Ein Topic-Knoten beschreibt Knoten mit gleichem Auswertungskontext. So wird in großen Objektgraphen die Übersichtlichkeit gewährleistet, da 15

18 so Knoten gleichen Inhalts besser erkennbar werden. T-Knoten erlauben es logische Verbindungen zwischen S-Knoten darzustellen und so die Modellierung mehrerer Sichten auf ein Schema. o Aggregation (A-Knoten) Logisch zusammengehörige Einzelfakten werden mit A-Knoten zusammengefasst (hier sind nicht numerische Aggregation wie zum Beispiel. Summen- oder Differenzbildung gemeint). o Generalisierung (G-Knoten) Die Generalisierung ist das Komplementärkonstrukt zur Aggregation, sie bildet durch Weglassen spezifischer Eigenschaften oder Herausheben von Gemeinsamkeiten eine übergeordnete Klasse abstrakter Objekte. Ein graphbasiertes Schema muss folgenden Bedingungen genügen. Ein minimaler Graph muss mindestens je einen T-,S-,X-,C- und t n -Knoten besitzen, weiter unterliegen die einzelnen Knoten gewissen Regeln: - Ein T-Knoten ist mit einem oder mehreren T- und /oder S-Knoten verbunden. - Ein S-Knoten ist mit einem oder mehreren S- und /oder X-Knoten verbunden. - Ein X-Knoten ist mit einem oder mehreren S-, C- oder X-Knoten verbunden. - Ein C-Knoten ist mit einem oder mehreren X- und mit zwei oder mehreren t n - Knoten desselben Wertebereichs verbunden. - Ein t n -Knoten ist nur mit einem C-Knoten verbunden. In Schaubild 14. ist der Ausschnitt eines Objektgraphen dargestellt, welcher das bisher verwendete konzeptuelle Schema beschreibt. 16

19 Schaubild 14.. Ausschnitt der Beispielmodellierung in graphbasierter Notation Trotz der großen Flexibilität und Mächtigkeit der graphbasierten Ansätze haben sie in den letzten Jahren kaum Beachtung gefunden. 17

20 5. Vergleich der vorgestellten Modellierungsansätze Die in Schaubild 15. dargestellte Tabelle vergleicht die hier vorgestellten Ansätze. Da das MAC-Modell das neueste, der hier vorgestellten Modelle ist, erfüllt es alle Kriterien. Wie man in Schaubild 15. sieht erfüllen alle anderen Ansätze Ansatz [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] me/r X X X X X X X muml X X X X X X Totok X X N/A N/A N/A MAC X X X X X X X X X X DFM X X X X X Graph. Ansatz X X N/A X N/A N/A [1] - Ebenen in Dimensionen, [2] - gruppierende Relationen zwischen Ebenen, [3] - N-M gruppierende Relationen, [4] - n-äre Relationen zwischen N Dimensions-Ebenen, [5] - Dimensionen die an Relation beteiligt sind müssen nicht total beteiligt sein, [6] - Analysepfade, [7] - mehrere Kenngrößen zu einem Fakt, [8] -Kennzahlen auf jeder Hierarchie- Ebene definiert, [9] - Kenngrößen über mehrere Ebenen definierbar, [10] - Kenngrößen für einige (nicht für alle) Dimensionsebenen darstellbar Schaubild 15. Vergleich der vorgestellten Notationsmodelle nahezu die gleichen Kriterien. Die Wahl eines, der hier vorgestellten Ansätze hängt von den Vorkenntnissen des Anwenders ab, so ist das me/r-modell ist für einen erfahrenen E/R-Modellierer schnell erlern- und anwendbar, für einen erfahrenen UML-Modellierer ist das muml-modell empfehlenswert. Das MAC- Modell verfügt durch die Modellierung auf verschiedenen Abstraktionsebenen über die größte Ausdrucksmächtigkeit, jedoch ist auch der Aufwand, der betrieben werden muss um solch eine komplexe Modellierung zu realisieren, sehr hoch. Die Wahl der grafischen Notation des Konzepts sollte nach Richtlinien wie dem Aufwand, der für die Umsetzung in der jeweiligen Notation benötigten Zeit und den Vorkenntnissen des Anwenders entschieden werden. 18

21 Literaturverzeichnis Literaturverzeichnis [BaGü01] Bauer, A. / Günzel, H. (2001), Data Warehouse Systeme: Architektur, Entwicklung, Anwendung, Heidelberg dpunkt. Verlag [Lehn03] Lehner, W. (2003), Datenbanktechnologie für Data-Warehouse- Systeme, Konzepte und Methoden, Heidelberg dpunkt. Verlag [SBHD98] Sapia, C. / Blaschka, M. / Höfling, G. / Dinter, B. (1999), Extending the E/R Model for the Multidimensional Paradigm. In Kambayashi, Y. et Al., Advances in Database Technologies, LNCS Vol. 1552, Springer Verlag [TKS01] Tsois, A. / Karayannidis, N. / Sellis, T. (2001), MAC: Conceptual Data Modelling for OLAP, Proceedings of the International Workshop on Design and Management of Data Warehouses. [GMR98] Golfarelli, M. / Maio, D./ Rizzi, S. (1998): The Dimensional Fact Model: a Conceptual Model for Data Warehouses. International Journal Computer and Information Systems. III

Hetero-Homogene Data Warehouses

Hetero-Homogene Data Warehouses Hetero-Homogene Data Warehouses TDWI München 2011 Christoph Schütz http://hh-dw.dke.uni-linz.ac.at/ Institut für Wirtschaftsinformatik Data & Knowledge Engineering Juni 2011 1 Data-Warehouse-Modellierung

Mehr

Das Multidimensionale Datenmodell

Das Multidimensionale Datenmodell Das Multidimensionale Datenmodell Konzeptuelle Modellierung Umsetzung des Modells Beispiel ER-Modell 2 / 36 Probleme ER-Modellierung Keine Unterscheidung Klassifikation, Attribute, Kenngrößen Dimension

Mehr

Multidimensionales Datenmodell, Cognos

Multidimensionales Datenmodell, Cognos Data Warehousing (II): Multidimensionales Datenmodell, Cognos Praktikum: Data Warehousing und Mining Praktikum Data Warehousing und Mining, Sommersemester 2010 Vereinfachte Sicht auf die Referenzarchitektur

Mehr

Datenbanktechnologie für Data-Warehouse-Systeme

Datenbanktechnologie für Data-Warehouse-Systeme Wolfgang Lehner Datenbanktechnologie für Data-Warehouse-Systeme Konzepte und Methoden dpunkt.verlag 1 1.1 1.2 1.3 1.4 1. 5 2 2.1 2.2 2.3 Einleitung 1 Betriebswirtschaftlicher Ursprung des Data Warehousing...

Mehr

Einführung in das Entity-Relationship-Modell

Einführung in das Entity-Relationship-Modell Einführung in das Entity-Relationship-Modell Historie Entity-Relationship-Modell kurz: ER-Modell bzw. ERM 1976 von Peter Chen vorgeschlagen Standardmodell für frühe Entwurfsphasen in der Datenbankentwicklung

Mehr

4 Grundlagen der Datenbankentwicklung

4 Grundlagen der Datenbankentwicklung 4 Grundlagen der Datenbankentwicklung In diesem Kapitel werden wir die Grundlagen der Konzeption von relationalen Datenbanken beschreiben. Dazu werden Sie die einzelnen Entwicklungsschritte von der Problemanalyse

Mehr

Konzeptuelle und logische Modellierung eines Data-Warehouse-Systems

Konzeptuelle und logische Modellierung eines Data-Warehouse-Systems Seminar Data Warehousing im Verkehrsbereich Sommersemester 2003 Konzeptuelle und logische Modellierung eines Data-Warehouse-Systems Ling Kong 09.07.2003 Inhaltsverzeichnis 1. Einleitung... 1 2. Multidimensionales

Mehr

3. Das Relationale Datenmodell

3. Das Relationale Datenmodell 3. Das Relationale Datenmodell Das Relationale Datenmodell geht zurück auf Codd (1970): E. F. Codd: A Relational Model of Data for Large Shared Data Banks. Comm. of the ACM 13(6): 377-387(1970) DBMS wie

Mehr

Kapitel DB:III. III. Konzeptueller Datenbankentwurf

Kapitel DB:III. III. Konzeptueller Datenbankentwurf Kapitel DB:III III. Konzeptueller Datenbankentwurf Einführung in das Entity-Relationship-Modell ER-Konzepte und ihre Semantik Charakterisierung von Beziehungstypen Existenzabhängige Entity-Typen Abstraktionskonzepte

Mehr

Christian Kurze BI-Praktikum IBM WS 2008/09

Christian Kurze BI-Praktikum IBM WS 2008/09 Einführung in die multidimensionale Datenmodellierung e mit ADAPT BI-Praktikum IBM WS 2008/09 1 Gliederung Einführung multidimensionale Datenmodellierung 1. Multidimensionales Modell BI-Praktikum IBM WS

Mehr

3. Spezielle ER-Modelle und Tabellenableitung. Transformation von ER-Diagrammen in Relationen

3. Spezielle ER-Modelle und Tabellenableitung. Transformation von ER-Diagrammen in Relationen 3. Spezielle ER-Modelle und Tabellenableitung Spezialfälle von ER-Modellen Grundlage, was sind Relationen Transformation von ER-Diagrammen in Relationen 56 Lesebeispiel Access (Realisierungmodell!) 57

Mehr

6. Modellierung von Informationssystemen. 6.1 Einleitung 6.2 Konzeptuelles Modell 6.3 OASIS Spezifikation 6.4 Execution Model 6.

6. Modellierung von Informationssystemen. 6.1 Einleitung 6.2 Konzeptuelles Modell 6.3 OASIS Spezifikation 6.4 Execution Model 6. 6. Modellierung von Informationssystemen Spezialseminar Matr. FS 2000 1/10 Volker Dobrowolny FIN- ITI Quellen: Oscar Pastor, Jaime Gomez, Emilio Insfran, Vicente Pelechano The OO-Method approach for information

Mehr

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining 2 Eigenschaften eines Data Warehouse Referenzarchitektur Integrierte Sicht auf beliebige Daten aus verschieden Datenbanken

Mehr

Ein Schlüssel ist eine Menge von Attributen (also eines oder mehrere), die eine Datenzeile (Tupel) einer Tabelle eindeutig identifiziert

Ein Schlüssel ist eine Menge von Attributen (also eines oder mehrere), die eine Datenzeile (Tupel) einer Tabelle eindeutig identifiziert Maika Büschenfeldt Datenbanken: Skript 1 1. Was ist eine relationale Datenbank? In Datenbanken können umfangreiche Datenbestände strukturiert abgelegt werden. Das Konzept relationaler Datenbanken soll

Mehr

Datenbankmodelle 1. Das Entity-Relationship-Modell. Prof. Dr. Bernhard Schiefer 2-1

Datenbankmodelle 1. Das Entity-Relationship-Modell. Prof. Dr. Bernhard Schiefer 2-1 Datenbankmodelle 1 Das Entity-Relationship-Modell Prof. Dr. Bernhard Schiefer 2-1 Datenbankmodelle ER-Modell hierarchisches Modell Netzwerkmodell relationales Modell objektorientierte Modelle Prof. Dr.

Mehr

Vorlesung "Software-Engineering"

Vorlesung Software-Engineering Vorlesung "Software-Engineering" Rainer Marrone, TUHH, Arbeitsbereich STS Vorige Vorlesung Pflichtenheft (requirements specification document) Charakterisierung von Software-Qualität Detaillierte Anforderungsanalyse

Mehr

Fundamentals of Software Engineering 1

Fundamentals of Software Engineering 1 Folie a: Name Fundamentals of Software Engineering 1 Grundlagen der Programmentwurfstechnik 1 Sommersemester 2012 Dr.-Ing. Stefan Werner Fakultät für Ingenieurwissenschaften Folie 1 Inhaltsverzeichnis

Mehr

Modellierung von OLAP- und Data- Warehouse-Systemen

Modellierung von OLAP- und Data- Warehouse-Systemen Andreas Totok Modellierung von OLAP- und Data- Warehouse-Systemen Mit einem Geleitwort von Prof. Dr. Burkhard Huch Deutscher Universitäts-Verlag Inhaltsverzeichnis Abbildungsverzeichnis Tabellenverzeichnis

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining OLAP Operationen Ein konzeptionelles MDDM Aggregierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Operationen im multidimensionalen Datenmodell

Mehr

Themenblock: Data Warehousing (I)

Themenblock: Data Warehousing (I) Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining Agenda Einführung Data Warehouses Online Transactional Processing (OLTP) Datenmanipulation mit SQL Anfragen mit SQL Online

Mehr

Entwurf von Datenbanken

Entwurf von Datenbanken Bisher: was sind Datenbanken? Wie funktionieren sie? Im Folgenden: wie entwickle ich eine Datenbank? Was ist eine gute Datenbank? Der Datenbankentwurfsprozess Das Entity Relationship (ER) Modell Abbildung

Mehr

Techniken der Projektentwicklung

Techniken der Projektentwicklung diagramme Termin 6 Denken in Schnittstellen Was nun? Einführung Bisher kennengelernt: Modellierung auf Konzeptlevel Usecase-Diagramme Domänenmodelle Jetzt: Übergang zu Spezifikation und Implementierung!

Mehr

Kapitel DB:II. II. Datenbankentwurf und Datenbankmodelle. Entwurfsprozess Datenbankmodelle

Kapitel DB:II. II. Datenbankentwurf und Datenbankmodelle. Entwurfsprozess Datenbankmodelle Kapitel DB:II II. Datenbankentwurf und Datenbankmodelle Entwurfsprozess Datenbankmodelle DB:II-1 DB Design and Models STEIN 2004-2015 Entwurfsprozess ANSI/SPARC-Schema-Architektur externe Ebene externes

Mehr

Grundlagen von Datenbanksystemen

Grundlagen von Datenbanksystemen Ramez Elmasri Shamkant B. Navathe Grundlagen von Datenbanksystemen 3., überarbeitete Auflage ein Imprint der Pearson Education Deutschland GmbH Inhaltsverzeichnis Vorwort 9 Über die Autoren 13 Teil 1 Grundkonzepte

Mehr

Entwicklung von Data-Warehouse-Systemen

Entwicklung von Data-Warehouse-Systemen Matthias Goeken Entwicklung von Data-Warehouse-Systemen Anforderungsmanagement, Modellierung, Implementierung Mit einem Geleitwort von Prof. Dr. Ulrich Hasenkamp Deutscher Universitäts-Verlag Inhaltsverzeichnis

Mehr

Datenbankmodelle 1. Das Entity-Relationship-Modell

Datenbankmodelle 1. Das Entity-Relationship-Modell Datenbankmodelle 1 Das Entity-Relationship-Modell Datenbankmodelle ER-Modell hierarchisches Modell Netzwerkmodell relationales Modell objektorientierte Modelle ER Modell - 2 Was kann modelliert werden?

Mehr

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

Einführung in Datenbanken

Einführung in Datenbanken Einführung in Datenbanken Dipl.-Inf. Michael Wilhelm Hochschule Harz FB Automatisierung und Informatik mwilhelm@hs-harz.de aum 2.202 Tel. 03943 / 659 338 1 Inhalt 1. Grundlegende Begriffe der Datenbanktechnologie

Mehr

Seminar C16 - Datenmodellierung für SAP BW

Seminar C16 - Datenmodellierung für SAP BW C16: Datenmodellierung für SAP BW Ein Seminar der DWH academy Seminar C16 - Datenmodellierung für SAP BW Dieses Seminar soll einen umfassenden Einblick in die Datenmodellierung beim Einsatz von SAP BW

Mehr

IT-Kompaktkurs. Datenbanken Skript zur Folge 5. Prof. Dr. Georg Herde Fachhochschule Deggendorf

IT-Kompaktkurs. Datenbanken Skript zur Folge 5. Prof. Dr. Georg Herde Fachhochschule Deggendorf IT-Kompaktkurs Skript zur Folge 5 Prof. Dr. Georg Herde Fachhochschule Deggendorf Semantisches Datenmodell, Entity-Relationship, Normalformen Bei der Entwicklung einer Datenbank wird das Ziel angestrebt,

Mehr

Data Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de

Data Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de Data Warehouses Sommersemester 2011 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen Data Warehouse Architektur Data-Warehouse-System Teilsichten

Mehr

Datenbankentwurf. Entwicklungsprozess Anforderungsanalyse & Miniwelt

Datenbankentwurf. Entwicklungsprozess Anforderungsanalyse & Miniwelt Datenbankentwurf Entwicklungsprozess Wollen DB entwickeln. Etwa für Comic-Sammlung, aus der Freunde ausleihen dürfen. Was ist dazu zu tun? Wie kommt man zu einer laufenden Anwendung? Datenbankentwurf Entwicklungsprozess

Mehr

Multidimensionales Datenmodell. Motivation. Motivation /2. Grundbegriffe. Analyseoperationen. Notationen zur konzeptuellen Modellierung

Multidimensionales Datenmodell. Motivation. Motivation /2. Grundbegriffe. Analyseoperationen. Notationen zur konzeptuellen Modellierung Multidimensionales Datenmodell Grundbegriffe Dimensionen, Fakten/Kennzahlen, Würfel Analyseoperationen Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung ME/R,ADAPT,graphbasierteAnsätze

Mehr

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier Realisierung von OLAP Operatoren in einem visuellen Analysetool Vortrag von Alexander Spachmann und Thomas Lindemeier Gliederung Ausgangssituation/Motivation Was ist OLAP? Anwendungen Was sind Operatoren?

Mehr

Code-Erzeugung aus UML-Klassendiagrammen

Code-Erzeugung aus UML-Klassendiagrammen Dominik 09.03.2009 Universität Ulm Gessenharter Inst. f. Programmiermethodik und Compilerbau Code-Erzeugung aus UML-Klassendiagrammen Theorie und Praxis Seite 2 REConf 2009 München Dominik Gessenharter

Mehr

3. Konzepte der objektorientierten Programmierung

3. Konzepte der objektorientierten Programmierung 3. Konzepte der objektorientierten Programmierung 3.1 Basiskonzepte 3.2 Generalisierung / Spezialisierung 3.3 Aggregation 3.4 Assoziation 3.5 Nachrichten 3.6 Polymorphismus 3. Konzepte der Objektorientierung

Mehr

Abstrakt zum Vortrag im Oberseminar. Graphdatenbanken. Gero Kraus HTWK Leipzig 14. Juli 2015

Abstrakt zum Vortrag im Oberseminar. Graphdatenbanken. Gero Kraus HTWK Leipzig 14. Juli 2015 Abstrakt zum Vortrag im Oberseminar Graphdatenbanken Gero Kraus HTWK Leipzig 14. Juli 2015 1 Motivation Zur Darstellung komplexer Beziehungen bzw. Graphen sind sowohl relationale als auch NoSQL-Datenbanken

Mehr

Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann

Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann Andreas Ditze MID GmbH Kressengartenstraße 10 90402 Nürnberg a.ditze@mid.de Abstract: Data Lineage

Mehr

Relationale Datenbanken Datenbankgrundlagen

Relationale Datenbanken Datenbankgrundlagen Datenbanksystem Ein Datenbanksystem (DBS) 1 ist ein System zur elektronischen Datenverwaltung. Die wesentliche Aufgabe eines DBS ist es, große Datenmengen effizient, widerspruchsfrei und dauerhaft zu speichern

Mehr

Projekt AGB-10 Fremdprojektanalyse

Projekt AGB-10 Fremdprojektanalyse Projekt AGB-10 Fremdprojektanalyse 17. Mai 2010 1 Inhaltsverzeichnis 1 Allgemeines 3 2 Produktübersicht 3 3 Grundsätzliche Struktur und Entwurfsprinzipien für das Gesamtsystem 3 3.1 Die Prefuse Library...............................

Mehr

9. Einführung in Datenbanken

9. Einführung in Datenbanken 9. Einführung in Datenbanken 9.1 Motivation und einführendes Beispiel 9.2 Modellierungskonzepte der realen Welt 9.3 Anfragesprachen (Query Languages) 9.1 Motivation und einführendes Beispiel Datenbanken

Mehr

Programmieren in Java

Programmieren in Java FG TECHNISCHE INFORMATIK V JV A00 00 TH 0 Programmieren in Java Anhang A A. Modellierung von OOP-Programmen A.. Klassenkategorien A.2. Klassembeziehungen A.3. Klassendiagramm und Sequenzdiagramm der UML

Mehr

Inhaltsverzeichnis. 1. Fragestellung

Inhaltsverzeichnis. 1. Fragestellung Inhaltsverzeichnis 1. Fragestellung... 1 2. Herleitung zum Thema... 1 3. Das Entity Relationship Modell (ERM)... 2 4. Praktisches Beispiel zum ERM... 7 5. Anhang...Fehler! Textmarke nicht definiert. 1.

Mehr

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein 1 Definitionen 1.1 Datenbank Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert Integriert, selbstbeschreibend, verwandt 1.2 Intension/Extension Intension: Menge der Attribute Extension:

Mehr

Datenbanken: ER-Modell

Datenbanken: ER-Modell Beispiel: Lastenheft: Für eine Hochschule soll eine Verwaltungssoftware geschrieben werden, die alle relevanten Daten in einem relationalen Datenbanksystem speichert. Zu diesen Daten zählen die Stamm-

Mehr

2. Datenmodellierung mit ERM. Motivation für Datenmodellierung. Begriffsklärung. Kardinalität/Komplexität von Beziehungstypen

2. Datenmodellierung mit ERM. Motivation für Datenmodellierung. Begriffsklärung. Kardinalität/Komplexität von Beziehungstypen 2. Datenmodellierung mit ERM Motivation für Datenmodellierung Begriffsklärung Kardinalität/Komplexität von Beziehungstypen Erweiterungen des E/R-Modells Darstellung von Attributen/Beziehungen als Entitytypen

Mehr

EinfÅhrung in die objektorientiere Programmierung (OOP) unter Delphi 6.0. EDV Kurs 13/2

EinfÅhrung in die objektorientiere Programmierung (OOP) unter Delphi 6.0. EDV Kurs 13/2 EinfÅhrung in die objektorientiere Programmierung (OOP) unter Delphi 6.0 EDV Kurs 13/2 Inhaltsverzeichnis 1 Objekte... 1 2 Klassen... 3 2.1 Beziehungen zwischen Klassen... 4 2.1.1 Vererbung... 4 2.1.2

Mehr

Inhalt. 2.1 Datenbankentwurf. 2.2 Relationales Modell. 2.3 Relationale Entwurfstheorie. 2.4 Relationale Algebra. 2.5 Structured Query Language (SQL)

Inhalt. 2.1 Datenbankentwurf. 2.2 Relationales Modell. 2.3 Relationale Entwurfstheorie. 2.4 Relationale Algebra. 2.5 Structured Query Language (SQL) 2. Datenbanken Inhalt 2.1 Datenbankentwurf 2.2 Relationales Modell 2.3 Relationale Entwurfstheorie 2.4 Relationale Algebra 2.5 Structured Query Language (SQL) 2 2.1 Datenbankentwurf Datenbankanwendungen

Mehr

Logische Modellierung von Data Warehouses

Logische Modellierung von Data Warehouses Logische Modellierung von Data Warehouses Vertiefungsarbeit von Karin Schäuble Gliederung. Einführung. Abgrenzung und Grundlagen. Anforderungen. Logische Modellierung. Methoden.. Star Schema.. Galaxy-Schema..

Mehr

Eignung unterschiedlicher Faktenmodellierungen in Data Warehouse-Systemen

Eignung unterschiedlicher Faktenmodellierungen in Data Warehouse-Systemen Christoph Arnold (B. Sc.) Prof. Dr. Harald Ritz Eignung unterschiedlicher Faktenmodellierungen in Data Warehouse-Systemen AKWI-Tagung, 17.09.2012, Hochschule Pforzheim Christoph Arnold, Prof. Dr. Harald

Mehr

Multidimensionales Datenmodell

Multidimensionales Datenmodell Multidimensionales Datenmodell Grundbegriffe fi Fakten, Dimensionen, Würfel Analyseoperationen fi Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung fi ME/R, ADAPT Relationale

Mehr

Konzeptueller Data-Warehouse-Entwurf

Konzeptueller Data-Warehouse-Entwurf Übung Data Warehousing, WS 2007/08 Übung 1 Abgabeschluss: Mo., 29. Okt. 2007, 18:00 Uhr 12 Punkte Matrikel-Nr.: Matrikel-Nr.: Name: Name: Auszuarbeitende Aufgaben: Nr. Punkte Beispiel 1 12 Wohnbau-Genossenschaft:

Mehr

Multidimensionale Datenbanksysteme

Multidimensionale Datenbanksysteme Multidimensionale Datenbanksysteme Modellierung und Verarbeitung Von Dr.-Ing. Wolfgang Lehner IBM Almaden Research Center, San Jose, USA Technische Universität Darrr:ctadi FACHBEREICH INFORMATIK BIBLIOTHEK

Mehr

Motivation. Motivation /2. Dimensionen. Einfache Hierarchien. Hierarchien in Dimensionen. 3. Multidimensionales Datenmodell

Motivation. Motivation /2. Dimensionen. Einfache Hierarchien. Hierarchien in Dimensionen. 3. Multidimensionales Datenmodell 3. Multidimensionales Datenmodell Grundbegriffe Dimensionen, Fakten/Kennzahlen, Würfel Analyseoperationen Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung ME/R, ADAPT, graphbasierte

Mehr

Raumbezogene Datenbanken (Spatial Databases)

Raumbezogene Datenbanken (Spatial Databases) Raumbezogene Datenbanken (Spatial Databases) Ein Vortrag von Dominik Trinter Alexander Christian 1 Inhalte Was ist ein raumbezogenes DBMS? Modellierung Abfragen Werkzeuge zur Implementierung Systemarchitektur

Mehr

Datenbanken: Relationales Datenbankmodell RDM

Datenbanken: Relationales Datenbankmodell RDM Das RDM wurde in den 70'er Jahren von Codd entwickelt und ist seit Mitte der 80'er Jahre definierter Standard für Datenbanksysteme! Der Name kommt vom mathematischen Konzept einer Relation: (Sind A, B

Mehr

Objektorientierte Softwareentwicklung

Objektorientierte Softwareentwicklung Objektorientierte Softwareentwicklung Objektorientierte Softwareentwicklung Smalltalk CLOS Ada 9 C++ Objektorientierte Softwareentwicklung Object Pascal Java Oberon-2 Frage: Die Bibliothek der Fachhochschule

Mehr

Data Warehouse Technologien

Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............

Mehr

Einführung in die Programmierung mit Java. Hörsaalübung

Einführung in die Programmierung mit Java. Hörsaalübung Einführung in die Programmierung mit Java Hörsaalübung Folie 1 Grundlagen der Objektorientierung Seit Anfang der Neunzigerjahre Standardmethode der Softwareentwicklung. Die OOP Objektorientierte Programmierung

Mehr

Metadaten-gestützer Data-Warehouse-Entwurf mit ADAPTed 1 UML

Metadaten-gestützer Data-Warehouse-Entwurf mit ADAPTed 1 UML Erscheint in Proc. 5. Internationale Tagung Wirtschaftsinformatik (WI 2001), 19.-21. September 2001, Augsburg, Germany. Metadaten-gestützer Data-Warehouse-Entwurf mit ADAPTed 1 UML Torsten Priebe, Günther

Mehr

Informationssystemanalyse Use Cases 11 1

Informationssystemanalyse Use Cases 11 1 Informationssystemanalyse Use Cases 11 1 Use Cases Slide 1 Als ein populäres Mittel um Anforderungen zu erfassen und Systeme zu beschreiben, werden Use Cases benutzt. Sie bilden die Basis für eine umfassendere

Mehr

3. Ontologien und Wissensbasen

3. Ontologien und Wissensbasen Ontologien Ontologien stellen mittlerweile die Basis für viele innovative wissensbasierte Systeme dar: 3. Ontologien und Wissensbasen ecommerce/elearning Knowledge Management Informationsextraktion/Data-mining

Mehr

KONZEPTUELLES DATENBANKEN-DESIGN

KONZEPTUELLES DATENBANKEN-DESIGN KONZEPTUELLES DATENBANKEN-DESIGN Batini, Ceri, Navathe, Conceptual Database Design, The Benjamin/Cummings Pub., 1992 ISBN 0-8053-0244-1 Part I: Kapitel 1 und Kapitel 2 II-1 Methode des Datenbanken-Designs

Mehr

Zusammenhänge präzisieren im Modell

Zusammenhänge präzisieren im Modell Zusammenhänge präzisieren im Modell Dr. Roland Poellinger Munich Center for Mathematical Philosophy Begriffsfeld Logik 1 Mathematik und Logik Die Mathematik basiert auf logisch gültigen Folgerungsschritten

Mehr

Erweiterte Entwurfskonzepte im Data Warehousing

Erweiterte Entwurfskonzepte im Data Warehousing Universität Karlsruhe (TH) Fakultät für Informatik Institut für Programmstrukturen und Datenorganisation (IPD) Hauptseminar Imperfektion und erweiterte Konzepte im Data Warehousing Erweiterte Entwurfskonzepte

Mehr

Datenbankentwurf. 4.2 Logischer Entwurf. Kapitel 4. ER-Modell. Umsetzung. Entwurfsdokumentation. relationales Modell. Verbesserung

Datenbankentwurf. 4.2 Logischer Entwurf. Kapitel 4. ER-Modell. Umsetzung. Entwurfsdokumentation. relationales Modell. Verbesserung 4.2 Logischer Entwurf Datenbankentwurf 4.2 Logischer Entwurf 2002 Prof. Dr. Rainer Manthey Informationssysteme Logischer Entwurf: Einordnung Entwurfsdokumentation logische Strukturen "auf dem Papier" konzeptueller

Mehr

Erhalt von Imperfektion in einem Data Warehouse

Erhalt von Imperfektion in einem Data Warehouse Erhalt von Imperfektion in einem Data Warehouse Heiko Schepperle, Andreas Merkel, Alexander Haag {schepperle,merkela,haag}@ipd.uni-karlsruhe.de Abstract: Üblicherweise werden in einem Data-Warehouse-System

Mehr

Das Metamodell der UML und in FUJABA. Vortrag von Alexander Geburzi

Das Metamodell der UML und in FUJABA. Vortrag von Alexander Geburzi Das Metamodell der UML und in FUJABA Vortrag von Alexander Geburzi Gliederung Metamodellierung Metamodell der UML Metamodell in FUJABA Metamodellierung - Metamodell der UML - Metamodell in FUJABA 2/20

Mehr

Vergleich von Open-Source und kommerziellen Programmen zur Durchführung eines ETL-Prozesses

Vergleich von Open-Source und kommerziellen Programmen zur Durchführung eines ETL-Prozesses Vergleich von Open-Source und kommerziellen Programmen zur Durchführung eines ETL-Prozesses Exposé zur Diplomarbeit Humboldt-Universität zu Berlin Mathematisch-Naturwissenschaftliche Fakultät II Institut

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Vom Spreadsheet zum Würfel Multidimensionales Datenmodell (MDDM)

Mehr

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...

Mehr

OLAP und Data Warehouses

OLAP und Data Warehouses OLP und Data Warehouses Überblick Monitoring & dministration Externe Quellen Operative Datenbanken Extraktion Transformation Laden Metadaten- Repository Data Warehouse OLP-Server nalyse Query/Reporting

Mehr

Unternehmensweite Daten- und Informationsmodellierung

Unternehmensweite Daten- und Informationsmodellierung Unternehmensweite Daten- und Informationsmodellierung Diplomarbeit im Fach Management Studiengang Informationswirtschaft der Fachhochschule Stuttgart Hochschule der Medien Carmen Stier Erstprüfer: Prof.

Mehr

Einführung. Kapitel 1 2 / 508

Einführung. Kapitel 1 2 / 508 Kapitel 1 Einführung 2 / 508 Einführung Was ist ein Datenbanksystem (DBS)? Ein System zum Speichern und Verwalten von Daten. Warum kein herkömmliches Dateisystem verwenden? Ausfallsicherheit und Skalierbarkeit

Mehr

Übungsaufgaben zur Vorlesung Modellbasierte Softwareentwicklung Wintersemester 2014/2015 Übungsblatt 8

Übungsaufgaben zur Vorlesung Modellbasierte Softwareentwicklung Wintersemester 2014/2015 Übungsblatt 8 Prof. Dr. Wilhelm Schäfer Paderborn, 8. Dezember 2014 Christian Brenner Tristan Wittgen Besprechung der Aufgaben: 15. - 18. Dezember 2014 Übungsaufgaben zur Vorlesung Modellbasierte Softwareentwicklung

Mehr

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation 27. Juni 2013 Hinweis Diese Folien ersetzen keinesfalls den Übungsstoff des zugehörigen e-learning-kurses.

Mehr

Darstellung von Assoziationen

Darstellung von Assoziationen Darstellung von Assoziationen Wie bereit aus Kapitel 1 bekannt, beschreiben Assoziationen Beziehungen zwischen Objekten, die zwischen Klassen modelliert werden. Zunächst soll die Modellierung binärer Assoziationen

Mehr

Teil 7: Einführung in den logischen Entwurf

Teil 7: Einführung in den logischen Entwurf 7. Einführung in den logischen Entwurf 7-1 Teil 7: Einführung in den logischen Entwurf Literatur: Elmasri/Navathe:Fundamentals of Database Systems, 3. Auflage, 1999. Chapter 3, Data Modeling Using the

Mehr

Uni Duisburg-Essen Fachgebiet Informationssysteme Prof. Dr. N. Fuhr

Uni Duisburg-Essen Fachgebiet Informationssysteme Prof. Dr. N. Fuhr Raum: LF 230 Bearbeitung: 25.-29. April 2005 Datum Gruppe Vorbereitung Präsenz Aktuelle Informationen unter: http://www.is.informatik.uni-duisburg.de/courses/dbp_ss03/index.html Datenbankentwurf Der Entwurf

Mehr

Vertrautmachen mit Daten

Vertrautmachen mit Daten Kapitel III Vertrautmachen mit Daten 2004 AIFB / FZI 1 III Vertrautmachen mit Daten (see also Data Preparation ) 2004 AIFB / FZI 2 III Vertrautmachen mit Daten III.1 OLAP III.1.1 Einführung in OLAP Wie

Mehr

Kapitel 04 Strukturiertes Entity-Relationship-Modell. 4 Strukturiertes Entity-Relationship- Modell

Kapitel 04 Strukturiertes Entity-Relationship-Modell. 4 Strukturiertes Entity-Relationship- Modell Kapitel 04 Strukturiertes Entity-Relationship-Modell 4 Strukturiertes Entity-Relationship- Modell 4 Strukturiertes Entity-Relationship-Modell...1 4.1 Erste Verbesserung...4 4.2 Objekttypen in SERM...6

Mehr

Motivation. Dimensionen. Motivation /2. 3. Multidimensionales Datenmodell

Motivation. Dimensionen. Motivation /2. 3. Multidimensionales Datenmodell 3. Multidimensionales Datenmodell Grundbegriffe Dimensionen, Fakten/Kennzahlen, Würfel Analyseoperationen Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung ME/R, ADAPT, graphbasierte

Mehr

2. Automatische Codegenerierung mittels dynamischer Spezialisierung

2. Automatische Codegenerierung mittels dynamischer Spezialisierung 2 Automatische Codegenerierung mittels dynamischer Spezialisierung 1/16 Quelle: Vicente Pelechano, Oscar Pastor, Emilio Insfran Automated code generation of dynamic specializations: An approach based on

Mehr

Aufgabe 1: [Logische Modellierung]

Aufgabe 1: [Logische Modellierung] Aufgabe 1: [Logische Modellierung] a) Entwerfen Sie für das von Ihnen entworfene Modell aus Aufgabe 2 des 1. Übungsblattes ein Star-Schema. b) Entwerfen Sie für das vorangegangene Modell einen Teil eines

Mehr

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik ARFA ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik Ralf Leipner Domain Architect Analytics, Risk Management & Finance 33. Berner Architekten

Mehr

Relationale Datenbanken Kursziele

Relationale Datenbanken Kursziele Relationale Datenbanken Kursziele DB Grundlagen Daten-Modellierung Relationales Modell und DB => Praxis: Mit SQL als Anfragesprache Mit MySQL als DB RDB 1-1 Kursinhalt (Tage) 1. DB Einleitung / Entity-Relationship

Mehr

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Michael Hahne T&I GmbH Workshop MSS-2000 Bochum, 24. März 2000 Folie 1 Worum es geht...

Mehr

Einführung in die Informationsverarbeitung Teil Thaller. Stunde VII: Planen und Realisieren

Einführung in die Informationsverarbeitung Teil Thaller. Stunde VII: Planen und Realisieren Einführung in die Informationsverarbeitung Teil Thaller Stunde VII: Planen und Realisieren Manfred Thaller, Universität zu Köln Köln 18. Dezember 2014 Rekapitulation Der Gang der Argumentation 1. Der Rohstoff:

Mehr

Daten- und Informationsmodellierung

Daten- und Informationsmodellierung Institute for Web Science & Technologies WeST Grundlagen der Datenbanken Daten- und Informationsmodellierung Dr. Thomas Gottron Wintersemester 2012/13 Lernziele Kenntnis der Vorgehensweise beim DB-Entwurf

Mehr

WS 2002/03. Prof. Dr. Rainer Manthey. Institut für Informatik III Universität Bonn. Informationssysteme. Kapitel 1. Informationssysteme

WS 2002/03. Prof. Dr. Rainer Manthey. Institut für Informatik III Universität Bonn. Informationssysteme. Kapitel 1. Informationssysteme Informationssysteme Informationssysteme WS 2002/03 Prof. Dr. Rainer Manthey Institut für Informatik III Universität Bonn 2002 Prof. Dr. Rainer Manthey Informationssysteme 1 DB und/oder IS: terminologischer

Mehr

Seminar C02 - Praxisvergleich OLAP Tools

Seminar C02 - Praxisvergleich OLAP Tools C02: Praxisvergleich OLAP Tools Ein Seminar der DWH academy Seminar C02 - Praxisvergleich OLAP Tools Das Seminar "Praxisvergleich OLAP-Tools" bietet den Teilnehmern eine neutrale Einführung in die Technologien

Mehr

Business Intelligence Praktikum 1

Business Intelligence Praktikum 1 Hochschule Darmstadt Business Intelligence SS 2014 Fachbereich Informatik Praktikumsversuch 1 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 07.05.2014 Business Intelligence Praktikum

Mehr

Design Theorie für relationale Datenbanken

Design Theorie für relationale Datenbanken Design Theorie für relationale Datenbanken Design von relationalen Datenbanken alternativen Datenabhängigkeiten Normalisierung Ziel: automatisches Datenbankdesign IX-1 Schlechtes Datenbank Design Frage:

Mehr

OLAP und der MS SQL Server

OLAP und der MS SQL Server OLAP und der MS SQL Server OLAP und der MS SQL Server OLAP-Systeme werden wie umfangreiche Berichtssysteme heute nicht mehr von Grund auf neu entwickelt. Stattdessen konzentriert man sich auf die individuellen

Mehr

Vorlesung Datenbankmanagementsysteme

Vorlesung Datenbankmanagementsysteme Vorlesung Datenbankmanagementsysteme SQL zur Datenanalyse & Einführung Online Analytical Processing (OLAP) (auf Basis von Oracle) Vorlesung Datenbankmanagementsysteme SQL zur Datenanalyse M. Lange, S.

Mehr

Systemanalyse. - Folien zur Vorlesung für AI3 im Sommersemester 2010 - -Teil 4 -

Systemanalyse. - Folien zur Vorlesung für AI3 im Sommersemester 2010 - -Teil 4 - Systemanalyse - Folien zur Vorlesung für AI3 im Sommersemester 2010 - -Teil 4 - Hans-Jürgen Steffens (by courtesy of Prof. Dr. Thomas Allweyer) Fachbereich Informatik und Mikrosystemtechnik Fachhochschule

Mehr

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung

Mehr

Das Entity-Relationship-Modell

Das Entity-Relationship-Modell Das Entity-Relationship-Modell 1976 vorgeschlagen von Peter Chen Entities wohlunterschiedbare Dinge der realen Welt Beispiele: Personen, Autos weithin akzeptiertes Modellierungswerkzeug, denn ist unabhšngig

Mehr

ER-Modell. Entity-Relationship-Model

ER-Modell. Entity-Relationship-Model + ER-Modell Entity-Relationship-Model + Was ist ein Modell? Worte/Zitat aus einem Physikbuch: "Modelle sind also Vorstellungshilfen und Wirklichkeitshilfen, nicht die Wirklichkeit selbst." (Metzler Physik).

Mehr

Fachbereich Informatik Praktikum 1

Fachbereich Informatik Praktikum 1 Hochschule Darmstadt DATA WAREHOUSE SS2015 Fachbereich Informatik Praktikum 1 Prof. Dr. S. Karczewski Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 14.April.2015 1. Kurzbeschreibung In diesem Praktikum geht

Mehr