Friedrich-Schiller-Universität Jena Fakultät für Mathematik Informatik Lehrstuhl für Datenbanken und Informationssysteme Betreut von: David Wiese

Save this PDF as:
 WORD  PNG  TXT  JPG

Größe: px
Ab Seite anzeigen:

Download "Friedrich-Schiller-Universität Jena Fakultät für Mathematik Informatik Lehrstuhl für Datenbanken und Informationssysteme Betreut von: David Wiese"

Transkript

1 Friedrich-Schiller-Universität Jena Fakultät für Mathematik Informatik Lehrstuhl für Datenbanken und Informationssysteme Betreut von: David Wiese Seminar Data Warehousing Sommersemester 2005 vorgelegt von: Marcus Wenzel Matrikelnummer: 44277

2 Inhaltsverzeichnis Inhaltsverzeichnis Inhaltsverzeichnis II 1. Einleitung 1 2. Evolutionäre Ansätze der graphischen Konzeption von DWHS Die multidimensionale E/R-Notation Die multidimensionale UML-Notaion muml 5 3. Revolutionäre Ansätze der graphischen Konzeption von DWHS Der Ansatz von Totok Der multidimensional Aggregation Cube (MAC) Das Dimensional Fact Model Graphbasierte Ansätze Vergleich der vorgestellten Modellierungsansätze 18 Literaturverzeichnis III II

3 1. Einleitung Die Bedeutung von Datenerfassung, Datenhaltung und Datenauswertung nimmt mehr und mehr zu. So sind zum Beispiel für ein Unternehmen Verkaufsstatistiken von großem Interesse, welche Hypothesen über zukünftige Verkäufe erlauben. Aus unternehmerischer Sicht unterliegen solche Statistiken dem Kriterium der Wirtschaftlichkeit, das heißt die Kosten müssen vertretbar sein und die Dauer darf nur verantwortbar lang sein, wobei jedoch die zur Analyse herangezogenen Datenmengen immer größer werden. Ein weit verbreiteter Ansatz solche Fragestellungen zu lösen sind Data-Warehouse-Systeme (DWHS). Bei der Entwicklung eines solchen Systems wird ein der Entwicklung von Datenbanksystemen ähnlicher Prozess durchlaufen (Schaubild 1.). Dieser Vergleich liegt nahe, da Data-Warehouses zumeist als relationale Datenbanken realisiert werden. Im Unterschied zu Datenbanken werden in DWHS Daten mehrerer Dimensionen gespeichert, in diesen Dimensionen können Hierarchien existieren. Eine Dimension wäre zum Beispiel die Zeitdimension (Minute-Stunde-Tag-Monat- Jahr). Eine Dimensionsebene ist Element einer Dimension, so ist z.b. ist Minute eine Dimensionsebene der Dimension Zeit. Ein DWHS enthält mehrere Dimensionen, weshalb auf konzeptioneller Ebene ein Modellierungsansatz verwendet werden muss, der diesem Aspekt gerecht wird. Die aus dem Datenbankbereich bekannten Modellierungskonzepte erlauben nur unzureichende multidimensionale Entwürfe. Diese Arbeit bietet einen Einblick in einige der verschiedenen Möglichkeiten der graphischen Konzeption von DWHS. Am Schaubild 1. ist zu sehen, dass im klassischen Entwurf von Datenbanksystemen, allem voran eine Anforderungsanalyse betrieben wird, um das zu entwickelnde System optimal auf die jeweiligen Ansprüche abzustimmen. Diesem Schritt schließt sich der konzeptionelle Entwurf an, in dem losgelöst von der konkreten Umsetzung des Datenbanksystems die Struktur des zu realisierenden Systems beschrieben wird. Nachdem das zu entwickelnde System konzeptioniert ist, wird im 3.Schritt des Datenbankentwurfs dieses Konzept in ein konkretes Datenmodell transportiert (z.b. in das relationale Modell). Den letzten Schritt des Datenbankentwurfs stellt die Implementierung in einem konkreten Datenbankmanagementsystem (z.b. 1

4 DB2 oder Oracle) dar. Man unterscheidet Ansätze des konzeptionellen DWHS- Entwurfs in evolutionäre Ansätze, revolutionäre Ansätze und graphbasierte Ansätze. Evolutionäre Ansätze sind Erweiterungen bestehender Modellierungskonzepte. Von revolutionären Ansätzen spricht man dann, wenn für die Modellierung von DWHS neue Modellierungsarten entwickelt wurden. Im Folgenden wird näher auf die drei Arten der Modellierungsansätze eingegangen und ihre Vertreter vorgestellt. Schaubild 1. Entwicklungsprozess von DB - bzw. DWH - Systemen 2. Evolutionäre Ansätze der graphischen Konzeption von DWHS Unter evolutionären Ansätzen der Modellierung von DWHS versteht man Erweiterungen von aus dem Datenbankbereich bekannten Modellierungskonzepten. Hier werden die Erweiterung des E/R-Modells und die Erweiterung des UML-Modells für den multidimensionalen Fall vorgestellt. 2.1 Die multidimensionale E/R-Notation Die multidimensionale E/R-Notation (me/r) ist eine Erweiterung des bekannten Entity/Relationship-Modells [Chen76]. Sie wurde entwickelt, um multidimensionale Schemata modellieren zu können. Der Erweiterung des E/R-Modells um multidimensionale Semantik lagen 3 wichtige Zielstellungen zugrunde: o Das me/r-modell sollte eine Spezialisierung des E/R-Modells sein, das heißt die neu eingeführten Konstrukte sollten Spezialfälle ursprünglicher E/R-Konstrukte sein um die Flexibilität und Ausdrucksmächtigkeit des E/R- Modells nicht einzuschränken. o Ein E/R-Modellierer sollte ohne große Probleme die neue Notationsweise erlernen und anwenden können. Deshalb musste die Anzahl der erweiterten 2

5 Konstrukte so gering wie möglich sein. Diese Minimalität der Erweiterung sollte es möglich machen, vorhandene Ergebnisse (z.b.: formale Fundierung) über E/R-Modellierung auf den Fall der me/r-notation zu transferieren. o Die multidimensionale Semantik sollte mit der neuen Notation vollständig darstellbar sein, das heißt es sollte eine Unterscheidung zwischen qualifizierenden und quantifizierenden Daten (Klassifikationsschema und Würfelstruktur) möglich sein. Schaubild 2. Das Metamodell des me/r-modells (vgl. [SBHD99]) In Schaubild 2. wird dargestellt in wie weit das me/r-modell die Funktionalität des E/R-Modells um spezialisierte Konstrukte aus einem multidimensionalen Schema abbilden erweitert. Diese spezialisierten Konstrukte sind: o eine spezielle Entitätenmenge (Klassifikationsstufe), o eine spezielle n-äre Faktbeziehungsmenge (Fakten-Relation), o eine spezielle binäre Classification - Beziehungsmenge (binäre Relationen-Menge) um die Klassifikationsstufen zu verbinden. 3

6 Schaubild 3. Notationen des me/r-modells In Schaublid 3. werden die Symbole der erweiterten Konstrukte vorgestellt. Eine Klassifikationsbeziehung verbindet eine Klassifikationsstufe A mit einer Klassifikationsstufe B, diese Verbindung der beiden Klassifikationsstufen symbolisiert eine Abstraktion von A nach B. In Schaubild 4. sieht man zum Beispiel, dass Räume nach Gebäuden, und Tage nach Monaten klassifiziert werden. Sind 2 Klassifikationsstufen direkt miteinander verbunden, so werden sie atomare Klassifikationsstufen genannt. Diejenigen Klassifikationsstufen, die Schaubild 4. Beispielmodellierung in me/r-notation direkt mit der Faktbeziehung verbunden sind, nennt man Basisklassifikationsstufen. Der Graph einer Klassifikationsbeziehung muss azyklisch sein, um unsinnigen Klassifikationen vorzubeugen. Es würde keinen Sinn machen, wenn man von Jahr nach Tag klassifizieren würde. Die Graphen der im Schaubild 4. 4

7 von der Faktbeziehung Vorlesung ausgehenden Klassifikationen sind azyklische gerichtete Graphen (DAG). Eine Faktbeziehung, die n verschiedene Klassifikationsstufen verbindet, stellt einen Fakt der Dimensionalität n dar. Die Kenngrößen der Fakten, die quantifizierenden Daten, werden als Attribute der n-stelligen Faktbeziehung dargestellt und die qualifizierenden Daten werden durch die Klassifikationsstufen dargestellt. In Schaubild 4 wären das zum Beispiel Honorar des Vortragenden, die Länge des Vortrags und die Anzahl der Zuhörer, welche den Vortrag besuchen. Die Klassifikationshierarchien müssen nicht nur wie in Schaubild 4. realisiert werden. So sind zum Beispiel auch parallele Hierarchien möglich. Für die Zeitdimension würde dies zum Beispiel bedeuten, dass man neben Monat eine Klassifikationsstufe Woche mit einer Klassifikationsbeziehung von Tag zu Woche realisieren könnte, dies nennt man Alternativpfad. Des weiteren ist es möglich, dass sich verschiedene Faktbeziehungen eine Klassifikationshierarchie teilen, das heißt in Schaubild 4., dass zum Beispiel eine beliebige Faktbeziehung mit der Klassifikationsstufe Ort verbunden ist. 2.2 Die multidimensionale UML-Notaion muml Eine weitere Möglichkeit des Erstellens multidimensionaler Schemata ist die Verwendung einer Erweiterung von UML, die so genannte multidimensionale UML (muml). Diese Notationsweise entlehnt ihre Semantik und die multidimensionalen Konstrukte der MML (Multidimensional Modelling Language). Ohne das Metamodell von UML verändern zu müssen, ist es möglich mittels der UML-eigenen Erweiterungsmechanismen (Constraints, Eigenschaftswerte (tagged values) und Stereotypen) multidimensionale Schemata zu entwickeln. Besonders der Tagged-Value und der Stereotypen-Mechanismus werden dazu benutzt, die multidimensionalen Konstrukte der MML bereitzustellen. So können mit Hilfe des Tagged-Value Elementeigenschaften definiert werden, die in muml Eigenschaften von MML-Objekten beschreiben, für die keine UML-Notation vorhanden ist. Ein Tagged-Value ist ein Paar, das aus einem Schlüsselwort, dem Tag, und einem dazugehörigen Datenwert besteht. Ein Stereotyp hingegen führt ein neues, von einer bestehenden UML-Klasse abgeleitetes Modellierungskonstrukt ein. Die Struktur dieser bestehenden Klasse 5

8 darf vom Stereotypen jedoch nicht verändert werden. Das zu modellierende konzeptuelle Schema wird in muml mittels des Static-Structure-Diagramms (Klassendiagramm) der UML dargestellt (siehe Schaubild 5.). Mittels Stereotypen stellt muml verschiedene Klassentypen aus der MML für die Darstellung dimensionaler Klassen, Fakt- und Datenklassen bereit. Besondere Eigenschaften von MML-Klassen wie zum Beispiel Berechnungsformeln abgeleiteter Attribute werden durch Elementeigenschaften repräsentiert. Schaubild 5. Graphische Notation der in der muml verwendeten Konstrukte In Schaubild 6. ist die Umsetzung des in Schaubild 3. in me/r-notation dargestellten Beispielszenarios in muml-notation zu sehen. Die Klasse des Typs Fact-Class stellt den Fakt dar. In ihr sind die Kenngrößen zu sehen. Diese Klasse ist durch Faktenbeziehungen mit den Dimensionen verbunden, jede Klassifikationsstufe einer Dimension ist durch eine Klasse vom Typ Dimensional Class modelliert. Durch das Klassenverständnis in UML ist es möglich Klassen in mehreren Dimensionen zu verwenden. So könnte man zum Beispiel noch eine Klassifikationsbeziehung zwischen der Klasse Ort aus Schaubild 6. und Referent modellieren, um eine Relation wohnt_in darzustellen. Es ist auch möglich parallele Hierarchien darzustellen, hierzu bedient man sich einer Besonderheit der MML, die many-to-many Beziehungen innerhalb von Roll-Up-Pfaden (Klassifikationsbeziehungen) zwischen zwei Klassifikationsstufen ermöglicht. So ist es möglich eine neue Klassifikationsstufe Woche oberhalb von Tag neben Monat in der Zeitdimension einzuführen. Diese Verbindung nennt man Shared Roll-Up, sie ermöglicht es parallele Hierarchien darzustellen. Die Dimension kann oberhalb von Woche fortgeführt werden, eine Klassifikationsbeziehung zum Beispiel zu Jahr wäre denkbar, dabei ist jedoch zu beachten, dass eine Woche zwei Jahren angehören kann. Da muml den objektorientierten Ansatz von UML und MML geerbt hat, stehen in muml auch abstrakte Klassen, Vererbung und 6

9 das Kompositionskonstrukt zur Verfügung. Das Kompositionskonstrukt kann dazu genutzt werden eine Abstraktion einer Fakt-Klasse vorzunehmen. In muml ist es auch möglich, mit Hilfe von abstrakten Klassen und des Vererbungskonstruktes, verschiedene Objekttypen in einer Klassifikationsstufe zu unterscheiden und ihnen verschiedene Attribute zuzuordnen. So könnte man verschiedene Veranstaltungstypen modellieren. Die Eigenschaften des multidimensionalen Modells werden von MML durch ein Metamodell beschrieben, mit dem die von muml verwendeten Konstrukte, deren Beziehungen und die Semantik multidimensionaler Schemata spezifiziert werden. Dabei wird eine strikte Trennung zwischen Metamodell, Schema, und Ausprägung berücksichtigt. Dieses Metamodell stellt eine Grundlage für graphische und konzeptuelle Entwicklung multidimensionaler Modellierungsnotationen dar. Schaubild 6. Beispielmodell in muml-notation 3. Revolutionäre Ansätze der graphischen Konzeption von DWHS Unter revolutionären Ansätzen versteht man diejenigen Ansätze zur Entwicklung multidimensionaler Schemata, die nicht auf vorhandene Konzepte aufbauen, sondern Neuentwicklungen sind. Im Folgenden werden hier der Ansatz von Totok, das Dimensional Fact Model und das MAC-Modell vorgestellt. 7

10 3.1. Der Ansatz von Totok Im Gegensatz zu muml und me/r baut der Notationsansatz von Totok nicht auf eine vorhandene Notation oder bestehendes Modell auf. Ein objektorientierter Modellrahmen wird bereitgestellt, dieser Rahmen wir mit UML-Mitteln modelliert. Es ist so möglich, eventuell auftretende Spezialfälle des multidimensionalen Schemas abbilden zu können. Diese Notationsweise verknüpft die Kennzahlen direkt mit den Dimensionselementen und den dazugehörigen Methoden. Wie in Schaubild 7. zu sehen ist, ist die Kenngröße Besucherzahl direkt mit den Dimensionselementen verbunden bezüglich derer sie analysierbar ist. Strukturelle Änderungen werden durch Gültigkeitsregeln behandelt. Die Besucherzahl ist nach den Dimensionen Zeit, der Veranstaltung und dem Ort analysierbar. Die Kenngröße Besucherzahl ist für alle möglichen Kombinationen dieser Verknüpfungen gültig. Schaubild 7. Gültigkeitszuordnung für die Kenngröße Besucherzahl 8

11 3.2. Der multidimensional Aggregation Cube (MAC) Das MAC-Modell benutzt OLAP-nutzerfreundliche Konzepte der Modellierung, dabei beschreibt das MAC-Modell die Informationen als Dimensionsebene (dimension level), Dimensionspfade (dimension paths), Dimensionen (dimensions), Würfel (cubes), Attribute (attributes) und Aggregationsrelationen (drilling relationships). Die graphische Notation dieser Elemente soweit existent ist Schaubild 8. zu entnehmen. Eine Menge von Aggregationsrelationen kann einen Dimensionspfad bilden. Schaubild 8. Ein MAC wird definiert als eine n-äre Relation zwischen Wertebereichen ( domains ) einer oder mehrer Dimensionen. Ein MAC kann eine oder mehrere Kennzahlen besitzen, jede Kennzahl kann als einfaches Attribut der Relation, die durch den MAC repräsentiert wird, dargestellt werden. Eine Instanz eines MAC wird MAC-Zelle oder nur Zelle (cell) genannt. Eine Dimensionsebene kann ein oder mehrere Attribute haben, von denen eine Untermenge den Schlüssel der Dimensionsebene bildet, meistens ist das ein einzelnes Attribut aber es kann auch zusammengesetzte Schlüssel geben. Eine Aggregationsrelation ist eine n-äre Relation zwischen einer Dimensionsebene (Elternteil ( parent ) der Relation) und n-1 Dimensionsebenen (Kinder der Relation). Eine Aggregationsbeziehung muss immer Kinderdimensionsebenen mit einer Elterndimension verbinden. Sie beschreibt wie Ausprägungen einer Dimensionsstufe in eine andere Dimensionsstufe auf gespalten werden. Aggregationsrelationen sollten nicht dazu verwendet werden Beziehungen zwischen Dimensionen darzustellen, daher dürfen Aggregationsrelationen keine Attribute besitzen. Ein Dimensionspfad ist aus einer Menge von Aggregationsrelationen zusammengesetzt. Die einfachste Form ist eine Folge von Aggregationsrelationen, wobei jede Aggregationsrelation jeweils nur eine Kindebene besitzt. Die Kindebene der letzten Aggregationsrelation wird 9

12 als detaillierte Ebene ( detailed level ) des Dimensionspfades bezeichnet. Ist eine Dimensionsebene an mehreren Dimensionspfaden beteiligt, die drill-down- Operation entlang des Pfades ausgeführt auf dem die aktuelle Analyse stattfindet. Ein Dimensionspfad ist der Graph G(P) einer nichtleeren Menge von Aggregationsrelationen P, für den gilt, dass genau ein Knoten ohne eingehende Kanten existiert (Wurzel), G(P) ein gerichteter azyklischer Graph (DAG) ist, er also keine Kreise enthält, nie 2 Aggregationsrelationen in P mit der gleichen Elterndimensi- Schaubild 9. die Dimensionen: Veranstaltung, Lokation, Referenten, Zeit onsstufen verbunden sind. Eine Dimension ist eine nichtleere Menge von Dimensionspfaden. Besitzt eine Dimension mehr als einen Pfad, so muss jeder Dimensionspfad mit mindestens einer Dimensionsebene verbunden sein, die an mindestens einem weiteren Dimensionspfad teil hat. Der in Schaubild 9. abgebildete Graph P3 ist der Graph der Menge der Aggregationsrelationen (z.b.: zwischen Gebäude und Raum) der Lokation Dimensionen P3. Jeder Knoten des Graphen stellt eine Dimensionsstufe, auf dem Dimensionspfad dar, auch wenn diese Dimensionsstufe an mehreren Aggregationsrelationen beteiligt sein sollte, wird nur ein Knoten im Graph dargestellt. Für jede Aggregationsbeziehung in P wird eine gerichtete 10

13 Kante von der Elternebene zur Kindebene dargestellt. Jede der in Schaubild 9. dargestellten Dimensionen besitzt je nur einen Dimensionspfad. Im MAC-Modell ist also auch die Darstellung von parallelen Hierarchien in einer Dimension (z.b.: in der Zeitdimension Tag-Woche,Tag-Monat,Monat-Jahr) möglich. Dimensionen sind im MAC-Modell von zentraler Bedeutung, da sie zur Definition des Würfels (Cubes) benutzt werden. In dieser Definition werden Dimensionen als Mengen von Dimensionswerten betrachtet. Ein Dimensionswert kann eine Ausprägung einer Dimensionsstufe oder eine Menge solcher Ausprägungen sein. Die Menge aller möglichen Dimensionswerte einer Dimension wir als Dimensionswertebereich ( Dimension Domain ) bezeichnet. Der Dimensionswertebereich der Lokations-Dimension aus Schaubild 9. umfasst also Zeit und Datumsangaben. Dimensionswerte sind Eigenschaften nach denen eine multidimensionale Analyse durchgeführt werden kann. Der multidimensionale Aggregationswürfel (MAC) verbindet Eigenschaftswerte mit Kennzahlen ( measures ). Jede Instanz des MAC wird als Zelle ( cell ) bezeichnet. Diese Zellen sind mit Werten für die Würfelattribute gefüllt. Es besteht eine funktionale Abhängigkeit zwischen Kennzahlen und den, sie repräsentierenden Koordinaten. Die N Dimensionswerte, die in einer Zelle abgelegt sind werden Koordinaten der Zelle genannt. Die Instanzen / Zellen eines Würfels können Kennzahlen verschiedener Granularitäten repräsentieren, wenn zwischen Ihnen eine funktionale Abhängigkeit besteht Das Dimensional Fact Model Das Dimensional Fact Model (DFM) ist entwickelt worden um ausgehend von E/R-basiereten Unterlagen über ein bereits existierendes Informationssystem ein konzeptuelles Schema zu erstellen, das dem Nutzer ermöglicht leichter auf dem Schaubild 10. Symbole der DFM-Notation Datenbestand zu navigieren. Das DFM besteht aus einer Menge von Faktensche- 11

14 mata. Diese Faktenschemata (fact schemes) bestehen aus Fakten, Dimensionen und Hierarchien. Definition 1: Sei g=(v,e) ein gerichteter azyklischer Graph, dann ist g genau dann ein Quasi-Baum mit Wurzel v 0 V, wenn jeder andere Knoten v j V von v 0 über mindesten einen gerichteten Graphen erreicht werden kann. Definition 2: Ein Faktenschema (fact schema) f=(m,a,n,r,o,s) M = Menge der Kenngrößen (Measures) A = Menge der Dimensionsattribute (a i A) Dom(a i ) N = Menge der Nicht-Dimensionsattribute R = geordnetes Paar (a i,a j ) mit a i A { a 0 } und a j A N (a i a j ) so dass quasi-tree qt(f)=(a N { a 0 }) R ist ein Quasi-Baum (qt) mit Wurzel a 0. Eine Dimensionsmenge ( dimension pattern ) ist die Menge Dim(f) ={a i A ( a 0, a i ) R}; jedes Element von Dim(f) ist eine Dimension. a 0 ist ein Dummy-Attribut, das den Fakt (z.b.: Vortrag) repräsentiert. Jedes Attribut a i A, das direkt mit dem Fakt verbunden ist, ist eine Dimension und wird mit d i (d i Dim(f)) bezeichnet. Eine Hierarchie einer Dimension d i Dim(f) ist der Quasi-Baum (Quasi-Tree) mit Wurzel in d i, sub(qt(f), d i ). O R Optionale Relationen Der Wertebereich jedes Dimensionsattributs a j, für das gilt (a i, a j ) O enthält den NULL-Wert. S = Menge von Aggregationsausdrücken (Aggregation statements), jeder Aggregationsausdruck besteht aus einem Tripel (m j,d i,ω), wobei m j M, d i Dim(f) und Ω { SUM, COUNT, MIN, MAX, AND, OR,...}(Aggregations- Operator) Das Statement (m j,d i,ω) S gibt an, dass die Kennzahl m j entlang der Dimension d i nach der Operation Ω aggregiert werden kann, existiert kein solches Statement für ein Paar (m j,d i ) so kann m j nicht entlang d i aggregiert werden. 12

15 Im Folgenden wird auf das in Schaubild 11. dargestellte Faktenschema Vortrag eingegangen. Der Fakt Vortrag enthält die Kennzahlen, die entlang der mit Vortrag direkt verbundenen Dimensionen Zeit, Veranstaltung, Lokation und Referent aggregiert werden. Kann eine Kennzahl nach einer Dimension nicht aggregiert werden so ist diese Kennzahl mit einer unterbrochenen Linie mit der betreffenden Dimension verbunden (im Beispiel Besucherzahl kann nicht nach der Veranstaltungsdimension aggregiert werden, sie ist abhängig von Lokation und Zeit). Auch bei dieser Notation ist es möglich parallele Hierarchien darzustellen. Schaubild 11. Faktenschema Vortrag Gehen mehr als ein Dimensionsattribut in ein anderes Dimensionsattribut ein, so wird eine der beiden Verbindungen durch einen Pfeil auf das höhere Dimensionsattribut dargestellt. Nicht-Dimensionsattribute wie zum Beispiel Adresse werden als Strich dargestellt. Es ist im DFM auch möglich Dimensionsattribute zu modellieren, die keine Werte enthalten müssen (sie dürfen NULL sein), so werden diese Dimensionen durch eine optionale Relation mit dem Fakt verbunden. Dies ist z.b. beim Zusatzmaterial der Fall. 4. Graphbasierte Ansätze Da es eine Vielzahl graphbasierter Ansätze gibt, wird hier nicht nur auf einen graphbasierten Ansatz konzeptionelle Schemata umzusetzen, eingegangen, 13

16 sondern vielmehr werden hier die Grundprinzipien der verschiedenen graphbasierten Ansätze vorgestellt. Die Idee hinter der graphbasierten Modellierung ist, einen azyklischen gerichteten Objektgraphen zu finden und diesen dem Nutzer zur Navigation durch den Datenbestand zur Verfügung zu stellen. Die Kanten des Graphen stellen die Beziehungen zwischen den Knoten dar, die Knoten werden nach ihrer Semantik unterschieden. Der erste betrachtete Ansatz, der heißt SUBJECT [ChSh81], unterscheidet 2 grundlegende Knotentypen: o Kategorien -Cluster-Knoten (C-Knoten) Ein C-Knoten zeigt eine Hierarchie / Gruppe von Kategorien an. o Kreuzprodukt -Knoten (X-Knoten) Ein X-Knoten ermöglicht die Vereinigung (Kreuzprodukt) von eingehenden Knoten (C - oder X- Knoten) C-Knoten repräsentieren qualifizierende Informationen, X-Knoten stellen quantifizierende Daten dar. In Schaubild 12. sind 2 Zuordnungsregeln und deren Schaubild 12. Zuordnungsregeln graphbasierter Ansätze Umsetzung im graphbasierten Modell abgebildet. o Funktionale Abhängigkeit Vater-Sohn-Beziehungen werden als Kante zwischen 2 C-Knoten realisiert. o N:M-Beziehung Eine N:M-Beziehung wird unter Verwendung eines X-Knotens (quantifizierende Information) dargestellt. 14

17 Andere graphbasierte Ansätze wie zum Beispiel: GRASS (Graphical Aproach for Statistical Summaries [RaRi87]), STORM (Statistical Object Representation Model [RaSh90], [BEMR94]), ADaS (Aggregate Data Structure [RaBT96]), SAM* (Semantic Association Model [Semantic Association Model [Su83]) oder CSM (Conceptual Semantic Model [BaBa88]) führen weitere Knotentypen ein, von denen im Weiteren einige vorgestellt werden. o Terminale Knoten (t n -Knoten) Terminale Knoten repräsentieren mögliche Werte aus dem Wertebereich des übergeordneten Kategorieattributs (C-Knoten). Die Menge aller t n -Knoten eines Kattegorieattributs ist eine Teilmenge des Schaubild 12a. primitiven Wertebereichs. Schaubild 12a. zeigt 2 mögliche Ausprägungen des Kategorieattributs Jahr. Schaubild 13. Beispiel für den Einsatz von S- und T-Knoten o Summenknoten (S-Knoten) Summen-Knoten werden benutzt um den quantitativen Teil (die Kennzahlen) zu spezifizieren. Die numerischen Werte werden durch Aggregation aus den unterliegenden Objektgraphen berechnet. In Schaubild 13 ist eine Anwendungsmöglichkeit eines S-Knoten abgebildet o Topic-Knoten (T-Knoten) Ein Topic-Knoten beschreibt Knoten mit gleichem Auswertungskontext. So wird in großen Objektgraphen die Übersichtlichkeit gewährleistet, da 15

18 so Knoten gleichen Inhalts besser erkennbar werden. T-Knoten erlauben es logische Verbindungen zwischen S-Knoten darzustellen und so die Modellierung mehrerer Sichten auf ein Schema. o Aggregation (A-Knoten) Logisch zusammengehörige Einzelfakten werden mit A-Knoten zusammengefasst (hier sind nicht numerische Aggregation wie zum Beispiel. Summen- oder Differenzbildung gemeint). o Generalisierung (G-Knoten) Die Generalisierung ist das Komplementärkonstrukt zur Aggregation, sie bildet durch Weglassen spezifischer Eigenschaften oder Herausheben von Gemeinsamkeiten eine übergeordnete Klasse abstrakter Objekte. Ein graphbasiertes Schema muss folgenden Bedingungen genügen. Ein minimaler Graph muss mindestens je einen T-,S-,X-,C- und t n -Knoten besitzen, weiter unterliegen die einzelnen Knoten gewissen Regeln: - Ein T-Knoten ist mit einem oder mehreren T- und /oder S-Knoten verbunden. - Ein S-Knoten ist mit einem oder mehreren S- und /oder X-Knoten verbunden. - Ein X-Knoten ist mit einem oder mehreren S-, C- oder X-Knoten verbunden. - Ein C-Knoten ist mit einem oder mehreren X- und mit zwei oder mehreren t n - Knoten desselben Wertebereichs verbunden. - Ein t n -Knoten ist nur mit einem C-Knoten verbunden. In Schaubild 14. ist der Ausschnitt eines Objektgraphen dargestellt, welcher das bisher verwendete konzeptuelle Schema beschreibt. 16

19 Schaubild 14.. Ausschnitt der Beispielmodellierung in graphbasierter Notation Trotz der großen Flexibilität und Mächtigkeit der graphbasierten Ansätze haben sie in den letzten Jahren kaum Beachtung gefunden. 17

20 5. Vergleich der vorgestellten Modellierungsansätze Die in Schaubild 15. dargestellte Tabelle vergleicht die hier vorgestellten Ansätze. Da das MAC-Modell das neueste, der hier vorgestellten Modelle ist, erfüllt es alle Kriterien. Wie man in Schaubild 15. sieht erfüllen alle anderen Ansätze Ansatz [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] me/r X X X X X X X muml X X X X X X Totok X X N/A N/A N/A MAC X X X X X X X X X X DFM X X X X X Graph. Ansatz X X N/A X N/A N/A [1] - Ebenen in Dimensionen, [2] - gruppierende Relationen zwischen Ebenen, [3] - N-M gruppierende Relationen, [4] - n-äre Relationen zwischen N Dimensions-Ebenen, [5] - Dimensionen die an Relation beteiligt sind müssen nicht total beteiligt sein, [6] - Analysepfade, [7] - mehrere Kenngrößen zu einem Fakt, [8] -Kennzahlen auf jeder Hierarchie- Ebene definiert, [9] - Kenngrößen über mehrere Ebenen definierbar, [10] - Kenngrößen für einige (nicht für alle) Dimensionsebenen darstellbar Schaubild 15. Vergleich der vorgestellten Notationsmodelle nahezu die gleichen Kriterien. Die Wahl eines, der hier vorgestellten Ansätze hängt von den Vorkenntnissen des Anwenders ab, so ist das me/r-modell ist für einen erfahrenen E/R-Modellierer schnell erlern- und anwendbar, für einen erfahrenen UML-Modellierer ist das muml-modell empfehlenswert. Das MAC- Modell verfügt durch die Modellierung auf verschiedenen Abstraktionsebenen über die größte Ausdrucksmächtigkeit, jedoch ist auch der Aufwand, der betrieben werden muss um solch eine komplexe Modellierung zu realisieren, sehr hoch. Die Wahl der grafischen Notation des Konzepts sollte nach Richtlinien wie dem Aufwand, der für die Umsetzung in der jeweiligen Notation benötigten Zeit und den Vorkenntnissen des Anwenders entschieden werden. 18

21 Literaturverzeichnis Literaturverzeichnis [BaGü01] Bauer, A. / Günzel, H. (2001), Data Warehouse Systeme: Architektur, Entwicklung, Anwendung, Heidelberg dpunkt. Verlag [Lehn03] Lehner, W. (2003), Datenbanktechnologie für Data-Warehouse- Systeme, Konzepte und Methoden, Heidelberg dpunkt. Verlag [SBHD98] Sapia, C. / Blaschka, M. / Höfling, G. / Dinter, B. (1999), Extending the E/R Model for the Multidimensional Paradigm. In Kambayashi, Y. et Al., Advances in Database Technologies, LNCS Vol. 1552, Springer Verlag [TKS01] Tsois, A. / Karayannidis, N. / Sellis, T. (2001), MAC: Conceptual Data Modelling for OLAP, Proceedings of the International Workshop on Design and Management of Data Warehouses. [GMR98] Golfarelli, M. / Maio, D./ Rizzi, S. (1998): The Dimensional Fact Model: a Conceptual Model for Data Warehouses. International Journal Computer and Information Systems. III

Das Multidimensionale Datenmodell

Das Multidimensionale Datenmodell Das Multidimensionale Datenmodell Konzeptuelle Modellierung Umsetzung des Modells Beispiel ER-Modell 2 / 36 Probleme ER-Modellierung Keine Unterscheidung Klassifikation, Attribute, Kenngrößen Dimension

Mehr

Hetero-Homogene Data Warehouses

Hetero-Homogene Data Warehouses Hetero-Homogene Data Warehouses TDWI München 2011 Christoph Schütz http://hh-dw.dke.uni-linz.ac.at/ Institut für Wirtschaftsinformatik Data & Knowledge Engineering Juni 2011 1 Data-Warehouse-Modellierung

Mehr

3. Das Relationale Datenmodell

3. Das Relationale Datenmodell 3. Das Relationale Datenmodell Das Relationale Datenmodell geht zurück auf Codd (1970): E. F. Codd: A Relational Model of Data for Large Shared Data Banks. Comm. of the ACM 13(6): 377-387(1970) DBMS wie

Mehr

4 Grundlagen der Datenbankentwicklung

4 Grundlagen der Datenbankentwicklung 4 Grundlagen der Datenbankentwicklung In diesem Kapitel werden wir die Grundlagen der Konzeption von relationalen Datenbanken beschreiben. Dazu werden Sie die einzelnen Entwicklungsschritte von der Problemanalyse

Mehr

Kapitel DB:III. III. Konzeptueller Datenbankentwurf

Kapitel DB:III. III. Konzeptueller Datenbankentwurf Kapitel DB:III III. Konzeptueller Datenbankentwurf Einführung in das Entity-Relationship-Modell ER-Konzepte und ihre Semantik Charakterisierung von Beziehungstypen Existenzabhängige Entity-Typen Abstraktionskonzepte

Mehr

Christian Kurze BI-Praktikum IBM WS 2008/09

Christian Kurze BI-Praktikum IBM WS 2008/09 Einführung in die multidimensionale Datenmodellierung e mit ADAPT BI-Praktikum IBM WS 2008/09 1 Gliederung Einführung multidimensionale Datenmodellierung 1. Multidimensionales Modell BI-Praktikum IBM WS

Mehr

Datenbanktechnologie für Data-Warehouse-Systeme

Datenbanktechnologie für Data-Warehouse-Systeme Wolfgang Lehner Datenbanktechnologie für Data-Warehouse-Systeme Konzepte und Methoden dpunkt.verlag 1 1.1 1.2 1.3 1.4 1. 5 2 2.1 2.2 2.3 Einleitung 1 Betriebswirtschaftlicher Ursprung des Data Warehousing...

Mehr

Ein Schlüssel ist eine Menge von Attributen (also eines oder mehrere), die eine Datenzeile (Tupel) einer Tabelle eindeutig identifiziert

Ein Schlüssel ist eine Menge von Attributen (also eines oder mehrere), die eine Datenzeile (Tupel) einer Tabelle eindeutig identifiziert Maika Büschenfeldt Datenbanken: Skript 1 1. Was ist eine relationale Datenbank? In Datenbanken können umfangreiche Datenbestände strukturiert abgelegt werden. Das Konzept relationaler Datenbanken soll

Mehr

Datenbankmodelle 1. Das Entity-Relationship-Modell. Prof. Dr. Bernhard Schiefer 2-1

Datenbankmodelle 1. Das Entity-Relationship-Modell. Prof. Dr. Bernhard Schiefer 2-1 Datenbankmodelle 1 Das Entity-Relationship-Modell Prof. Dr. Bernhard Schiefer 2-1 Datenbankmodelle ER-Modell hierarchisches Modell Netzwerkmodell relationales Modell objektorientierte Modelle Prof. Dr.

Mehr

Multidimensionales Datenmodell, Cognos

Multidimensionales Datenmodell, Cognos Data Warehousing (II): Multidimensionales Datenmodell, Cognos Praktikum: Data Warehousing und Mining Praktikum Data Warehousing und Mining, Sommersemester 2010 Vereinfachte Sicht auf die Referenzarchitektur

Mehr

Vorlesung "Software-Engineering"

Vorlesung Software-Engineering Vorlesung "Software-Engineering" Rainer Marrone, TUHH, Arbeitsbereich STS Vorige Vorlesung Pflichtenheft (requirements specification document) Charakterisierung von Software-Qualität Detaillierte Anforderungsanalyse

Mehr

Einführung in das Entity-Relationship-Modell

Einführung in das Entity-Relationship-Modell Einführung in das Entity-Relationship-Modell Historie Entity-Relationship-Modell kurz: ER-Modell bzw. ERM 1976 von Peter Chen vorgeschlagen Standardmodell für frühe Entwurfsphasen in der Datenbankentwicklung

Mehr

Modellierung von OLAP- und Data- Warehouse-Systemen

Modellierung von OLAP- und Data- Warehouse-Systemen Andreas Totok Modellierung von OLAP- und Data- Warehouse-Systemen Mit einem Geleitwort von Prof. Dr. Burkhard Huch Deutscher Universitäts-Verlag Inhaltsverzeichnis Abbildungsverzeichnis Tabellenverzeichnis

Mehr

Inhaltsverzeichnis. 1. Fragestellung

Inhaltsverzeichnis. 1. Fragestellung Inhaltsverzeichnis 1. Fragestellung... 1 2. Herleitung zum Thema... 1 3. Das Entity Relationship Modell (ERM)... 2 4. Praktisches Beispiel zum ERM... 7 5. Anhang...Fehler! Textmarke nicht definiert. 1.

Mehr

Relationale Datenbanken Datenbankgrundlagen

Relationale Datenbanken Datenbankgrundlagen Datenbanksystem Ein Datenbanksystem (DBS) 1 ist ein System zur elektronischen Datenverwaltung. Die wesentliche Aufgabe eines DBS ist es, große Datenmengen effizient, widerspruchsfrei und dauerhaft zu speichern

Mehr

6. Modellierung von Informationssystemen. 6.1 Einleitung 6.2 Konzeptuelles Modell 6.3 OASIS Spezifikation 6.4 Execution Model 6.

6. Modellierung von Informationssystemen. 6.1 Einleitung 6.2 Konzeptuelles Modell 6.3 OASIS Spezifikation 6.4 Execution Model 6. 6. Modellierung von Informationssystemen Spezialseminar Matr. FS 2000 1/10 Volker Dobrowolny FIN- ITI Quellen: Oscar Pastor, Jaime Gomez, Emilio Insfran, Vicente Pelechano The OO-Method approach for information

Mehr

3. Spezielle ER-Modelle und Tabellenableitung. Transformation von ER-Diagrammen in Relationen

3. Spezielle ER-Modelle und Tabellenableitung. Transformation von ER-Diagrammen in Relationen 3. Spezielle ER-Modelle und Tabellenableitung Spezialfälle von ER-Modellen Grundlage, was sind Relationen Transformation von ER-Diagrammen in Relationen 56 Lesebeispiel Access (Realisierungmodell!) 57

Mehr

Einführung in Datenbanken

Einführung in Datenbanken Einführung in Datenbanken Dipl.-Inf. Michael Wilhelm Hochschule Harz FB Automatisierung und Informatik mwilhelm@hs-harz.de aum 2.202 Tel. 03943 / 659 338 1 Inhalt 1. Grundlegende Begriffe der Datenbanktechnologie

Mehr

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

ER-Modell. Entity-Relationship-Model

ER-Modell. Entity-Relationship-Model + ER-Modell Entity-Relationship-Model + Was ist ein Modell? Worte/Zitat aus einem Physikbuch: "Modelle sind also Vorstellungshilfen und Wirklichkeitshilfen, nicht die Wirklichkeit selbst." (Metzler Physik).

Mehr

Konzeptuelle und logische Modellierung eines Data-Warehouse-Systems

Konzeptuelle und logische Modellierung eines Data-Warehouse-Systems Seminar Data Warehousing im Verkehrsbereich Sommersemester 2003 Konzeptuelle und logische Modellierung eines Data-Warehouse-Systems Ling Kong 09.07.2003 Inhaltsverzeichnis 1. Einleitung... 1 2. Multidimensionales

Mehr

Entwurf von Datenbanken

Entwurf von Datenbanken Bisher: was sind Datenbanken? Wie funktionieren sie? Im Folgenden: wie entwickle ich eine Datenbank? Was ist eine gute Datenbank? Der Datenbankentwurfsprozess Das Entity Relationship (ER) Modell Abbildung

Mehr

Code-Erzeugung aus UML-Klassendiagrammen

Code-Erzeugung aus UML-Klassendiagrammen Dominik 09.03.2009 Universität Ulm Gessenharter Inst. f. Programmiermethodik und Compilerbau Code-Erzeugung aus UML-Klassendiagrammen Theorie und Praxis Seite 2 REConf 2009 München Dominik Gessenharter

Mehr

Entwicklung von Data-Warehouse-Systemen

Entwicklung von Data-Warehouse-Systemen Matthias Goeken Entwicklung von Data-Warehouse-Systemen Anforderungsmanagement, Modellierung, Implementierung Mit einem Geleitwort von Prof. Dr. Ulrich Hasenkamp Deutscher Universitäts-Verlag Inhaltsverzeichnis

Mehr

EinfÅhrung in die objektorientiere Programmierung (OOP) unter Delphi 6.0. EDV Kurs 13/2

EinfÅhrung in die objektorientiere Programmierung (OOP) unter Delphi 6.0. EDV Kurs 13/2 EinfÅhrung in die objektorientiere Programmierung (OOP) unter Delphi 6.0 EDV Kurs 13/2 Inhaltsverzeichnis 1 Objekte... 1 2 Klassen... 3 2.1 Beziehungen zwischen Klassen... 4 2.1.1 Vererbung... 4 2.1.2

Mehr

Datenbankmodelle 1. Das Entity-Relationship-Modell

Datenbankmodelle 1. Das Entity-Relationship-Modell Datenbankmodelle 1 Das Entity-Relationship-Modell Datenbankmodelle ER-Modell hierarchisches Modell Netzwerkmodell relationales Modell objektorientierte Modelle ER Modell - 2 Was kann modelliert werden?

Mehr

Projekt AGB-10 Fremdprojektanalyse

Projekt AGB-10 Fremdprojektanalyse Projekt AGB-10 Fremdprojektanalyse 17. Mai 2010 1 Inhaltsverzeichnis 1 Allgemeines 3 2 Produktübersicht 3 3 Grundsätzliche Struktur und Entwurfsprinzipien für das Gesamtsystem 3 3.1 Die Prefuse Library...............................

Mehr

Seminar C16 - Datenmodellierung für SAP BW

Seminar C16 - Datenmodellierung für SAP BW C16: Datenmodellierung für SAP BW Ein Seminar der DWH academy Seminar C16 - Datenmodellierung für SAP BW Dieses Seminar soll einen umfassenden Einblick in die Datenmodellierung beim Einsatz von SAP BW

Mehr

Grundlagen von Datenbanksystemen

Grundlagen von Datenbanksystemen Ramez Elmasri Shamkant B. Navathe Grundlagen von Datenbanksystemen 3., überarbeitete Auflage ein Imprint der Pearson Education Deutschland GmbH Inhaltsverzeichnis Vorwort 9 Über die Autoren 13 Teil 1 Grundkonzepte

Mehr

Datenbanken: Relationales Datenbankmodell RDM

Datenbanken: Relationales Datenbankmodell RDM Das RDM wurde in den 70'er Jahren von Codd entwickelt und ist seit Mitte der 80'er Jahre definierter Standard für Datenbanksysteme! Der Name kommt vom mathematischen Konzept einer Relation: (Sind A, B

Mehr

3. Konzepte der objektorientierten Programmierung

3. Konzepte der objektorientierten Programmierung 3. Konzepte der objektorientierten Programmierung 3.1 Basiskonzepte 3.2 Generalisierung / Spezialisierung 3.3 Aggregation 3.4 Assoziation 3.5 Nachrichten 3.6 Polymorphismus 3. Konzepte der Objektorientierung

Mehr

IT-Kompaktkurs. Datenbanken Skript zur Folge 5. Prof. Dr. Georg Herde Fachhochschule Deggendorf

IT-Kompaktkurs. Datenbanken Skript zur Folge 5. Prof. Dr. Georg Herde Fachhochschule Deggendorf IT-Kompaktkurs Skript zur Folge 5 Prof. Dr. Georg Herde Fachhochschule Deggendorf Semantisches Datenmodell, Entity-Relationship, Normalformen Bei der Entwicklung einer Datenbank wird das Ziel angestrebt,

Mehr

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining 2 Eigenschaften eines Data Warehouse Referenzarchitektur Integrierte Sicht auf beliebige Daten aus verschieden Datenbanken

Mehr

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken Dateiname: ecdl5_01_00_documentation_standard.doc Speicherdatum: 14.02.2005 ECDL 2003 Basic Modul 5 Datenbank - Grundlagen

Mehr

Fundamentals of Software Engineering 1

Fundamentals of Software Engineering 1 Folie a: Name Fundamentals of Software Engineering 1 Grundlagen der Programmentwurfstechnik 1 Sommersemester 2012 Dr.-Ing. Stefan Werner Fakultät für Ingenieurwissenschaften Folie 1 Inhaltsverzeichnis

Mehr

Einführung. Kapitel 1 2 / 508

Einführung. Kapitel 1 2 / 508 Kapitel 1 Einführung 2 / 508 Einführung Was ist ein Datenbanksystem (DBS)? Ein System zum Speichern und Verwalten von Daten. Warum kein herkömmliches Dateisystem verwenden? Ausfallsicherheit und Skalierbarkeit

Mehr

Aufgabe 1: [Logische Modellierung]

Aufgabe 1: [Logische Modellierung] Aufgabe 1: [Logische Modellierung] a) Entwerfen Sie für das von Ihnen entworfene Modell aus Aufgabe 2 des 1. Übungsblattes ein Star-Schema. b) Entwerfen Sie für das vorangegangene Modell einen Teil eines

Mehr

Themenblock: Data Warehousing (I)

Themenblock: Data Warehousing (I) Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining Agenda Einführung Data Warehouses Online Transactional Processing (OLTP) Datenmanipulation mit SQL Anfragen mit SQL Online

Mehr

Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann

Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann Andreas Ditze MID GmbH Kressengartenstraße 10 90402 Nürnberg a.ditze@mid.de Abstract: Data Lineage

Mehr

OLAP und der MS SQL Server

OLAP und der MS SQL Server OLAP und der MS SQL Server OLAP und der MS SQL Server OLAP-Systeme werden wie umfangreiche Berichtssysteme heute nicht mehr von Grund auf neu entwickelt. Stattdessen konzentriert man sich auf die individuellen

Mehr

Seminar C02 - Praxisvergleich OLAP Tools

Seminar C02 - Praxisvergleich OLAP Tools C02: Praxisvergleich OLAP Tools Ein Seminar der DWH academy Seminar C02 - Praxisvergleich OLAP Tools Das Seminar "Praxisvergleich OLAP-Tools" bietet den Teilnehmern eine neutrale Einführung in die Technologien

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining OLAP Operationen Ein konzeptionelles MDDM Aggregierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Operationen im multidimensionalen Datenmodell

Mehr

Abschlussklausur Geschäftsprozessmodellierung und Workflowmanagement

Abschlussklausur Geschäftsprozessmodellierung und Workflowmanagement Abschlussklausur Geschäftsprozessmodellierung und Workflowmanagement (Wintersemester 2007/2008, Freitag, 08.02.2008, Leo18) Es können maximal 120 Punkte erreicht werden. 1 Punkt entspricht etwa einer Minute

Mehr

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung

Mehr

Das Metamodell der UML und in FUJABA. Vortrag von Alexander Geburzi

Das Metamodell der UML und in FUJABA. Vortrag von Alexander Geburzi Das Metamodell der UML und in FUJABA Vortrag von Alexander Geburzi Gliederung Metamodellierung Metamodell der UML Metamodell in FUJABA Metamodellierung - Metamodell der UML - Metamodell in FUJABA 2/20

Mehr

Multidimensionale Datenbanksysteme

Multidimensionale Datenbanksysteme Multidimensionale Datenbanksysteme Modellierung und Verarbeitung Von Dr.-Ing. Wolfgang Lehner IBM Almaden Research Center, San Jose, USA Technische Universität Darrr:ctadi FACHBEREICH INFORMATIK BIBLIOTHEK

Mehr

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein 1 Definitionen 1.1 Datenbank Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert Integriert, selbstbeschreibend, verwandt 1.2 Intension/Extension Intension: Menge der Attribute Extension:

Mehr

Datenbanken: ER-Modell

Datenbanken: ER-Modell Beispiel: Lastenheft: Für eine Hochschule soll eine Verwaltungssoftware geschrieben werden, die alle relevanten Daten in einem relationalen Datenbanksystem speichert. Zu diesen Daten zählen die Stamm-

Mehr

Null-Werte in Relationalen Datenbanken

Null-Werte in Relationalen Datenbanken Seminar: Imperfektion in Datenbanken WS03/04 Null-Werte in Relationalen Datenbanken Thomas Bierhance Einführung Null-Werte in DBen sind notwendiges Übel, da... (1) das Wissen über die tatsächliche Welt

Mehr

Datenbankentwurf. 4.2 Logischer Entwurf. Kapitel 4. ER-Modell. Umsetzung. Entwurfsdokumentation. relationales Modell. Verbesserung

Datenbankentwurf. 4.2 Logischer Entwurf. Kapitel 4. ER-Modell. Umsetzung. Entwurfsdokumentation. relationales Modell. Verbesserung 4.2 Logischer Entwurf Datenbankentwurf 4.2 Logischer Entwurf 2002 Prof. Dr. Rainer Manthey Informationssysteme Logischer Entwurf: Einordnung Entwurfsdokumentation logische Strukturen "auf dem Papier" konzeptueller

Mehr

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik ARFA ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik Ralf Leipner Domain Architect Analytics, Risk Management & Finance 33. Berner Architekten

Mehr

Darstellung von Assoziationen

Darstellung von Assoziationen Darstellung von Assoziationen Wie bereit aus Kapitel 1 bekannt, beschreiben Assoziationen Beziehungen zwischen Objekten, die zwischen Klassen modelliert werden. Zunächst soll die Modellierung binärer Assoziationen

Mehr

9. Einführung in Datenbanken

9. Einführung in Datenbanken 9. Einführung in Datenbanken 9.1 Motivation und einführendes Beispiel 9.2 Modellierungskonzepte der realen Welt 9.3 Anfragesprachen (Query Languages) 9.1 Motivation und einführendes Beispiel Datenbanken

Mehr

Data Warehouse Technologien

Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............

Mehr

Übungsaufgaben zur Vorlesung Modellbasierte Softwareentwicklung Wintersemester 2014/2015 Übungsblatt 8

Übungsaufgaben zur Vorlesung Modellbasierte Softwareentwicklung Wintersemester 2014/2015 Übungsblatt 8 Prof. Dr. Wilhelm Schäfer Paderborn, 8. Dezember 2014 Christian Brenner Tristan Wittgen Besprechung der Aufgaben: 15. - 18. Dezember 2014 Übungsaufgaben zur Vorlesung Modellbasierte Softwareentwicklung

Mehr

WS 2002/03. Prof. Dr. Rainer Manthey. Institut für Informatik III Universität Bonn. Informationssysteme. Kapitel 1. Informationssysteme

WS 2002/03. Prof. Dr. Rainer Manthey. Institut für Informatik III Universität Bonn. Informationssysteme. Kapitel 1. Informationssysteme Informationssysteme Informationssysteme WS 2002/03 Prof. Dr. Rainer Manthey Institut für Informatik III Universität Bonn 2002 Prof. Dr. Rainer Manthey Informationssysteme 1 DB und/oder IS: terminologischer

Mehr

Techniken der Projektentwicklung

Techniken der Projektentwicklung diagramme Termin 6 Denken in Schnittstellen Was nun? Einführung Bisher kennengelernt: Modellierung auf Konzeptlevel Usecase-Diagramme Domänenmodelle Jetzt: Übergang zu Spezifikation und Implementierung!

Mehr

Kapitel DB:II. II. Datenbankentwurf und Datenbankmodelle. Entwurfsprozess Datenbankmodelle

Kapitel DB:II. II. Datenbankentwurf und Datenbankmodelle. Entwurfsprozess Datenbankmodelle Kapitel DB:II II. Datenbankentwurf und Datenbankmodelle Entwurfsprozess Datenbankmodelle DB:II-1 DB Design and Models STEIN 2004-2015 Entwurfsprozess ANSI/SPARC-Schema-Architektur externe Ebene externes

Mehr

Systemanalyse. - Folien zur Vorlesung für AI3 im Sommersemester 2010 - -Teil 4 -

Systemanalyse. - Folien zur Vorlesung für AI3 im Sommersemester 2010 - -Teil 4 - Systemanalyse - Folien zur Vorlesung für AI3 im Sommersemester 2010 - -Teil 4 - Hans-Jürgen Steffens (by courtesy of Prof. Dr. Thomas Allweyer) Fachbereich Informatik und Mikrosystemtechnik Fachhochschule

Mehr

Datenbanken 16.1.2008. Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt:

Datenbanken 16.1.2008. Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt: Datenbanksysteme Entwicklung der Datenbanksysteme Die Entwicklung der Datenbanksysteme ist eng an die der Hardware gekoppelt und wird wie jene in Generationen eingeteilt: 1. Generation: In den fünfziger

Mehr

Das Entity-Relationship-Modell

Das Entity-Relationship-Modell Das Entity-Relationship-Modell 1976 vorgeschlagen von Peter Chen Entities wohlunterschiedbare Dinge der realen Welt Beispiele: Personen, Autos weithin akzeptiertes Modellierungswerkzeug, denn ist unabhšngig

Mehr

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...

Mehr

Anwendung des Prinzips der Doppik beim Aufbau eines Data Warehouses

Anwendung des Prinzips der Doppik beim Aufbau eines Data Warehouses Anwendung des Prinzips der Doppik beim Aufbau eines Data Warehouses Einführung Einer der Nachteile der Data Warehouse Technologie besteht daran, dass in einem Data Warehouse (DWH ) nur Momentaufnahmen

Mehr

Mengenvergleiche: Alle Konten außer das, mit dem größten Saldo.

Mengenvergleiche: Alle Konten außer das, mit dem größten Saldo. Mengenvergleiche: Mehr Möglichkeiten als der in-operator bietet der θany und der θall-operator, also der Vergleich mit irgendeinem oder jedem Tupel der Unteranfrage. Alle Konten außer das, mit dem größten

Mehr

Siehe auch Heide Balzert: Lehrbuch der Objektmodellierung.

Siehe auch Heide Balzert: Lehrbuch der Objektmodellierung. Siehe auch Heide Balzert: Lehrbuch der Objektmodellierung. 9. Analyse Muster 1 Der Unterschied von Analyse und Design Pattern besteht auch in der zeitlichen Abfolge. Analyse Muster werden in der Analyse

Mehr

Raumbezogene Datenbanken (Spatial Databases)

Raumbezogene Datenbanken (Spatial Databases) Raumbezogene Datenbanken (Spatial Databases) Ein Vortrag von Dominik Trinter Alexander Christian 1 Inhalte Was ist ein raumbezogenes DBMS? Modellierung Abfragen Werkzeuge zur Implementierung Systemarchitektur

Mehr

Abstrakt zum Vortrag im Oberseminar. Graphdatenbanken. Gero Kraus HTWK Leipzig 14. Juli 2015

Abstrakt zum Vortrag im Oberseminar. Graphdatenbanken. Gero Kraus HTWK Leipzig 14. Juli 2015 Abstrakt zum Vortrag im Oberseminar Graphdatenbanken Gero Kraus HTWK Leipzig 14. Juli 2015 1 Motivation Zur Darstellung komplexer Beziehungen bzw. Graphen sind sowohl relationale als auch NoSQL-Datenbanken

Mehr

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten Michael Hahne T&I GmbH Workshop MSS-2000 Bochum, 24. März 2000 Folie 1 Worum es geht...

Mehr

Business Intelligence Praktikum 1

Business Intelligence Praktikum 1 Hochschule Darmstadt Business Intelligence SS 2014 Fachbereich Informatik Praktikumsversuch 1 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 07.05.2014 Business Intelligence Praktikum

Mehr

Data Mining: Einige Grundlagen aus der Stochastik

Data Mining: Einige Grundlagen aus der Stochastik Data Mining: Einige Grundlagen aus der Stochastik Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 21. Oktober 2015 Vorwort Das vorliegende Skript enthält eine Zusammenfassung verschiedener

Mehr

Business Intelligence Praktikum 1

Business Intelligence Praktikum 1 Hochschule Darmstadt Business Intelligence WS 2013-14 Fachbereich Informatik Praktikumsversuch 1 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 14.10.2013 Business Intelligence Praktikum

Mehr

Data Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de

Data Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de Data Warehouses Sommersemester 2011 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen Data Warehouse Architektur Data-Warehouse-System Teilsichten

Mehr

Vortrag von: Ilias Agorakis & Robert Roginer

Vortrag von: Ilias Agorakis & Robert Roginer MDA Model Driven Architecture Vortrag von: Ilias Agorakis & Robert Roginer Anwendungen der SWT - WS 08/09 Inhalt Was ist MDA? Object Management Group (OMG) Ziele Konzepte der MDA Werkzeuge Vor- und Nachteile

Mehr

Konzepte der Informatik

Konzepte der Informatik Konzepte der Informatik Vorkurs Informatik zum WS 2011/2012 26.09. - 30.09.2011 17.10. - 21.10.2011 Dr. Werner Struckmann / Christoph Peltz Stark angelehnt an Kapitel 1 aus "Abenteuer Informatik" von Jens

Mehr

Definition Informationssystem

Definition Informationssystem Definition Informationssystem Informationssysteme (IS) sind soziotechnische Systeme, die menschliche und maschinelle Komponenten umfassen. Sie unterstützen die Sammlung, Verarbeitung, Bereitstellung, Kommunikation

Mehr

Datenbankentwurf. Entwicklungsprozess Anforderungsanalyse & Miniwelt

Datenbankentwurf. Entwicklungsprozess Anforderungsanalyse & Miniwelt Datenbankentwurf Entwicklungsprozess Wollen DB entwickeln. Etwa für Comic-Sammlung, aus der Freunde ausleihen dürfen. Was ist dazu zu tun? Wie kommt man zu einer laufenden Anwendung? Datenbankentwurf Entwicklungsprozess

Mehr

PFlow-Editor Entwicklung und Implementierung eines Modellierungswerkzeugs für ein Peer-to-Peer Production Workflow Management System

PFlow-Editor Entwicklung und Implementierung eines Modellierungswerkzeugs für ein Peer-to-Peer Production Workflow Management System PFlow-Editor Entwicklung und Implementierung eines Modellierungswerkzeugs für ein Peer-to-Peer Production Workflow Management System Fortgeschrittenenpraktikum bei Prof. Dr. Martin Wirsing vorgelegt von:

Mehr

Das konzeptionelle Datenmodell

Das konzeptionelle Datenmodell Das konzeptionelle Datenmodell Signifikanz der Datenmodellierung Anforderungsanalyse Effizienz der Anwendung. Redundanzfreiheit. Datenintegrität. Reibungsarme Umsetzung des Datenmodells in das physikalische

Mehr

Kapitel 04 Strukturiertes Entity-Relationship-Modell. 4 Strukturiertes Entity-Relationship- Modell

Kapitel 04 Strukturiertes Entity-Relationship-Modell. 4 Strukturiertes Entity-Relationship- Modell Kapitel 04 Strukturiertes Entity-Relationship-Modell 4 Strukturiertes Entity-Relationship- Modell 4 Strukturiertes Entity-Relationship-Modell...1 4.1 Erste Verbesserung...4 4.2 Objekttypen in SERM...6

Mehr

VL2: Softwareprojekt - Anforderungsanalyse. Inhalt. 1. Struktur eines Softwareprojektes

VL2: Softwareprojekt - Anforderungsanalyse. Inhalt. 1. Struktur eines Softwareprojektes Dozent: G.Döben-Henisch (Version vom 16.April 2005) PPmP VL2 VL2: Softwareprojekt - Anforderungsanalyse Inhalt 1. Struktur eines Softwareprojektes 2. Anforderungsanalyse 1. Struktur eines Softwareprojektes

Mehr

Entwurf: Fortgeschrittene Konzepte

Entwurf: Fortgeschrittene Konzepte Bisher: Entwurf als grafisches Diagramm mit Entitätsmengen (auch weiche) Beziehungsmengen Attribute Assoziationstypen, Beziehungstypen und ausschließlich 2 stellige Beziehungen Extended / Enhanced (Erweitertes)

Mehr

Grundlagen der Informatik. Prof. Dr. Stefan Enderle NTA Isny

Grundlagen der Informatik. Prof. Dr. Stefan Enderle NTA Isny Grundlagen der Informatik Prof. Dr. Stefan Enderle NTA Isny 2 Datenstrukturen 2.1 Einführung Syntax: Definition einer formalen Grammatik, um Regeln einer formalen Sprache (Programmiersprache) festzulegen.

Mehr

Objektorientierte Datenmodelle und - verwaltung

Objektorientierte Datenmodelle und - verwaltung Schlagworte der 90er: Objektorientiertes GIS OpenGIS Case-Tool Geoökologe Legt Problemstellung fest (Art, Anzahl, Dimension, Skalierung) Wählt Koordinatensystem Wählt Fachattribute OOUI (object-oriented

Mehr

5.2 Entity-Relationship-Modell

5.2 Entity-Relationship-Modell 5.2 Entity-Relationship-Modell Mod-5.8 Entity-Relationship-Modell, ER-Modell (P. Chen 1976): Kalkül zur Modellierung von Aufgabenbereichen mit ihren Objekten, Eigenschaften und Beziehungen. Weitergehende

Mehr

Modellierung biologischer. Christian Maidorfer Thomas Zwifl (Seminar aus Informatik)

Modellierung biologischer. Christian Maidorfer Thomas Zwifl (Seminar aus Informatik) Modellierung biologischer Prozesse Christian Maidorfer Thomas Zwifl (Seminar aus Informatik) Überblick Einführung Arten von Modellen Die stochastische Pi-Maschine Warum Modelle Die Biologie konzentriert

Mehr

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier Realisierung von OLAP Operatoren in einem visuellen Analysetool Vortrag von Alexander Spachmann und Thomas Lindemeier Gliederung Ausgangssituation/Motivation Was ist OLAP? Anwendungen Was sind Operatoren?

Mehr

4. Jeder Knoten hat höchstens zwei Kinder, ein linkes und ein rechtes.

4. Jeder Knoten hat höchstens zwei Kinder, ein linkes und ein rechtes. Binäre Bäume Definition: Ein binärer Baum T besteht aus einer Menge von Knoten, die durch eine Vater-Kind-Beziehung wie folgt strukturiert ist: 1. Es gibt genau einen hervorgehobenen Knoten r T, die Wurzel

Mehr

Binäre Bäume Darstellung und Traversierung

Binäre Bäume Darstellung und Traversierung Binäre Bäume Darstellung und Traversierung Name Frank Bollwig Matrikel-Nr. 2770085 E-Mail fb641378@inf.tu-dresden.de Datum 15. November 2001 0. Vorbemerkungen... 3 1. Terminologie binärer Bäume... 4 2.

Mehr

Lösungen zu Übung 3 Objektorientierte Modellierung - Statisches Modell

Lösungen zu Übung 3 Objektorientierte Modellierung - Statisches Modell Universität Stuttgart Institut für Automatisierungs- und Softwaretechnik Prof. Dr.-Ing. Dr. h. c. P. Göhner Lösungen zu Übung 3 Objektorientierte Modellierung - Statisches Modell Aufgabe 3. Assoziation

Mehr

Inhalt. 2.1 Datenbankentwurf. 2.2 Relationales Modell. 2.3 Relationale Entwurfstheorie. 2.4 Relationale Algebra. 2.5 Structured Query Language (SQL)

Inhalt. 2.1 Datenbankentwurf. 2.2 Relationales Modell. 2.3 Relationale Entwurfstheorie. 2.4 Relationale Algebra. 2.5 Structured Query Language (SQL) 2. Datenbanken Inhalt 2.1 Datenbankentwurf 2.2 Relationales Modell 2.3 Relationale Entwurfstheorie 2.4 Relationale Algebra 2.5 Structured Query Language (SQL) 2 2.1 Datenbankentwurf Datenbankanwendungen

Mehr

(Titel des Berichts)

(Titel des Berichts) (Titel des Berichts) Praxissemesterbericht von (Vorname Name) aus (Geburtsort) Matrikelnummer Anschrift Telefon HTW Aalen Hochschule für Technik und Wirtschaft Betreuender Professor Abgabetermin Angaben

Mehr

Design Theorie für relationale Datenbanken

Design Theorie für relationale Datenbanken Design Theorie für relationale Datenbanken Design von relationalen Datenbanken alternativen Datenabhängigkeiten Normalisierung Ziel: automatisches Datenbankdesign IX-1 Schlechtes Datenbank Design Frage:

Mehr

Vgl. Oestereich Kap 2.7 Seiten 134-147

Vgl. Oestereich Kap 2.7 Seiten 134-147 Vgl. Oestereich Kap 2.7 Seiten 134-147 1 Sequenzdiagramme beschreiben die Kommunikation/Interaktion zwischen den Objekten (bzw. verschiedenen Rollen) eines Szenarios. Es wird beschrieben, welche Objekte

Mehr

Visualisierung. Rückblick. Scientific Visualization vs. Informationsvisualisierung. Allgemeine Ziele und Anforderungen Prof. Dr.-Ing.

Visualisierung. Rückblick. Scientific Visualization vs. Informationsvisualisierung. Allgemeine Ziele und Anforderungen Prof. Dr.-Ing. Allgemeine Ziele und Prof. Dr.-Ing. Detlef Krömker Goethe-Universität, Frankfurt Graphische Datenverarbeitung Rückblick K als Anwendung der CG K Meilensteine der Entwicklung K Terminologie Scientific Visualization

Mehr

Objektorientierte Softwareentwicklung

Objektorientierte Softwareentwicklung Objektorientierte Softwareentwicklung Objektorientierte Softwareentwicklung Smalltalk CLOS Ada 9 C++ Objektorientierte Softwareentwicklung Object Pascal Java Oberon-2 Frage: Die Bibliothek der Fachhochschule

Mehr

4. Relationen. Beschreibung einer binären Relation

4. Relationen. Beschreibung einer binären Relation 4. Relationen Relationen spielen bei Datenbanken eine wichtige Rolle. Die meisten Datenbanksysteme sind relational. 4.1 Binäre Relationen Eine binäre Relation (Beziehung) R zwischen zwei Mengen A und B

Mehr

Produktskizze. 28. November 2005 Projektgruppe Syspect

Produktskizze. 28. November 2005 Projektgruppe Syspect 28. November 2005 Carl von Ossietzky Universität Oldenburg Fakultät II Department für Informatik Abteilung Entwicklung korrekter Systeme Inhaltsverzeichnis 1 Einleitung 3 2 Die graphische Oberfläche der

Mehr

ER-Modellierung am Beispiel der Universitätsdatenbank aus der DBIS-Vorlesung

ER-Modellierung am Beispiel der Universitätsdatenbank aus der DBIS-Vorlesung ER-Modellierung am Beispiel der Universitätsdatenbank aus der DBIS-Vorlesung Datenbank-Praktikum SS 2010 Prof. Dr. Georg Lausen Florian Schmedding ER-Modell: Wiederholung Entitäten E Beziehungen B Attribute

Mehr

Objektorientierter Software-Entwurf Die Unified Modeling Language 4 1

Objektorientierter Software-Entwurf Die Unified Modeling Language 4 1 Objektorientierter Software-Entwurf Die Unified Modeling Language 4 1 Die Unified Modeling Language Die UML (hier in der Version 0.9) ist ein Satz von Notationen zur Beschreibung objektorientierter Softwaresysteme.

Mehr

Algorithmen und Datenstrukturen 2

Algorithmen und Datenstrukturen 2 Algorithmen und Datenstrukturen 2 Sommersemester 2006 3. Vorlesung Peter F. Stadler Universität Leipzig Institut für Informatik studla@bioinf.uni-leipzig.de Algorithmen für Graphen Fragestellungen: Suche

Mehr