Data Warehousing. Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit. Ulf Leser Wissensmanagement in der Bioinformatik

Größe: px
Ab Seite anzeigen:

Download "Data Warehousing. Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit. Ulf Leser Wissensmanagement in der Bioinformatik"

Transkript

1 Data Warehousing Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik

2 Begriffe Klassifikationsschema Jahr Stufen einer Dimension plus Halbordnung Quartal Monat Woche Saison Klassifikationsstufe Granularität der Verdichtung Klassifikationspfad Tag Verdichtungspfad Dimension Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

3 Klassifikationsschema Definition. Ein Klassifikationsschema K (einer Dimension D) ist ein 5-Tupel {k 0, k 1,... k n },, M, stufe(), knoten()) mit Menge von Klassifikationsstufen {k 0,... k n } Menge M von Klassifikationsknoten Halbordnung auf {k 0,... k n } mit Größtem Element k n : k i, 0 i n-1: k n k i Stufe() weist jedem Klassifikationsknoten genau eine Klassifikationsstufe zu Knoten()=stufe -1 () berechnet für eine Klassifikationsstufe die Menge aller ihr zugeordneten Klassifikationsknoten Bemerkung Die Halbordnung überträgt sich natürlich auf Klassifikationsknoten Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

4 Erläuterung Klassifikationsstufen Die Klassifikationsstufen sind die Schemaelemente der Dimension Das größte Element k n ist artifiziell es steht für alles, also die Verdichtung in einen einzelnen Wert Wir nennen es TOP Interpretation von : Funktionale Abhängigkeit Aggregierbarkeit Tag bestimmt Monat bestimmt Jahr bestimmt TOP TOP Produkt Produktfamilie Produktgruppe TOP Asus M2400N Notebooks Büroelektronik TOP Beachte: Halbordnung ist immer zyklusfrei Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

5 Klassifikations hierarchie Begriffe Top Jahr Quartal I II III IV I II III IV Monat Jan Feb Mar Okt Nov Dez Tag Klassifikationsknoten Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

6 Dimension Definition. Eine Dimension D=(K, {P 1,...,P j }) besteht aus Einem Klassifikationsschema K Einer Menge von Pfaden P i aus K Jedes k K muss in mindestens einem Pfad in D enthalten sein Bemerkungen Für jedes k K gibt es mindestens einen Pfad, nämlich k TOP D muss nicht alle Pfade enthalten, die es in K gibt Designentscheidung Schreibweise: D.k bezeichnet die Klassifikationsstufe k aus D Jedes D.k kann in mehreren Pfaden vorkommen Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

7 Granularität Definition. Gegeben eine Menge U von n Dimensionen D 1,..., D n. Eine Granularität G über U ist eine Menge {D 1.k k1,...,d n.k kn } für die gilt k ki ist eine Klassifikationsstufe in D i Es gibt keine funktionalen Abhängigkeiten zwischen den Klassifikationsstufen D 1.k k1,..., D n.k kn Bemerkungen Beispiel: Nicht gleichzeitig Dimensionen Zeit und Fiskalisches Jahr in einer Granularität betrachten Mit einer Granularität legt man fest, in welcher Detailstufe Fakten in den einzelnen Dimensionen beschrieben werden Abkürzung: Lässt man in U eine Dimension D i weg, ist implizit D i.top gemeint Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

8 Halbordnung auf Granularitäten Definition. Auf der Menge aller Granularitäten zu einer Menge U von Dimensionen ist eine Halbordnung < wie folgt definiert Sei G 1 ={D 11.k k11,...,d n1.k kn1 } und G 2 ={D 12.k k12,...,d n2.k kn2 } Ordne die Dimensionen in G 1 und G 2 beliebig, aber gleich Es gilt G 1 <G 2 genau dann wenn Benutzung i: D i1.k ki1 D i2.k 2i2 oder D i1.k ki1 =D i2.k ki 2 Beschreibung der Transformation von Granularitäten Anfrageoptimierung: Wiederverwendung von Aggregaten Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

9 Bereich Beispiel Region Zeit TOP Top Top Konzern Staat Jahr Sparte Bundesland Monat Abteilung Shop Tag (B.Sparte, R.Shop, Z.Tag) < (B.Sparte, R.Shop, Z.Monat) < (B.Sparte, R.Top, Z.Monat) < (B.Top, R.Top, Z.Top) (B.Sparte, R.Staat, Z.Tag)? (B.Konzern, R.Shop, Z.Tag) Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

10 Inhalt dieser Vorlesung Operationen im multidimensionalen Datenmodell ME/R: Graphische multidimensionale Datenmodellierung Theorie der Summierbarkeit Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

11 1. OLAP Operationen MDDM spricht die Sprache des Analysten Operationen auf dem MDDM sollten die Analysevorgänge abbilden bzw. unterstützen Ziel: Schnelle und intuitive Manipulation der Daten Notwendig Definition der Operationen (Unterstützung durch graphische Werkzeuge) Heute: ME/R (Umsetzung in ausführbare Operationen) Ab nächster Stunde Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

12 Vorgehen Die wichtigsten Operationen im MDDM sind Aggregation (Roll-Up) Verfeinerung (Drill-Down) Weiteres Vorgehen Datenpunkte und Würfelkoordinaten Aggregation in Klassifikationshierarchien Inhalt eines Würfel einer bestimmten Granularität OLAP Operationen: Aggregation und Verfeinerung Weitere OLAP Operationen, Visualisierung Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

13 Übersicht Z.Tag Z.Monat B.Abteilung B.Sparte Skoda.Reparatur Skoda.Ersatzteile Skoda VW München Wedding Nantes Lyon Koordinaten der Datenpunkte R.Shop Bayern Berlin Aggregierte Fakten Department1 Department2 R.Bundesland (1.101, , Wedding, Ersatzteile) (12.400, , Nantes, Reparatur) (1.540, , Wedding, Ersatzteile) Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

14 Datenpunkte und Würfelkoordinaten Definition. Gegeben Würfel W, Dimension D und ein Klassifikationsknoten x aus D Sei z ein Datenpunkt und D(z) seine Koordinate bzgl. D Wir sagen: D(z) liegt in x wenn entweder D(z)=x oder D(z) nachfahren(x) punkte(x) sei die Menge aller Datenpunkte z, für die D(z) in x liegt Bemerkung Erweiterung auf mehrere Koordinaten durch Schnittmengenbildung punkte(x,y,z) = punkte(x) punkte(y) punkte(z) mit x in D 1, y in D 2, z in D punkte(x) x Januar Februar... Dezember 32,50 17, ,50 Viele z Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

15 Aggregation in Hierarchien Definition. Gegeben Dimension D, Pfad P={k 0... k k... TOP} in D Sei x knoten(k) ein Klassifikationsknoten Sei f eine Aggregatfunktion und F ein Measure Sei Y=kinder(x) (die Menge {y 1,...,y n } knoten(k ) von Klassifikationsknoten von k, von denen x abhängt) Die Aggregation von Y nach x bzgl. f und F bezeichnet die Berechnung des aggregierten Faktes F(x)=f(F(y 1 ),..., F(y n )) Die Aggregation von k nach k bzgl. f und F bezeichnet die Berechnung von F(x) für alle x knoten(k) Das schreiben wir kurz als F(k) k Jahr x k Monat Januar Februar... Dezember Y Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

16 Startpunkt Sei P={k 0... k n TOP} Man berechnet F(TOP) aus F(k n ), F(k n ) aus F(k n-1 ), etc. Wie berechnet man aber F(k 0 )? Aus den einzelnen Datenpunkten Definition. Gegeben Dimension D, Pfad P={k 0... TOP} in D und ein Klassifikationsknoten x knoten(k 0 ) Sei punkte(x)={z 1,...,z n }, die Menge aller Datenpunkte, deren D- Koordinate in x liegt Für eine Aggregatfunktion f und Measure F berechnet sich dann das aggregierte Fakt F(x) als F(x)=f(F(z 1 ),...,F(z n )) Mit F(z) als dem Wert des Measures F von Datenpunkt z x punkte(x) Januar Februar... Dezember 32,50 17, ,50 Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

17 Berechnung Die vorherige Definition ist prinzipiell abwendbar für alle Klassifikationsknoten bzw. stufen eines Pfades Bedingt durch...d-koordinate in x... Aber Es schneller, die Aggregation aus der nächstkleineren Stufe zu berechnen Weniger Werte - weniger Arbeit Das setzt voraus, dass man die auch hat Präaggregation OLAP Operationen wandern immer nur eine Stufe in einem Pfad herauf oder herab deshalb definieren wir Aggregation von Ebene zu Ebene Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

18 Wo sind wir? Wir können entlang eines Pfades in einer Dimension für ein Measure mit einer Aggregatfunktion die aggregierten Fakten für höherstufige Knoten berechnen Zwei Möglichkeiten Aggregierte Measures von Knoten einer Stufe aus aggregierten Measures der nächstkleineren Stufe berechnen Aggregierte Measures immer direkt aus den Werten aller Datenpunke mit den entsprechenden Koordinaten berechnen Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

19 Würfelinhalt Ein Würfel W=(G,F) Granularität G=(D 1.k 11,...,D n.k n1 ) Menge von aggregierten Measures F={f 1,...,f m } Schreibweise für Zellen eines Würfels W(x 1, x 2,..., x n ) = (f 1,...,f m ) x i sind die Koordinaten im Würfel: x i knoten(k i1 ) Pro Punkt in W gibt es m aggregierte Measures f 1,..., f m Betrachten wir den einfachen Fall: n=m=1 Eine Dimension D mit Knoten x, ein Measure F Dann: W(x) = (F(kinder(x)) Berechnung rekursiv oder direkt aus Datenpunkten Bemerkung Auf unterster Ebene ist kinder(x)=punkte(x) Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

20 Würfelinhalt, allgemeiner Fall Ein Würfel W=(G,F) Granularität G=(D 1.k 11,...,D n.k n1 ) Menge von aggregierten Measures F={f 1,...,f m } Allgemeiner Fall W(x 1,...,x n ) = (f 1,...,f m ) = (F 1 (kinder(x 1 ) kinder(x 2 )... kinder(x n )), F 2 (kinder(x 1 ) kinder(x 2 )... kinder(x n )),... F m (kinder(x 1 ) kinder(x 2 )... kinder(x n ))) mit Koordinaten x i knoten(k i1 ) Bemerkung Die Schnittmengenbildung berechnet die Menge von Punkten in der Würfelzelle mit Koordinaten x 1,...,x n Jedes Measure wird gesondert aggregiert Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

21 Beispiel Z.Tag Z.Monat B.Abteilung B.Sparte Skoda.Reparatur Skoda.Ersatzteile VW Skoda München Wedding Nantes Koordinaten der Fakten Lyon R.Shop Bayern Aggregierte Fakten Berlin Department1 Department2 R.Bundesland ( , Wedding, Ersatzt.) = (...) ( , Wedding, Ersatzt.) = (...) (1 1999, Berlin, Skoda) = (...) (4 1999, Bayern, VW) = (...) Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

22 Operationen auf Würfeln OLAP Operationen überführen einen Würfel W=(G,F) in einen Würfel W =(G,F ) Dabei gilt Aggregation: G < G Verfeinerung G > G Eine einfache Operation verändert nur die Klassifikationsstufe einer Dimension in G Komplexe Operationen können auf natürliche Weise aus einfachen Operationen durch Verkettung zusammengesetzt werden Wir betrachten deshalb im folgenden nur einfache Operationen Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

23 OLAP Operationen Definition. Geg.: Würfel W=(G,F) mit G=(D 1.k 11,...,D n.k n1 ) und F=(f 1,..,f m ) Sei P={k 0... k i1 k i1 k i1... TOP} ein Pfad in D i Die einfache Aggregation von D i in W entlang P bzgl. Aggregatfunktion f überführt W in W = ( (D 1.k 11,..., D i.k i1,..., D n.k n1 ), (f 1,..., f m )) (f 1,..., f m ) = (F 1 (punkte(k 11 )... punkte(k i1 )... punkte(k n1 )),..., F m (punkte(k 11 )... punkte(k i1 )... punkte(k n1 ))) Die einfache Verfeinerung von D i in W entlang P bzgl. Aggregatfunktion f überführt W in W = ( (D 1.k 11,..., D i.k i1,..., D n.k n1 ), (f 1,..., f m )) Mit (f 1,..., f m ) =... Bemerkung Bei Aggregation kann man die f i per Aggregation berechnen Bei Verfeinerung ist ein Zugriff auf die Datenbank (Datenpunkte oder Ulf Präaggregate) Leser: Data Warehousing, notwendig Vorlesung, Sommersemester

24 Beispiel: Aggregation (Roll-Up) Z.Tag Z.Monat B.Abteilung B.Abt Skoda.Reparatur Skoda.Ersatzteile Skoda.Repa. Skoda.Ersatz München Wedding Nantes Lyon R.Shop München Wedding Nantes Lyon R.Shop Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

25 Beispiel: Verfeinerung (Drill-Down) Z.Tag Z.Monat B.Abteilung B.Abt Skoda.Reparatur Skoda.Ersatzteile Skoda.Repa. Skoda.Ersatz München Wedding Nantes Lyon R.Shop München Wedding Nantes Lyon R.Shop Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

26 Wo sind wir? Das MDDM gibt Klassifikationsstufen, Knoten, Pfade und Dimensionen vor Die Daten bestehen aus verschiedenen Measures, jeweils mit Koordinaten in den jeweiligen Dimensionen Koordinaten (Dimensionen) sind hierarchisch gegliedert (entlang der Pfade); jeder Datenpunkt hat eine Koordinate in jeder Klassifikationsstufe Die Koordinaten in einem Pfad sind voneinander abhängig Würfel stellen aggregierte Daten gemäß der Würfelgranularität dar OLAP Operationen (Aggregation, Verfeinerung) sind entlang der Pfade und gemäß der Granularität möglich Sie verändern die Granularität und die aggregierten Fakten Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

27 Aggregation bis TOP Summe Umsatz pro Tag und Abteilungen über alle Shops Z.Tag B.Abteilung Skoda.Reparatur Skoda.Ersatzteile München Wedding Nantes Lyon R.Shop Summe Umsatz pro Shop und Tag, über alle Abteilungen Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

28 ... in mehreren Dimensionen Z.Tag B.Abteilung Skoda.Reparatur Skoda.Ersatzteile München Wedding Nantes Lyon R.Shop G=(Z.TOP, R.TOP, B.TOP) Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

29 Weitere Operationen Aggregation ist die spannendste OLAP Operation Die restlichen führen keine Berechnungen durch, sondern selektieren bzw. ändern nur Ausschnitte des Würfels In der Literatur werden teilweise noch weitere Operationen angeführt (Drill-Across, Dicing,...) Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

30 Rotation Unterschiedliche Sichtweisen auf einen Datenbestand Jahr Jahr Kontinent Marke Asien Südamerika BMW Ford Peugeo t BMW VW Ford Automarke Asien Europa S-Amerika Australien Kontinent Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

31 Selektion einer Scheibe (Slicing) Verkäufe von Peugeot pro Jahr und Kontinent Verkäufe in Asien pro Jahr und Marke Jahr Asien Südamerika Kontinent BMW Peugeot VW Ford Automarke Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

32 Auswahl von Unterwürfeln Verkäufe von (Peugeot, VW) in (2000, 2001) pro Kontinent Jahr Asien Südamerika Kontinent BMW Peugeot VW Ford Automarke Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

33 2: Grafische Modellierung Grafische Modellierung multidimensionaler Daten Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

34 Datenbankentwurf Konzeptionelles Modell Logisches Modell Implementierung Designer, Requirements Engineering Entwickler, Administrator Administrator Produktsupport E/R, UML: Klassen, Attribute, Assoziationen Relationen, Attribute, Keys, SQL Join-Order, Indexe, Buffermanagement, Sortierung (Halb)Automatisch Vollautomatisch Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

35 ME/R Literatur Sapia at al. Extending the E/R Model for the Multidimensional Paradigm, Workshop DWDM, 1998 Logisches MDDM Fakten, Klassifikationsstufen, Dimensionen,... Konzeptionelles/Graphisches Modell für MDDM? E/R nicht ausreichend Keine Repräsentation von MDDM Konzepten: Fakten, Dimension, Klassifikationsstufen, etc. ME/R: Erweitertes E/R Modell Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

36 Gesamtbild ME/R MDDM ROLAP: Relationales Modell Implementierung MOLAP: multidimensionales Implementierung Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

37 ME/R: Elemente und Notation Neue Elemente Klassifikationsstufe (Dimension Level) Würfel (Fact) Halbordnung zwischen Klassifikationsstufen (Roll-Ups) Constraint: Keine Zyklen in den ROLL-UP Beziehungen Klassifikationsstufe Würfel Roll-Up Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

38 Beispiel Jahr Monat Tag Menge Shop_name Preis Produktgruppe Produkt Verkauf Shop Product_name Top Top Top Kunde Region TOP Land Land Jahr Region Land Produkgruppe Produkt Region Region Monat Land Kunde Shop Tag Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

39 Wiederverwendung von Stufen... Menge Shop_name Preis Produktgruppe Produkt Verkauf Shop Product_name Kunde Region Möglich, aber nicht unproblematisch Wenn Kundenregionen (nach Vertrieb) anders organisiert sind als Shopregionen (nach Logistik) IC nicht überwachbar Wenn Kunden in mehr Regionen wohnen dürfen als es Shops gibt verborgenes Integritätsconstraint Entspricht funk. Abhängigkeiten von unterschiedlichen, aber gleichnamigen Attributen Wird auf unterschiedliche Fremdschlüssel abgebildet Land Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

40 ME/R Bewertung Minimale, konservative Erweiterung Mehrere Würfel sind möglich Flexible Zuordnung Dimensionen Würfel Klare Semantik durch Metamodell in Extended E/R Greift eher kurz Keine Eigenschaften von Fakten (Summierbarkeit) Keine Besonderheiten von Klassifikationspfaden Übersprungene Stufen, unendliche Hierarchien Keine Übersetzungsmethode definiert Toolunterstützung? Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

41 Weitere Ansätze muml UML-Erweiterung basierend auf UML Metamodell (Constraints, Stereotypen) -> Werkzeugunterstützung vorhanden Klassifikationsstufe: <<Dimensional class>> Fakten: <<Fakt class>> Würfel: <<Dimension>> (Assoziationstyp) Hierarchie: <<Roll-Up>> (Assoziationstyp)... Multi-dimensional Modelling Language (MML)... Keine der Methoden hat sich (bisher) durchgesetzt Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

42 3. Summierbarkeit Ziel des MDDM Verdichtung von Daten entlang der Klassifikationspfade Aber das geht nicht immer gut Numerische versus kategorische Fakten Numerisch: Umsatz, Verkäufe, Messwerte,... Kategorisch: Geschlecht, Kundensegment,... Sollte man als Dimension definieren, muss man aber nicht Nicht alle Aggregatsfunktionen sind hierarchisch anwendbar Summe der Umsätze aller Tage Umsatz des Monats Summe der Umsätze aller Monate Umsatz des Jahres Durchschnitt der Umsätze aller Tage Durchschnitt des Monats? Durchschnitt der Umsätze aller Monate Durchschnitt des Jahres? Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

43 Beispiel Level 0 Level 1 Level Summe: 2 Avg: 1 Summe: Summe: 10 Avg: 11/2 12/3 Avg: 10 Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

44 Charakterisierung von Aggregatsfunktionen Lenz, Shoshani: Summarizability in OLAP and Statistical Databases, SSDBM, 1997 Geg.: Set X, Partitionierung (X 1,X 2,..., X n ) X entspricht einem Klassifikationsknoten, (X 1,X 2,..., X n ) sind seine Kinder Definition. Eine Aggregatfunktion f ist distributiv gdw g: f(x) = f( g(x 1 ), g(x 2 ),... g(x n )) Eine Aggregatfunktion f ist algebraisch gdw f(x) berechenbar aus fester Menge von g s Eine Aggregatfunktion f ist holistisch gdw f(x) kann nur aus den Grundelementen von X berechnet werden D.h., dass die Menge von g s nicht begrenzt ist Dann muss man immer auf die Datenpunkte zurück Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

45 Beispiele Distributiv Algebraisch Holistisch Summe, Count, Max, Min,... AVG (mit G 1 =SUM und G 2 =CNT) STDDEV, MaxN,... MEDIAN, RANK, PERCENTILE Highest Frequency,... Highest Frequency Merke Werte und jeweilige Frequenz: ( (v 1,f 1 ), (v 2,f 2 ),...) Merge zweier Sets möglich Aber: Keine feste Grenze für Platzbedarf, da Anzahl unterschiedlicher Werte nicht fest Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

46 Summierbarkeit / Aggregierbarkeit Bisher: Wann darf man Werte hierarchisch summieren? Natürlich nur numerische Fakten Art der Aggregatfunktion beachten Aber Summe der Lagerbestände pro Produkt über Jahre? Gesamtsumme Studenten als Summe über Studenten pro Studiengang? Weitere notwendige Kriterien für Aggregierbarkeit entlang eines Klassifikationspfades Überlappungsfreiheit der Zuordnung von Klassifikationsknoten Vollständigkeit der Zerlegung pro Klassifikationslevel Typverträglich von Fakt und Aggregatfunktion Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

47 Beispiel Studenten pro Jahr und Studiengang Gesamt Informatik BWL Gesamt Wie kann das stimmen? Wie lange dauern Studiengänge? Studenten nur in einem Studiengang eingeschrieben? Summen lassen sich nicht aus den Einzelwerten berechnen Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

48 Überlappungsfreiheit Definition. Eine Klassifikationshierarchie ist überlappungsfrei gdw Jeder Klassifikationsknoten mit Level i ist höchstens einem Klassifikationsknoten in Level i+1 zugeordnet Jeder Datenpunkt ist höchstens einem Klassifikationsknoten mit Level 0 zugeordnet Produktfamilie Bekleidung Produktgruppe Damen Herren Produktart Rock Jeans Anzug Verkauf: ((Rock,Jeans), 79.00,...) Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

49 Vollständigkeit Definition. Eine Klassifikationshierarchie ist vollständig gdw Jeder Klassifikationsknoten mit Level i ist mindestens einem Klassifikationsknoten in Level i+1 zugeordnet Jedes Fakt ist mindestens einem Klassifikationsknoten mit Level 0 zugeordnet Produktfamilie Bekleidung Produktgruppe Damen Herren Produktart Rock Jeans Anzug Verkauf: ((Produkt das zu keiner Produktart passt),...) Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

50 Was tun? Wir sind bisher immer von vollständigen und überlappungsfreien Klassifikationsschemas ausgegangen Summierbarkeit ist ein wichtiger Grund dafür Das entspricht nicht immer der betrieblichen Realität Was tun wenn nicht? Neue Klassifikationsknoten Artifizielle Klassifikationsknoten: Others, Rest, Nicht zugewiesen Knotenaufspaltung: Herrenjeans, Damenjeans Gewichtete Zuordnung Türkei ist 10% Europa, 90% Asien Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

51 Typen von Fakten Flow (Ereignis zu Zeitpunkt T) Verkäufe, Umsatz, Lieferungen, diplomierte Studenten,... Stock (Zustand zu Zeitpunkt T) Lagerbestand, eingeschriebene Studenten, Einwohnerzahlen,... Value-per-Unit (Eigenschaft zu Zeitpunkt T) Preis, Herstellungskurs, Währungskurs,... Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

52 Typverträglichkeit Stock Flow Value-per- Unit MIN/MAX SUM Zeit: nein Sonst: Nie AVG Erkennen von Problemen Nicht automatisch möglich Metadaten Beschreibung der Measures notwendig Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

53 Zusammenfassung OLAP Operationen MDDM Modell Modellierung der Daten in der Sprache des Analysten Einschränkung auf sinnvolle Operationen Roll-Up und Drill-Down Selektion und Rotation Grafische Notationen sind vorhanden, aber noch nicht verbreitet Vorsicht vor Modellierungsfallen Summierung über kategorische Fakten Rekursive Durchschnittsbildung Typunverträgliche Summierung Löchrige Klassifikationshierarchien Ulf Leser: Data Warehousing, Vorlesung, Sommersemester

Data Warehousing. Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Klassifikationsschema Definition Ein Klassifikationsschema

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining OLAP Operationen Ein konzeptionelles MDDM Aggregierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Operationen im multidimensionalen Datenmodell

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining OLAP Operationen Ein konzeptionelles MDDM Aggregierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Operationen im multidimensionalen Datenmodell

Mehr

Data Warehousing. Modellierung im DWH Das multidimensionale Datenmodell. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Modellierung im DWH Das multidimensionale Datenmodell. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Modellierung im DWH Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Zusammenfassung: Hubs and Spokes Mart 1 Mart 2 Mart 3 Mart 4 DWH Quelle 1 RDBMS Quelle

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Vom Spreadsheet zum Würfel Multidimensionales Datenmodell (MDDM)

Mehr

Data Warehousing. Multidimensionale Modellierung. Modellierung im DWH. Wissensmanagement in der. Bioinformatik. Ulf Leser

Data Warehousing. Multidimensionale Modellierung. Modellierung im DWH. Wissensmanagement in der. Bioinformatik. Ulf Leser Data Warehousing Modellierung im DWH Multidimensionale Modellierung Ulf Leser Wissensmanagement in der Bioinformatik Zusammenfassung: Hubs and Spokes Mart 1 Mart 2 Mart 3 Mart 4 DWH Quelle 1 RDBMS Quelle

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik DWH Grobarchitektur: Hubs and Spokes Abgeleitete Sichten Mart 1 Mart 2 Mart 3 Mart 4

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Vom Spreadsheet zum Würfel Multidimensionales Datenmodell (MDDM)

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Speicherung multidimensionaler Daten Ulf Leser Wissensmanagement in der Bioinformatik Dimension Dimension Top Jahr 1997 1998 1999 2000 Quartal I II III IV I II III IV Klassifikationsstufen

Mehr

Data Warehousing. Modellierung im DWH Das multidimensionale Datenmodell. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Modellierung im DWH Das multidimensionale Datenmodell. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Modellierung im DWH Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Zusammenfassung: Hubs and Spokes Mart 1 Mart 2 Mart 3 Mart 4 DWH Quelle 1 RDBMS Quelle

Mehr

Data Warehousing. Speicherung multidimensionaler Daten. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Speicherung multidimensionaler Daten. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Speicherung multidimensionaler Daten Ulf Leser Wissensmanagement in der Bioinformatik Beispiel Z.Tag Z.Monat 4.1.1999 B.Abteilung 4 1999 B.Sparte 3.1.1999 3 1999 2.1.1999 1.1.1999 Skoda.Reparatur

Mehr

Multidimensionale Modellierung

Multidimensionale Modellierung Multidimensionale Modellierung Vorlesung: Übung: Patrick Schäfer Berlin, 27. November 2017 patrick.schaefer@hu-berlin.de https://hu.berlin/vl_dwhdm17 https://hu.berlin/ue_dwhdm17 Grundlagen Fakten (Kennzahlen/Messgrößen):

Mehr

Data Warehousing. Ausführung von OLAP Operationen. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Ausführung von OLAP Operationen. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Ausführung von OLAP Operationen Ulf Leser Wissensmanagement in der Bioinformatik Variante 1 - Snowflake Year id year Productgroup id pg_name Month Id Month year_id Day Id day month_id

Mehr

Datenbanksysteme I Data Warehouses Felix Naumann

Datenbanksysteme I Data Warehouses Felix Naumann Datenbanksysteme I Data Warehouses 13.7.2009 Felix Naumann Überblick 2 Einsatzgebiete OLAP versus OLTP Multimensionale i l Modellierung OLAP Operationen Relationale Implementierung Folien zu DWH: Ulf Leser

Mehr

Logische Modelle für OLAP. Burkhard Schäfer

Logische Modelle für OLAP. Burkhard Schäfer Logische Modelle für OLAP Burkhard Schäfer Übersicht Einführung in OLAP Multidimensionale Daten: Hypercubes Operationen Formale Grundlagen Zusammenfassung Einführung in OLAP Verfahren zur Analyse großer

Mehr

Datenbanksysteme I Data Warehouses Felix Naumann

Datenbanksysteme I Data Warehouses Felix Naumann Datenbanksysteme I Data Warehouses 5.7.2010 Felix Naumann Überblick 2 Einsatzgebiete OLAP versus OLTP Multimensionale i l Modellierung OLAP Operationen Relationale Implementierung Neue Architekturen Folien

Mehr

Repetitorium. Data Warehousing und Data Mining 11/12. Sebastian Wandelt 13./16. Februar 2012

Repetitorium. Data Warehousing und Data Mining 11/12. Sebastian Wandelt 13./16. Februar 2012 Repetitorium Data Warehousing und Data Mining 11/12 Sebastian Wandelt 13./16. Februar 2012 Inhalt Data Warehousing und Data Mining auf 40 Slides Weder in-, noch exklusiv! Subjektive Zusammenfassung pro

Mehr

Anfragesprachen für On-Line Analytical Processing (OLAP)

Anfragesprachen für On-Line Analytical Processing (OLAP) Anfragesprachen für On-Line Analytical Processing (OLAP) Seminar Business Intelligence Teil I: OLAP & Data Warehousing René Rondot rondot@informatik.uni-kl.de Universität Kaiserslautern Anfragesprachen

Mehr

Anfragen an multidimensionale Daten

Anfragen an multidimensionale Daten Anfragen an multidimensionale Daten Alexander Heidrich - BID8 09.06.2005 Hintergrundbild: http://www.csc.calpoly.edu/~zwood/teaching/csc471/finalproj02/afternoon/mfouquet/cube.jpg Inhaltsübersicht Motivation

Mehr

Geoinformation Abbildung auf Tabellen

Geoinformation Abbildung auf Tabellen Folie 1 von 32 Geoinformation Abbildung auf Tabellen Folie 2 von 32 Abbildung auf Tabellen Übersicht Motivation des relationalen Datenmodells Von Objekten zu Tabellen Abbildung von Objekten Schlüssel Abbildung

Mehr

Vorlesung Wissensentdeckung in Datenbanken

Vorlesung Wissensentdeckung in Datenbanken Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Uwe Ligges Informatik LS 8 22.04.2010 1 von 26 Gliederung 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der

Mehr

ISU 1. Ue_08/02_Datenbanken/SQL. 08 Datenbanken. Übung. SQL Einführung. Eckbert Jankowski. www.iit.tu-cottbus.de

ISU 1. Ue_08/02_Datenbanken/SQL. 08 Datenbanken. Übung. SQL Einführung. Eckbert Jankowski. www.iit.tu-cottbus.de 08 Datenbanken Übung SQL Einführung Eckbert Jankowski www.iit.tu-cottbus.de Datenmodell (Wiederholung, Zusammenfassung) Objekte und deren Eigenschaften definieren Beziehungen zwischen den Objekten erkennen/definieren

Mehr

Informationsintegration

Informationsintegration Informationsintegration Data Warehouse (= Materialisierte Integration) Ulf Leser Sebastian Wandelt Inhalt dieser Vorlesung Data Warehouses OLAP versus OLTP Multidimensionale Modellierung ETL Prozess Vergleich:

Mehr

Vorlesung Wissensentdeckung in Datenbanken

Vorlesung Wissensentdeckung in Datenbanken Gliederung Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Claus Weihs 14.07.2009 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der Cube-Operator 5 Implementierung

Mehr

6.2 Datenmodellierung

6.2 Datenmodellierung Umsetzung des multidimensionalen Modells Interne Verwaltung der Daten durch - Relationale Strukturen (Tabellen) Relationales OLAP (ROLAP) Vorteile: Verfügbarkeit, Reife der Systeme - Multidimensionale

Mehr

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein 1 Definitionen 1.1 Datenbank Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert Integriert, selbstbeschreibend, verwandt 1.2 Intension/Extension Intension: Menge der Attribute Extension:

Mehr

Data Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2004 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

Einführung in die Informatik II

Einführung in die Informatik II Einführung in die Informatik II Relationale Datenbanken und SQL Theorie und Anwendung Prof. Dr. Nikolaus Wulff Gründe für eine Datenbank Meist werden Daten nicht in XML-Dokumenten, sondern innerhalb einer

Mehr

Das Multidimensionale Datenmodell

Das Multidimensionale Datenmodell Das Multidimensionale Datenmodell Konzeptuelle Modellierung Umsetzung des Modells Beispiel ER-Modell 2 / 36 Probleme ER-Modellierung Keine Unterscheidung Klassifikation, Attribute, Kenngrößen Dimension

Mehr

Fuzzy-Summierbarkeit. Benjamin Hohl. Imperfektion und erweiterte Konzepte im Data Warehousing Seminar im Sommersemester 2005

Fuzzy-Summierbarkeit. Benjamin Hohl. Imperfektion und erweiterte Konzepte im Data Warehousing Seminar im Sommersemester 2005 Fuzzy-Summierbarkeit Benjamin Hohl Imperfektion und erweiterte Konzepte im Data Warehousing 2 Überblick Was ist Summierbarkeit? Wann kann man sie nutzen? Wann nicht? Ansatz nach Pedersen, Jensen & Dyreson

Mehr

Multidimensionales Datenmodell, Cognos

Multidimensionales Datenmodell, Cognos Data Warehousing (II): Multidimensionales Datenmodell, Cognos Praktikum: Data Warehousing und Mining Praktikum Data Warehousing und Mining, Sommersemester 2010 Vereinfachte Sicht auf die Referenzarchitektur

Mehr

Kapitel 6. Vorlesung: PD Dr. Peer Kröger

Kapitel 6. Vorlesung: PD Dr. Peer Kröger Kapitel 6 Einführung in Data Warehouses Vorlesung: PD Dr. Peer Kröger Dieses Skript basiert auf den Skripten zur Vorlesung Datenbanksysteme II an der LMU München Dieses Skript basiert auf den Skripten

Mehr

Data Cubes PG Wissensmangement Seminarphase

Data Cubes PG Wissensmangement Seminarphase PG 402 - Wissensmangement Seminarphase 23.10.2001-25.10.2001 Hanna Köpcke Lehrstuhl für Künstliche Intelligenz Universität Dortmund Übersicht 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit

Mehr

Business Intelligence & Reporting. Michael Cordes Holger Oehring Matthias Rein

Business Intelligence & Reporting. Michael Cordes Holger Oehring Matthias Rein Business Intelligence & Reporting Michael Cordes Holger Oehring Matthias Rein Ziele Einführung Business Intelligence / Front Room Online Analytical Processing (OLAP) Arten des Reporting & Nutzergruppen

Mehr

Data Cube. 1. Einführung. 2. Aggregation in SQL, GROUP BY. 3. Probleme mit GROUP BY. 4. Der Cube-Operator. 5. Implementierung des Data Cube

Data Cube. 1. Einführung. 2. Aggregation in SQL, GROUP BY. 3. Probleme mit GROUP BY. 4. Der Cube-Operator. 5. Implementierung des Data Cube Data Cube 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator 5. Implementierung des Data Cube 6. Zusammenfassung und Ausblick Dank an Hanna Köpcke! 1 On-line Analytical

Mehr

Inhaltsverzeichnis. 1 Einleitung 1. 2 Aufbau von Data-Warehouse-Systemen 15. Lehner, Wolfgang Datenbanktechnologie für Data-Warehouse-Systeme 2003

Inhaltsverzeichnis. 1 Einleitung 1. 2 Aufbau von Data-Warehouse-Systemen 15. Lehner, Wolfgang Datenbanktechnologie für Data-Warehouse-Systeme 2003 1 Einleitung 1 1.1 Betriebswirtschaftlicher Ursprung des Data Warehousing 2 1.2 Statistischer Ursprung des Data Warehousing 5 1.3 Fòderativer Ursprung des Data Warehousing 7 1.4 Definition eines Data-Warehouse-Systems

Mehr

Grundlagen der Programmentwurfstechnik Fundamentals of Software Engineering 1

Grundlagen der Programmentwurfstechnik Fundamentals of Software Engineering 1 Fundamentals of Software Engineering 1 Inhaltsverzeichnis 1. Einführung 2. Allgemeine Modellbildung - Klassische Konzepte des Software Engineering- 2.1 Das Kontextmodell 2.2 Entscheidungstabellen 2.3 Zustandsmodelle

Mehr

Objektorientierter Software-Entwurf Ergebnisse der funktionalen Zerlegung 3 1. Die Zerlegungsmethoden sollen in zwei Dimensionen betrachtet werden:

Objektorientierter Software-Entwurf Ergebnisse der funktionalen Zerlegung 3 1. Die Zerlegungsmethoden sollen in zwei Dimensionen betrachtet werden: Objektorientierter Software-Entwurf Ergebnisse der funktionalen Zerlegung 3 1 Vergleich der Zerlegungsmethoden Die Zerlegungsmethoden sollen in zwei Dimensionen betrachtet werden: Vergleich nach Ergebnissen

Mehr

Medizininformatik Software Engineering

Medizininformatik Software Engineering Vorlesung Software Engineering Inhaltsverzeichnis 1. Einleitung 2. Software und Medizinprodukt 3. Vorgehensmodelle 4. Strukturierter Entwurf von Echtzeitsystemen 4.1 Echzeit, was ist das? 4.2 Einführung

Mehr

Grundlagen der Programmentwurfstechnik Fundamentals of Software Engineering 1

Grundlagen der Programmentwurfstechnik Fundamentals of Software Engineering 1 Vorlesung 3 Fundamentals of Software Engineering 1 Inhaltsverzeichnis 1. Einführung 2. Allgemeine Modellbildung - Klassische Konzepte des Software Engineering- 2.1 Das Kontextmodell 2.2 Entscheidungstabellen

Mehr

Online Kurse Modulbeschreibungen

Online Kurse Modulbeschreibungen Online Kurse Modulbeschreibungen K0100 SQL Basics M0101 DB Theorie Dieses Modul führt in die Thematik von Datenbanken und deren grundlegenden Begriffen und Konzepten ein. Es werden Fragen beantwortet,

Mehr

Business Intelligence

Business Intelligence Hochschule Darmstadt Business Intelligence Fachbereich Informatik Praktikumsaufgabe 3 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 11.06.2007 Business Intelligence Aufgabenstellung 1.

Mehr

SQL. Ziele. Grundlagen von SQL. Beziehung zur relationalen Algebra SELECT, FROM, WHERE. Joins ORDER BY. Aggregatfunktionen. dbis.

SQL. Ziele. Grundlagen von SQL. Beziehung zur relationalen Algebra SELECT, FROM, WHERE. Joins ORDER BY. Aggregatfunktionen. dbis. SQL Lehr- und Forschungseinheit Datenbanken und Informationssysteme Ziele Grundlagen von SQL Beziehung zur relationalen Algebra SELECT, FROM, WHERE Joins ORDER BY Aggregatfunktionen Lehr- und Forschungseinheit

Mehr

Geoinformation I Datenmodellierung

Geoinformation I Datenmodellierung Seite 1 von 61 Geoinformation I Datenmodellierung Seite 2 von 61 Datenmodellierung Übersicht Datenverwaltung und Datenbanken objektorientierte Abbildung der Realität Grundlagen der Objektorientierung Darstellung

Mehr

Summarization-based Aggregation

Summarization-based Aggregation Summarization-based Aggregation Daten Generalisierung: Prozess, der Anwendungsdaten schrittweise von niedrigen auf höhere konzeptuelle Level aggregiert Conceptual levels 2 3 4 5 example: all federal states

Mehr

Kapitel 3: Datenbanksysteme

Kapitel 3: Datenbanksysteme LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Skript zur Vorlesung: Einführung in die Informatik: Systeme und Anwendungen Sommersemester 2018 Kapitel 3: Datenbanksysteme Vorlesung:

Mehr

Fortgeschrittene OLAP Analysemodelle

Fortgeschrittene OLAP Analysemodelle Fortgeschrittene OLAP Analysemodelle Jens Kübler Imperfektion und erweiterte Konzepte im Data Warehousing 2 Grundlagen - Datenanalyse Systemmodell Datenmodell Eingaben System Schätzer Datentypen Datenoperationen

Mehr

3 Grundlagen der Datenmodellierung

3 Grundlagen der Datenmodellierung 22 3 Grundlagen der Datenmodellierung Das Verständnis für den in der vorliegenden Arbeit gewählten Lösungsansatz erfordert eine Einführung in die Methoden und Konzepte des Datenbankentwurfes. Grundlegend

Mehr

Übungen zu Logik und Künstliche Intelligenz Blatt 8

Übungen zu Logik und Künstliche Intelligenz Blatt 8 Heilbronn, den 14.5.2010 Prof. Dr. V. Stahl WS 10/11 Übungen zu Logik und Künstliche Intelligenz Blatt 8 Aufgabe 1. Überlegen Sie, wie man folgende Relationen R grafisch darstellen könnte und entscheiden

Mehr

Übungsblatt 1. f(n) = f(n) = O(g(n)) g(n) = O(f(n)) Zeigen oder widerlegen Sie: 3 n = Θ(2 n ) Aufgabe 1.2 Gegeben sei die folgende Funktion:

Übungsblatt 1. f(n) = f(n) = O(g(n)) g(n) = O(f(n)) Zeigen oder widerlegen Sie: 3 n = Θ(2 n ) Aufgabe 1.2 Gegeben sei die folgende Funktion: Übungsblatt 1 Aufgabe 1.1 Beweisen oder widerlegen Sie, dass für die im Folgenden definierte Funktion f(n) die Beziehung f(n) = Θ(n 4 ) gilt. Beachten Sie, dass zu einem vollständigen Beweis gegebenenfalls

Mehr

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining 2 Eigenschaften eines Data Warehouse Referenzarchitektur Integrierte Sicht auf beliebige Daten aus verschieden Datenbanken

Mehr

Common Warehouse Metamodel und Imperfektion

Common Warehouse Metamodel und Imperfektion Common Warehouse Metamodel und Imperfektion Christoph Goebel Imperfektion und erweiterte Konzepte im Data Warehousing 2 Fragestellungen Welche Bedeutung haben Metadaten in der Information Supply Chain

Mehr

Teil II: Architektur eines Data-Warehouse-Systems... 57

Teil II: Architektur eines Data-Warehouse-Systems... 57 O:/Wiley/Reihe_Dummies/9783527714476_Gerken/3d/ftoc.3d from 08.08.2018 14:02:02 Auf einen Blick Einleitung... 19 Teil I: Was ist ein Data Warehouse?... 25 Kapitel 1: Ein Beispiel zur Einführung..... 27

Mehr

Kapitel DB:IV (Fortsetzung)

Kapitel DB:IV (Fortsetzung) Kapitel DB:IV (Fortsetzung) IV. Logischer Datenbankentwurf mit dem relationalen Modell Das relationale Modell Integritätsbedingungen Umsetzung ER-Schema in relationales Schema DB:IV-46 Relational Design

Mehr

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier Realisierung von OLAP Operatoren in einem visuellen Analysetool Vortrag von Alexander Spachmann und Thomas Lindemeier Gliederung Ausgangssituation/Motivation Was ist OLAP? Anwendungen Was sind Operatoren?

Mehr

Konvergenz von Folgen

Konvergenz von Folgen 6 Konvergenz von Folgen Definition 6.1 Eine Folge in C (oder R) ist eine Abbildung f : N C (oder R). Schreibweise: (a n ) n N, (a n ), a 1, a 2... wobei a n = f(n). Beispiele: 1) (1 + 2 n ) n N, 3 2, 5

Mehr

Diskrete Strukturen Kapitel 2: Grundlagen (Relationen)

Diskrete Strukturen Kapitel 2: Grundlagen (Relationen) WS 2016/17 Diskrete Strukturen Kapitel 2: Grundlagen (Relationen) Hans-Joachim Bungartz Lehrstuhl für wissenschaftliches Rechnen Fakultät für Informatik Technische Universität München http://www5.in.tum.de/wiki/index.php/diskrete_strukturen_-_winter_16

Mehr

Kapitel 3: Datenbanksysteme

Kapitel 3: Datenbanksysteme LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Skript zur : Einführung in die Informatik: Systeme und Anwendungen Sommersemester 2009 Kapitel 3: Datenbanksysteme : PDDr. Peer

Mehr

Datenorientierter Ansatz. Datenbankentwurfsschritte. Welche Daten müssen im System verwaltet werden? Wie werden die Daten im System verändert?

Datenorientierter Ansatz. Datenbankentwurfsschritte. Welche Daten müssen im System verwaltet werden? Wie werden die Daten im System verändert? .RQ]HSWLRQHOOHU'DWHQEDQNHQWZXUI Datenorientierter Ansatz Welche Daten müssen im System verwaltet werden? Wie werden die Daten im System verändert? Datenbankentwurfsschritte Datenverarbeitungsanforderungen

Mehr

Pivotieren. Themenblock: Anfragen auf dem Cube. Roll-up und Drill-down. Slicing und Dicing. Praktikum: Data Warehousing und Data Mining. Produkt.

Pivotieren. Themenblock: Anfragen auf dem Cube. Roll-up und Drill-down. Slicing und Dicing. Praktikum: Data Warehousing und Data Mining. Produkt. Zeit Pivotieren Themenblock: Anfragen auf dem Cube Praktikum: Data Warehousing und Data Mining Zeit Zeit 2 Roll-up und Drill-down Slicing und Dicing Drill-down Januar 2 3 33 1. Quartal 11 36 107 Februar

Mehr

Datenbanken Grundlagen und Design

Datenbanken Grundlagen und Design Frank Geisler Datenbanken Grundlagen und Design 3., aktualisierte und erweiterte Auflage mitp Vorwort 15 Teil I Grundlagen 19 i Einführung in das Thema Datenbanken 21 i.i Warum ist Datenbankdesign wichtig?

Mehr

SQL Data Manipulation Language (DML) und Query Language (QL)

SQL Data Manipulation Language (DML) und Query Language (QL) Innsbruck Information System University of Innsbruck School of Management Information Systems Universitätsstraße 15 6020 Innsbruck SQL Data Manipulation Language (DML) und Query Language (QL) Universität

Mehr

Einführung in Datenbanken

Einführung in Datenbanken Einführung in Datenbanken Dipl.-Inf. Michael Wilhelm Hochschule Harz FB Automatisierung und Informatik mwilhelm@hs-harz.de Raum 2.202 Tel. 03943 / 659 338 1 Inhalt 1. Grundlegende Begriffe der Datenbanktechnologie

Mehr

UML. Weiteres Vorgehen im Projekt

UML. Weiteres Vorgehen im Projekt UML Download objectif Personal Edition (kostenlos): http://www.microtool.de/objectif/de/download.asp Weiteres Vorgehen im Projekt Komponenten, Klassen, Objekte Prozesse Nichtfunktionale Anforderungen Skizzen,

Mehr

Web Engineering-Seminar Methoden zur Web Modellierung: Object-oriented Hypermedia Method (OO-H)

Web Engineering-Seminar Methoden zur Web Modellierung: Object-oriented Hypermedia Method (OO-H) Web Engineering-Seminar Methoden zur Web Modellierung: Object-oriented Hypermedia Method (OO-H) Dominik Kirsten Daniel Schäferbarthold Trier, 21.01.2008 1 Gliederung 1. Einführung 1.1 Anforderungen an

Mehr

WS 2013/14. Diskrete Strukturen

WS 2013/14. Diskrete Strukturen WS 2013/14 Diskrete Strukturen Prof. Dr. J. Esparza Lehrstuhl für Grundlagen der Softwarezuverlässigkeit und theoretische Informatik Fakultät für Informatik Technische Universität München http://www7.in.tum.de/um/courses/ds/ws13/14

Mehr

Data Warehousing. DWH Projekte. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. DWH Projekte. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing DWH Projekte Ulf Leser Wissensmanagement in der Bioinformatik Inhalt DWH Projekte Spezifika Die kritischen Punkte Warum scheitern DWH Projekte? Ulf Leser: Data Warehousing, Vorlesung,

Mehr

Kapitel 3: Datenbanksysteme

Kapitel 3: Datenbanksysteme LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Skript zur Vorlesung: Einführung in die Informatik: Systeme und Anwendungen Sommersemester 2008 Kapitel 3: Datenbanksysteme Vorlesung:

Mehr

Relationales Datenmodell

Relationales Datenmodell Relationales Datenmodell Ein Datenmodell hat zwei Bestandteile: Eine mathematische Notation zur Darstellung von Daten und Beziehungen. Operationen auf den Daten, um Abfragen und andere Manipulationen zu

Mehr

Entity Relationship Modell (ERM) (Konzeptueller Datenbankentwurf)

Entity Relationship Modell (ERM) (Konzeptueller Datenbankentwurf) Entity Relationship Modell (ERM) (Konzeptueller Datenbankentwurf) 10.02.14 Ahmad Nessar Nazar 1 Reale Welt Sie bekommen von einer Reifenhandels Firma den Zuschlag, eine Verwaltungsdatenbank zu entwerfen,

Mehr

Nutzung der Oracle Database InMemory Option für SAP BW

Nutzung der Oracle Database InMemory Option für SAP BW Nutzung der Oracle Database InMemory Option für SAP BW Schlüsselworte Oracle, SAP-BW, InMemory, Star-Schema. Jörn Bartels Oracle München Einleitung In SAP BW wurde bisher ein erweitertes Snow Flake Schema

Mehr

Themenblock: Data Warehousing (I)

Themenblock: Data Warehousing (I) Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining Agenda Einführung Data Warehouses Online Transactional Processing (OLTP) Datenmanipulation mit SQL Anfragen mit SQL Online

Mehr

Multidimensionales Datenmodell

Multidimensionales Datenmodell Multidimensionales Datenmodell Grundbegriffe fi Fakten, Dimensionen, Würfel Analyseoperationen fi Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung fi ME/R, ADAPT Relationale

Mehr

Kapitel 3: Indices und Sichten

Kapitel 3: Indices und Sichten Kapitel 3: Indices und Sichten Data Warehousing und Mining - 1 Gliederung im folgenden: Klassifikation Aggregationsfunktionen, Materialisierte Sichten Grundsätzliche Alternativen beim Updaten materialisierter

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Sprachen für OLAP Operationen Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung OLAP Operationen MDX: Multidimensional Expressions SQL Erweiterungen

Mehr

Java Einführung Objektorientierte Grundkonzepte

Java Einführung Objektorientierte Grundkonzepte Java Einführung Objektorientierte Grundkonzepte Inhalt Verständnis der grundlegenden Konzepte der Objektorientierung: Objekte Nachrichten Kapselung Klassen und Instanzen Vererbung Polymorphismus Darstellung

Mehr

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

Christian Kurze BI-Praktikum IBM WS 2008/09

Christian Kurze BI-Praktikum IBM WS 2008/09 Einführung in die multidimensionale Datenmodellierung e mit ADAPT BI-Praktikum IBM WS 2008/09 1 Gliederung Einführung multidimensionale Datenmodellierung 1. Multidimensionales Modell BI-Praktikum IBM WS

Mehr

Einleitung. ROLLUP, CUBE und GROUPING. Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002)

Einleitung. ROLLUP, CUBE und GROUPING. Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Betrifft Autör: GROUPING_ID Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Quelle Aus dem Oracle9i Data Warehousing Guide und den Kursen New Features Oracle9i

Mehr

Allgemeine Definition von statistischer Abhängigkeit (1)

Allgemeine Definition von statistischer Abhängigkeit (1) Allgemeine Definition von statistischer Abhängigkeit (1) Bisher haben wir die statistische Abhängigkeit zwischen Ereignissen nicht besonders beachtet, auch wenn wir sie wie im Fall zweier disjunkter Mengen

Mehr

FACHHOCHSCHULE MANNHEIM

FACHHOCHSCHULE MANNHEIM Objektorientierte Programmierung 8. Vorlesung Prof. Dr. Peter Knauber FACHHOCHSCHULE MANNHEIM Hochschule für Technik und Gestaltung e Die 1. lgruppe von KobrA: Realization le der Realization: Kurze Structural

Mehr

Daniel Warner SQL. Das Praxisbuch. Mit 119 Abbildungen. Franzis

Daniel Warner SQL. Das Praxisbuch. Mit 119 Abbildungen. Franzis Daniel Warner SQL Das Praxisbuch Mit 119 Abbildungen Franzis Inhaltsverzeichnis Teil I - Einleitung 15 1 Einleitung 17 1.1 Zum Aufbau des Buchs 17 1.2 Hinweise zur Buch-CD 18 1.3 Typografische Konventionen

Mehr

Modellierungskonzepte semantischer Datenmodelle. Semantische Datenmodelle. Das Entity-Relationship Modell

Modellierungskonzepte semantischer Datenmodelle. Semantische Datenmodelle. Das Entity-Relationship Modell DEVO. Semantische Datenmodelle DEVO.4 Modellierungskonzepte semantischer Datenmodelle Äquivalente Begriffe: Objekttypenebene = Objektklassenebene = Schema (Schema-level), Objektebene = Exemplarebene (Instance-level)

Mehr

Kap. 6 Data Warehouse

Kap. 6 Data Warehouse 1 Kap. 6 Data Warehouse 6.1 Was ist ein Data Warehouse, Motivation? 6.2 Data Cube und Cube-Operationen 6.3 Workshop: MS SQL Server, Cube Operationen 6.4 Physischer Entwurf, Implementierung von Cubes 6.5

Mehr

6. Induktives Beweisen - Themenübersicht

6. Induktives Beweisen - Themenübersicht 6. Induktives Beweisen - Themenübersicht Ordnungsrelationen Partielle Ordnungen Quasiordnungen Totale Ordnungen Striktordnungen Ordnungen und Teilstrukturen Noethersche Induktion Anwendung: Terminierungsbeweise

Mehr

Klausur Konzeptionelle Modellierung

Klausur Konzeptionelle Modellierung Klausur Konzeptionelle Modellierung Braindump Wintersemester 2012/2013 Inhaltsverzeichnis 1 Allgemeines 2 1.1 Begriffe............................... 2 1.2 Konzeptionelles Schema..................... 2

Mehr

Quantitative Methoden Wissensbasierter Systeme

Quantitative Methoden Wissensbasierter Systeme Quantitative Methoden Wissensbasierter Systeme Probabilistische Netze und ihre Anwendungen Robert Remus Universität Leipzig Fakultät für Mathematik und Informatik Abteilung für Intelligente Systeme 23.

Mehr

Aufgabe 1: [Logische Modellierung]

Aufgabe 1: [Logische Modellierung] Aufgabe 1: [Logische Modellierung] a) Entwerfen Sie für das von Ihnen entworfene Modell aus Aufgabe 2 des 1. Übungsblattes ein Star-Schema. b) Entwerfen Sie für das vorangegangene Modell einen Teil eines

Mehr

Data Warehouse Technologien

Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............

Mehr

Arithmetik und Algebra

Arithmetik und Algebra Willkommen Gliederung "Hallo Welt!" für Fortgeschrittene Friedrich-Alexander-Universität Erlangen-Nürnberg Institut für Informatik Lehrstuhl 2 7. Juni 2005 Willkommen Gliederung Gliederung 1 Repräsentation

Mehr

3. Grundlagen relationaler Datenbanksysteme

3. Grundlagen relationaler Datenbanksysteme 3. Grundlagen relationaler Datenbanksysteme Hier nur kurze Rekapitulation, bei Bedarf nachlesen 3.1 Basiskonzepte des Relationenmodells 1 Darstellung der Miniwelt in Tabellenform (DB = Menge von Relationen

Mehr

2. Vorlesung. Die Theorie der schwarz-weissen Ketten.

2. Vorlesung. Die Theorie der schwarz-weissen Ketten. 2. Vorlesung. Die Theorie der schwarz-weissen Ketten. Die Theorie der schwarzen Steinchen haben wir jetzt halbwegs vertanden. Statt mit schwarzen Steinen wie die Griechen, wollen wir jetzt mit schwarzen

Mehr

Kapitel 5: Vom relationalen zum multidimensionalen Datenmodell

Kapitel 5: Vom relationalen zum multidimensionalen Datenmodell Kapitel 5: Vom relationalen zum multidimensionalen Datenmodell Data Warehousing und Mining 1 Data Warehousing, Gliederung Dimensionen und Measures Schematypen für Data Warehousing GroupBy und Data Cubes

Mehr

Kapitel 5: Vom relationalen zum multidimensionalen Datenmodell

Kapitel 5: Vom relationalen zum multidimensionalen Datenmodell Data Warehousing, Gliederung Kapitel 5: Vom relationalen zum multidimensionalen Datenmodell Dimensionen und Measures Schematypen für Data Warehousing GroupBy und Data Cubes Operatoren für den Data Cube

Mehr

Dimensionen, Measures

Dimensionen, Measures ... Operationen und peicherung Multi-dimensionaler Daten Aggregate um RED WHITE BLUE Group By (with total) By Color um Cross Tab Chevy Ford By Color RED WHITE BLUE By Make um By Make & Year By Year FORD

Mehr

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...

Mehr