Data Warehousing. Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit. Ulf Leser Wissensmanagement in der Bioinformatik
|
|
- Hildegard Dunkle
- vor 7 Jahren
- Abrufe
Transkript
1 Data Warehousing Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik
2 Begriffe Klassifikationsschema Jahr Stufen einer Dimension plus Halbordnung Quartal Monat Woche Saison Klassifikationsstufe Granularität der Verdichtung Klassifikationspfad Tag Verdichtungspfad Dimension Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
3 Klassifikationsschema Definition. Ein Klassifikationsschema K (einer Dimension D) ist ein 5-Tupel {k 0, k 1,... k n },, M, stufe(), knoten()) mit Menge von Klassifikationsstufen {k 0,... k n } Menge M von Klassifikationsknoten Halbordnung auf {k 0,... k n } mit Größtem Element k n : k i, 0 i n-1: k n k i Stufe() weist jedem Klassifikationsknoten genau eine Klassifikationsstufe zu Knoten()=stufe -1 () berechnet für eine Klassifikationsstufe die Menge aller ihr zugeordneten Klassifikationsknoten Bemerkung Die Halbordnung überträgt sich natürlich auf Klassifikationsknoten Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
4 Erläuterung Klassifikationsstufen Die Klassifikationsstufen sind die Schemaelemente der Dimension Das größte Element k n ist artifiziell es steht für alles, also die Verdichtung in einen einzelnen Wert Wir nennen es TOP Interpretation von : Funktionale Abhängigkeit Aggregierbarkeit Tag bestimmt Monat bestimmt Jahr bestimmt TOP TOP Produkt Produktfamilie Produktgruppe TOP Asus M2400N Notebooks Büroelektronik TOP Beachte: Halbordnung ist immer zyklusfrei Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
5 Klassifikations hierarchie Begriffe Top Jahr Quartal I II III IV I II III IV Monat Jan Feb Mar Okt Nov Dez Tag Klassifikationsknoten Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
6 Dimension Definition. Eine Dimension D=(K, {P 1,...,P j }) besteht aus Einem Klassifikationsschema K Einer Menge von Pfaden P i aus K Jedes k K muss in mindestens einem Pfad in D enthalten sein Bemerkungen Für jedes k K gibt es mindestens einen Pfad, nämlich k TOP D muss nicht alle Pfade enthalten, die es in K gibt Designentscheidung Schreibweise: D.k bezeichnet die Klassifikationsstufe k aus D Jedes D.k kann in mehreren Pfaden vorkommen Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
7 Granularität Definition. Gegeben eine Menge U von n Dimensionen D 1,..., D n. Eine Granularität G über U ist eine Menge {D 1.k k1,...,d n.k kn } für die gilt k ki ist eine Klassifikationsstufe in D i Es gibt keine funktionalen Abhängigkeiten zwischen den Klassifikationsstufen D 1.k k1,..., D n.k kn Bemerkungen Beispiel: Nicht gleichzeitig Dimensionen Zeit und Fiskalisches Jahr in einer Granularität betrachten Mit einer Granularität legt man fest, in welcher Detailstufe Fakten in den einzelnen Dimensionen beschrieben werden Abkürzung: Lässt man in U eine Dimension D i weg, ist implizit D i.top gemeint Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
8 Halbordnung auf Granularitäten Definition. Auf der Menge aller Granularitäten zu einer Menge U von Dimensionen ist eine Halbordnung < wie folgt definiert Sei G 1 ={D 11.k k11,...,d n1.k kn1 } und G 2 ={D 12.k k12,...,d n2.k kn2 } Ordne die Dimensionen in G 1 und G 2 beliebig, aber gleich Es gilt G 1 <G 2 genau dann wenn Benutzung i: D i1.k ki1 D i2.k 2i2 oder D i1.k ki1 =D i2.k ki 2 Beschreibung der Transformation von Granularitäten Anfrageoptimierung: Wiederverwendung von Aggregaten Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
9 Bereich Beispiel Region Zeit TOP Top Top Konzern Staat Jahr Sparte Bundesland Monat Abteilung Shop Tag (B.Sparte, R.Shop, Z.Tag) < (B.Sparte, R.Shop, Z.Monat) < (B.Sparte, R.Top, Z.Monat) < (B.Top, R.Top, Z.Top) (B.Sparte, R.Staat, Z.Tag)? (B.Konzern, R.Shop, Z.Tag) Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
10 Inhalt dieser Vorlesung Operationen im multidimensionalen Datenmodell ME/R: Graphische multidimensionale Datenmodellierung Theorie der Summierbarkeit Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
11 1. OLAP Operationen MDDM spricht die Sprache des Analysten Operationen auf dem MDDM sollten die Analysevorgänge abbilden bzw. unterstützen Ziel: Schnelle und intuitive Manipulation der Daten Notwendig Definition der Operationen (Unterstützung durch graphische Werkzeuge) Heute: ME/R (Umsetzung in ausführbare Operationen) Ab nächster Stunde Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
12 Vorgehen Die wichtigsten Operationen im MDDM sind Aggregation (Roll-Up) Verfeinerung (Drill-Down) Weiteres Vorgehen Datenpunkte und Würfelkoordinaten Aggregation in Klassifikationshierarchien Inhalt eines Würfel einer bestimmten Granularität OLAP Operationen: Aggregation und Verfeinerung Weitere OLAP Operationen, Visualisierung Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
13 Übersicht Z.Tag Z.Monat B.Abteilung B.Sparte Skoda.Reparatur Skoda.Ersatzteile Skoda VW München Wedding Nantes Lyon Koordinaten der Datenpunkte R.Shop Bayern Berlin Aggregierte Fakten Department1 Department2 R.Bundesland (1.101, , Wedding, Ersatzteile) (12.400, , Nantes, Reparatur) (1.540, , Wedding, Ersatzteile) Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
14 Datenpunkte und Würfelkoordinaten Definition. Gegeben Würfel W, Dimension D und ein Klassifikationsknoten x aus D Sei z ein Datenpunkt und D(z) seine Koordinate bzgl. D Wir sagen: D(z) liegt in x wenn entweder D(z)=x oder D(z) nachfahren(x) punkte(x) sei die Menge aller Datenpunkte z, für die D(z) in x liegt Bemerkung Erweiterung auf mehrere Koordinaten durch Schnittmengenbildung punkte(x,y,z) = punkte(x) punkte(y) punkte(z) mit x in D 1, y in D 2, z in D punkte(x) x Januar Februar... Dezember 32,50 17, ,50 Viele z Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
15 Aggregation in Hierarchien Definition. Gegeben Dimension D, Pfad P={k 0... k k... TOP} in D Sei x knoten(k) ein Klassifikationsknoten Sei f eine Aggregatfunktion und F ein Measure Sei Y=kinder(x) (die Menge {y 1,...,y n } knoten(k ) von Klassifikationsknoten von k, von denen x abhängt) Die Aggregation von Y nach x bzgl. f und F bezeichnet die Berechnung des aggregierten Faktes F(x)=f(F(y 1 ),..., F(y n )) Die Aggregation von k nach k bzgl. f und F bezeichnet die Berechnung von F(x) für alle x knoten(k) Das schreiben wir kurz als F(k) k Jahr x k Monat Januar Februar... Dezember Y Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
16 Startpunkt Sei P={k 0... k n TOP} Man berechnet F(TOP) aus F(k n ), F(k n ) aus F(k n-1 ), etc. Wie berechnet man aber F(k 0 )? Aus den einzelnen Datenpunkten Definition. Gegeben Dimension D, Pfad P={k 0... TOP} in D und ein Klassifikationsknoten x knoten(k 0 ) Sei punkte(x)={z 1,...,z n }, die Menge aller Datenpunkte, deren D- Koordinate in x liegt Für eine Aggregatfunktion f und Measure F berechnet sich dann das aggregierte Fakt F(x) als F(x)=f(F(z 1 ),...,F(z n )) Mit F(z) als dem Wert des Measures F von Datenpunkt z x punkte(x) Januar Februar... Dezember 32,50 17, ,50 Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
17 Berechnung Die vorherige Definition ist prinzipiell abwendbar für alle Klassifikationsknoten bzw. stufen eines Pfades Bedingt durch...d-koordinate in x... Aber Es schneller, die Aggregation aus der nächstkleineren Stufe zu berechnen Weniger Werte - weniger Arbeit Das setzt voraus, dass man die auch hat Präaggregation OLAP Operationen wandern immer nur eine Stufe in einem Pfad herauf oder herab deshalb definieren wir Aggregation von Ebene zu Ebene Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
18 Wo sind wir? Wir können entlang eines Pfades in einer Dimension für ein Measure mit einer Aggregatfunktion die aggregierten Fakten für höherstufige Knoten berechnen Zwei Möglichkeiten Aggregierte Measures von Knoten einer Stufe aus aggregierten Measures der nächstkleineren Stufe berechnen Aggregierte Measures immer direkt aus den Werten aller Datenpunke mit den entsprechenden Koordinaten berechnen Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
19 Würfelinhalt Ein Würfel W=(G,F) Granularität G=(D 1.k 11,...,D n.k n1 ) Menge von aggregierten Measures F={f 1,...,f m } Schreibweise für Zellen eines Würfels W(x 1, x 2,..., x n ) = (f 1,...,f m ) x i sind die Koordinaten im Würfel: x i knoten(k i1 ) Pro Punkt in W gibt es m aggregierte Measures f 1,..., f m Betrachten wir den einfachen Fall: n=m=1 Eine Dimension D mit Knoten x, ein Measure F Dann: W(x) = (F(kinder(x)) Berechnung rekursiv oder direkt aus Datenpunkten Bemerkung Auf unterster Ebene ist kinder(x)=punkte(x) Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
20 Würfelinhalt, allgemeiner Fall Ein Würfel W=(G,F) Granularität G=(D 1.k 11,...,D n.k n1 ) Menge von aggregierten Measures F={f 1,...,f m } Allgemeiner Fall W(x 1,...,x n ) = (f 1,...,f m ) = (F 1 (kinder(x 1 ) kinder(x 2 )... kinder(x n )), F 2 (kinder(x 1 ) kinder(x 2 )... kinder(x n )),... F m (kinder(x 1 ) kinder(x 2 )... kinder(x n ))) mit Koordinaten x i knoten(k i1 ) Bemerkung Die Schnittmengenbildung berechnet die Menge von Punkten in der Würfelzelle mit Koordinaten x 1,...,x n Jedes Measure wird gesondert aggregiert Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
21 Beispiel Z.Tag Z.Monat B.Abteilung B.Sparte Skoda.Reparatur Skoda.Ersatzteile VW Skoda München Wedding Nantes Koordinaten der Fakten Lyon R.Shop Bayern Aggregierte Fakten Berlin Department1 Department2 R.Bundesland ( , Wedding, Ersatzt.) = (...) ( , Wedding, Ersatzt.) = (...) (1 1999, Berlin, Skoda) = (...) (4 1999, Bayern, VW) = (...) Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
22 Operationen auf Würfeln OLAP Operationen überführen einen Würfel W=(G,F) in einen Würfel W =(G,F ) Dabei gilt Aggregation: G < G Verfeinerung G > G Eine einfache Operation verändert nur die Klassifikationsstufe einer Dimension in G Komplexe Operationen können auf natürliche Weise aus einfachen Operationen durch Verkettung zusammengesetzt werden Wir betrachten deshalb im folgenden nur einfache Operationen Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
23 OLAP Operationen Definition. Geg.: Würfel W=(G,F) mit G=(D 1.k 11,...,D n.k n1 ) und F=(f 1,..,f m ) Sei P={k 0... k i1 k i1 k i1... TOP} ein Pfad in D i Die einfache Aggregation von D i in W entlang P bzgl. Aggregatfunktion f überführt W in W = ( (D 1.k 11,..., D i.k i1,..., D n.k n1 ), (f 1,..., f m )) (f 1,..., f m ) = (F 1 (punkte(k 11 )... punkte(k i1 )... punkte(k n1 )),..., F m (punkte(k 11 )... punkte(k i1 )... punkte(k n1 ))) Die einfache Verfeinerung von D i in W entlang P bzgl. Aggregatfunktion f überführt W in W = ( (D 1.k 11,..., D i.k i1,..., D n.k n1 ), (f 1,..., f m )) Mit (f 1,..., f m ) =... Bemerkung Bei Aggregation kann man die f i per Aggregation berechnen Bei Verfeinerung ist ein Zugriff auf die Datenbank (Datenpunkte oder Ulf Präaggregate) Leser: Data Warehousing, notwendig Vorlesung, Sommersemester
24 Beispiel: Aggregation (Roll-Up) Z.Tag Z.Monat B.Abteilung B.Abt Skoda.Reparatur Skoda.Ersatzteile Skoda.Repa. Skoda.Ersatz München Wedding Nantes Lyon R.Shop München Wedding Nantes Lyon R.Shop Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
25 Beispiel: Verfeinerung (Drill-Down) Z.Tag Z.Monat B.Abteilung B.Abt Skoda.Reparatur Skoda.Ersatzteile Skoda.Repa. Skoda.Ersatz München Wedding Nantes Lyon R.Shop München Wedding Nantes Lyon R.Shop Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
26 Wo sind wir? Das MDDM gibt Klassifikationsstufen, Knoten, Pfade und Dimensionen vor Die Daten bestehen aus verschiedenen Measures, jeweils mit Koordinaten in den jeweiligen Dimensionen Koordinaten (Dimensionen) sind hierarchisch gegliedert (entlang der Pfade); jeder Datenpunkt hat eine Koordinate in jeder Klassifikationsstufe Die Koordinaten in einem Pfad sind voneinander abhängig Würfel stellen aggregierte Daten gemäß der Würfelgranularität dar OLAP Operationen (Aggregation, Verfeinerung) sind entlang der Pfade und gemäß der Granularität möglich Sie verändern die Granularität und die aggregierten Fakten Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
27 Aggregation bis TOP Summe Umsatz pro Tag und Abteilungen über alle Shops Z.Tag B.Abteilung Skoda.Reparatur Skoda.Ersatzteile München Wedding Nantes Lyon R.Shop Summe Umsatz pro Shop und Tag, über alle Abteilungen Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
28 ... in mehreren Dimensionen Z.Tag B.Abteilung Skoda.Reparatur Skoda.Ersatzteile München Wedding Nantes Lyon R.Shop G=(Z.TOP, R.TOP, B.TOP) Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
29 Weitere Operationen Aggregation ist die spannendste OLAP Operation Die restlichen führen keine Berechnungen durch, sondern selektieren bzw. ändern nur Ausschnitte des Würfels In der Literatur werden teilweise noch weitere Operationen angeführt (Drill-Across, Dicing,...) Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
30 Rotation Unterschiedliche Sichtweisen auf einen Datenbestand Jahr Jahr Kontinent Marke Asien Südamerika BMW Ford Peugeo t BMW VW Ford Automarke Asien Europa S-Amerika Australien Kontinent Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
31 Selektion einer Scheibe (Slicing) Verkäufe von Peugeot pro Jahr und Kontinent Verkäufe in Asien pro Jahr und Marke Jahr Asien Südamerika Kontinent BMW Peugeot VW Ford Automarke Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
32 Auswahl von Unterwürfeln Verkäufe von (Peugeot, VW) in (2000, 2001) pro Kontinent Jahr Asien Südamerika Kontinent BMW Peugeot VW Ford Automarke Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
33 2: Grafische Modellierung Grafische Modellierung multidimensionaler Daten Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
34 Datenbankentwurf Konzeptionelles Modell Logisches Modell Implementierung Designer, Requirements Engineering Entwickler, Administrator Administrator Produktsupport E/R, UML: Klassen, Attribute, Assoziationen Relationen, Attribute, Keys, SQL Join-Order, Indexe, Buffermanagement, Sortierung (Halb)Automatisch Vollautomatisch Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
35 ME/R Literatur Sapia at al. Extending the E/R Model for the Multidimensional Paradigm, Workshop DWDM, 1998 Logisches MDDM Fakten, Klassifikationsstufen, Dimensionen,... Konzeptionelles/Graphisches Modell für MDDM? E/R nicht ausreichend Keine Repräsentation von MDDM Konzepten: Fakten, Dimension, Klassifikationsstufen, etc. ME/R: Erweitertes E/R Modell Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
36 Gesamtbild ME/R MDDM ROLAP: Relationales Modell Implementierung MOLAP: multidimensionales Implementierung Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
37 ME/R: Elemente und Notation Neue Elemente Klassifikationsstufe (Dimension Level) Würfel (Fact) Halbordnung zwischen Klassifikationsstufen (Roll-Ups) Constraint: Keine Zyklen in den ROLL-UP Beziehungen Klassifikationsstufe Würfel Roll-Up Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
38 Beispiel Jahr Monat Tag Menge Shop_name Preis Produktgruppe Produkt Verkauf Shop Product_name Top Top Top Kunde Region TOP Land Land Jahr Region Land Produkgruppe Produkt Region Region Monat Land Kunde Shop Tag Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
39 Wiederverwendung von Stufen... Menge Shop_name Preis Produktgruppe Produkt Verkauf Shop Product_name Kunde Region Möglich, aber nicht unproblematisch Wenn Kundenregionen (nach Vertrieb) anders organisiert sind als Shopregionen (nach Logistik) IC nicht überwachbar Wenn Kunden in mehr Regionen wohnen dürfen als es Shops gibt verborgenes Integritätsconstraint Entspricht funk. Abhängigkeiten von unterschiedlichen, aber gleichnamigen Attributen Wird auf unterschiedliche Fremdschlüssel abgebildet Land Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
40 ME/R Bewertung Minimale, konservative Erweiterung Mehrere Würfel sind möglich Flexible Zuordnung Dimensionen Würfel Klare Semantik durch Metamodell in Extended E/R Greift eher kurz Keine Eigenschaften von Fakten (Summierbarkeit) Keine Besonderheiten von Klassifikationspfaden Übersprungene Stufen, unendliche Hierarchien Keine Übersetzungsmethode definiert Toolunterstützung? Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
41 Weitere Ansätze muml UML-Erweiterung basierend auf UML Metamodell (Constraints, Stereotypen) -> Werkzeugunterstützung vorhanden Klassifikationsstufe: <<Dimensional class>> Fakten: <<Fakt class>> Würfel: <<Dimension>> (Assoziationstyp) Hierarchie: <<Roll-Up>> (Assoziationstyp)... Multi-dimensional Modelling Language (MML)... Keine der Methoden hat sich (bisher) durchgesetzt Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
42 3. Summierbarkeit Ziel des MDDM Verdichtung von Daten entlang der Klassifikationspfade Aber das geht nicht immer gut Numerische versus kategorische Fakten Numerisch: Umsatz, Verkäufe, Messwerte,... Kategorisch: Geschlecht, Kundensegment,... Sollte man als Dimension definieren, muss man aber nicht Nicht alle Aggregatsfunktionen sind hierarchisch anwendbar Summe der Umsätze aller Tage Umsatz des Monats Summe der Umsätze aller Monate Umsatz des Jahres Durchschnitt der Umsätze aller Tage Durchschnitt des Monats? Durchschnitt der Umsätze aller Monate Durchschnitt des Jahres? Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
43 Beispiel Level 0 Level 1 Level Summe: 2 Avg: 1 Summe: Summe: 10 Avg: 11/2 12/3 Avg: 10 Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
44 Charakterisierung von Aggregatsfunktionen Lenz, Shoshani: Summarizability in OLAP and Statistical Databases, SSDBM, 1997 Geg.: Set X, Partitionierung (X 1,X 2,..., X n ) X entspricht einem Klassifikationsknoten, (X 1,X 2,..., X n ) sind seine Kinder Definition. Eine Aggregatfunktion f ist distributiv gdw g: f(x) = f( g(x 1 ), g(x 2 ),... g(x n )) Eine Aggregatfunktion f ist algebraisch gdw f(x) berechenbar aus fester Menge von g s Eine Aggregatfunktion f ist holistisch gdw f(x) kann nur aus den Grundelementen von X berechnet werden D.h., dass die Menge von g s nicht begrenzt ist Dann muss man immer auf die Datenpunkte zurück Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
45 Beispiele Distributiv Algebraisch Holistisch Summe, Count, Max, Min,... AVG (mit G 1 =SUM und G 2 =CNT) STDDEV, MaxN,... MEDIAN, RANK, PERCENTILE Highest Frequency,... Highest Frequency Merke Werte und jeweilige Frequenz: ( (v 1,f 1 ), (v 2,f 2 ),...) Merge zweier Sets möglich Aber: Keine feste Grenze für Platzbedarf, da Anzahl unterschiedlicher Werte nicht fest Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
46 Summierbarkeit / Aggregierbarkeit Bisher: Wann darf man Werte hierarchisch summieren? Natürlich nur numerische Fakten Art der Aggregatfunktion beachten Aber Summe der Lagerbestände pro Produkt über Jahre? Gesamtsumme Studenten als Summe über Studenten pro Studiengang? Weitere notwendige Kriterien für Aggregierbarkeit entlang eines Klassifikationspfades Überlappungsfreiheit der Zuordnung von Klassifikationsknoten Vollständigkeit der Zerlegung pro Klassifikationslevel Typverträglich von Fakt und Aggregatfunktion Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
47 Beispiel Studenten pro Jahr und Studiengang Gesamt Informatik BWL Gesamt Wie kann das stimmen? Wie lange dauern Studiengänge? Studenten nur in einem Studiengang eingeschrieben? Summen lassen sich nicht aus den Einzelwerten berechnen Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
48 Überlappungsfreiheit Definition. Eine Klassifikationshierarchie ist überlappungsfrei gdw Jeder Klassifikationsknoten mit Level i ist höchstens einem Klassifikationsknoten in Level i+1 zugeordnet Jeder Datenpunkt ist höchstens einem Klassifikationsknoten mit Level 0 zugeordnet Produktfamilie Bekleidung Produktgruppe Damen Herren Produktart Rock Jeans Anzug Verkauf: ((Rock,Jeans), 79.00,...) Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
49 Vollständigkeit Definition. Eine Klassifikationshierarchie ist vollständig gdw Jeder Klassifikationsknoten mit Level i ist mindestens einem Klassifikationsknoten in Level i+1 zugeordnet Jedes Fakt ist mindestens einem Klassifikationsknoten mit Level 0 zugeordnet Produktfamilie Bekleidung Produktgruppe Damen Herren Produktart Rock Jeans Anzug Verkauf: ((Produkt das zu keiner Produktart passt),...) Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
50 Was tun? Wir sind bisher immer von vollständigen und überlappungsfreien Klassifikationsschemas ausgegangen Summierbarkeit ist ein wichtiger Grund dafür Das entspricht nicht immer der betrieblichen Realität Was tun wenn nicht? Neue Klassifikationsknoten Artifizielle Klassifikationsknoten: Others, Rest, Nicht zugewiesen Knotenaufspaltung: Herrenjeans, Damenjeans Gewichtete Zuordnung Türkei ist 10% Europa, 90% Asien Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
51 Typen von Fakten Flow (Ereignis zu Zeitpunkt T) Verkäufe, Umsatz, Lieferungen, diplomierte Studenten,... Stock (Zustand zu Zeitpunkt T) Lagerbestand, eingeschriebene Studenten, Einwohnerzahlen,... Value-per-Unit (Eigenschaft zu Zeitpunkt T) Preis, Herstellungskurs, Währungskurs,... Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
52 Typverträglichkeit Stock Flow Value-per- Unit MIN/MAX SUM Zeit: nein Sonst: Nie AVG Erkennen von Problemen Nicht automatisch möglich Metadaten Beschreibung der Measures notwendig Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
53 Zusammenfassung OLAP Operationen MDDM Modell Modellierung der Daten in der Sprache des Analysten Einschränkung auf sinnvolle Operationen Roll-Up und Drill-Down Selektion und Rotation Grafische Notationen sind vorhanden, aber noch nicht verbreitet Vorsicht vor Modellierungsfallen Summierung über kategorische Fakten Rekursive Durchschnittsbildung Typunverträgliche Summierung Löchrige Klassifikationshierarchien Ulf Leser: Data Warehousing, Vorlesung, Sommersemester
Data Warehousing. Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Klassifikationsschema Definition Ein Klassifikationsschema
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining OLAP Operationen Ein konzeptionelles MDDM Aggregierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Operationen im multidimensionalen Datenmodell
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining OLAP Operationen Ein konzeptionelles MDDM Aggregierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Operationen im multidimensionalen Datenmodell
MehrData Warehousing. Modellierung im DWH Das multidimensionale Datenmodell. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Modellierung im DWH Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Zusammenfassung: Hubs and Spokes Mart 1 Mart 2 Mart 3 Mart 4 DWH Quelle 1 RDBMS Quelle
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Vom Spreadsheet zum Würfel Multidimensionales Datenmodell (MDDM)
MehrData Warehousing. Multidimensionale Modellierung. Modellierung im DWH. Wissensmanagement in der. Bioinformatik. Ulf Leser
Data Warehousing Modellierung im DWH Multidimensionale Modellierung Ulf Leser Wissensmanagement in der Bioinformatik Zusammenfassung: Hubs and Spokes Mart 1 Mart 2 Mart 3 Mart 4 DWH Quelle 1 RDBMS Quelle
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik DWH Grobarchitektur: Hubs and Spokes Abgeleitete Sichten Mart 1 Mart 2 Mart 3 Mart 4
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Vom Spreadsheet zum Würfel Multidimensionales Datenmodell (MDDM)
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Speicherung multidimensionaler Daten Ulf Leser Wissensmanagement in der Bioinformatik Dimension Dimension Top Jahr 1997 1998 1999 2000 Quartal I II III IV I II III IV Klassifikationsstufen
MehrData Warehousing. Modellierung im DWH Das multidimensionale Datenmodell. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Modellierung im DWH Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Zusammenfassung: Hubs and Spokes Mart 1 Mart 2 Mart 3 Mart 4 DWH Quelle 1 RDBMS Quelle
MehrData Warehousing. Speicherung multidimensionaler Daten. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Speicherung multidimensionaler Daten Ulf Leser Wissensmanagement in der Bioinformatik Beispiel Z.Tag Z.Monat 4.1.1999 B.Abteilung 4 1999 B.Sparte 3.1.1999 3 1999 2.1.1999 1.1.1999 Skoda.Reparatur
MehrMultidimensionale Modellierung
Multidimensionale Modellierung Vorlesung: Übung: Patrick Schäfer Berlin, 27. November 2017 patrick.schaefer@hu-berlin.de https://hu.berlin/vl_dwhdm17 https://hu.berlin/ue_dwhdm17 Grundlagen Fakten (Kennzahlen/Messgrößen):
MehrData Warehousing. Ausführung von OLAP Operationen. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Ausführung von OLAP Operationen Ulf Leser Wissensmanagement in der Bioinformatik Variante 1 - Snowflake Year id year Productgroup id pg_name Month Id Month year_id Day Id day month_id
MehrDatenbanksysteme I Data Warehouses Felix Naumann
Datenbanksysteme I Data Warehouses 13.7.2009 Felix Naumann Überblick 2 Einsatzgebiete OLAP versus OLTP Multimensionale i l Modellierung OLAP Operationen Relationale Implementierung Folien zu DWH: Ulf Leser
MehrLogische Modelle für OLAP. Burkhard Schäfer
Logische Modelle für OLAP Burkhard Schäfer Übersicht Einführung in OLAP Multidimensionale Daten: Hypercubes Operationen Formale Grundlagen Zusammenfassung Einführung in OLAP Verfahren zur Analyse großer
MehrDatenbanksysteme I Data Warehouses Felix Naumann
Datenbanksysteme I Data Warehouses 5.7.2010 Felix Naumann Überblick 2 Einsatzgebiete OLAP versus OLTP Multimensionale i l Modellierung OLAP Operationen Relationale Implementierung Neue Architekturen Folien
MehrRepetitorium. Data Warehousing und Data Mining 11/12. Sebastian Wandelt 13./16. Februar 2012
Repetitorium Data Warehousing und Data Mining 11/12 Sebastian Wandelt 13./16. Februar 2012 Inhalt Data Warehousing und Data Mining auf 40 Slides Weder in-, noch exklusiv! Subjektive Zusammenfassung pro
MehrAnfragesprachen für On-Line Analytical Processing (OLAP)
Anfragesprachen für On-Line Analytical Processing (OLAP) Seminar Business Intelligence Teil I: OLAP & Data Warehousing René Rondot rondot@informatik.uni-kl.de Universität Kaiserslautern Anfragesprachen
MehrAnfragen an multidimensionale Daten
Anfragen an multidimensionale Daten Alexander Heidrich - BID8 09.06.2005 Hintergrundbild: http://www.csc.calpoly.edu/~zwood/teaching/csc471/finalproj02/afternoon/mfouquet/cube.jpg Inhaltsübersicht Motivation
MehrGeoinformation Abbildung auf Tabellen
Folie 1 von 32 Geoinformation Abbildung auf Tabellen Folie 2 von 32 Abbildung auf Tabellen Übersicht Motivation des relationalen Datenmodells Von Objekten zu Tabellen Abbildung von Objekten Schlüssel Abbildung
MehrVorlesung Wissensentdeckung in Datenbanken
Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Uwe Ligges Informatik LS 8 22.04.2010 1 von 26 Gliederung 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der
MehrISU 1. Ue_08/02_Datenbanken/SQL. 08 Datenbanken. Übung. SQL Einführung. Eckbert Jankowski. www.iit.tu-cottbus.de
08 Datenbanken Übung SQL Einführung Eckbert Jankowski www.iit.tu-cottbus.de Datenmodell (Wiederholung, Zusammenfassung) Objekte und deren Eigenschaften definieren Beziehungen zwischen den Objekten erkennen/definieren
MehrInformationsintegration
Informationsintegration Data Warehouse (= Materialisierte Integration) Ulf Leser Sebastian Wandelt Inhalt dieser Vorlesung Data Warehouses OLAP versus OLTP Multidimensionale Modellierung ETL Prozess Vergleich:
MehrVorlesung Wissensentdeckung in Datenbanken
Gliederung Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Claus Weihs 14.07.2009 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der Cube-Operator 5 Implementierung
Mehr6.2 Datenmodellierung
Umsetzung des multidimensionalen Modells Interne Verwaltung der Daten durch - Relationale Strukturen (Tabellen) Relationales OLAP (ROLAP) Vorteile: Verfügbarkeit, Reife der Systeme - Multidimensionale
MehrVerwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein
1 Definitionen 1.1 Datenbank Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert Integriert, selbstbeschreibend, verwandt 1.2 Intension/Extension Intension: Menge der Attribute Extension:
MehrData Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Sommersemester 2004 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte
MehrEinführung in die Informatik II
Einführung in die Informatik II Relationale Datenbanken und SQL Theorie und Anwendung Prof. Dr. Nikolaus Wulff Gründe für eine Datenbank Meist werden Daten nicht in XML-Dokumenten, sondern innerhalb einer
MehrDas Multidimensionale Datenmodell
Das Multidimensionale Datenmodell Konzeptuelle Modellierung Umsetzung des Modells Beispiel ER-Modell 2 / 36 Probleme ER-Modellierung Keine Unterscheidung Klassifikation, Attribute, Kenngrößen Dimension
MehrFuzzy-Summierbarkeit. Benjamin Hohl. Imperfektion und erweiterte Konzepte im Data Warehousing Seminar im Sommersemester 2005
Fuzzy-Summierbarkeit Benjamin Hohl Imperfektion und erweiterte Konzepte im Data Warehousing 2 Überblick Was ist Summierbarkeit? Wann kann man sie nutzen? Wann nicht? Ansatz nach Pedersen, Jensen & Dyreson
MehrMultidimensionales Datenmodell, Cognos
Data Warehousing (II): Multidimensionales Datenmodell, Cognos Praktikum: Data Warehousing und Mining Praktikum Data Warehousing und Mining, Sommersemester 2010 Vereinfachte Sicht auf die Referenzarchitektur
MehrKapitel 6. Vorlesung: PD Dr. Peer Kröger
Kapitel 6 Einführung in Data Warehouses Vorlesung: PD Dr. Peer Kröger Dieses Skript basiert auf den Skripten zur Vorlesung Datenbanksysteme II an der LMU München Dieses Skript basiert auf den Skripten
MehrData Cubes PG Wissensmangement Seminarphase
PG 402 - Wissensmangement Seminarphase 23.10.2001-25.10.2001 Hanna Köpcke Lehrstuhl für Künstliche Intelligenz Universität Dortmund Übersicht 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit
MehrBusiness Intelligence & Reporting. Michael Cordes Holger Oehring Matthias Rein
Business Intelligence & Reporting Michael Cordes Holger Oehring Matthias Rein Ziele Einführung Business Intelligence / Front Room Online Analytical Processing (OLAP) Arten des Reporting & Nutzergruppen
MehrData Cube. 1. Einführung. 2. Aggregation in SQL, GROUP BY. 3. Probleme mit GROUP BY. 4. Der Cube-Operator. 5. Implementierung des Data Cube
Data Cube 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator 5. Implementierung des Data Cube 6. Zusammenfassung und Ausblick Dank an Hanna Köpcke! 1 On-line Analytical
MehrInhaltsverzeichnis. 1 Einleitung 1. 2 Aufbau von Data-Warehouse-Systemen 15. Lehner, Wolfgang Datenbanktechnologie für Data-Warehouse-Systeme 2003
1 Einleitung 1 1.1 Betriebswirtschaftlicher Ursprung des Data Warehousing 2 1.2 Statistischer Ursprung des Data Warehousing 5 1.3 Fòderativer Ursprung des Data Warehousing 7 1.4 Definition eines Data-Warehouse-Systems
MehrGrundlagen der Programmentwurfstechnik Fundamentals of Software Engineering 1
Fundamentals of Software Engineering 1 Inhaltsverzeichnis 1. Einführung 2. Allgemeine Modellbildung - Klassische Konzepte des Software Engineering- 2.1 Das Kontextmodell 2.2 Entscheidungstabellen 2.3 Zustandsmodelle
MehrObjektorientierter Software-Entwurf Ergebnisse der funktionalen Zerlegung 3 1. Die Zerlegungsmethoden sollen in zwei Dimensionen betrachtet werden:
Objektorientierter Software-Entwurf Ergebnisse der funktionalen Zerlegung 3 1 Vergleich der Zerlegungsmethoden Die Zerlegungsmethoden sollen in zwei Dimensionen betrachtet werden: Vergleich nach Ergebnissen
MehrMedizininformatik Software Engineering
Vorlesung Software Engineering Inhaltsverzeichnis 1. Einleitung 2. Software und Medizinprodukt 3. Vorgehensmodelle 4. Strukturierter Entwurf von Echtzeitsystemen 4.1 Echzeit, was ist das? 4.2 Einführung
MehrGrundlagen der Programmentwurfstechnik Fundamentals of Software Engineering 1
Vorlesung 3 Fundamentals of Software Engineering 1 Inhaltsverzeichnis 1. Einführung 2. Allgemeine Modellbildung - Klassische Konzepte des Software Engineering- 2.1 Das Kontextmodell 2.2 Entscheidungstabellen
MehrOnline Kurse Modulbeschreibungen
Online Kurse Modulbeschreibungen K0100 SQL Basics M0101 DB Theorie Dieses Modul führt in die Thematik von Datenbanken und deren grundlegenden Begriffen und Konzepten ein. Es werden Fragen beantwortet,
MehrBusiness Intelligence
Hochschule Darmstadt Business Intelligence Fachbereich Informatik Praktikumsaufgabe 3 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 11.06.2007 Business Intelligence Aufgabenstellung 1.
MehrSQL. Ziele. Grundlagen von SQL. Beziehung zur relationalen Algebra SELECT, FROM, WHERE. Joins ORDER BY. Aggregatfunktionen. dbis.
SQL Lehr- und Forschungseinheit Datenbanken und Informationssysteme Ziele Grundlagen von SQL Beziehung zur relationalen Algebra SELECT, FROM, WHERE Joins ORDER BY Aggregatfunktionen Lehr- und Forschungseinheit
MehrGeoinformation I Datenmodellierung
Seite 1 von 61 Geoinformation I Datenmodellierung Seite 2 von 61 Datenmodellierung Übersicht Datenverwaltung und Datenbanken objektorientierte Abbildung der Realität Grundlagen der Objektorientierung Darstellung
MehrSummarization-based Aggregation
Summarization-based Aggregation Daten Generalisierung: Prozess, der Anwendungsdaten schrittweise von niedrigen auf höhere konzeptuelle Level aggregiert Conceptual levels 2 3 4 5 example: all federal states
MehrKapitel 3: Datenbanksysteme
LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Skript zur Vorlesung: Einführung in die Informatik: Systeme und Anwendungen Sommersemester 2018 Kapitel 3: Datenbanksysteme Vorlesung:
MehrFortgeschrittene OLAP Analysemodelle
Fortgeschrittene OLAP Analysemodelle Jens Kübler Imperfektion und erweiterte Konzepte im Data Warehousing 2 Grundlagen - Datenanalyse Systemmodell Datenmodell Eingaben System Schätzer Datentypen Datenoperationen
Mehr3 Grundlagen der Datenmodellierung
22 3 Grundlagen der Datenmodellierung Das Verständnis für den in der vorliegenden Arbeit gewählten Lösungsansatz erfordert eine Einführung in die Methoden und Konzepte des Datenbankentwurfes. Grundlegend
MehrÜbungen zu Logik und Künstliche Intelligenz Blatt 8
Heilbronn, den 14.5.2010 Prof. Dr. V. Stahl WS 10/11 Übungen zu Logik und Künstliche Intelligenz Blatt 8 Aufgabe 1. Überlegen Sie, wie man folgende Relationen R grafisch darstellen könnte und entscheiden
MehrÜbungsblatt 1. f(n) = f(n) = O(g(n)) g(n) = O(f(n)) Zeigen oder widerlegen Sie: 3 n = Θ(2 n ) Aufgabe 1.2 Gegeben sei die folgende Funktion:
Übungsblatt 1 Aufgabe 1.1 Beweisen oder widerlegen Sie, dass für die im Folgenden definierte Funktion f(n) die Beziehung f(n) = Θ(n 4 ) gilt. Beachten Sie, dass zu einem vollständigen Beweis gegebenenfalls
MehrAgenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL
Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining 2 Eigenschaften eines Data Warehouse Referenzarchitektur Integrierte Sicht auf beliebige Daten aus verschieden Datenbanken
MehrCommon Warehouse Metamodel und Imperfektion
Common Warehouse Metamodel und Imperfektion Christoph Goebel Imperfektion und erweiterte Konzepte im Data Warehousing 2 Fragestellungen Welche Bedeutung haben Metadaten in der Information Supply Chain
MehrTeil II: Architektur eines Data-Warehouse-Systems... 57
O:/Wiley/Reihe_Dummies/9783527714476_Gerken/3d/ftoc.3d from 08.08.2018 14:02:02 Auf einen Blick Einleitung... 19 Teil I: Was ist ein Data Warehouse?... 25 Kapitel 1: Ein Beispiel zur Einführung..... 27
MehrKapitel DB:IV (Fortsetzung)
Kapitel DB:IV (Fortsetzung) IV. Logischer Datenbankentwurf mit dem relationalen Modell Das relationale Modell Integritätsbedingungen Umsetzung ER-Schema in relationales Schema DB:IV-46 Relational Design
MehrRealisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier
Realisierung von OLAP Operatoren in einem visuellen Analysetool Vortrag von Alexander Spachmann und Thomas Lindemeier Gliederung Ausgangssituation/Motivation Was ist OLAP? Anwendungen Was sind Operatoren?
MehrKonvergenz von Folgen
6 Konvergenz von Folgen Definition 6.1 Eine Folge in C (oder R) ist eine Abbildung f : N C (oder R). Schreibweise: (a n ) n N, (a n ), a 1, a 2... wobei a n = f(n). Beispiele: 1) (1 + 2 n ) n N, 3 2, 5
MehrDiskrete Strukturen Kapitel 2: Grundlagen (Relationen)
WS 2016/17 Diskrete Strukturen Kapitel 2: Grundlagen (Relationen) Hans-Joachim Bungartz Lehrstuhl für wissenschaftliches Rechnen Fakultät für Informatik Technische Universität München http://www5.in.tum.de/wiki/index.php/diskrete_strukturen_-_winter_16
MehrKapitel 3: Datenbanksysteme
LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Skript zur : Einführung in die Informatik: Systeme und Anwendungen Sommersemester 2009 Kapitel 3: Datenbanksysteme : PDDr. Peer
MehrDatenorientierter Ansatz. Datenbankentwurfsschritte. Welche Daten müssen im System verwaltet werden? Wie werden die Daten im System verändert?
.RQ]HSWLRQHOOHU'DWHQEDQNHQWZXUI Datenorientierter Ansatz Welche Daten müssen im System verwaltet werden? Wie werden die Daten im System verändert? Datenbankentwurfsschritte Datenverarbeitungsanforderungen
MehrPivotieren. Themenblock: Anfragen auf dem Cube. Roll-up und Drill-down. Slicing und Dicing. Praktikum: Data Warehousing und Data Mining. Produkt.
Zeit Pivotieren Themenblock: Anfragen auf dem Cube Praktikum: Data Warehousing und Data Mining Zeit Zeit 2 Roll-up und Drill-down Slicing und Dicing Drill-down Januar 2 3 33 1. Quartal 11 36 107 Februar
MehrDatenbanken Grundlagen und Design
Frank Geisler Datenbanken Grundlagen und Design 3., aktualisierte und erweiterte Auflage mitp Vorwort 15 Teil I Grundlagen 19 i Einführung in das Thema Datenbanken 21 i.i Warum ist Datenbankdesign wichtig?
MehrSQL Data Manipulation Language (DML) und Query Language (QL)
Innsbruck Information System University of Innsbruck School of Management Information Systems Universitätsstraße 15 6020 Innsbruck SQL Data Manipulation Language (DML) und Query Language (QL) Universität
MehrEinführung in Datenbanken
Einführung in Datenbanken Dipl.-Inf. Michael Wilhelm Hochschule Harz FB Automatisierung und Informatik mwilhelm@hs-harz.de Raum 2.202 Tel. 03943 / 659 338 1 Inhalt 1. Grundlegende Begriffe der Datenbanktechnologie
MehrUML. Weiteres Vorgehen im Projekt
UML Download objectif Personal Edition (kostenlos): http://www.microtool.de/objectif/de/download.asp Weiteres Vorgehen im Projekt Komponenten, Klassen, Objekte Prozesse Nichtfunktionale Anforderungen Skizzen,
MehrWeb Engineering-Seminar Methoden zur Web Modellierung: Object-oriented Hypermedia Method (OO-H)
Web Engineering-Seminar Methoden zur Web Modellierung: Object-oriented Hypermedia Method (OO-H) Dominik Kirsten Daniel Schäferbarthold Trier, 21.01.2008 1 Gliederung 1. Einführung 1.1 Anforderungen an
MehrWS 2013/14. Diskrete Strukturen
WS 2013/14 Diskrete Strukturen Prof. Dr. J. Esparza Lehrstuhl für Grundlagen der Softwarezuverlässigkeit und theoretische Informatik Fakultät für Informatik Technische Universität München http://www7.in.tum.de/um/courses/ds/ws13/14
MehrData Warehousing. DWH Projekte. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing DWH Projekte Ulf Leser Wissensmanagement in der Bioinformatik Inhalt DWH Projekte Spezifika Die kritischen Punkte Warum scheitern DWH Projekte? Ulf Leser: Data Warehousing, Vorlesung,
MehrKapitel 3: Datenbanksysteme
LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Skript zur Vorlesung: Einführung in die Informatik: Systeme und Anwendungen Sommersemester 2008 Kapitel 3: Datenbanksysteme Vorlesung:
MehrRelationales Datenmodell
Relationales Datenmodell Ein Datenmodell hat zwei Bestandteile: Eine mathematische Notation zur Darstellung von Daten und Beziehungen. Operationen auf den Daten, um Abfragen und andere Manipulationen zu
MehrEntity Relationship Modell (ERM) (Konzeptueller Datenbankentwurf)
Entity Relationship Modell (ERM) (Konzeptueller Datenbankentwurf) 10.02.14 Ahmad Nessar Nazar 1 Reale Welt Sie bekommen von einer Reifenhandels Firma den Zuschlag, eine Verwaltungsdatenbank zu entwerfen,
MehrNutzung der Oracle Database InMemory Option für SAP BW
Nutzung der Oracle Database InMemory Option für SAP BW Schlüsselworte Oracle, SAP-BW, InMemory, Star-Schema. Jörn Bartels Oracle München Einleitung In SAP BW wurde bisher ein erweitertes Snow Flake Schema
MehrThemenblock: Data Warehousing (I)
Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining Agenda Einführung Data Warehouses Online Transactional Processing (OLTP) Datenmanipulation mit SQL Anfragen mit SQL Online
MehrMultidimensionales Datenmodell
Multidimensionales Datenmodell Grundbegriffe fi Fakten, Dimensionen, Würfel Analyseoperationen fi Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung fi ME/R, ADAPT Relationale
MehrKapitel 3: Indices und Sichten
Kapitel 3: Indices und Sichten Data Warehousing und Mining - 1 Gliederung im folgenden: Klassifikation Aggregationsfunktionen, Materialisierte Sichten Grundsätzliche Alternativen beim Updaten materialisierter
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Sprachen für OLAP Operationen Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung OLAP Operationen MDX: Multidimensional Expressions SQL Erweiterungen
MehrJava Einführung Objektorientierte Grundkonzepte
Java Einführung Objektorientierte Grundkonzepte Inhalt Verständnis der grundlegenden Konzepte der Objektorientierung: Objekte Nachrichten Kapselung Klassen und Instanzen Vererbung Polymorphismus Darstellung
MehrData Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte
MehrChristian Kurze BI-Praktikum IBM WS 2008/09
Einführung in die multidimensionale Datenmodellierung e mit ADAPT BI-Praktikum IBM WS 2008/09 1 Gliederung Einführung multidimensionale Datenmodellierung 1. Multidimensionales Modell BI-Praktikum IBM WS
MehrEinleitung. ROLLUP, CUBE und GROUPING. Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002)
Betrifft Autör: GROUPING_ID Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Quelle Aus dem Oracle9i Data Warehousing Guide und den Kursen New Features Oracle9i
MehrAllgemeine Definition von statistischer Abhängigkeit (1)
Allgemeine Definition von statistischer Abhängigkeit (1) Bisher haben wir die statistische Abhängigkeit zwischen Ereignissen nicht besonders beachtet, auch wenn wir sie wie im Fall zweier disjunkter Mengen
MehrFACHHOCHSCHULE MANNHEIM
Objektorientierte Programmierung 8. Vorlesung Prof. Dr. Peter Knauber FACHHOCHSCHULE MANNHEIM Hochschule für Technik und Gestaltung e Die 1. lgruppe von KobrA: Realization le der Realization: Kurze Structural
MehrDaniel Warner SQL. Das Praxisbuch. Mit 119 Abbildungen. Franzis
Daniel Warner SQL Das Praxisbuch Mit 119 Abbildungen Franzis Inhaltsverzeichnis Teil I - Einleitung 15 1 Einleitung 17 1.1 Zum Aufbau des Buchs 17 1.2 Hinweise zur Buch-CD 18 1.3 Typografische Konventionen
MehrModellierungskonzepte semantischer Datenmodelle. Semantische Datenmodelle. Das Entity-Relationship Modell
DEVO. Semantische Datenmodelle DEVO.4 Modellierungskonzepte semantischer Datenmodelle Äquivalente Begriffe: Objekttypenebene = Objektklassenebene = Schema (Schema-level), Objektebene = Exemplarebene (Instance-level)
MehrKap. 6 Data Warehouse
1 Kap. 6 Data Warehouse 6.1 Was ist ein Data Warehouse, Motivation? 6.2 Data Cube und Cube-Operationen 6.3 Workshop: MS SQL Server, Cube Operationen 6.4 Physischer Entwurf, Implementierung von Cubes 6.5
Mehr6. Induktives Beweisen - Themenübersicht
6. Induktives Beweisen - Themenübersicht Ordnungsrelationen Partielle Ordnungen Quasiordnungen Totale Ordnungen Striktordnungen Ordnungen und Teilstrukturen Noethersche Induktion Anwendung: Terminierungsbeweise
MehrKlausur Konzeptionelle Modellierung
Klausur Konzeptionelle Modellierung Braindump Wintersemester 2012/2013 Inhaltsverzeichnis 1 Allgemeines 2 1.1 Begriffe............................... 2 1.2 Konzeptionelles Schema..................... 2
MehrQuantitative Methoden Wissensbasierter Systeme
Quantitative Methoden Wissensbasierter Systeme Probabilistische Netze und ihre Anwendungen Robert Remus Universität Leipzig Fakultät für Mathematik und Informatik Abteilung für Intelligente Systeme 23.
MehrAufgabe 1: [Logische Modellierung]
Aufgabe 1: [Logische Modellierung] a) Entwerfen Sie für das von Ihnen entworfene Modell aus Aufgabe 2 des 1. Übungsblattes ein Star-Schema. b) Entwerfen Sie für das vorangegangene Modell einen Teil eines
MehrData Warehouse Technologien
Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............
MehrArithmetik und Algebra
Willkommen Gliederung "Hallo Welt!" für Fortgeschrittene Friedrich-Alexander-Universität Erlangen-Nürnberg Institut für Informatik Lehrstuhl 2 7. Juni 2005 Willkommen Gliederung Gliederung 1 Repräsentation
Mehr3. Grundlagen relationaler Datenbanksysteme
3. Grundlagen relationaler Datenbanksysteme Hier nur kurze Rekapitulation, bei Bedarf nachlesen 3.1 Basiskonzepte des Relationenmodells 1 Darstellung der Miniwelt in Tabellenform (DB = Menge von Relationen
Mehr2. Vorlesung. Die Theorie der schwarz-weissen Ketten.
2. Vorlesung. Die Theorie der schwarz-weissen Ketten. Die Theorie der schwarzen Steinchen haben wir jetzt halbwegs vertanden. Statt mit schwarzen Steinen wie die Griechen, wollen wir jetzt mit schwarzen
MehrKapitel 5: Vom relationalen zum multidimensionalen Datenmodell
Kapitel 5: Vom relationalen zum multidimensionalen Datenmodell Data Warehousing und Mining 1 Data Warehousing, Gliederung Dimensionen und Measures Schematypen für Data Warehousing GroupBy und Data Cubes
MehrKapitel 5: Vom relationalen zum multidimensionalen Datenmodell
Data Warehousing, Gliederung Kapitel 5: Vom relationalen zum multidimensionalen Datenmodell Dimensionen und Measures Schematypen für Data Warehousing GroupBy und Data Cubes Operatoren für den Data Cube
MehrDimensionen, Measures
... Operationen und peicherung Multi-dimensionaler Daten Aggregate um RED WHITE BLUE Group By (with total) By Color um Cross Tab Chevy Ford By Color RED WHITE BLUE By Make um By Make & Year By Year FORD
MehrVeit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien
Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...
Mehr