Data Warehousing. Multidimensionale Modellierung. Modellierung im DWH. Wissensmanagement in der. Bioinformatik. Ulf Leser

Größe: px
Ab Seite anzeigen:

Download "Data Warehousing. Multidimensionale Modellierung. Modellierung im DWH. Wissensmanagement in der. Bioinformatik. Ulf Leser"

Transkript

1 Data Warehousing Modellierung im DWH Multidimensionale Modellierung Ulf Leser Wissensmanagement in der Bioinformatik

2 Zusammenfassung: Hubs and Spokes Mart 1 Mart 2 Mart 3 Mart 4 DWH Quelle 1 RDBMS Quelle 2 IMS Quelle 3 Textfile Jahresumsatz: Pro Monat Januar: Februar Ulf Leser: Data Warehousing, Vorlesung, SoSe

3 Quelle 1 RDBMS Quelle 2 IMS DWH Architektur Metadaten Staging Area Staging Area Mart 2 Cube Mart 1 Flüchtig Persistent Ulf Leser: Data Warehousing, Vorlesung, SoSe

4 DWH Komponenten 1. Datenquellen Technisch Heterogen Push oder Pull Snapshot oder LOG File 2. Staging Area Komplexere Transformationen Datenqualität Datenabgleich 3. Basisdatenbank Analyseorientiertes-DWH: Cube, Multidimensionale Modellierung Integrations-DWH: Enterprise Modell, Schemaintegration Ulf Leser: Data Warehousing, Vorlesung, SoSe

5 DWH Komponenten 4. Abgeleitete Sichten Datenauswahl und aggregation Materialisierte Sichten 5. Analysewerkzeuge Graphische Clients 6. Metadatenrepository Was, was, wann, wie 7. Data Warehouse Manager Scheduling & Monitoring Managementkonsole Ulf Leser: Data Warehousing, Vorlesung, SoSe

6 DWH Prozesse O t W e E xtraction T ransformation L oad Aggregation View Maintenance Ulf Leser: Data Warehousing, Vorlesung, SoSe

7 Inhalt dieser Vorlesung Multidimensionale Datenmodellierung (MDDM) Elemente, Begriffe, Konzepte Aggregierbarkeit und Anomalien OLAP Operationen Graphische multidimensionale Modellierung Ulf Leser: Data Warehousing, Vorlesung, SoSe

8 Modellierung der Basisdatenbank Anforderungen Aufnahme von Detail-Daten Speicherung historischer Daten (Zeit) Integrierte Sicht: Anreicherung der Quelldaten Kasse -> Filiale, Region, Land,... Produkt -> Lieferant, Marge, Produktgruppe,... Ausgerichtet auf betriebswirtschaftliche Analysen Summen, Durchschnitte, Maxima, etc. Kennzahlenableitung von Organisationseinheiten, Bereichen. Zeiträumen, etc. Multidimensionale Modellierung Ulf Leser: Data Warehousing, Vorlesung, SoSe

9 Teil 1: Das multidimensionale Datenmodell Das Multidimensionale Datenmodell Motivierung Elemente: Informell Elemente: Formal Aggregatsfunktionen und Aggregierbarkeit Ulf Leser: Data Warehousing, Vorlesung, SoSe

10 MDDM Grundidee Unterscheidung von Fakten (Measures) Gemessene Werte Dimensionen Beschreibung der Messwerte in Raum, Zeit, Organisation,... Dimensionshierarchien Dimensionen haben hierarchische Struktur Metapher: Würfel (Quader) bzw. Hypercube Fakten: Punkte im multidimensionalen Raum Ziel: Erfassung und Analyse von Kennzahlen Verkaufszahlen, Herstellungskosten,... Kennzahlen durch Operationen auf dem Cube Dimensionen erhöhen/verringern Sichten entlang der Dimensionsachsen verschieben Ulf Leser: Data Warehousing, Vorlesung, SoSe

11 Beispiel Verkäufe von Autos pro Marke, Kontinent und Jahr gemessen in Euro Measures: Verkäufe in Euro Dimensionen Automarke (Produkt) Kontinente Jahre Operationen Verfeinerung: Verkäufe pro Quartal Dimensionsreduktion: Summierte Verkäufe pro Marke und Jahr Auswahl: Verkäufe von Marke XYZ pro Jahr in USA Ulf Leser: Data Warehousing, Vorlesung, SoSe

12 Beispielcube Jahr Kontinent Asien Südamerika 1999 Automarke Ford VW Peugot BMW Ulf Leser: Data Warehousing, Vorlesung, SoSe

13 Auswahl - Slicing Verkäufe in Asien pro Jahr und Marke Verkäufe von Peugot pro Jahr und Kontinent Jahr Kontinent Asien Südamerika Automarke Ford VW Peugot BMW Ulf Leser: Data Warehousing, Vorlesung, SoSe

14 Dimensionen Orthogonale und eindeutige Strukturierung des Datenraums Dimension - Schema Tag, Woche, Jahr Landkreis, Land, Staat Produktgruppe, Produktklasse, Produktfamilie Dimension - Werte (1, 2, 3,..., 31), (1,... 52), (1900,..., 2003) (...), (Berlin, NRW, Department-1,...), (BRD, F,...) Ulf Leser: Data Warehousing, Vorlesung, SoSe

15 Dimension Dimension Top Jahr Quartal I II III IV I II III IV Klassifikationsstufen Monat Jan Feb Mar Okt Nov Dez Tag Klassifikationsknoten Ulf Leser: Data Warehousing, Vorlesung, SoSe

16 Produkthierarchien Aus: Geppert, ETZ Zürich, Vorlesung Data Warehouse Geordnete Klassifikationsstufen: Zeit,... Ungeordnete Klassifikationsstufen : Produkte,... Ulf Leser: Data Warehousing, Vorlesung, SoSe

17 Quartal Monat Klassifikationspfade Parallele Klassifikationen Jahr Konzern Sparte Region Woche Saison Bereich Unternehmen Tag Abteilung Ulf Leser: Data Warehousing, Vorlesung, SoSe

18 Klassifikationsschema Definition: Klassifikationsschema K Menge von Klassifikationsstufen {K 0, K 1,... K n } Halbordnung auf K Kleinstes Element K 0 : K i, 1 i n: K 0 K i Schreibweise: K = ({K 0, K 1,... K n }, ) Interpretation von Funktionale Abhängigkeit der Klassifikationsstufen Tag Monat Jahr Produkt Produktfamilie Produktgruppe Beachte: Halbordnung ist zyklusfrei Ulf Leser: Data Warehousing, Vorlesung, SoSe

19 Beispiel Ordnung Tag Monat Monat Quartal Quartal Jahr Tag Woche Woche Jahr Quartal Alle Top Keine Ordnung Quartal? Woche Monat? Woche Transitivität Tag Jahr Monat Top Jahr Tag Tatsächlich? Woche Ulf Leser: Data Warehousing, Vorlesung, SoSe

20 Pfad Sei K= ({K 0, K 1,... K n }, ) ein Klassif.schema Def.: Klassifikationspfad P = {P 0,P 1,... P n } in K P 0 = K 0 P i, 0 i n: K j K: P i = K j P i, 1 i n: K i-1 K i Bedeutung der Pfade Voll geordnete Teilemenge von K Beginnt auf feinster und endet auf gröbster Stufe Ziel: Definition von sinnvollen Verdichtungswegen Ulf Leser: Data Warehousing, Vorlesung, SoSe

21 Beispielpfade Klassifikationsschema Pfad 1 Pfad 2 Top Top Top Jahr Jahr Jahr Quartal Monat Quartal Woche Woche Monat Tag Tag Tag Ulf Leser: Data Warehousing, Vorlesung, SoSe

22 Klassifikationsknoten Sei K= ({K 0, K 1,... K n }, ) ein Klassif.schema Def. Die Ausprägungen einer Klassifikationsstufe K i heißen Klassifikationsknoten Die Funktion knoten(k i ) liefert alle Klassifikationsknoten zur Stufe K i Sei M die Menge aller Klassifikationsknoten zu Klassifikationsstufen in K Erläuterung Jeder Klassifikationsknoten gehört zu genau einer Klassifikationsstufe Klassifikationsstufe: Schema Klassifikationsknoten: Werte Ulf Leser: Data Warehousing, Vorlesung, SoSe

23 Klassifikationsknoten und Verdichtung Top Jahr Quartal Monat Tag Top I II III IV I II III IV Jan Feb Mar Okt Nov Dez Ulf Leser: Data Warehousing, Vorlesung, SoSe

24 Klassifikationslevel Geg. Klas.schema K; Pfad P= {P 0,P 1,... P n } in K Def. Klassifikationslevel Der Klassifikationslevel von P i in P ist i Folgerung? Jede Klassifikationsstufe in K hat einen eindeutigen Klassifikationslevel Ulf Leser: Data Warehousing, Vorlesung, SoSe

25 Nein Level 0 Top Level 0 Top Level 1 Jahr Level 1 Jahr Level 2 Level 3 Quartal Level 2 Woche Monat Level 4 Tag Level 3 Tag Ulf Leser: Data Warehousing, Vorlesung, SoSe

26 Name... Name Depot Manager Logistics Knotenattribute Continent Country Region Name... Name Def. Jede Klassifikationsstufe K i hat eine Menge von Attributen, die Knotenattribute Address Shop Supplier Facilities Ulf Leser: Data Warehousing, Vorlesung, SoSe

27 Klassifikationshierarchie Geg.: Klassifikationsschema K, Pfad P, knoten() Def. Die Klassifikationshierarchie zu (K,P,M,knoten) ist ein Baum (N,E) mit E = ( n, n ) 1 2 n 1 N, n 2 = U knoten ( K ) K i P N n j : n 1 1 n 2 knoten ( P i = M ) n knoten j 2 P j ( ) + 1 Beachte: Jede Klassifikationshierarchie ist balanciert Alle Pfade Wurzel-Blatt haben die selbe Länge Ulf Leser: Data Warehousing, Vorlesung, SoSe

28 Dimension und Granularität Def. Eine Dimension D=(K, {P 1,...P n }, M, k) besteht aus Einem Klassifikationsschema K Einer Menge von Pfaden P i aus K Einer Menge von Klassifikationsknoten M Einer Funktion k zur Knotenzuordnung Schreibweise: D.K = Klassifikationsstufe K aus Dim. D Def. Eine Granularität G über einer Menge {D 1,...D n } ist die Menge {D 1.K 1,...D n.k n } mit K i beliebige Klassifikationsstufe in D i Ulf Leser: Data Warehousing, Vorlesung, SoSe

29 Würfelschema Def. Ein Würfelschema WS=(G,M) besteht aus Einer Granularität G Einer Menge M von Fakten Es gibt keine funkt. Abhängigkeiten zwischen Klassifikationsstufen in G Def. Ein Würfel W zu einem Würfelschema WS W = dom ( G ) dom ( M ) Anders ausgedrückt ) W = dom ( D. K )... dom ( D n. K ) dom ( M 1 ) dom ( M 1 1 n m Ulf Leser: Data Warehousing, Vorlesung, SoSe

30 Kein Würfelschema Autoverkäufe pro Zeit (Monat, Jahr), Händler und Region (Land, Kontinent) Drei Dimensionen Monat -> Jahr Händler Land -> Kontinent Aber: EU Recht! Händler -> Land Kontinent Land Kontinent Modellierung Land ist anwendungsabhängig Händer Händer Ulf Leser: Data Warehousing, Vorlesung, SoSe

31 Semantik von Kanten in Klas.Hierarchien Die Hierarchie von Klassifikationsstufen wird durch funktionale Abhängigkeiten bestimmt Das beinhaltet zunächst keine Bestimmung der Semantik der Kanten Bereich Komm.Eletronik Land Brandenburg Top Güter Hauptabt. Mobilfunk Kreis Potsdam P.gruppe Kleidung Abteilung Dualband Stadt Golm Produkt Hose Part-Of Topologisch IS-A Ulf Leser: Data Warehousing, Vorlesung, SoSe

32 Beispiel 1 Ein längeres Beispiel Bestand und Delta pro Monat in Lagerhäusern pro Monat/Quartal/Woche/Jahr Region/Land Artikel/Artikelgruppe/Bereich Fakten: Bestand, Delta pro Monat Dimensionen: Zeit, Ort, Produkt Ulf Leser: Data Warehousing, Vorlesung, SoSe

33 Beispiel 2 Klassifikationsschema = {Monat, Quartal, Woche, Jahr, Region, Land, Artikel, Artikelgruppe, Bereich, TOP} Top Jahr Jahr Quartal Quartal Monat Jahr Woche Top Land Land Region Top Bereich Bereich Artikelgruppe Artikelgruppe Artikel Sammlung und Struktur aller gewünschten Klassifikationsstufen Ulf Leser: Data Warehousing, Vorlesung, SoSe

34 Beispiel 3 Pfade = {Monat, Quartal, Woche, Jahr, Region, Land, Artikel, Artikelgruppe, Bereich, TOP} P 1 : Top Jahr Quartal Monat P 2 : Top Jahr Woche P 3 : Top Land Region P 4 : Top Bereich Artikelgruppe Artikel Entlang der Pfade sind Verdichtungen im Modell sinnvoll Ulf Leser: Data Warehousing, Vorlesung, SoSe

35 Beispiel 4 Klassifikationsknoten TOP: Jahr: 1997, 1998, 1999 Quartal: I, II, III, IV (pro Jahr) Woche: 1-52 (pro Woche) Monat: 1-3 (pro Quartal I), 4-6 (pro Quartal II),... Land: BRD, F, GB Region: Bayern, Berlin, BadenWürtenberg, Dep1, Dep2,... Bereich: Kleidung, Nahrung, Elektro Artikelgruppe: Oberbekleidung, Unterbekleidung, Spirituosen, Kindernahrung, Kleingeräte, TV/Video,... Artikel:... Alle möglichen Ausprägungen der Klassifikationsstufen Ulf Leser: Data Warehousing, Vorlesung, SoSe

36 Beispiel 5 Klassifikationshierarchie P 1 Top I II III IV Klassifikationshierarchie P 2 Jan Feb Mar Okt Nov Dez Top Ulf Leser: Data Warehousing, Vorlesung, SoSe

37 Beispiel 6 Klassifikationshierarchie P 3 Top BRD F GB Bayern... Bremen... Wales... N-Irland Klassifikationshierarchie P 4 Top Nahrung Kleidung Elektro Milchwaren... Spiritousen... Kleingeräte... TV/Video Ulf Leser: Data Warehousing, Vorlesung, SoSe

38 Beispiel 7 Dimension ZEIT = {K, {P 1, P 2 }, {Top, 1997,... Dez}, k} ORT = {K, {P 3 }, {Top, BRD, F, GB, Berlin,...}, k} PRODUKT = {K, {P 4 }, {Nahrung, Kleidung, Kleingeräte,...}, k} Dimensionen fassen Hierarchien und Pfade in sinnvolle Strukturen zusammen Keine Würfel mit Dimension P 1 und P 2... Ulf Leser: Data Warehousing, Vorlesung, SoSe

39 Beispiel 8 Granularität G 1 = (Zeit.Woche, Ort.Land, Produkt.Artikel) G 2 = (Zeit.Jahr, Ort.Gebiet) Halbordnung: (Zeit.Woche, Ort.Gebiet, Produkt.Artikel) < (Zeit.Jahr, Ort.Gebiet, Produkt.Bereich) < (Zeit.Top, Ort.Top, Produkt.Top) Würfelschema und Würfel Granularität plus Fakten (M 1 =Bestand, M 2 =Delta) Würfel haben eine Granularität Operationen auf Würfeln verändern die Granularität Nur sinnvolle Operationen zulassen Ulf Leser: Data Warehousing, Vorlesung, SoSe

40 Fakten und Verdichtung Ziel des MDDM: Verdichtung von Daten entlang der Konsolidierungspfade Numerische versus kategorische Fakten Numerisch: Umsatz, Verkäufe, Messwerte,... Kategorisch: Geschlecht, Kundensegment,... Nicht alle Funktionen vertragen die Hierarchie Summe des Umsatz aller Tage Umsatz Monat Summe des Umsatz aller Monate Umsatz Jahr Durchschnitt des Umsatz aller Tage Durchschnitt des Umsatz im Monat Durchschnitt des Umsatz aller Monate Durchschnitt? des Umsatz im Jahr Summierbarkeit! OK Ulf Leser: Data Warehousing, Vorlesung, SoSe

41 Aggregatfunktionen Level 0 Level 1 Level 2 1 Summe: 2 1 Avg: 1 Summe: 12 Summe: 10 Avg: 11/2 12/3 10 Avg: 10 Hierarch. Berechnung: SUM, CNT, MAX,... Benötigt SUM und CNT: AVG Benötigt Basisdaten: MEDIAN, QUARTILE,... Ulf Leser: Data Warehousing, Vorlesung, SoSe

42 Charakterisierung von Agg.funktionen [GCB+97] Geg.: Set X, Partitionierung (X 1,X 2,..., X n ) Def. Aggregatfunktion f ist distributiv gdw g: f(x) = f( g(x 1 ), g(x 2 ),... g(x n )) Def. Aggregatfunktion f ist algebraisch gdw f(x) berechenbar aus fester Menge von g s Def. Aggregatfunktion f ist holistisch gdw f(x) kann nur aus den Grundelementen von X berechnet werden Bemerkung: d.h. dass die Menge von g s nicht begrenzt ist Ulf Leser: Data Warehousing, Vorlesung, SoSe

43 Beispiele Distributiv Summe, Count, Max, Min,... Algebraisch AVG (mit G 1 =SUM und G 2 =CNT) STDDEV, MaxN,... Holistisch MEDIAN, RANK, PERCENTILE Highest Frequency,... Highest Frequency Merke Werte und jeweilige Frequenz: ( (v 1,f 1 ), (v 2,f 2 ),...) Merge zweier Sets möglich Aber: Keine feste Grenze für Platzbedarf, da Anzahl unterschiedlicher Werte nicht fest Ulf Leser: Data Warehousing, Vorlesung, SoSe

44 Summierbarkeit / Aggregierbarkeit [LS97] Bisher: Wann darf man Werte summieren? Numerische Fakten Bei Verdichtungshierarchie Art der Aggregatfunktion beachten Aber Summe der Lagerbestände pro Produkt über Jahre? Gesamtsumme Studenten als Summe über Studenten pro Studiengang? Weitere notwendige Kriterien für Aggregierbarkeit entlang einer Klassifikationshierarchie Überlappungsfreiheit der Zuordnung von Klassifikationsknoten Vollständigkeit der Zerlegung pro Klassifikationslevel Typverträglich von Fakt und Aggregatfunktion Ulf Leser: Data Warehousing, Vorlesung, SoSe

45 Beispiel Studenten pro Jahr und Studiengang Gesamt Informatik BWL Gesamt Kann das stimmen? Wie lange dauern Studiengänge? Studenten nur in einem Studiengang eingeschrieben? Ulf Leser: Data Warehousing, Vorlesung, SoSe

46 Überlappungsfreiheit Def: Eine Klassifikationshierarchie ist überlappungsfrei (disjoint) gdw Jeder Klassifikationsknoten mit Level i ist höchstens einem Klassifikationsknoten in Level i+1 zugeordnet Jedes Fakt ist höchstens einem Klassifikationsknoten mit Level 0 zugeordnet P.familie Bekleidung P.gruppe Damen Herren Rock Anzug Produkt Jeans Ulf Leser: Data Warehousing, Vorlesung, SoSe

47 Vollständigkeit Def: Eine Klassifikationshierarchie ist vollständig (complete) gdw Jeder Klassifikationsknoten mit Level i ist mindestens einem Klassifikationsknoten in Level i+1 zugeordnet Jedes Fakt ist mindestens einem Klassifikationsknoten mit Level 0 zugeordnet P.familie Bekleidung P.gruppe Damen Herren Walkman Produkt Rock Anzug Jeans Ulf Leser: Data Warehousing, Vorlesung, SoSe

48 Was tun? Änderung der Modellierung Artifizielle Klassifikationsknoten: Others, Rest, Nicht zugewiesen Knotenaufspaltung: Herrenjeans, Damenjeans Gewichtete Zuordnung Türkei ist 10% Europa, 90% Asien Nicht-Testbar: Haben wir auch alle Fakten? Ulf Leser: Data Warehousing, Vorlesung, SoSe

49 Typen von Fakten Flow (Ereignis zu Zeitpunkt T) Verkäufe, Umsatz, Lieferungen, diplomierte Studenten,... Stock (Zustand zu Zeitpunkt T) Lagerbestand, eingeschriebene Studenten, Einwohnerzahlen,... Value-per-Unit (Eigenschaft zu Zeitpunkt T) Preis, Herstellungskurs, Währungskurs,... Ulf Leser: Data Warehousing, Vorlesung, SoSe

50 Typverträglichkeit MIN/MAX SUM AVG Stock Zeit: nein Sonst: Flow Value-per- Unit Nie Erkennen von Problemen Nicht automatisch möglich Metadaten Beschreibung der Fakten Ulf Leser: Data Warehousing, Vorlesung, SoSe

51 Studentenbeispiel Erklärung Gesamt Informatik BWL Gesamt Studiengangdauer: 2 Jahre Fakten sind Typ Stock Doppelt eingeschriebene Studenten Überlappungsfreiheit verletzt Studenten haben Studium abgebrochen Vollständigkeit verletzt Ulf Leser: Data Warehousing, Vorlesung, SoSe

52 Zusammenfassung MDDM Wesentliche Elemente Klassifikationsstufen, -knoten und hierarchien Würfel Fakten Ziel: Verdichtung entlang definierter Pfade Denn nur dort ist es sinnvoll Vorsicht vor Modellierungsfallen Summierung über kategorische Fakten Rekursive Durchschnittsbildung Typunverträgliche Summierung Löchrige Klassifikationshierarchien Ulf Leser: Data Warehousing, Vorlesung, SoSe

53 Teil 2: OLAP Operatoren Operationen auf multidimensionalen Daten Rotation (Pivoting) Aggregation / Verfeinerung (Roll-Up, Drill-Down) Selektion von Werten oder Wertebereichen (Slice, Dice) Zur Verdeutlichung nur 3-dimensionaler Fall Ulf Leser: Data Warehousing, Vorlesung, SoSe

54 Zweck von OLAP Operationen Ziel: Unterstützung des Analysten Flexible Datenanalyse kreativer Analyseprozess Unterschiedliche Sichtweisen OLAP Schnelle und intuitive Manipulation der Daten Notwendig Unterstützung durch graphischen Werkzeugen Umsetzung in physikalische Operationen Ulf Leser: Data Warehousing, Vorlesung, SoSe

55 Rotation Unterschiedliche Sichtweisen auf einen Datenbestand Jahr Marke Automarke Ulf Leser: Data Warehousing, Vorlesung, SoSe Jahr Asien Südamerika Kontinent BMW Ford 1999 Kontinent Australien S-Amerika Europa Asien Ford VW Peugot BMW

56 Aggregation / Konsolidierung Aggregation entlang eines Klassifikationspfades Jahr Jahr Kontinent Kontinent Asien Südamerika Asien 1999 Südamerika 1999 Automarke Rest BRD Automarke Ford Peugot VW BMW Rest BRD Ulf Leser: Data Warehousing, Vorlesung, SoSe

57 Verfeinerung Verfeinerung entlang eines Klassifikationspfades Jahr Jahr Kontinent Kontinent Asien Südamerika Asien 1999 Südamerika 1999 Automarke Rest BRD Automarke Ford Peugot VW BMW Rest BRD Ulf Leser: Data Warehousing, Vorlesung, SoSe

58 Selektion eines Wertes Verkäufe in Asien pro Jahr und Marke Verkäufe von Peugot pro Jahr und Kontinent Jahr Kontinent Asien Südamerika Automarke Ford VW Peugot BMW Ulf Leser: Data Warehousing, Vorlesung, SoSe

59 Auswahl von Unterwürfeln Verkäufe von Peugot,VW in 2000,2001 pro Kontinent Jahr Kontinent Asien Südamerika Automarke Ford VW Peugot BMW Ulf Leser: Data Warehousing, Vorlesung, SoSe

60 Formale Beschreibung Rotation Keine Auswirkung auf Cube; reine Darstellungsangelegenheit Aggregation Veränderung der Granularität durch Ersetzen einer Klassifikationsstufe D.K i durch D.K i+1 Aggregation von Fakten Selektion Veränderung der Granularität durch Festlegung eines Wertes / Wertebereiches in einer/mehreren Dimensionen Slicing: Optische Reduktion der Dimensionalität Keine Änderung der Fakten Häufige Kombination: Slicing + Aggregation Aggregation bis zum TOP-Element Echte Reduktion der Dimensionalität Ulf Leser: Data Warehousing, Vorlesung, SoSe

61 Slicing plus Roll-Up Summe Verkäufe pro Jahr und Marke Summe Verkäufe pro Jahr und Kontinent Jahr Kontinent Asien Südamerika Automarke Ford VW Peugot BMW Ulf Leser: Data Warehousing, Vorlesung, SoSe

62 Teil 3: Konzeptionelle MD Modellierung Konzeptionelle Modellierung multidimensionaler Daten Grundlagen ME/R Andere Ulf Leser: Data Warehousing, Vorlesung, SoSe

63 Datenbankentwurf Konzeptionelles Modell Abbild der Anwendungswirklichkeit im Kopf des Designers Semiformale, graphische Notation Logisches Modell Formalisierung des konzeptionellen Modells Algebras, Logik, Programmiersprachen Physisches (internes Modell) Implementierung der Elemente des formalen Modells Optimierung, Algorithmen, Speicherverfahren, Indexe, Hardwarekonfiguration, etc. Vorteil: Unabhängigkeit der Ebenen Unterschiedliche Verfahren und Notationen Unabhängige Evolution Definierte Schnittstellen: Produkt- und Herstellerunabhängigkeit Ulf Leser: Data Warehousing, Vorlesung, SoSe

64 Ablauf Konzeptionelles Modell Logisches Modell Implementierung Designer, Requirements Engineering Entwickler, Administrator Administrator Produktsupport E/R, UML: Klassen, Attribute, Assoziationen Relationen, Attribute, Keys, SQL (Halb)Automatisch Vollautomatisch Join-Order, Memory- Hierarchie, Indexe, Buffer / Blocks / Segments, Sort,... Ulf Leser: Data Warehousing, Vorlesung, SoSe

65 ME/R [SBHD98] E/R nicht ausreichend für MDDM Keine Unterscheidung Fakten Dimension Keine Repräsentation von Klassifikationsstufen und - hierarchien Keine Repräsentation der Eigenschaften von Fakten Numerisch / kategorisch, Stock/Flow/Value-per-Unit, Einheiten,... Keine Repräsentation der Eigenschaften von Klassifikationen Vollständigkeit, Überlappungen, Ordnung, etc. ME/R: Erweitertes E/R Modell Ulf Leser: Data Warehousing, Vorlesung, SoSe

66 Elemente und Notation Neue Elemente Entity Set: Dimension Level, Klassifikationsstufe Relationship Set: Fact, Würfel Relationship Set: Roll-Ups, Beziehung zwischen Klassifikationsstufen IC: Keine Zyklen in den ROLL-UP Beziehungen Klassifikationsstufe Fakt Roll-Up Ulf Leser: Data Warehousing, Vorlesung, SoSe

67 Beispiel Doppelte Verwendung von Geogr. Region? Zwei Dimensionen: Kunde und Werkstatt Wiederverwendung einer Klassifikationshierarchie Muss doppelt abgebildet werden (funkt. Abhängigkeit!) Ulf Leser: Data Warehousing, Vorlesung, SoSe

68 ME/R Metamodell (Extended E/R) Klassifikations stufe Würfel Beziehung zwischen Klassifikationsstufen Ulf Leser: Data Warehousing, Vorlesung, SoSe

69 ME/R Metamodell Dazu ist zu sagen Beziehungen werden auch geerbt (Roll-Up hat drei Connects sets) Polymorphie in Assoziationen Warum sind die Vererbungsbeziehungen eigentlich notwendig? Für die Attribute Warum ist das Metamodell in extended ER? Warum keine Repräsentation von Dimension? Würde formale keine Auswirkung haben, aber die Lesbarkeit/Verständlichkeit erhöhen Ulf Leser: Data Warehousing, Vorlesung, SoSe

70 Fazit Minimale, konservative Erweiterung Flexible Zuordnung Dimensionen Würfel Greift kurz Keine Eigenschaften von Fakten/Dimensionen Keine explizite Granularität (immer feinste) Keine Verankerung in umfassendem DWH- Metamodell Keine Übersetzungsmethode definiert aber nicht schwierig Toolunterstützung? Ulf Leser: Data Warehousing, Vorlesung, SoSe

71 Weitere Ansätze muml UML-Erweiterung basierend auf UML Metamodell (Constraints, Stereotypen) -> Werkzeugunterstützung vorhanden Klassifikationsstufe: <<Dimensional class>> Fakten: <<Fakt class>> Würfel: <<Dimension>> (Assoziationstyp) Hierarchie: <<Roll-Up>> (Assoziationstyp)... ADEPT Multi-dimensional Modelling Language (MML)... Keine der Methoden hat sich (bisher) durchgesetzt Ulf Leser: Data Warehousing, Vorlesung, SoSe

72 Literatur [Oeh00] Oehler: OLAP: Grundlagen, Modellierung und betriebswirtschaftliche Grundlagen, Hanser Verlag, 2000 [BG01]: Bauer, Günzel: Data Warehouse Systeme: Architektur, Entwicklung, Anwendung, dpunkt.verlag, 2001 [Vas98] Vassiliadis: Modeling Multidimensional Databases, Cubes, and Cube Operations, SSDBM, 1998 [SBHD98] Sapia at al. Extending the E/R Model for the Multidimensional Paradigm, Workshop DWDM, 1998 [SL97] Lenz, Shoshani: Summarizability in OLAP and Statistical Databases, SSDBM, 1997 Ulf Leser: Data Warehousing, Vorlesung, SoSe

Data Warehousing. Modellierung im DWH Das multidimensionale Datenmodell. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Modellierung im DWH Das multidimensionale Datenmodell. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Modellierung im DWH Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Zusammenfassung: Hubs and Spokes Mart 1 Mart 2 Mart 3 Mart 4 DWH Quelle 1 RDBMS Quelle

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Vom Spreadsheet zum Würfel Multidimensionales Datenmodell (MDDM)

Mehr

Data Warehousing. Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Klassifikationsschema Definition Ein Klassifikationsschema

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik DWH Grobarchitektur: Hubs and Spokes Abgeleitete Sichten Mart 1 Mart 2 Mart 3 Mart 4

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining OLAP Operationen Ein konzeptionelles MDDM Aggregierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Operationen im multidimensionalen Datenmodell

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Vom Spreadsheet zum Würfel Multidimensionales Datenmodell (MDDM)

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining OLAP Operationen Ein konzeptionelles MDDM Aggregierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Operationen im multidimensionalen Datenmodell

Mehr

Data Warehousing. Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Begriffe Klassifikationsschema Jahr Stufen einer Dimension

Mehr

Data Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2004 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

Repetitorium. Data Warehousing und Data Mining 11/12. Sebastian Wandelt 13./16. Februar 2012

Repetitorium. Data Warehousing und Data Mining 11/12. Sebastian Wandelt 13./16. Februar 2012 Repetitorium Data Warehousing und Data Mining 11/12 Sebastian Wandelt 13./16. Februar 2012 Inhalt Data Warehousing und Data Mining auf 40 Slides Weder in-, noch exklusiv! Subjektive Zusammenfassung pro

Mehr

Vorlesung Wissensentdeckung in Datenbanken

Vorlesung Wissensentdeckung in Datenbanken Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Uwe Ligges Informatik LS 8 22.04.2010 1 von 26 Gliederung 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der

Mehr

1 Business-Intelligence-Architektur 1

1 Business-Intelligence-Architektur 1 D3kjd3Di38lk323nnm xi 1 Business-Intelligence-Architektur 1 1.1 Data Warehouse....................................... 1 1.2 OLAP und mehrdimensionale Datenbanken.................. 4 1.3 Architekturvarianten....................................

Mehr

Anfragen an multidimensionale Daten

Anfragen an multidimensionale Daten Anfragen an multidimensionale Daten Alexander Heidrich - BID8 09.06.2005 Hintergrundbild: http://www.csc.calpoly.edu/~zwood/teaching/csc471/finalproj02/afternoon/mfouquet/cube.jpg Inhaltsübersicht Motivation

Mehr

Vorlesung Wissensentdeckung in Datenbanken

Vorlesung Wissensentdeckung in Datenbanken Gliederung Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Claus Weihs 14.07.2009 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der Cube-Operator 5 Implementierung

Mehr

Data Cubes PG Wissensmangement Seminarphase

Data Cubes PG Wissensmangement Seminarphase PG 402 - Wissensmangement Seminarphase 23.10.2001-25.10.2001 Hanna Köpcke Lehrstuhl für Künstliche Intelligenz Universität Dortmund Übersicht 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit

Mehr

Data Warehousing. Ausführung von OLAP Operationen. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Ausführung von OLAP Operationen. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Ausführung von OLAP Operationen Ulf Leser Wissensmanagement in der Bioinformatik Variante 1 - Snowflake Year id year Productgroup id pg_name Month Id Month year_id Day Id day month_id

Mehr

Data Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de

Data Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de Data Warehouses Sommersemester 2011 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen Data Warehouse Architektur Data-Warehouse-System Teilsichten

Mehr

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

Christian Kurze BI-Praktikum IBM WS 2008/09

Christian Kurze BI-Praktikum IBM WS 2008/09 Einführung in die multidimensionale Datenmodellierung e mit ADAPT BI-Praktikum IBM WS 2008/09 1 Gliederung Einführung multidimensionale Datenmodellierung 1. Multidimensionales Modell BI-Praktikum IBM WS

Mehr

Übung zur Einführung in die Wirtschaftsinformatik Cognos Powerplay als Beispiel für ein DSS

Übung zur Einführung in die Wirtschaftsinformatik Cognos Powerplay als Beispiel für ein DSS Übung zur Einführung in die Wirtschaftsinformatik 2006-05 - 10 Cognos Powerplay als Beispiel für ein DSS 1 Entscheidungsunterstützungssysteme (EUS) Decision Support Systems (DSS) EUS sollen das gemeinsame

Mehr

Das Multidimensionale Datenmodell

Das Multidimensionale Datenmodell Das Multidimensionale Datenmodell Konzeptuelle Modellierung Umsetzung des Modells Beispiel ER-Modell 2 / 36 Probleme ER-Modellierung Keine Unterscheidung Klassifikation, Attribute, Kenngrößen Dimension

Mehr

Logische Modelle für OLAP. Burkhard Schäfer

Logische Modelle für OLAP. Burkhard Schäfer Logische Modelle für OLAP Burkhard Schäfer Übersicht Einführung in OLAP Multidimensionale Daten: Hypercubes Operationen Formale Grundlagen Zusammenfassung Einführung in OLAP Verfahren zur Analyse großer

Mehr

Business Intelligence & Reporting. Michael Cordes Holger Oehring Matthias Rein

Business Intelligence & Reporting. Michael Cordes Holger Oehring Matthias Rein Business Intelligence & Reporting Michael Cordes Holger Oehring Matthias Rein Ziele Einführung Business Intelligence / Front Room Online Analytical Processing (OLAP) Arten des Reporting & Nutzergruppen

Mehr

Datenbanken Grundlagen und Design

Datenbanken Grundlagen und Design Frank Geisler Datenbanken Grundlagen und Design 3., aktualisierte und erweiterte Auflage mitp Vorwort 15 Teil I Grundlagen 19 i Einführung in das Thema Datenbanken 21 i.i Warum ist Datenbankdesign wichtig?

Mehr

Kapitel 7 Grundlagen von Data

Kapitel 7 Grundlagen von Data LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS DATABASE Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2014 Kapitel 7 Grundlagen von Data Warehouses Vorlesung: PD

Mehr

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung

Mehr

Common Warehouse Metamodel und Imperfektion

Common Warehouse Metamodel und Imperfektion Common Warehouse Metamodel und Imperfektion Christoph Goebel Imperfektion und erweiterte Konzepte im Data Warehousing 2 Fragestellungen Welche Bedeutung haben Metadaten in der Information Supply Chain

Mehr

Inhaltsverzeichnis. vii.

Inhaltsverzeichnis. vii. vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt 2 1.2 OLTP versus OLAP 4 1.2.1 OLAP-versus OLTP-Transaktionen 5 1.2.2 Vergleich von OLTP und OLAP 6 1.2.3 Abgrenzung: DBMS-Techniken

Mehr

Inhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte

Inhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte 4. Data Warehouses Inhalt 4.1 Motivation 4.2 Datenintegration 4.3 Konzeptuelle Modellierung 4.4 Anfragen an Data Warehouses 4.5 Implementierungsaspekte 2 Literatur V. Köppen, G. Saake und K.-U. Sattler:

Mehr

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining 2 Eigenschaften eines Data Warehouse Referenzarchitektur Integrierte Sicht auf beliebige Daten aus verschieden Datenbanken

Mehr

Data Warehouse Technologien

Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............

Mehr

Themenblock: Data Warehousing (I)

Themenblock: Data Warehousing (I) Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining Agenda Einführung Data Warehouses Online Transactional Processing (OLTP) Datenmanipulation mit SQL Anfragen mit SQL Online

Mehr

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier Realisierung von OLAP Operatoren in einem visuellen Analysetool Vortrag von Alexander Spachmann und Thomas Lindemeier Gliederung Ausgangssituation/Motivation Was ist OLAP? Anwendungen Was sind Operatoren?

Mehr

Datenbanktechnologie für Data-Warehouse-Systeme

Datenbanktechnologie für Data-Warehouse-Systeme Wolfgang Lehner Datenbanktechnologie für Data-Warehouse-Systeme Konzepte und Methoden dpunkt.verlag 1 1.1 1.2 1.3 1.4 1. 5 2 2.1 2.2 2.3 Einleitung 1 Betriebswirtschaftlicher Ursprung des Data Warehousing...

Mehr

Multidimensionales Datenmodell, Cognos

Multidimensionales Datenmodell, Cognos Data Warehousing (II): Multidimensionales Datenmodell, Cognos Praktikum: Data Warehousing und Mining Praktikum Data Warehousing und Mining, Sommersemester 2010 Vereinfachte Sicht auf die Referenzarchitektur

Mehr

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...

Mehr

OLAP und Data Warehouses

OLAP und Data Warehouses OLP und Data Warehouses Überblick Monitoring & dministration Externe Quellen Operative Datenbanken Extraktion Transformation Laden Metadaten- Repository Data Warehouse OLP-Server nalyse Query/Reporting

Mehr

Grundlagen der Programmentwurfstechnik Fundamentals of Software Engineering 1

Grundlagen der Programmentwurfstechnik Fundamentals of Software Engineering 1 Fundamentals of Software Engineering 1 Inhaltsverzeichnis 1. Einführung 2. Allgemeine Modellbildung - Klassische Konzepte des Software Engineering- 2.1 Das Kontextmodell 2.2 Entscheidungstabellen 2.3 Zustandsmodelle

Mehr

3 Grundlagen der Datenmodellierung

3 Grundlagen der Datenmodellierung 22 3 Grundlagen der Datenmodellierung Das Verständnis für den in der vorliegenden Arbeit gewählten Lösungsansatz erfordert eine Einführung in die Methoden und Konzepte des Datenbankentwurfes. Grundlegend

Mehr

Testen mit Use Cases. Chris Rupp Dr. Stefan Queins

Testen mit Use Cases. Chris Rupp Dr. Stefan Queins Testen mit Use Cases Chris Rupp Dr. Stefan Queins Das Problem Requirements- Engineering Was kann passieren? Was ist das gewünschte Verhalten? Was soll ich testen? Welche Eingaben benötigt mein Testpfad?

Mehr

Einführung in Datenbanken

Einführung in Datenbanken Einführung in Datenbanken Dipl.-Inf. Michael Wilhelm Hochschule Harz FB Automatisierung und Informatik mwilhelm@hs-harz.de Raum 2.202 Tel. 03943 / 659 338 1 Inhalt 1. Grundlegende Begriffe der Datenbanktechnologie

Mehr

Datenorientierter Ansatz. Datenbankentwurfsschritte. Welche Daten müssen im System verwaltet werden? Wie werden die Daten im System verändert?

Datenorientierter Ansatz. Datenbankentwurfsschritte. Welche Daten müssen im System verwaltet werden? Wie werden die Daten im System verändert? .RQ]HSWLRQHOOHU'DWHQEDQNHQWZXUI Datenorientierter Ansatz Welche Daten müssen im System verwaltet werden? Wie werden die Daten im System verändert? Datenbankentwurfsschritte Datenverarbeitungsanforderungen

Mehr

Geoinformation I Datenmodellierung

Geoinformation I Datenmodellierung Seite 1 von 61 Geoinformation I Datenmodellierung Seite 2 von 61 Datenmodellierung Übersicht Datenverwaltung und Datenbanken objektorientierte Abbildung der Realität Grundlagen der Objektorientierung Darstellung

Mehr

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem. Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen

Mehr

Themenblock: Erstellung eines Cube

Themenblock: Erstellung eines Cube Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen

Mehr

5 BINÄRE ENTSCHEIDUNGS- DIAGRAMME (BDDS)

5 BINÄRE ENTSCHEIDUNGS- DIAGRAMME (BDDS) 5 BINÄRE ENTSCHEIDUNGS- DIAGRAMME (BDDS) Sommersemester 2009 Dr. Carsten Sinz, Universität Karlsruhe Datenstruktur BDD 2 1986 von R. Bryant vorgeschlagen zur Darstellung von aussagenlogischen Formeln (genauer:

Mehr

Datenbanksysteme: Entwurf

Datenbanksysteme: Entwurf Wichtigste Themen hier: Datenbanksysteme: Entwurf DB Entwurf ist in der Regel eingebettet in ein größeres Projekt: siehe Informationssysteme Die Daten dienen einem Zweck und sind dennoch universell nutzbar:

Mehr

Inhaltsverzeichnis. 1 Einleitung Motivation und Umfeld Zielsetzung der Arbeit Methodisches Vorgehen und Aufbau der Arbeit 3

Inhaltsverzeichnis. 1 Einleitung Motivation und Umfeld Zielsetzung der Arbeit Methodisches Vorgehen und Aufbau der Arbeit 3 Inhaltsverzeichnis 1 Einleitung 1 1.1 Motivation und Umfeld 1 1.2 Zielsetzung der Arbeit 2 1.3 Methodisches Vorgehen und Aufbau der Arbeit 3 2 Grundlagen des Feuerwehrwesens 5 2.1 Kategorisierung der Feuerwehren

Mehr

Analytic Views: Einsatzgebiete im Data Warehouse

Analytic Views: Einsatzgebiete im Data Warehouse Analytic Views: Einsatzgebiete im Data Warehouse Dani Schnider Trivadis AG Zürich/Glattbrugg, Schweiz Einleitung Analytic Views sind eine der wesentlichen Erweiterungen in Oracle 12c Release 2. Durch zusätzliche

Mehr

Inhaltsverzeichnis.

Inhaltsverzeichnis. Wegweiser durch das Buch 1 1 Problembereich und Lösungsbereich 10 1.1.Unterschiede zwischen Problembereich und Lösungsbereich 10 1.2 Paradigmen der Softwareentwicklung 12 1.3 Methoden für die verschiedenen

Mehr

OLAP mit dem SQL-Server

OLAP mit dem SQL-Server Hartmut Messerschmidt Kai Schweinsberg OLAP mit dem SQL-Server Eine Einführung in Theorie und Praxis IIIBibliothek V dpunkt.verlag Teil OLAP undder Microsoft SQL-Server 1 1 Theoretische Grundlagen 3 1.1

Mehr

Datenbanken. Datenbanken. Grundlagen und Design. Grundlagen und Design. Frank. Geisler. 4. Auflage

Datenbanken. Datenbanken. Grundlagen und Design. Grundlagen und Design. Frank. Geisler. 4. Auflage Datenbanksysteme, Datenbankanwendungen und Middleware Das relationale Datenbankmodell ER-Datenbankmodellierung und Normalisierung SQL-Grundlagen Projektablauf bei der Erstellung einer Datenbank Transaktionen

Mehr

Vertrautmachen mit Daten

Vertrautmachen mit Daten Kapitel III Vertrautmachen mit Daten 2004 AIFB / FZI 1 III Vertrautmachen mit Daten (see also Data Preparation ) 2004 AIFB / FZI 2 III Vertrautmachen mit Daten III.1 OLAP III.1.1 Einführung in OLAP Wie

Mehr

Datenbanksysteme I Data Warehouses Felix Naumann

Datenbanksysteme I Data Warehouses Felix Naumann Datenbanksysteme I Data Warehouses 5.7.2010 Felix Naumann Überblick 2 Einsatzgebiete OLAP versus OLTP Multimensionale i l Modellierung OLAP Operationen Relationale Implementierung Neue Architekturen Folien

Mehr

Wie erziehe ich meinen Kunden

Wie erziehe ich meinen Kunden Wie erziehe ich meinen Kunden Dr. Andrea Kennel InfoPunkt Kennel GmbH CH-8600 Dübendorf Schlüsselworte: Data Warehousing, Dimensionen, Fakten, Zusammenarbeit, Kommunikation. Ausgangslage Die Informatikabteilung

Mehr

Inhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte

Inhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte 4. Data Warehouses Inhalt 4.1 Motivation 4.2 Datenintegration 4.3 Konzeptuelle Modellierung 4.4 Anfragen an Data Warehouses 4.5 Implementierungsaspekte 2 Literatur V. Köppen, G. Saake und K.-U. Sattler:

Mehr

Datenbankanwendungen werden oft über einen sehr langen Zeitraum (z.b. Jahrzehnte) eingesetzt

Datenbankanwendungen werden oft über einen sehr langen Zeitraum (z.b. Jahrzehnte) eingesetzt 2. Datenbankentwurf Motivation Datenbankanwendungen werden oft über einen sehr langen Zeitraum (z.b. Jahrzehnte) eingesetzt Fehler sind umso teurer zu beheben, je weiter die Entwicklung bzw. der Einsatz

Mehr

Medizininformatik Software Engineering

Medizininformatik Software Engineering Vorlesung Software Engineering Inhaltsverzeichnis 1. Einleitung 2. Software und Medizinprodukt 3. Vorgehensmodelle 4. Strukturierter Entwurf von Echtzeitsystemen 4.1 Echzeit, was ist das? 4.2 Einführung

Mehr

Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube

Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube Fragen des Marketingleiters Data Warehousing Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt nach? Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon Technisch

Mehr

Entwurf: Fortgeschrittene Konzepte

Entwurf: Fortgeschrittene Konzepte Bisher: Entwurf als grafisches Diagramm mit Entitätsmengen (auch weiche) Beziehungsmengen Attribute Assoziationstypen, Beziehungstypen und ausschließlich 2 stellige Beziehungen Extended / Enhanced (Erweitertes)

Mehr

Data Warehousing. DWH Projekte. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. DWH Projekte. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing DWH Projekte Ulf Leser Wissensmanagement in der Bioinformatik Inhalt DWH Projekte Spezifika Die kritischen Punkte Warum scheitern DWH Projekte? Ulf Leser: Data Warehousing, Vorlesung,

Mehr

Rückblick: Entity-Relationship-Modell

Rückblick: Entity-Relationship-Modell Rückblick: Entity-Relationship-Modell Entity-Relationship-Modell für konzeptuellen Entwurf Entitytypen (entity types) (z.b. Studenten) Beziehungstypen (relationships) (z.b. hören) Attribute beschreiben

Mehr

Friedrich-Schiller-Universität Jena Fakultät für Mathematik Informatik Lehrstuhl für Datenbanken und Informationssysteme Betreut von: David Wiese

Friedrich-Schiller-Universität Jena Fakultät für Mathematik Informatik Lehrstuhl für Datenbanken und Informationssysteme Betreut von: David Wiese Friedrich-Schiller-Universität Jena Fakultät für Mathematik Informatik Lehrstuhl für Datenbanken und Informationssysteme Betreut von: David Wiese Seminar Data Warehousing Sommersemester 2005 vorgelegt

Mehr

Datenbanken - Grundlagen und Design

Datenbanken - Grundlagen und Design mitp Professional Datenbanken - Grundlagen und Design von Frank Geisler überarbeitet Datenbanken - Grundlagen und Design Geisler schnell und portofrei erhältlich bei beck-shop.de DIE FACHBUCHHANDLUNG mitp/bhv

Mehr

d.h. zu Definitions-Stelle eindeutiger Funktionswert x X! y Y : (x,y) f umgekehrt: (x 1,y), (x 2,y) f ist o.k. X Y f(x) = y

d.h. zu Definitions-Stelle eindeutiger Funktionswert x X! y Y : (x,y) f umgekehrt: (x 1,y), (x 2,y) f ist o.k. X Y f(x) = y Kapitel 7 Normalformen und DB-Entwurf Kap. 7.1 Normalformen Theorie Funktionale Abhängigkeit: f X Y f als Relation, d.h. Menge von Paaren {(x,y)} x: Definitions-Stelle, y: Funktionswert f ist Funktion

Mehr

Data Warehouse und Data Mining

Data Warehouse und Data Mining Einführungsseminar Data Mining Seminarvortrag zum Thema: Data Warehouse und Data Mining Von gehalten am Betreuer: Dr. M. Grabert Einführung Problemstellung Seite 2 Einführung Unternehmen bekommen eine

Mehr

Inhaltsübersicht...IX Inhaltsverzeichnis...XI Abbildungsverzeichnis...XVII Tabellenverzeichnis... XXIII Abkürzungsverzeichnis...

Inhaltsübersicht...IX Inhaltsverzeichnis...XI Abbildungsverzeichnis...XVII Tabellenverzeichnis... XXIII Abkürzungsverzeichnis... Inhaltsübersicht...IX Inhaltsverzeichnis...XI Abbildungsverzeichnis...XVII Tabellenverzeichnis... XXIII Abkürzungsverzeichnis... XXV 1 Einführung... 1 1.1 Problemstellung... 1 1.2 Zielsetzung... 3 1.3

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Architektur und Komponenten von Data Warehouses Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Architektur Komponenten ETL Ulf Leser: Data Warehousing

Mehr

Diskrete Strukturen Kapitel 2: Grundlagen (Relationen)

Diskrete Strukturen Kapitel 2: Grundlagen (Relationen) WS 2016/17 Diskrete Strukturen Kapitel 2: Grundlagen (Relationen) Hans-Joachim Bungartz Lehrstuhl für wissenschaftliches Rechnen Fakultät für Informatik Technische Universität München http://www5.in.tum.de/wiki/index.php/diskrete_strukturen_-_winter_16

Mehr

Kapitel DB:IV (Fortsetzung)

Kapitel DB:IV (Fortsetzung) Kapitel DB:IV (Fortsetzung) IV. Logischer Datenbankentwurf mit dem relationalen Modell Das relationale Modell Integritätsbedingungen Umsetzung ER-Schema in relationales Schema DB:IV-46 Relational Design

Mehr

ISU 1. Ue_08/02_Datenbanken/SQL. 08 Datenbanken. Übung. SQL Einführung. Eckbert Jankowski. www.iit.tu-cottbus.de

ISU 1. Ue_08/02_Datenbanken/SQL. 08 Datenbanken. Übung. SQL Einführung. Eckbert Jankowski. www.iit.tu-cottbus.de 08 Datenbanken Übung SQL Einführung Eckbert Jankowski www.iit.tu-cottbus.de Datenmodell (Wiederholung, Zusammenfassung) Objekte und deren Eigenschaften definieren Beziehungen zwischen den Objekten erkennen/definieren

Mehr

Vorlesung Datenbankmanagementsysteme

Vorlesung Datenbankmanagementsysteme Vorlesung Datenbankmanagementsysteme SQL zur Datenanalyse & Einführung Online Analytical Processing (OLAP) (auf Basis von Oracle) Vorlesung Datenbankmanagementsysteme SQL zur Datenanalyse M. Lange, S.

Mehr

Data Warehouse Grundlagen

Data Warehouse Grundlagen Seminarunterlage Version: 2.10 Version 2.10 vom 24. Juli 2015 Dieses Dokument wird durch die veröffentlicht.. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen sind Warenzeichen

Mehr

Klausur Konzeptionelle Modellierung

Klausur Konzeptionelle Modellierung Klausur Konzeptionelle Modellierung Braindump Wintersemester 2012/2013 Inhaltsverzeichnis 1 Allgemeines 2 1.1 Begriffe............................... 2 1.2 Konzeptionelles Schema..................... 2

Mehr

Das relationale Modell (Teil 1)

Das relationale Modell (Teil 1) Vorlesung #2 Das relationale Modell (Teil 1) Fahrplan WS 2010/11 Feedback Vorlesung#1 Das relationale Modell Einordnung (wir überspringen die Modellierung, das kommt im 4. Semester Datenmanagement ) Definition,

Mehr

Multidimensionales Datenmodell

Multidimensionales Datenmodell Multidimensionales Datenmodell Grundbegriffe fi Fakten, Dimensionen, Würfel Analyseoperationen fi Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung fi ME/R, ADAPT Relationale

Mehr

DWH Best Practices das QUNIS Framework 80 Jahre Erfahrung bei der Modellierung & dem Betrieb von DWH. Referent: Ilona Tag

DWH Best Practices das QUNIS Framework 80 Jahre Erfahrung bei der Modellierung & dem Betrieb von DWH. Referent: Ilona Tag DWH Best Practices das QUNIS Framework 80 Jahre Erfahrung bei der Modellierung & dem Betrieb von DWH Referent: Ilona Tag Agenda 10.00 10.30 Begrüßung & aktuelle Entwicklungen bei QUNIS 10.30 11.00 11.00

Mehr

Diskrete Strukturen Kapitel 4: Graphentheorie (Bäume)

Diskrete Strukturen Kapitel 4: Graphentheorie (Bäume) WS 2016/17 Diskrete Strukturen Kapitel 4: Graphentheorie (Bäume) Hans-Joachim Bungartz Lehrstuhl für wissenschaftliches Rechnen Fakultät für Informatik Technische Universität München http://www5.in.tum.de/wiki/index.php/diskrete_strukturen_-_winter_16

Mehr

Inhalt. 1 Einleitung Warum dieses Buch? Der rote Faden Danksagung URL zum Buch 4. TEIL I Einführung 5

Inhalt. 1 Einleitung Warum dieses Buch? Der rote Faden Danksagung URL zum Buch 4. TEIL I Einführung 5 Inhalt 1 Einleitung 1 1.1 Warum dieses Buch? 1 1.2 Der rote Faden 2 1.3 Danksagung 3 1.4 URL zum Buch 4 TEIL I Einführung 5 2 XML-Grundlagen 7 2.1 Einleitung 7 2.2 WasistXML? 7 2.3 Dokumenttypen und Namensräume

Mehr

Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH

Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH Dani Schnider Principal Consultant Business Intelligence BI Trilogie, Zürich/Basel 25./26. November 2009 Basel Baden Bern Lausanne Zürich

Mehr

Inhaltsverzeichnis. Teil I OLAP und der Microsoft SQL-Server 1. 1 Theoretische Grundlagen 3

Inhaltsverzeichnis. Teil I OLAP und der Microsoft SQL-Server 1. 1 Theoretische Grundlagen 3 vii Teil I OLAP und der Microsoft SQL-Server 1 1 Theoretische Grundlagen 3 1.1 Was ist OLAP?......................................... 3 1.1.1 Business Intelligence............................... 4 1.1.2

Mehr

Multikonferenz Wirtschaftsinformatik 2004

Multikonferenz Wirtschaftsinformatik 2004 Multikonferenz Wirtschaftsinformatik 2004 Grafische Repräsentation mehrdimensionaler Datenmodelle des SAP Business Information Warehouse Dr. Michael Hahne, cundus AG Essen, 9. März 2004 cundus AG 2004

Mehr

Einführung in die Datenorganisation. Informationssysteme

Einführung in die Datenorganisation. Informationssysteme Einführung in die Datenorganisation Informationssysteme Informationen Sind Kenntnisse über Sachverhalte Daten sind abgelegte Informationen Nachrichten sind Informationen zur Weitergabe Drei Betrachtungsebenen

Mehr

Mehrwegbäume Motivation

Mehrwegbäume Motivation Mehrwegbäume Motivation Wir haben gute Strukturen (AVL-Bäume) kennen gelernt, die die Anzahl der Operationen begrenzen Was ist, wenn der Baum zu groß für den Hauptspeicher ist? Externe Datenspeicherung

Mehr

Die richtige Grafik als Zauberstab zur Mart Modellierung Referat vom

Die richtige Grafik als Zauberstab zur Mart Modellierung Referat vom Die richtige Grafik als Zauberstab zur Mart Modellierung Referat vom 22.11.2016 Peter Brunner,NTTData Dr. Andrea Kennel, InfoPunkt Kennel GmbH Copyright 2014 NTT DATA EMEA Ltd. Die richtige Grafik als

Mehr

Daniel Warner SQL. Das Praxisbuch. Mit 119 Abbildungen. Franzis

Daniel Warner SQL. Das Praxisbuch. Mit 119 Abbildungen. Franzis Daniel Warner SQL Das Praxisbuch Mit 119 Abbildungen Franzis Inhaltsverzeichnis Teil I - Einleitung 15 1 Einleitung 17 1.1 Zum Aufbau des Buchs 17 1.2 Hinweise zur Buch-CD 18 1.3 Typografische Konventionen

Mehr

Ausgabe: Eine DBMS unabhängige high-level Repräsentation der Anforderungen, das "konzeptuelle Schema".

Ausgabe: Eine DBMS unabhängige high-level Repräsentation der Anforderungen, das konzeptuelle Schema. Phasen des Datenbanken-Designs Konzeptuelles Design Eingabe: Anforderungen Ausgabe: Eine DBMS unabhängige high-level Repräsentation der Anforderungen, das "konzeptuelle Schema". Qualität: Richtigkeit und

Mehr

Erfolg mit Oracle BI?

Erfolg mit Oracle BI? Erfolg mit Oracle BI? Typische Fehlerszenarien und deren Lösung Gerd Aiglstorfer G.A. itbs GmbH Das Thema 2 Oracle BI (OBIEE)? Das war eine Fehlentscheidung! Viel zu umständlich! Wenig Flexibilität & teure

Mehr

Wirtschaftsinformatik 2 (PWIN) Übung 4. Wirtschaftsinformatik 2 (PWIN) SS2010, Professur für Mobile Business & Multilateral Security 1

Wirtschaftsinformatik 2 (PWIN) Übung 4. Wirtschaftsinformatik 2 (PWIN) SS2010, Professur für Mobile Business & Multilateral Security 1 Wirtschaftsinformatik 2 (PWIN) Übung 4 Entwicklung von IS Wirtschaftsinformatik 2 (PWIN) SS2010, Professur für Mobile Business & Multilateral Security 1 Überblick Entwicklung von Informationssystemen 25.5.

Mehr

good. better. outperform.

good. better. outperform. good. better. outperform. Quo Vadis Oracle BI Relational oder besser multidimensional? DOAG 2013 Business Intelligence, 17.04.2013 Dirk Fleischmann Director Business Intelligence & DWH Business Intelligence

Mehr

Wie modelliere ich mein Core Data Warehouse?

Wie modelliere ich mein Core Data Warehouse? Wie modelliere ich mein Core Data Warehouse? Dani Schnider Trivadis AG Zürich/Glattbrugg, Schweiz Schlüsselworte: Data Warehouse, Datenmodellierung, Historisierung Einleitung Das Core dient im Data Warehouse

Mehr

Praxishandbuch SAP BW 3-1

Praxishandbuch SAP BW 3-1 Norbert Egger Praxishandbuch SAP BW 3-1 Technische Universität DarmsUdt FACHBEREICH INFORMATIK BIBLIOTHEK Inventar-Nr.: Ä/A< Sachgebiete: Standort- Co Galileo Press Inhalt Vorwort 13 Zu diesem Buch 17

Mehr

WS 2013/14. Diskrete Strukturen

WS 2013/14. Diskrete Strukturen WS 2013/14 Diskrete Strukturen Prof. Dr. J. Esparza Lehrstuhl für Grundlagen der Softwarezuverlässigkeit und theoretische Informatik Fakultät für Informatik Technische Universität München http://www7.in.tum.de/um/courses/ds/ws1314

Mehr

Oracle SQL Developer Data Modeling

Oracle SQL Developer Data Modeling Oracle SQL Developer Data Modeling DOAG Regio Rhein-Neckar Oracle Deutschland GmbH The following is intended to outline our general product direction. It is intended for information

Mehr

A Big Data Change Detection System. Carsten Lanquillon und Sigurd Schacht

A Big Data Change Detection System. Carsten Lanquillon und Sigurd Schacht A Big Data Change Detection System Carsten Lanquillon und Sigurd Schacht Digitale Transformation in Unternehmen u Umfassende Erfassung, Speicherung und Verfügbarkeit von Daten à Big Data Quelle: Rolland

Mehr

Hetero-Homogene Data Warehouses

Hetero-Homogene Data Warehouses Hetero-Homogene Data Warehouses TDWI München 2011 Christoph Schütz http://hh-dw.dke.uni-linz.ac.at/ Institut für Wirtschaftsinformatik Data & Knowledge Engineering Juni 2011 1 Data-Warehouse-Modellierung

Mehr

Semi-Skylines und Skyline Snippets

Semi-Skylines und Skyline Snippets Skyline von Manhattan, NY, USA Semi-Skylines und Skyline Snippets Markus Endres Universität Augsburg 10. Februar 2011 Skyline Queries Finde preiswerte Hotels in Strandnähe! Distance to the beach [km] 2.0

Mehr

Einleitung 19. Teil I Einführung in Datenbanksysteme 25. Kapitel 1 Wozu Datenbanksysteme da sind 27

Einleitung 19. Teil I Einführung in Datenbanksysteme 25. Kapitel 1 Wozu Datenbanksysteme da sind 27 Inhaltsverzeichnis Einleitung 19 Über dieses Buch 19 Konventionen in diesem Buch 20 Was Sie nicht lesen müssen 21 Törichte Annahmen über den Leser 21 Wie dieses Buch aufgebaut ist 22 Teil I: Einführung

Mehr

DWH Automatisierung mit Data Vault 2.0

DWH Automatisierung mit Data Vault 2.0 DWH Automatisierung mit Data Vault 2.0 Andre Dörr Trevisto AG Nürnberg Schlüsselworte Architektur, DWH, Data Vault Einleitung Wenn man die Entwicklung von ETL / ELT Prozessen für eine klassische DWH Architektur

Mehr

DM03: Datenmodellierung im Data Warehouse (Eintägiges Seminar)

DM03: Datenmodellierung im Data Warehouse (Eintägiges Seminar) DM03: Datenmodellierung im Data Warehouse (Eintägiges Seminar) Ein Seminar der DWH academy Seminar DM03 - Datenmodellierung im Data Warehouse (1 Tag) Normalisierung, Star- und Snowflake sind bekannte Schlagwörter

Mehr