Data Warehousing. Multidimensionale Modellierung. Modellierung im DWH. Wissensmanagement in der. Bioinformatik. Ulf Leser
|
|
- Helmuth Kranz
- vor 6 Jahren
- Abrufe
Transkript
1 Data Warehousing Modellierung im DWH Multidimensionale Modellierung Ulf Leser Wissensmanagement in der Bioinformatik
2 Zusammenfassung: Hubs and Spokes Mart 1 Mart 2 Mart 3 Mart 4 DWH Quelle 1 RDBMS Quelle 2 IMS Quelle 3 Textfile Jahresumsatz: Pro Monat Januar: Februar Ulf Leser: Data Warehousing, Vorlesung, SoSe
3 Quelle 1 RDBMS Quelle 2 IMS DWH Architektur Metadaten Staging Area Staging Area Mart 2 Cube Mart 1 Flüchtig Persistent Ulf Leser: Data Warehousing, Vorlesung, SoSe
4 DWH Komponenten 1. Datenquellen Technisch Heterogen Push oder Pull Snapshot oder LOG File 2. Staging Area Komplexere Transformationen Datenqualität Datenabgleich 3. Basisdatenbank Analyseorientiertes-DWH: Cube, Multidimensionale Modellierung Integrations-DWH: Enterprise Modell, Schemaintegration Ulf Leser: Data Warehousing, Vorlesung, SoSe
5 DWH Komponenten 4. Abgeleitete Sichten Datenauswahl und aggregation Materialisierte Sichten 5. Analysewerkzeuge Graphische Clients 6. Metadatenrepository Was, was, wann, wie 7. Data Warehouse Manager Scheduling & Monitoring Managementkonsole Ulf Leser: Data Warehousing, Vorlesung, SoSe
6 DWH Prozesse O t W e E xtraction T ransformation L oad Aggregation View Maintenance Ulf Leser: Data Warehousing, Vorlesung, SoSe
7 Inhalt dieser Vorlesung Multidimensionale Datenmodellierung (MDDM) Elemente, Begriffe, Konzepte Aggregierbarkeit und Anomalien OLAP Operationen Graphische multidimensionale Modellierung Ulf Leser: Data Warehousing, Vorlesung, SoSe
8 Modellierung der Basisdatenbank Anforderungen Aufnahme von Detail-Daten Speicherung historischer Daten (Zeit) Integrierte Sicht: Anreicherung der Quelldaten Kasse -> Filiale, Region, Land,... Produkt -> Lieferant, Marge, Produktgruppe,... Ausgerichtet auf betriebswirtschaftliche Analysen Summen, Durchschnitte, Maxima, etc. Kennzahlenableitung von Organisationseinheiten, Bereichen. Zeiträumen, etc. Multidimensionale Modellierung Ulf Leser: Data Warehousing, Vorlesung, SoSe
9 Teil 1: Das multidimensionale Datenmodell Das Multidimensionale Datenmodell Motivierung Elemente: Informell Elemente: Formal Aggregatsfunktionen und Aggregierbarkeit Ulf Leser: Data Warehousing, Vorlesung, SoSe
10 MDDM Grundidee Unterscheidung von Fakten (Measures) Gemessene Werte Dimensionen Beschreibung der Messwerte in Raum, Zeit, Organisation,... Dimensionshierarchien Dimensionen haben hierarchische Struktur Metapher: Würfel (Quader) bzw. Hypercube Fakten: Punkte im multidimensionalen Raum Ziel: Erfassung und Analyse von Kennzahlen Verkaufszahlen, Herstellungskosten,... Kennzahlen durch Operationen auf dem Cube Dimensionen erhöhen/verringern Sichten entlang der Dimensionsachsen verschieben Ulf Leser: Data Warehousing, Vorlesung, SoSe
11 Beispiel Verkäufe von Autos pro Marke, Kontinent und Jahr gemessen in Euro Measures: Verkäufe in Euro Dimensionen Automarke (Produkt) Kontinente Jahre Operationen Verfeinerung: Verkäufe pro Quartal Dimensionsreduktion: Summierte Verkäufe pro Marke und Jahr Auswahl: Verkäufe von Marke XYZ pro Jahr in USA Ulf Leser: Data Warehousing, Vorlesung, SoSe
12 Beispielcube Jahr Kontinent Asien Südamerika 1999 Automarke Ford VW Peugot BMW Ulf Leser: Data Warehousing, Vorlesung, SoSe
13 Auswahl - Slicing Verkäufe in Asien pro Jahr und Marke Verkäufe von Peugot pro Jahr und Kontinent Jahr Kontinent Asien Südamerika Automarke Ford VW Peugot BMW Ulf Leser: Data Warehousing, Vorlesung, SoSe
14 Dimensionen Orthogonale und eindeutige Strukturierung des Datenraums Dimension - Schema Tag, Woche, Jahr Landkreis, Land, Staat Produktgruppe, Produktklasse, Produktfamilie Dimension - Werte (1, 2, 3,..., 31), (1,... 52), (1900,..., 2003) (...), (Berlin, NRW, Department-1,...), (BRD, F,...) Ulf Leser: Data Warehousing, Vorlesung, SoSe
15 Dimension Dimension Top Jahr Quartal I II III IV I II III IV Klassifikationsstufen Monat Jan Feb Mar Okt Nov Dez Tag Klassifikationsknoten Ulf Leser: Data Warehousing, Vorlesung, SoSe
16 Produkthierarchien Aus: Geppert, ETZ Zürich, Vorlesung Data Warehouse Geordnete Klassifikationsstufen: Zeit,... Ungeordnete Klassifikationsstufen : Produkte,... Ulf Leser: Data Warehousing, Vorlesung, SoSe
17 Quartal Monat Klassifikationspfade Parallele Klassifikationen Jahr Konzern Sparte Region Woche Saison Bereich Unternehmen Tag Abteilung Ulf Leser: Data Warehousing, Vorlesung, SoSe
18 Klassifikationsschema Definition: Klassifikationsschema K Menge von Klassifikationsstufen {K 0, K 1,... K n } Halbordnung auf K Kleinstes Element K 0 : K i, 1 i n: K 0 K i Schreibweise: K = ({K 0, K 1,... K n }, ) Interpretation von Funktionale Abhängigkeit der Klassifikationsstufen Tag Monat Jahr Produkt Produktfamilie Produktgruppe Beachte: Halbordnung ist zyklusfrei Ulf Leser: Data Warehousing, Vorlesung, SoSe
19 Beispiel Ordnung Tag Monat Monat Quartal Quartal Jahr Tag Woche Woche Jahr Quartal Alle Top Keine Ordnung Quartal? Woche Monat? Woche Transitivität Tag Jahr Monat Top Jahr Tag Tatsächlich? Woche Ulf Leser: Data Warehousing, Vorlesung, SoSe
20 Pfad Sei K= ({K 0, K 1,... K n }, ) ein Klassif.schema Def.: Klassifikationspfad P = {P 0,P 1,... P n } in K P 0 = K 0 P i, 0 i n: K j K: P i = K j P i, 1 i n: K i-1 K i Bedeutung der Pfade Voll geordnete Teilemenge von K Beginnt auf feinster und endet auf gröbster Stufe Ziel: Definition von sinnvollen Verdichtungswegen Ulf Leser: Data Warehousing, Vorlesung, SoSe
21 Beispielpfade Klassifikationsschema Pfad 1 Pfad 2 Top Top Top Jahr Jahr Jahr Quartal Monat Quartal Woche Woche Monat Tag Tag Tag Ulf Leser: Data Warehousing, Vorlesung, SoSe
22 Klassifikationsknoten Sei K= ({K 0, K 1,... K n }, ) ein Klassif.schema Def. Die Ausprägungen einer Klassifikationsstufe K i heißen Klassifikationsknoten Die Funktion knoten(k i ) liefert alle Klassifikationsknoten zur Stufe K i Sei M die Menge aller Klassifikationsknoten zu Klassifikationsstufen in K Erläuterung Jeder Klassifikationsknoten gehört zu genau einer Klassifikationsstufe Klassifikationsstufe: Schema Klassifikationsknoten: Werte Ulf Leser: Data Warehousing, Vorlesung, SoSe
23 Klassifikationsknoten und Verdichtung Top Jahr Quartal Monat Tag Top I II III IV I II III IV Jan Feb Mar Okt Nov Dez Ulf Leser: Data Warehousing, Vorlesung, SoSe
24 Klassifikationslevel Geg. Klas.schema K; Pfad P= {P 0,P 1,... P n } in K Def. Klassifikationslevel Der Klassifikationslevel von P i in P ist i Folgerung? Jede Klassifikationsstufe in K hat einen eindeutigen Klassifikationslevel Ulf Leser: Data Warehousing, Vorlesung, SoSe
25 Nein Level 0 Top Level 0 Top Level 1 Jahr Level 1 Jahr Level 2 Level 3 Quartal Level 2 Woche Monat Level 4 Tag Level 3 Tag Ulf Leser: Data Warehousing, Vorlesung, SoSe
26 Name... Name Depot Manager Logistics Knotenattribute Continent Country Region Name... Name Def. Jede Klassifikationsstufe K i hat eine Menge von Attributen, die Knotenattribute Address Shop Supplier Facilities Ulf Leser: Data Warehousing, Vorlesung, SoSe
27 Klassifikationshierarchie Geg.: Klassifikationsschema K, Pfad P, knoten() Def. Die Klassifikationshierarchie zu (K,P,M,knoten) ist ein Baum (N,E) mit E = ( n, n ) 1 2 n 1 N, n 2 = U knoten ( K ) K i P N n j : n 1 1 n 2 knoten ( P i = M ) n knoten j 2 P j ( ) + 1 Beachte: Jede Klassifikationshierarchie ist balanciert Alle Pfade Wurzel-Blatt haben die selbe Länge Ulf Leser: Data Warehousing, Vorlesung, SoSe
28 Dimension und Granularität Def. Eine Dimension D=(K, {P 1,...P n }, M, k) besteht aus Einem Klassifikationsschema K Einer Menge von Pfaden P i aus K Einer Menge von Klassifikationsknoten M Einer Funktion k zur Knotenzuordnung Schreibweise: D.K = Klassifikationsstufe K aus Dim. D Def. Eine Granularität G über einer Menge {D 1,...D n } ist die Menge {D 1.K 1,...D n.k n } mit K i beliebige Klassifikationsstufe in D i Ulf Leser: Data Warehousing, Vorlesung, SoSe
29 Würfelschema Def. Ein Würfelschema WS=(G,M) besteht aus Einer Granularität G Einer Menge M von Fakten Es gibt keine funkt. Abhängigkeiten zwischen Klassifikationsstufen in G Def. Ein Würfel W zu einem Würfelschema WS W = dom ( G ) dom ( M ) Anders ausgedrückt ) W = dom ( D. K )... dom ( D n. K ) dom ( M 1 ) dom ( M 1 1 n m Ulf Leser: Data Warehousing, Vorlesung, SoSe
30 Kein Würfelschema Autoverkäufe pro Zeit (Monat, Jahr), Händler und Region (Land, Kontinent) Drei Dimensionen Monat -> Jahr Händler Land -> Kontinent Aber: EU Recht! Händler -> Land Kontinent Land Kontinent Modellierung Land ist anwendungsabhängig Händer Händer Ulf Leser: Data Warehousing, Vorlesung, SoSe
31 Semantik von Kanten in Klas.Hierarchien Die Hierarchie von Klassifikationsstufen wird durch funktionale Abhängigkeiten bestimmt Das beinhaltet zunächst keine Bestimmung der Semantik der Kanten Bereich Komm.Eletronik Land Brandenburg Top Güter Hauptabt. Mobilfunk Kreis Potsdam P.gruppe Kleidung Abteilung Dualband Stadt Golm Produkt Hose Part-Of Topologisch IS-A Ulf Leser: Data Warehousing, Vorlesung, SoSe
32 Beispiel 1 Ein längeres Beispiel Bestand und Delta pro Monat in Lagerhäusern pro Monat/Quartal/Woche/Jahr Region/Land Artikel/Artikelgruppe/Bereich Fakten: Bestand, Delta pro Monat Dimensionen: Zeit, Ort, Produkt Ulf Leser: Data Warehousing, Vorlesung, SoSe
33 Beispiel 2 Klassifikationsschema = {Monat, Quartal, Woche, Jahr, Region, Land, Artikel, Artikelgruppe, Bereich, TOP} Top Jahr Jahr Quartal Quartal Monat Jahr Woche Top Land Land Region Top Bereich Bereich Artikelgruppe Artikelgruppe Artikel Sammlung und Struktur aller gewünschten Klassifikationsstufen Ulf Leser: Data Warehousing, Vorlesung, SoSe
34 Beispiel 3 Pfade = {Monat, Quartal, Woche, Jahr, Region, Land, Artikel, Artikelgruppe, Bereich, TOP} P 1 : Top Jahr Quartal Monat P 2 : Top Jahr Woche P 3 : Top Land Region P 4 : Top Bereich Artikelgruppe Artikel Entlang der Pfade sind Verdichtungen im Modell sinnvoll Ulf Leser: Data Warehousing, Vorlesung, SoSe
35 Beispiel 4 Klassifikationsknoten TOP: Jahr: 1997, 1998, 1999 Quartal: I, II, III, IV (pro Jahr) Woche: 1-52 (pro Woche) Monat: 1-3 (pro Quartal I), 4-6 (pro Quartal II),... Land: BRD, F, GB Region: Bayern, Berlin, BadenWürtenberg, Dep1, Dep2,... Bereich: Kleidung, Nahrung, Elektro Artikelgruppe: Oberbekleidung, Unterbekleidung, Spirituosen, Kindernahrung, Kleingeräte, TV/Video,... Artikel:... Alle möglichen Ausprägungen der Klassifikationsstufen Ulf Leser: Data Warehousing, Vorlesung, SoSe
36 Beispiel 5 Klassifikationshierarchie P 1 Top I II III IV Klassifikationshierarchie P 2 Jan Feb Mar Okt Nov Dez Top Ulf Leser: Data Warehousing, Vorlesung, SoSe
37 Beispiel 6 Klassifikationshierarchie P 3 Top BRD F GB Bayern... Bremen... Wales... N-Irland Klassifikationshierarchie P 4 Top Nahrung Kleidung Elektro Milchwaren... Spiritousen... Kleingeräte... TV/Video Ulf Leser: Data Warehousing, Vorlesung, SoSe
38 Beispiel 7 Dimension ZEIT = {K, {P 1, P 2 }, {Top, 1997,... Dez}, k} ORT = {K, {P 3 }, {Top, BRD, F, GB, Berlin,...}, k} PRODUKT = {K, {P 4 }, {Nahrung, Kleidung, Kleingeräte,...}, k} Dimensionen fassen Hierarchien und Pfade in sinnvolle Strukturen zusammen Keine Würfel mit Dimension P 1 und P 2... Ulf Leser: Data Warehousing, Vorlesung, SoSe
39 Beispiel 8 Granularität G 1 = (Zeit.Woche, Ort.Land, Produkt.Artikel) G 2 = (Zeit.Jahr, Ort.Gebiet) Halbordnung: (Zeit.Woche, Ort.Gebiet, Produkt.Artikel) < (Zeit.Jahr, Ort.Gebiet, Produkt.Bereich) < (Zeit.Top, Ort.Top, Produkt.Top) Würfelschema und Würfel Granularität plus Fakten (M 1 =Bestand, M 2 =Delta) Würfel haben eine Granularität Operationen auf Würfeln verändern die Granularität Nur sinnvolle Operationen zulassen Ulf Leser: Data Warehousing, Vorlesung, SoSe
40 Fakten und Verdichtung Ziel des MDDM: Verdichtung von Daten entlang der Konsolidierungspfade Numerische versus kategorische Fakten Numerisch: Umsatz, Verkäufe, Messwerte,... Kategorisch: Geschlecht, Kundensegment,... Nicht alle Funktionen vertragen die Hierarchie Summe des Umsatz aller Tage Umsatz Monat Summe des Umsatz aller Monate Umsatz Jahr Durchschnitt des Umsatz aller Tage Durchschnitt des Umsatz im Monat Durchschnitt des Umsatz aller Monate Durchschnitt? des Umsatz im Jahr Summierbarkeit! OK Ulf Leser: Data Warehousing, Vorlesung, SoSe
41 Aggregatfunktionen Level 0 Level 1 Level 2 1 Summe: 2 1 Avg: 1 Summe: 12 Summe: 10 Avg: 11/2 12/3 10 Avg: 10 Hierarch. Berechnung: SUM, CNT, MAX,... Benötigt SUM und CNT: AVG Benötigt Basisdaten: MEDIAN, QUARTILE,... Ulf Leser: Data Warehousing, Vorlesung, SoSe
42 Charakterisierung von Agg.funktionen [GCB+97] Geg.: Set X, Partitionierung (X 1,X 2,..., X n ) Def. Aggregatfunktion f ist distributiv gdw g: f(x) = f( g(x 1 ), g(x 2 ),... g(x n )) Def. Aggregatfunktion f ist algebraisch gdw f(x) berechenbar aus fester Menge von g s Def. Aggregatfunktion f ist holistisch gdw f(x) kann nur aus den Grundelementen von X berechnet werden Bemerkung: d.h. dass die Menge von g s nicht begrenzt ist Ulf Leser: Data Warehousing, Vorlesung, SoSe
43 Beispiele Distributiv Summe, Count, Max, Min,... Algebraisch AVG (mit G 1 =SUM und G 2 =CNT) STDDEV, MaxN,... Holistisch MEDIAN, RANK, PERCENTILE Highest Frequency,... Highest Frequency Merke Werte und jeweilige Frequenz: ( (v 1,f 1 ), (v 2,f 2 ),...) Merge zweier Sets möglich Aber: Keine feste Grenze für Platzbedarf, da Anzahl unterschiedlicher Werte nicht fest Ulf Leser: Data Warehousing, Vorlesung, SoSe
44 Summierbarkeit / Aggregierbarkeit [LS97] Bisher: Wann darf man Werte summieren? Numerische Fakten Bei Verdichtungshierarchie Art der Aggregatfunktion beachten Aber Summe der Lagerbestände pro Produkt über Jahre? Gesamtsumme Studenten als Summe über Studenten pro Studiengang? Weitere notwendige Kriterien für Aggregierbarkeit entlang einer Klassifikationshierarchie Überlappungsfreiheit der Zuordnung von Klassifikationsknoten Vollständigkeit der Zerlegung pro Klassifikationslevel Typverträglich von Fakt und Aggregatfunktion Ulf Leser: Data Warehousing, Vorlesung, SoSe
45 Beispiel Studenten pro Jahr und Studiengang Gesamt Informatik BWL Gesamt Kann das stimmen? Wie lange dauern Studiengänge? Studenten nur in einem Studiengang eingeschrieben? Ulf Leser: Data Warehousing, Vorlesung, SoSe
46 Überlappungsfreiheit Def: Eine Klassifikationshierarchie ist überlappungsfrei (disjoint) gdw Jeder Klassifikationsknoten mit Level i ist höchstens einem Klassifikationsknoten in Level i+1 zugeordnet Jedes Fakt ist höchstens einem Klassifikationsknoten mit Level 0 zugeordnet P.familie Bekleidung P.gruppe Damen Herren Rock Anzug Produkt Jeans Ulf Leser: Data Warehousing, Vorlesung, SoSe
47 Vollständigkeit Def: Eine Klassifikationshierarchie ist vollständig (complete) gdw Jeder Klassifikationsknoten mit Level i ist mindestens einem Klassifikationsknoten in Level i+1 zugeordnet Jedes Fakt ist mindestens einem Klassifikationsknoten mit Level 0 zugeordnet P.familie Bekleidung P.gruppe Damen Herren Walkman Produkt Rock Anzug Jeans Ulf Leser: Data Warehousing, Vorlesung, SoSe
48 Was tun? Änderung der Modellierung Artifizielle Klassifikationsknoten: Others, Rest, Nicht zugewiesen Knotenaufspaltung: Herrenjeans, Damenjeans Gewichtete Zuordnung Türkei ist 10% Europa, 90% Asien Nicht-Testbar: Haben wir auch alle Fakten? Ulf Leser: Data Warehousing, Vorlesung, SoSe
49 Typen von Fakten Flow (Ereignis zu Zeitpunkt T) Verkäufe, Umsatz, Lieferungen, diplomierte Studenten,... Stock (Zustand zu Zeitpunkt T) Lagerbestand, eingeschriebene Studenten, Einwohnerzahlen,... Value-per-Unit (Eigenschaft zu Zeitpunkt T) Preis, Herstellungskurs, Währungskurs,... Ulf Leser: Data Warehousing, Vorlesung, SoSe
50 Typverträglichkeit MIN/MAX SUM AVG Stock Zeit: nein Sonst: Flow Value-per- Unit Nie Erkennen von Problemen Nicht automatisch möglich Metadaten Beschreibung der Fakten Ulf Leser: Data Warehousing, Vorlesung, SoSe
51 Studentenbeispiel Erklärung Gesamt Informatik BWL Gesamt Studiengangdauer: 2 Jahre Fakten sind Typ Stock Doppelt eingeschriebene Studenten Überlappungsfreiheit verletzt Studenten haben Studium abgebrochen Vollständigkeit verletzt Ulf Leser: Data Warehousing, Vorlesung, SoSe
52 Zusammenfassung MDDM Wesentliche Elemente Klassifikationsstufen, -knoten und hierarchien Würfel Fakten Ziel: Verdichtung entlang definierter Pfade Denn nur dort ist es sinnvoll Vorsicht vor Modellierungsfallen Summierung über kategorische Fakten Rekursive Durchschnittsbildung Typunverträgliche Summierung Löchrige Klassifikationshierarchien Ulf Leser: Data Warehousing, Vorlesung, SoSe
53 Teil 2: OLAP Operatoren Operationen auf multidimensionalen Daten Rotation (Pivoting) Aggregation / Verfeinerung (Roll-Up, Drill-Down) Selektion von Werten oder Wertebereichen (Slice, Dice) Zur Verdeutlichung nur 3-dimensionaler Fall Ulf Leser: Data Warehousing, Vorlesung, SoSe
54 Zweck von OLAP Operationen Ziel: Unterstützung des Analysten Flexible Datenanalyse kreativer Analyseprozess Unterschiedliche Sichtweisen OLAP Schnelle und intuitive Manipulation der Daten Notwendig Unterstützung durch graphischen Werkzeugen Umsetzung in physikalische Operationen Ulf Leser: Data Warehousing, Vorlesung, SoSe
55 Rotation Unterschiedliche Sichtweisen auf einen Datenbestand Jahr Marke Automarke Ulf Leser: Data Warehousing, Vorlesung, SoSe Jahr Asien Südamerika Kontinent BMW Ford 1999 Kontinent Australien S-Amerika Europa Asien Ford VW Peugot BMW
56 Aggregation / Konsolidierung Aggregation entlang eines Klassifikationspfades Jahr Jahr Kontinent Kontinent Asien Südamerika Asien 1999 Südamerika 1999 Automarke Rest BRD Automarke Ford Peugot VW BMW Rest BRD Ulf Leser: Data Warehousing, Vorlesung, SoSe
57 Verfeinerung Verfeinerung entlang eines Klassifikationspfades Jahr Jahr Kontinent Kontinent Asien Südamerika Asien 1999 Südamerika 1999 Automarke Rest BRD Automarke Ford Peugot VW BMW Rest BRD Ulf Leser: Data Warehousing, Vorlesung, SoSe
58 Selektion eines Wertes Verkäufe in Asien pro Jahr und Marke Verkäufe von Peugot pro Jahr und Kontinent Jahr Kontinent Asien Südamerika Automarke Ford VW Peugot BMW Ulf Leser: Data Warehousing, Vorlesung, SoSe
59 Auswahl von Unterwürfeln Verkäufe von Peugot,VW in 2000,2001 pro Kontinent Jahr Kontinent Asien Südamerika Automarke Ford VW Peugot BMW Ulf Leser: Data Warehousing, Vorlesung, SoSe
60 Formale Beschreibung Rotation Keine Auswirkung auf Cube; reine Darstellungsangelegenheit Aggregation Veränderung der Granularität durch Ersetzen einer Klassifikationsstufe D.K i durch D.K i+1 Aggregation von Fakten Selektion Veränderung der Granularität durch Festlegung eines Wertes / Wertebereiches in einer/mehreren Dimensionen Slicing: Optische Reduktion der Dimensionalität Keine Änderung der Fakten Häufige Kombination: Slicing + Aggregation Aggregation bis zum TOP-Element Echte Reduktion der Dimensionalität Ulf Leser: Data Warehousing, Vorlesung, SoSe
61 Slicing plus Roll-Up Summe Verkäufe pro Jahr und Marke Summe Verkäufe pro Jahr und Kontinent Jahr Kontinent Asien Südamerika Automarke Ford VW Peugot BMW Ulf Leser: Data Warehousing, Vorlesung, SoSe
62 Teil 3: Konzeptionelle MD Modellierung Konzeptionelle Modellierung multidimensionaler Daten Grundlagen ME/R Andere Ulf Leser: Data Warehousing, Vorlesung, SoSe
63 Datenbankentwurf Konzeptionelles Modell Abbild der Anwendungswirklichkeit im Kopf des Designers Semiformale, graphische Notation Logisches Modell Formalisierung des konzeptionellen Modells Algebras, Logik, Programmiersprachen Physisches (internes Modell) Implementierung der Elemente des formalen Modells Optimierung, Algorithmen, Speicherverfahren, Indexe, Hardwarekonfiguration, etc. Vorteil: Unabhängigkeit der Ebenen Unterschiedliche Verfahren und Notationen Unabhängige Evolution Definierte Schnittstellen: Produkt- und Herstellerunabhängigkeit Ulf Leser: Data Warehousing, Vorlesung, SoSe
64 Ablauf Konzeptionelles Modell Logisches Modell Implementierung Designer, Requirements Engineering Entwickler, Administrator Administrator Produktsupport E/R, UML: Klassen, Attribute, Assoziationen Relationen, Attribute, Keys, SQL (Halb)Automatisch Vollautomatisch Join-Order, Memory- Hierarchie, Indexe, Buffer / Blocks / Segments, Sort,... Ulf Leser: Data Warehousing, Vorlesung, SoSe
65 ME/R [SBHD98] E/R nicht ausreichend für MDDM Keine Unterscheidung Fakten Dimension Keine Repräsentation von Klassifikationsstufen und - hierarchien Keine Repräsentation der Eigenschaften von Fakten Numerisch / kategorisch, Stock/Flow/Value-per-Unit, Einheiten,... Keine Repräsentation der Eigenschaften von Klassifikationen Vollständigkeit, Überlappungen, Ordnung, etc. ME/R: Erweitertes E/R Modell Ulf Leser: Data Warehousing, Vorlesung, SoSe
66 Elemente und Notation Neue Elemente Entity Set: Dimension Level, Klassifikationsstufe Relationship Set: Fact, Würfel Relationship Set: Roll-Ups, Beziehung zwischen Klassifikationsstufen IC: Keine Zyklen in den ROLL-UP Beziehungen Klassifikationsstufe Fakt Roll-Up Ulf Leser: Data Warehousing, Vorlesung, SoSe
67 Beispiel Doppelte Verwendung von Geogr. Region? Zwei Dimensionen: Kunde und Werkstatt Wiederverwendung einer Klassifikationshierarchie Muss doppelt abgebildet werden (funkt. Abhängigkeit!) Ulf Leser: Data Warehousing, Vorlesung, SoSe
68 ME/R Metamodell (Extended E/R) Klassifikations stufe Würfel Beziehung zwischen Klassifikationsstufen Ulf Leser: Data Warehousing, Vorlesung, SoSe
69 ME/R Metamodell Dazu ist zu sagen Beziehungen werden auch geerbt (Roll-Up hat drei Connects sets) Polymorphie in Assoziationen Warum sind die Vererbungsbeziehungen eigentlich notwendig? Für die Attribute Warum ist das Metamodell in extended ER? Warum keine Repräsentation von Dimension? Würde formale keine Auswirkung haben, aber die Lesbarkeit/Verständlichkeit erhöhen Ulf Leser: Data Warehousing, Vorlesung, SoSe
70 Fazit Minimale, konservative Erweiterung Flexible Zuordnung Dimensionen Würfel Greift kurz Keine Eigenschaften von Fakten/Dimensionen Keine explizite Granularität (immer feinste) Keine Verankerung in umfassendem DWH- Metamodell Keine Übersetzungsmethode definiert aber nicht schwierig Toolunterstützung? Ulf Leser: Data Warehousing, Vorlesung, SoSe
71 Weitere Ansätze muml UML-Erweiterung basierend auf UML Metamodell (Constraints, Stereotypen) -> Werkzeugunterstützung vorhanden Klassifikationsstufe: <<Dimensional class>> Fakten: <<Fakt class>> Würfel: <<Dimension>> (Assoziationstyp) Hierarchie: <<Roll-Up>> (Assoziationstyp)... ADEPT Multi-dimensional Modelling Language (MML)... Keine der Methoden hat sich (bisher) durchgesetzt Ulf Leser: Data Warehousing, Vorlesung, SoSe
72 Literatur [Oeh00] Oehler: OLAP: Grundlagen, Modellierung und betriebswirtschaftliche Grundlagen, Hanser Verlag, 2000 [BG01]: Bauer, Günzel: Data Warehouse Systeme: Architektur, Entwicklung, Anwendung, dpunkt.verlag, 2001 [Vas98] Vassiliadis: Modeling Multidimensional Databases, Cubes, and Cube Operations, SSDBM, 1998 [SBHD98] Sapia at al. Extending the E/R Model for the Multidimensional Paradigm, Workshop DWDM, 1998 [SL97] Lenz, Shoshani: Summarizability in OLAP and Statistical Databases, SSDBM, 1997 Ulf Leser: Data Warehousing, Vorlesung, SoSe
Data Warehousing. Modellierung im DWH Das multidimensionale Datenmodell. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Modellierung im DWH Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Zusammenfassung: Hubs and Spokes Mart 1 Mart 2 Mart 3 Mart 4 DWH Quelle 1 RDBMS Quelle
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Vom Spreadsheet zum Würfel Multidimensionales Datenmodell (MDDM)
MehrData Warehousing. Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Klassifikationsschema Definition Ein Klassifikationsschema
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik DWH Grobarchitektur: Hubs and Spokes Abgeleitete Sichten Mart 1 Mart 2 Mart 3 Mart 4
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining OLAP Operationen Ein konzeptionelles MDDM Aggregierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Operationen im multidimensionalen Datenmodell
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Vom Spreadsheet zum Würfel Multidimensionales Datenmodell (MDDM)
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining OLAP Operationen Ein konzeptionelles MDDM Aggregierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Operationen im multidimensionalen Datenmodell
MehrData Warehousing. Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Operationen im multidimensionalen Datenmodell Graphische MDDM Summierbarkeit Ulf Leser Wissensmanagement in der Bioinformatik Begriffe Klassifikationsschema Jahr Stufen einer Dimension
MehrData Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Sommersemester 2004 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte
MehrRepetitorium. Data Warehousing und Data Mining 11/12. Sebastian Wandelt 13./16. Februar 2012
Repetitorium Data Warehousing und Data Mining 11/12 Sebastian Wandelt 13./16. Februar 2012 Inhalt Data Warehousing und Data Mining auf 40 Slides Weder in-, noch exklusiv! Subjektive Zusammenfassung pro
MehrVorlesung Wissensentdeckung in Datenbanken
Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Uwe Ligges Informatik LS 8 22.04.2010 1 von 26 Gliederung 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der
Mehr1 Business-Intelligence-Architektur 1
D3kjd3Di38lk323nnm xi 1 Business-Intelligence-Architektur 1 1.1 Data Warehouse....................................... 1 1.2 OLAP und mehrdimensionale Datenbanken.................. 4 1.3 Architekturvarianten....................................
MehrAnfragen an multidimensionale Daten
Anfragen an multidimensionale Daten Alexander Heidrich - BID8 09.06.2005 Hintergrundbild: http://www.csc.calpoly.edu/~zwood/teaching/csc471/finalproj02/afternoon/mfouquet/cube.jpg Inhaltsübersicht Motivation
MehrVorlesung Wissensentdeckung in Datenbanken
Gliederung Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Claus Weihs 14.07.2009 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der Cube-Operator 5 Implementierung
MehrData Cubes PG Wissensmangement Seminarphase
PG 402 - Wissensmangement Seminarphase 23.10.2001-25.10.2001 Hanna Köpcke Lehrstuhl für Künstliche Intelligenz Universität Dortmund Übersicht 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit
MehrData Warehousing. Ausführung von OLAP Operationen. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Ausführung von OLAP Operationen Ulf Leser Wissensmanagement in der Bioinformatik Variante 1 - Snowflake Year id year Productgroup id pg_name Month Id Month year_id Day Id day month_id
MehrData Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de
Data Warehouses Sommersemester 2011 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen Data Warehouse Architektur Data-Warehouse-System Teilsichten
MehrData Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte
MehrChristian Kurze BI-Praktikum IBM WS 2008/09
Einführung in die multidimensionale Datenmodellierung e mit ADAPT BI-Praktikum IBM WS 2008/09 1 Gliederung Einführung multidimensionale Datenmodellierung 1. Multidimensionales Modell BI-Praktikum IBM WS
MehrÜbung zur Einführung in die Wirtschaftsinformatik Cognos Powerplay als Beispiel für ein DSS
Übung zur Einführung in die Wirtschaftsinformatik 2006-05 - 10 Cognos Powerplay als Beispiel für ein DSS 1 Entscheidungsunterstützungssysteme (EUS) Decision Support Systems (DSS) EUS sollen das gemeinsame
MehrDas Multidimensionale Datenmodell
Das Multidimensionale Datenmodell Konzeptuelle Modellierung Umsetzung des Modells Beispiel ER-Modell 2 / 36 Probleme ER-Modellierung Keine Unterscheidung Klassifikation, Attribute, Kenngrößen Dimension
MehrLogische Modelle für OLAP. Burkhard Schäfer
Logische Modelle für OLAP Burkhard Schäfer Übersicht Einführung in OLAP Multidimensionale Daten: Hypercubes Operationen Formale Grundlagen Zusammenfassung Einführung in OLAP Verfahren zur Analyse großer
MehrBusiness Intelligence & Reporting. Michael Cordes Holger Oehring Matthias Rein
Business Intelligence & Reporting Michael Cordes Holger Oehring Matthias Rein Ziele Einführung Business Intelligence / Front Room Online Analytical Processing (OLAP) Arten des Reporting & Nutzergruppen
MehrDatenbanken Grundlagen und Design
Frank Geisler Datenbanken Grundlagen und Design 3., aktualisierte und erweiterte Auflage mitp Vorwort 15 Teil I Grundlagen 19 i Einführung in das Thema Datenbanken 21 i.i Warum ist Datenbankdesign wichtig?
MehrKapitel 7 Grundlagen von Data
LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS DATABASE Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2014 Kapitel 7 Grundlagen von Data Warehouses Vorlesung: PD
MehrData Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY
Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung
MehrCommon Warehouse Metamodel und Imperfektion
Common Warehouse Metamodel und Imperfektion Christoph Goebel Imperfektion und erweiterte Konzepte im Data Warehousing 2 Fragestellungen Welche Bedeutung haben Metadaten in der Information Supply Chain
MehrInhaltsverzeichnis. vii.
vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt 2 1.2 OLTP versus OLAP 4 1.2.1 OLAP-versus OLTP-Transaktionen 5 1.2.2 Vergleich von OLTP und OLAP 6 1.2.3 Abgrenzung: DBMS-Techniken
MehrInhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte
4. Data Warehouses Inhalt 4.1 Motivation 4.2 Datenintegration 4.3 Konzeptuelle Modellierung 4.4 Anfragen an Data Warehouses 4.5 Implementierungsaspekte 2 Literatur V. Köppen, G. Saake und K.-U. Sattler:
MehrAgenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL
Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining 2 Eigenschaften eines Data Warehouse Referenzarchitektur Integrierte Sicht auf beliebige Daten aus verschieden Datenbanken
MehrData Warehouse Technologien
Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............
MehrThemenblock: Data Warehousing (I)
Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining Agenda Einführung Data Warehouses Online Transactional Processing (OLTP) Datenmanipulation mit SQL Anfragen mit SQL Online
MehrRealisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier
Realisierung von OLAP Operatoren in einem visuellen Analysetool Vortrag von Alexander Spachmann und Thomas Lindemeier Gliederung Ausgangssituation/Motivation Was ist OLAP? Anwendungen Was sind Operatoren?
MehrDatenbanktechnologie für Data-Warehouse-Systeme
Wolfgang Lehner Datenbanktechnologie für Data-Warehouse-Systeme Konzepte und Methoden dpunkt.verlag 1 1.1 1.2 1.3 1.4 1. 5 2 2.1 2.2 2.3 Einleitung 1 Betriebswirtschaftlicher Ursprung des Data Warehousing...
MehrMultidimensionales Datenmodell, Cognos
Data Warehousing (II): Multidimensionales Datenmodell, Cognos Praktikum: Data Warehousing und Mining Praktikum Data Warehousing und Mining, Sommersemester 2010 Vereinfachte Sicht auf die Referenzarchitektur
MehrVeit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien
Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...
MehrOLAP und Data Warehouses
OLP und Data Warehouses Überblick Monitoring & dministration Externe Quellen Operative Datenbanken Extraktion Transformation Laden Metadaten- Repository Data Warehouse OLP-Server nalyse Query/Reporting
MehrGrundlagen der Programmentwurfstechnik Fundamentals of Software Engineering 1
Fundamentals of Software Engineering 1 Inhaltsverzeichnis 1. Einführung 2. Allgemeine Modellbildung - Klassische Konzepte des Software Engineering- 2.1 Das Kontextmodell 2.2 Entscheidungstabellen 2.3 Zustandsmodelle
Mehr3 Grundlagen der Datenmodellierung
22 3 Grundlagen der Datenmodellierung Das Verständnis für den in der vorliegenden Arbeit gewählten Lösungsansatz erfordert eine Einführung in die Methoden und Konzepte des Datenbankentwurfes. Grundlegend
MehrTesten mit Use Cases. Chris Rupp Dr. Stefan Queins
Testen mit Use Cases Chris Rupp Dr. Stefan Queins Das Problem Requirements- Engineering Was kann passieren? Was ist das gewünschte Verhalten? Was soll ich testen? Welche Eingaben benötigt mein Testpfad?
MehrEinführung in Datenbanken
Einführung in Datenbanken Dipl.-Inf. Michael Wilhelm Hochschule Harz FB Automatisierung und Informatik mwilhelm@hs-harz.de Raum 2.202 Tel. 03943 / 659 338 1 Inhalt 1. Grundlegende Begriffe der Datenbanktechnologie
MehrDatenorientierter Ansatz. Datenbankentwurfsschritte. Welche Daten müssen im System verwaltet werden? Wie werden die Daten im System verändert?
.RQ]HSWLRQHOOHU'DWHQEDQNHQWZXUI Datenorientierter Ansatz Welche Daten müssen im System verwaltet werden? Wie werden die Daten im System verändert? Datenbankentwurfsschritte Datenverarbeitungsanforderungen
MehrGeoinformation I Datenmodellierung
Seite 1 von 61 Geoinformation I Datenmodellierung Seite 2 von 61 Datenmodellierung Übersicht Datenverwaltung und Datenbanken objektorientierte Abbildung der Realität Grundlagen der Objektorientierung Darstellung
MehrEinführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.
Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen
MehrThemenblock: Erstellung eines Cube
Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen
Mehr5 BINÄRE ENTSCHEIDUNGS- DIAGRAMME (BDDS)
5 BINÄRE ENTSCHEIDUNGS- DIAGRAMME (BDDS) Sommersemester 2009 Dr. Carsten Sinz, Universität Karlsruhe Datenstruktur BDD 2 1986 von R. Bryant vorgeschlagen zur Darstellung von aussagenlogischen Formeln (genauer:
MehrDatenbanksysteme: Entwurf
Wichtigste Themen hier: Datenbanksysteme: Entwurf DB Entwurf ist in der Regel eingebettet in ein größeres Projekt: siehe Informationssysteme Die Daten dienen einem Zweck und sind dennoch universell nutzbar:
MehrInhaltsverzeichnis. 1 Einleitung Motivation und Umfeld Zielsetzung der Arbeit Methodisches Vorgehen und Aufbau der Arbeit 3
Inhaltsverzeichnis 1 Einleitung 1 1.1 Motivation und Umfeld 1 1.2 Zielsetzung der Arbeit 2 1.3 Methodisches Vorgehen und Aufbau der Arbeit 3 2 Grundlagen des Feuerwehrwesens 5 2.1 Kategorisierung der Feuerwehren
MehrAnalytic Views: Einsatzgebiete im Data Warehouse
Analytic Views: Einsatzgebiete im Data Warehouse Dani Schnider Trivadis AG Zürich/Glattbrugg, Schweiz Einleitung Analytic Views sind eine der wesentlichen Erweiterungen in Oracle 12c Release 2. Durch zusätzliche
MehrInhaltsverzeichnis.
Wegweiser durch das Buch 1 1 Problembereich und Lösungsbereich 10 1.1.Unterschiede zwischen Problembereich und Lösungsbereich 10 1.2 Paradigmen der Softwareentwicklung 12 1.3 Methoden für die verschiedenen
MehrOLAP mit dem SQL-Server
Hartmut Messerschmidt Kai Schweinsberg OLAP mit dem SQL-Server Eine Einführung in Theorie und Praxis IIIBibliothek V dpunkt.verlag Teil OLAP undder Microsoft SQL-Server 1 1 Theoretische Grundlagen 3 1.1
MehrDatenbanken. Datenbanken. Grundlagen und Design. Grundlagen und Design. Frank. Geisler. 4. Auflage
Datenbanksysteme, Datenbankanwendungen und Middleware Das relationale Datenbankmodell ER-Datenbankmodellierung und Normalisierung SQL-Grundlagen Projektablauf bei der Erstellung einer Datenbank Transaktionen
MehrVertrautmachen mit Daten
Kapitel III Vertrautmachen mit Daten 2004 AIFB / FZI 1 III Vertrautmachen mit Daten (see also Data Preparation ) 2004 AIFB / FZI 2 III Vertrautmachen mit Daten III.1 OLAP III.1.1 Einführung in OLAP Wie
MehrDatenbanksysteme I Data Warehouses Felix Naumann
Datenbanksysteme I Data Warehouses 5.7.2010 Felix Naumann Überblick 2 Einsatzgebiete OLAP versus OLTP Multimensionale i l Modellierung OLAP Operationen Relationale Implementierung Neue Architekturen Folien
MehrWie erziehe ich meinen Kunden
Wie erziehe ich meinen Kunden Dr. Andrea Kennel InfoPunkt Kennel GmbH CH-8600 Dübendorf Schlüsselworte: Data Warehousing, Dimensionen, Fakten, Zusammenarbeit, Kommunikation. Ausgangslage Die Informatikabteilung
MehrInhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte
4. Data Warehouses Inhalt 4.1 Motivation 4.2 Datenintegration 4.3 Konzeptuelle Modellierung 4.4 Anfragen an Data Warehouses 4.5 Implementierungsaspekte 2 Literatur V. Köppen, G. Saake und K.-U. Sattler:
MehrDatenbankanwendungen werden oft über einen sehr langen Zeitraum (z.b. Jahrzehnte) eingesetzt
2. Datenbankentwurf Motivation Datenbankanwendungen werden oft über einen sehr langen Zeitraum (z.b. Jahrzehnte) eingesetzt Fehler sind umso teurer zu beheben, je weiter die Entwicklung bzw. der Einsatz
MehrMedizininformatik Software Engineering
Vorlesung Software Engineering Inhaltsverzeichnis 1. Einleitung 2. Software und Medizinprodukt 3. Vorgehensmodelle 4. Strukturierter Entwurf von Echtzeitsystemen 4.1 Echzeit, was ist das? 4.2 Einführung
MehrData Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube
Fragen des Marketingleiters Data Warehousing Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt nach? Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon Technisch
MehrEntwurf: Fortgeschrittene Konzepte
Bisher: Entwurf als grafisches Diagramm mit Entitätsmengen (auch weiche) Beziehungsmengen Attribute Assoziationstypen, Beziehungstypen und ausschließlich 2 stellige Beziehungen Extended / Enhanced (Erweitertes)
MehrData Warehousing. DWH Projekte. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing DWH Projekte Ulf Leser Wissensmanagement in der Bioinformatik Inhalt DWH Projekte Spezifika Die kritischen Punkte Warum scheitern DWH Projekte? Ulf Leser: Data Warehousing, Vorlesung,
MehrRückblick: Entity-Relationship-Modell
Rückblick: Entity-Relationship-Modell Entity-Relationship-Modell für konzeptuellen Entwurf Entitytypen (entity types) (z.b. Studenten) Beziehungstypen (relationships) (z.b. hören) Attribute beschreiben
MehrFriedrich-Schiller-Universität Jena Fakultät für Mathematik Informatik Lehrstuhl für Datenbanken und Informationssysteme Betreut von: David Wiese
Friedrich-Schiller-Universität Jena Fakultät für Mathematik Informatik Lehrstuhl für Datenbanken und Informationssysteme Betreut von: David Wiese Seminar Data Warehousing Sommersemester 2005 vorgelegt
MehrDatenbanken - Grundlagen und Design
mitp Professional Datenbanken - Grundlagen und Design von Frank Geisler überarbeitet Datenbanken - Grundlagen und Design Geisler schnell und portofrei erhältlich bei beck-shop.de DIE FACHBUCHHANDLUNG mitp/bhv
Mehrd.h. zu Definitions-Stelle eindeutiger Funktionswert x X! y Y : (x,y) f umgekehrt: (x 1,y), (x 2,y) f ist o.k. X Y f(x) = y
Kapitel 7 Normalformen und DB-Entwurf Kap. 7.1 Normalformen Theorie Funktionale Abhängigkeit: f X Y f als Relation, d.h. Menge von Paaren {(x,y)} x: Definitions-Stelle, y: Funktionswert f ist Funktion
MehrData Warehouse und Data Mining
Einführungsseminar Data Mining Seminarvortrag zum Thema: Data Warehouse und Data Mining Von gehalten am Betreuer: Dr. M. Grabert Einführung Problemstellung Seite 2 Einführung Unternehmen bekommen eine
MehrInhaltsübersicht...IX Inhaltsverzeichnis...XI Abbildungsverzeichnis...XVII Tabellenverzeichnis... XXIII Abkürzungsverzeichnis...
Inhaltsübersicht...IX Inhaltsverzeichnis...XI Abbildungsverzeichnis...XVII Tabellenverzeichnis... XXIII Abkürzungsverzeichnis... XXV 1 Einführung... 1 1.1 Problemstellung... 1 1.2 Zielsetzung... 3 1.3
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Architektur und Komponenten von Data Warehouses Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Architektur Komponenten ETL Ulf Leser: Data Warehousing
MehrDiskrete Strukturen Kapitel 2: Grundlagen (Relationen)
WS 2016/17 Diskrete Strukturen Kapitel 2: Grundlagen (Relationen) Hans-Joachim Bungartz Lehrstuhl für wissenschaftliches Rechnen Fakultät für Informatik Technische Universität München http://www5.in.tum.de/wiki/index.php/diskrete_strukturen_-_winter_16
MehrKapitel DB:IV (Fortsetzung)
Kapitel DB:IV (Fortsetzung) IV. Logischer Datenbankentwurf mit dem relationalen Modell Das relationale Modell Integritätsbedingungen Umsetzung ER-Schema in relationales Schema DB:IV-46 Relational Design
MehrISU 1. Ue_08/02_Datenbanken/SQL. 08 Datenbanken. Übung. SQL Einführung. Eckbert Jankowski. www.iit.tu-cottbus.de
08 Datenbanken Übung SQL Einführung Eckbert Jankowski www.iit.tu-cottbus.de Datenmodell (Wiederholung, Zusammenfassung) Objekte und deren Eigenschaften definieren Beziehungen zwischen den Objekten erkennen/definieren
MehrVorlesung Datenbankmanagementsysteme
Vorlesung Datenbankmanagementsysteme SQL zur Datenanalyse & Einführung Online Analytical Processing (OLAP) (auf Basis von Oracle) Vorlesung Datenbankmanagementsysteme SQL zur Datenanalyse M. Lange, S.
MehrData Warehouse Grundlagen
Seminarunterlage Version: 2.10 Version 2.10 vom 24. Juli 2015 Dieses Dokument wird durch die veröffentlicht.. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen sind Warenzeichen
MehrKlausur Konzeptionelle Modellierung
Klausur Konzeptionelle Modellierung Braindump Wintersemester 2012/2013 Inhaltsverzeichnis 1 Allgemeines 2 1.1 Begriffe............................... 2 1.2 Konzeptionelles Schema..................... 2
MehrDas relationale Modell (Teil 1)
Vorlesung #2 Das relationale Modell (Teil 1) Fahrplan WS 2010/11 Feedback Vorlesung#1 Das relationale Modell Einordnung (wir überspringen die Modellierung, das kommt im 4. Semester Datenmanagement ) Definition,
MehrMultidimensionales Datenmodell
Multidimensionales Datenmodell Grundbegriffe fi Fakten, Dimensionen, Würfel Analyseoperationen fi Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung fi ME/R, ADAPT Relationale
MehrDWH Best Practices das QUNIS Framework 80 Jahre Erfahrung bei der Modellierung & dem Betrieb von DWH. Referent: Ilona Tag
DWH Best Practices das QUNIS Framework 80 Jahre Erfahrung bei der Modellierung & dem Betrieb von DWH Referent: Ilona Tag Agenda 10.00 10.30 Begrüßung & aktuelle Entwicklungen bei QUNIS 10.30 11.00 11.00
MehrDiskrete Strukturen Kapitel 4: Graphentheorie (Bäume)
WS 2016/17 Diskrete Strukturen Kapitel 4: Graphentheorie (Bäume) Hans-Joachim Bungartz Lehrstuhl für wissenschaftliches Rechnen Fakultät für Informatik Technische Universität München http://www5.in.tum.de/wiki/index.php/diskrete_strukturen_-_winter_16
MehrInhalt. 1 Einleitung Warum dieses Buch? Der rote Faden Danksagung URL zum Buch 4. TEIL I Einführung 5
Inhalt 1 Einleitung 1 1.1 Warum dieses Buch? 1 1.2 Der rote Faden 2 1.3 Danksagung 3 1.4 URL zum Buch 4 TEIL I Einführung 5 2 XML-Grundlagen 7 2.1 Einleitung 7 2.2 WasistXML? 7 2.3 Dokumenttypen und Namensräume
MehrData Warehouse schnell gemacht Performanceaspekte im Oracle DWH
Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH Dani Schnider Principal Consultant Business Intelligence BI Trilogie, Zürich/Basel 25./26. November 2009 Basel Baden Bern Lausanne Zürich
MehrInhaltsverzeichnis. Teil I OLAP und der Microsoft SQL-Server 1. 1 Theoretische Grundlagen 3
vii Teil I OLAP und der Microsoft SQL-Server 1 1 Theoretische Grundlagen 3 1.1 Was ist OLAP?......................................... 3 1.1.1 Business Intelligence............................... 4 1.1.2
MehrMultikonferenz Wirtschaftsinformatik 2004
Multikonferenz Wirtschaftsinformatik 2004 Grafische Repräsentation mehrdimensionaler Datenmodelle des SAP Business Information Warehouse Dr. Michael Hahne, cundus AG Essen, 9. März 2004 cundus AG 2004
MehrEinführung in die Datenorganisation. Informationssysteme
Einführung in die Datenorganisation Informationssysteme Informationen Sind Kenntnisse über Sachverhalte Daten sind abgelegte Informationen Nachrichten sind Informationen zur Weitergabe Drei Betrachtungsebenen
MehrMehrwegbäume Motivation
Mehrwegbäume Motivation Wir haben gute Strukturen (AVL-Bäume) kennen gelernt, die die Anzahl der Operationen begrenzen Was ist, wenn der Baum zu groß für den Hauptspeicher ist? Externe Datenspeicherung
MehrDie richtige Grafik als Zauberstab zur Mart Modellierung Referat vom
Die richtige Grafik als Zauberstab zur Mart Modellierung Referat vom 22.11.2016 Peter Brunner,NTTData Dr. Andrea Kennel, InfoPunkt Kennel GmbH Copyright 2014 NTT DATA EMEA Ltd. Die richtige Grafik als
MehrDaniel Warner SQL. Das Praxisbuch. Mit 119 Abbildungen. Franzis
Daniel Warner SQL Das Praxisbuch Mit 119 Abbildungen Franzis Inhaltsverzeichnis Teil I - Einleitung 15 1 Einleitung 17 1.1 Zum Aufbau des Buchs 17 1.2 Hinweise zur Buch-CD 18 1.3 Typografische Konventionen
MehrAusgabe: Eine DBMS unabhängige high-level Repräsentation der Anforderungen, das "konzeptuelle Schema".
Phasen des Datenbanken-Designs Konzeptuelles Design Eingabe: Anforderungen Ausgabe: Eine DBMS unabhängige high-level Repräsentation der Anforderungen, das "konzeptuelle Schema". Qualität: Richtigkeit und
MehrErfolg mit Oracle BI?
Erfolg mit Oracle BI? Typische Fehlerszenarien und deren Lösung Gerd Aiglstorfer G.A. itbs GmbH Das Thema 2 Oracle BI (OBIEE)? Das war eine Fehlentscheidung! Viel zu umständlich! Wenig Flexibilität & teure
MehrWirtschaftsinformatik 2 (PWIN) Übung 4. Wirtschaftsinformatik 2 (PWIN) SS2010, Professur für Mobile Business & Multilateral Security 1
Wirtschaftsinformatik 2 (PWIN) Übung 4 Entwicklung von IS Wirtschaftsinformatik 2 (PWIN) SS2010, Professur für Mobile Business & Multilateral Security 1 Überblick Entwicklung von Informationssystemen 25.5.
Mehrgood. better. outperform.
good. better. outperform. Quo Vadis Oracle BI Relational oder besser multidimensional? DOAG 2013 Business Intelligence, 17.04.2013 Dirk Fleischmann Director Business Intelligence & DWH Business Intelligence
MehrWie modelliere ich mein Core Data Warehouse?
Wie modelliere ich mein Core Data Warehouse? Dani Schnider Trivadis AG Zürich/Glattbrugg, Schweiz Schlüsselworte: Data Warehouse, Datenmodellierung, Historisierung Einleitung Das Core dient im Data Warehouse
MehrPraxishandbuch SAP BW 3-1
Norbert Egger Praxishandbuch SAP BW 3-1 Technische Universität DarmsUdt FACHBEREICH INFORMATIK BIBLIOTHEK Inventar-Nr.: Ä/A< Sachgebiete: Standort- Co Galileo Press Inhalt Vorwort 13 Zu diesem Buch 17
MehrWS 2013/14. Diskrete Strukturen
WS 2013/14 Diskrete Strukturen Prof. Dr. J. Esparza Lehrstuhl für Grundlagen der Softwarezuverlässigkeit und theoretische Informatik Fakultät für Informatik Technische Universität München http://www7.in.tum.de/um/courses/ds/ws1314
MehrOracle SQL Developer Data Modeling
Oracle SQL Developer Data Modeling DOAG Regio Rhein-Neckar Oracle Deutschland GmbH The following is intended to outline our general product direction. It is intended for information
MehrA Big Data Change Detection System. Carsten Lanquillon und Sigurd Schacht
A Big Data Change Detection System Carsten Lanquillon und Sigurd Schacht Digitale Transformation in Unternehmen u Umfassende Erfassung, Speicherung und Verfügbarkeit von Daten à Big Data Quelle: Rolland
MehrHetero-Homogene Data Warehouses
Hetero-Homogene Data Warehouses TDWI München 2011 Christoph Schütz http://hh-dw.dke.uni-linz.ac.at/ Institut für Wirtschaftsinformatik Data & Knowledge Engineering Juni 2011 1 Data-Warehouse-Modellierung
MehrSemi-Skylines und Skyline Snippets
Skyline von Manhattan, NY, USA Semi-Skylines und Skyline Snippets Markus Endres Universität Augsburg 10. Februar 2011 Skyline Queries Finde preiswerte Hotels in Strandnähe! Distance to the beach [km] 2.0
MehrEinleitung 19. Teil I Einführung in Datenbanksysteme 25. Kapitel 1 Wozu Datenbanksysteme da sind 27
Inhaltsverzeichnis Einleitung 19 Über dieses Buch 19 Konventionen in diesem Buch 20 Was Sie nicht lesen müssen 21 Törichte Annahmen über den Leser 21 Wie dieses Buch aufgebaut ist 22 Teil I: Einführung
MehrDWH Automatisierung mit Data Vault 2.0
DWH Automatisierung mit Data Vault 2.0 Andre Dörr Trevisto AG Nürnberg Schlüsselworte Architektur, DWH, Data Vault Einleitung Wenn man die Entwicklung von ETL / ELT Prozessen für eine klassische DWH Architektur
MehrDM03: Datenmodellierung im Data Warehouse (Eintägiges Seminar)
DM03: Datenmodellierung im Data Warehouse (Eintägiges Seminar) Ein Seminar der DWH academy Seminar DM03 - Datenmodellierung im Data Warehouse (1 Tag) Normalisierung, Star- und Snowflake sind bekannte Schlagwörter
Mehr