3. Mehrdimensionale Datenmodellierung. Kennzahlen
|
|
- Nelly Wilhelmine Schenck
- vor 6 Jahren
- Abrufe
Transkript
1 3. Mehrdimensionale Datenmodellierung Grundlagen Kennzahlen, Dimensionen, Cube Cuboide / Aggregationsgitter hierarchische Dimensionen / Konzepthierarchien CubeOperationen Multidimensionale Speicherung (MOLAP) MDX Relationale Repräsentation mehrdimensionaler Daten (ROLAP) StarSchema Varianten: Snowflake, GalaxienSchema Anfragen: Star Join, RollUp, DrillDown CubeOperator, RollupOperator, Grouping Sets Prof. E. Rahm 3 1 Kennzahlen auch: Fakten, Meßgrößen, Measures, Measured Facts Kennzahl ist Größe mit konzentrierter Aussagekraft zur Diagnose, Überwachung und Steuerung eines Sstems meist betriebswirtschaftliche Größen Bsp.: Umsatz / Gewinn / Rentabilität komplexe Beziehungen zwischen Kennzahlen möglich Kennzahlen besitzen beschreibende Attribute, z.b. Einheit, Wertebereich, Berechnungsvorschrift Arten von Kennzahlen additive Kennzahlen: additive Aggregation hinsichtlich aller Dimensionen möglich semiadditive Kennzahlen: additive Aggregation nur hinsichtlich ausgewählter Dimensionen möglich nichtadditive Kennzahlen (Bsp. Durchschnittswerte, Prozentanteile) Prof. E. Rahm 3 2
2 Dimensionen Zahlenwert einer Kennzahl ohne zugehörigen semantischen Bezug nichtssagend Dimensionen setzen Kennzahlen in Bezug zu Eigenschaften / sachlichen Kriterien Sachsen Bücher Wo? Mit was? Umsatz = EUR Wann? 1. Quartal Dimension: Datentp, i.a. endlich (z.b. Aufzählung) Beispiele: Menge aller e, en, Kunden, perioden etc. Attribute: Klassifikations/Kategorienattribute (inkl. eines Primärattributs) sowie dimensionale Attribute (zusätzliche beschreibende Eigenschaften, z.b. farbe / Gewicht Dimensionselement: Element / Ausprägung / Wert zu einer Dimension (z.b. bestimmtes ) Prof. E. Rahm 3 3 Data Cube Datenwürfel bzw. OLAPWürfel (Cube), Data Cube Dimensionen: Koordinaten Kennzahlen: Zellen im Schnittpunkt der Koordinaten Cube bezüglich Dimensionen D1, Dn und k Kennzahlen (Fakten): W = { (d 1, d n ), (f 1, f k ), Dimensionselement d i aus D i, i= 1.. n, Kennzahlen f j, j = 1..k)} eindeutige ZellenAdresse: (d 1, d n ) ZellenInhalt: (f 1, f k ) n: Dimensionalität des Cube Alternative: k Cubes mit je einer Kennzahl pro Zelle (MultiCube) tpischerweise 4 12 Dimensionen dimension fast immer dabei weitere Standarddimensionen:, Kunde, Verkäufer,, Lieferant, Q 2Q 3Q 4Q Ost West Nord Süd Sonstiges PC Video TV Prof. E. Rahm 3 4
3 TabellenDarstellung von Cubes direkte Umsetzung für 2 Dimensionen (2DSicht auf x ) = Quartal1 = Quartal2 Ost Süd West Ost Süd West Dimensionen: mehrere 2DTabellen bzw. geschachtelte Tabellen bzw. 3DCube Ost Süd West 1 Quartal 1 Quartal Quartal 1 Quartal Prof. E. Rahm 3 5 Quartal 1 Quartal CubeDarstellung 4DCube kann als Menge von 3DCubes dargestellt werden Lieferant = L1 Lieferant = L2 Lieferant = L3 allgemein: Ndimensionaler Cube entspricht Menge von (N1)dimensionalen SubCubes oder Cuboiden ( Quadern ) BasisCuboid: ndimensionaler Cube ScheitelCuboid: 0dimensionale Aggregation über alle Dimensionen aus BasisCuboid lassen sich Cuboiden geringerer Dimensionsanzahl ableiten > Data Cube entspricht Verband (Lattice) von Cuboiden Ndimensionaler Cube hat 2 N Cuboiden inkl. BasisCuboid (ohne Berücksichtigung von Dimensionshierarchien) Prof. E. Rahm 3 6
4 Cube: Verband von Cuboiden All 0D(Scheitel) Cuboid Lieferant 1D Cuboiden,,,, Lieferant, Lieferant, Lieferant 2D Cuboiden,,Lieferant,,,,Lieferant Product,, Lieferant 3D Cuboiden,,, Lieferant 4D (Basis)Cuboid Prof. E. Rahm 3 7 Data Cube: 3DBeispiel mit Aggregation TV PC VCR Summe 1Qtr 2Qtr 3Qtr 4Qtr Gesamtjahresabsatz für TV in West Summe West Süd Ost Summe Prof. E. Rahm 3 8
5 Zugehörige Cuboiden (Aggregationsgitter) All 0D (Scheitel) Cuboid 1D Cuboiden,,, 2D Cuboiden,, 3D (Basis)Cuboid Prof. E. Rahm 3 9 Dimensionshierarchien (Konzepthierarchien) häufig hierarchische Beziehungen zwischen Dimensionsobjekten TopLevel pro Hierarchie für alle Dimensionselemente (Gesamt, Top, All) Primärattribut: unterste (genaueste) Stufe funktionale Abhängigkeiten zwischen Primärattribut und Klassifikationsattributen höherer Stufen Beispiele Gesamt Gesamt Gesamt Jahr Branche Kontinent Quartal gruppe Land Monat familie Bezirk Tag Ort Dimensionen haben neben Klassifikations(Hierarchie)attributen meist noch beschreibende dimensionale Attribute Prof. E. Rahm 3 10
6 Beispiel einer Konzepthierarchie () (Gesamt) abgeleitete (verdichtete) Elemente Gebiet Ost Ort Leipzig Basiselemente (unabhängige Dimensionselemente) einfache Hierarchie (pro Element höchstens ein übergeordnetes Element) vs. parallele Hierarchie bzw. Halbordnung Prof. E. Rahm 3 11 Konzepthierarchien (3) Hierarchien sind meist auf Schemaebene durch Klassifikationsattribute und deren funktionalen Abhängigkeiten gegeben Variante: Hierarchiebildung durch Wertegruppierungen / Diskretisierungen ( Setgrouping Hierarchies ) können Auswertungen vereinfachen günstige Einteilungen auf Basis vorhandener Werte teilweise automatisch berechenbar Alter (Gesamt) 030 (jung) mittel alt Prof. E. Rahm 3 12
7 Cube mit hierarchischen Dimensionen Land Ort Gesamt gruppe Branche Gesamt Monat Quartal Jahr Prof. E. Rahm 3 13 Operationen auf Cubes Slice: Herausschneiden von Scheiben aus dem Würfel durch Einschränkung (Selektion) auf einer Dimension Verringerung der Dimensionalität Dice: Herausschneiden einen Teilwürfels durch Selektion auf mehreren Dimensionen leitersicht Controller Sicht Umsatzdaten alleitersicht unterschiedlichste mehrdimensionale Aggregationen / Gruppierungen Pivot (Austausch von Dimensionen), Sortierung, TopnAnfragen, Prof. E. Rahm 3 14 AdHoc Sicht
8 Beispiele: Slice / Pivot Prof. E. Rahm 3 15 Quelle: J. Han, M. Kamber: Data Mining,Morgan Kaufmann, 2001 Beispiel: Dice Prof. E. Rahm 3 16
9 Navigation in Hierarchien DrillDown Navigation nach unten in der Hierarchie Erhöhung des Detailgrad: von verdichteten Daten zu weniger verdichteten/aggregierten Daten manchmal auch verwendet für Erhöhung der Dimensionsanzahl RollUp (DrillUp) Navigation nach oben in der Hierarchie von weniger verdichteten (aggregierten) Daten zu stärker verdichteten Daten manchmal auch verwendet für Reduzierung der Dimensionsanzahl (Gesamt) RollUp Land Ort DrillDown Drill across Prof. E. Rahm 3 17 RollUp Prof. E. Rahm 3 18
10 DrillDown Prof. E. Rahm 3 19 DrillDown / RollUp (2D) gruppe Ost Süd Nord West Elektronik Spielwaren Kleidung DrillDown RollUp Elektronik Ost Süd Nord West TV 800 DVDPlaer 500 Camcorder 300 Prof. E. Rahm 3 20
11 Summenbildung Aggregation: 2DBeispiel gruppe Ost Süd Nord West Summe Elektronik Spielwaren Kleidung Summe Vorberechnung (Materialisierung) der Aggregationen zur schnellen Beantwortung von Aggregationsanfragen hoher Speicher und Aktualisierungsaufwand (bei vielen Dimensionselementen) ermöglicht nur kleinen Teil benötigter Aggegationen vorzuberechnen Prof. E. Rahm 3 21 Größe der Cubes Größe der BasisCuboids der Zellen entspricht der Dimensionskardinalitäten D i, i=1..n Beispiel: Tage, e, 1 Million Kunden jede weitere Dimension, z.b. oder Verkäufer, führt zu einer Vervielfachung des Datenraumes Vorberechnung von (aggregierten) Cuboiden erhöht Speicherbedarf Größe eines hierarchisch aggregierten Cubes Aggregierung für jedes Dimensionselement auf einer höheren Hierarchiestufe möglich Kombinationsmöglichkeit mit jedem Element auf einer der Hierarchiestufen der anderen n1 Dimensionen Cuboiden bei ndimensionalem Cube: L i : #Ebenen von Dimension i (ohne TopLevel) T = n ( L i + 1) i = 1 Kunde Gesamt 1 Gesamt 1 Gesamt 1 Quartal 12 Branche 50 Kundengruppe Monat 36 gruppe Einzelkunde 1 Million Tag Prof. E. Rahm 3 22
12 Umsetzung des multidimensionalen Modells Aspekte Speicherung der Daten Formulierung / Ausführung der Operationen MOLAP: Direkte Speicherung in multidimensionalen Speicherungsstrukturen CubeOperationen einfach formulierbar und effizient ausführbar begrenzte Skalierbarkeit auf große Datenmengen ROLAP: relationale Speicherung der Daten in Tabellen effiziente Speicherung sehr großer Datenmengen umständliche Anfrageformulierung StandardSQL nicht ausreichend (nur 1dimensionale Gruppierung, ) HOLAP: hbride Lösung relationale Speicherung der DetailDaten, multidimensionale Zugriffsschnittstelle unterschiedliche Kombinationen mit multidimensionaler Speicherung / Auswertung von aggregierten Daten Vorberechnung von Aggregationen erforderlich für ausreichende Leistung Prof. E. Rahm 3 23 Multidimensionale Datenspeicherung Datenspeicherung in multidimensionaler Matrix direkte Umsetzung der logischen CubeSicht VorabBerechnung und Speicherung der Kennzahlen basierend auf dem Kreuzprodukt aller Wertebereiche der Dimensionen schneller direkter Zugriff auf jede Kennzahl über Indexposition (x 1, x 2, x n ) multidimensional (Kreuztabelle) Sachsen Brandenburg TV DVDPlaer Camcorder Thüringen relational TV Camcorder Brandenburg Sachsen Umsatz Anfragen: Wie hoch ist der Umsatz für DVDPlaer in Thüringen Wie hoch ist der Gesamtumsatz für Camcorder? Prof. E. Rahm 3 24
13 Multidimensionale Datenspeicherung (2) mehrdimensionale Speicherung führt oft zu dünn besetzten Matrizen Beispiel (Kundenumsätze nach en) Kunde Kunde 1 Kunde 2 Kunde 3 Kunde 4 Kunde 5 Kunde 6 Kunde 7 Kunde 8 Kunde 9 REGION B S multidimensional (2dimenstional) NRW 150 SH 170 BW 200 SA 20 MVP 120 HH 100 TH 100 Kunden Kunde 1 Kunde 2 Kunde 3 Kunde 4 Kunde 5 Kunde 6 Kunde 7 Kunde 8 Kunde 9 relational B NRW BW S SH TH SA MVP HH Umsatz vollständig besetzte Matrizen i.a. nur für höhere Dimensionsebenen Unterstützung dünn besetzter Matrizen erforderlich (Leistungseinbussen) Zerlegung eines Cubes in SubCubes ( chunks ), die in Hauptspeicher passen zweistufige Adressierung: ChunkId, Zelle innerhalb Chunk Prof. E. Rahm 3 25 Sprachansatz MDX* MDX: Multidimensional Expressions MicrosoftSpezifikation für CubeZugriffe im Rahmen von OLE DB for OLAP an SQL angelehnt Extraktion von aggregierten SubCubes / Cuboiden aus Cubes Hauptanweisung SELECT [<axis_specification> [, <axis_specification>]] FROM [<cube_specification>] [WHERE [<slicer_specification>]] Beispiele SELECT FROM WHERE.CHILDREN ON COLUMNS,.CHILDREN ON ROWS Verkauf (Umsatz,.[]) SELECT Measures.MEMBERS ON COLUMNS, TOPCOUNT(Filiale.Ort.MEMBERS, 10, Measures.) ON ROWS FROM Verkauf Unterstützung durch Microsoft und zahlreiche ToolAnbieter * Prof. E. Rahm 3 26
14 ERDiagramm eines multidimensionalen Datenmodells KundenNr DatumID KundenName Kunde Tag Geschlecht Monat Jahr Verkauf Nr Umsatz Fname Name Filialen Ort gruppe Land Prof. E. Rahm 3 27 Relationale Speicherung: StarSchema Fakten (Kennzahlen) und Dimensionsdaten werden in Tabellen gehalten Faktentabelle bildet Zentrum des StarSchemas und enthält die DetailDaten mit den zu analsierenden Kennzahlen (analog den Zelleneinträgen einer multidimensionalen Matrix) pro Dimension existiert eine Dimensionstabelle, die nur mit der Faktentabelle verknüpft ist (> sternförmige Anordnung der Tabellen) Kunde KundenNr KundenName Geschlecht Alter 1 1 n n Verkauf KundenNr Nr Datum Filiale Datum Tag Monat Quartal Jahr Nr Name tp Branche Hersteller Farbe Preis 1 n Umsatz n 1 Fname Ort Land Filialen Dimensionstabelle Faktentabelle Dimensionstabelle Prof. E. Rahm 3 28
15 Beispielausprägungen Verkauf Datum 7654 Filiale Leipzig4 Nr 1847 KundenNr Umsatz FName Leipzig4 Ort Leipzig Filialen Land Sachsen Ost KundenNr 4711 Name Weber Kunde Geschlecht M Alter 39 Datum 7654 Tag 25 Monat April Jahr Quartal 2 Nr 1847 name Passat XY tp Auto Hersteller Farbe Blau Preis Prof. E. Rahm 3 29 StarSchema (2) Formale Definition: StarSchema besteht aus einer Menge von Tabellen D 1, D n, F mit Dimensionstabellen D i bestehend aus (i.a. künstlichen) Primärschlüssel d i und Dimensionsattributen Faktentabelle F bestehend aus Fremdschlüsseln d 1, d n sowie Meßgrößen (Kennzahlen) als weiteren Attributen Die Dimensionstabellen sind i.a. denormalisiert, d.h. nicht in dritter Normalform Beobachtungen der Datensätze in Faktentabelle entspricht der belegten Zellen einer multidimensionalen Matrix leere Dimensionskombinationen unproblematisch, da nur relevante Kombinationen in der Faktentabelle auftreten. dennoch oft riesige Faktentabellen Dimensionstabellen vergleichsweise klein, teilweise jedoch auch umfangreich (Kunden, Artikel etc.) Prof. E. Rahm 3 30
16 SnowflakeSchema explizite Repräsentation der Dimensionshierarchien normalisierte Dimensionstabellen leicht geringere Redundanz, geringerer Änderungsaufwand erhöhte Zugriffskosten (höherer JoinAufwand) StarSchema ist SnowflakeSchema meist vorzuziehen PGruppe gruppe Branche Kunde KundenNr KundenName Geschlecht Alter Nr Name tp Hersteller Farbe Preis Verkauf KundenNr Nr Datum Filiale Umsatz Faktentabelle Prof. E. Rahm 3 31 Datum Tag Monat Jahr Filialen Fname Ort MonatQ Monat Quartal OrtL Ort Land Land GalaxienSchema Data Warehouses benötigen meist mehrere Faktentabellen > MultiStarSchema (GalaxienSchema, Fact Constellation Schema ) gemeinsame Nutzung von Dimensionstabellen Speicherung vorberechneter Aggregate separate Faktentabelle im Rahmen der Faktentabelle mit DetailDaten Kunde Filiale Verkauf Einkauf Lieferant Prof. E. Rahm 3 32
17 Behandlung von Änderungen in Dimensionen Änderungsarten neue Dimensionselemente (z.b. neue version) Änderung von Werten zu einem Dimensionselement (z.b. neuer Familienstand/Wohnort von Kunden) neue Hierarchiestufe einer Dimension neue Dimension Behandlung auf SchemaEbene (SchemaEvolution) oder TupelEbene Änderung von Dimensionselementen Lösung 1: Überschreiben der alten Werte (Auswertungen für ältere räume sind verfälscht) Lösung 2: Versionierung von Dimensionselementen auf TupelEbene, z.b. erweiterte Schlüsselwerte Lösung 3: Versionierung auf SchemaEbene (Neue attribute für Gültigkeitszeit, Änderungszeit) Prof. E. Rahm 3 33 Anfragen auf dem StarSchema StarJoin sternförmiger Join der (relevanten) Dimensionstabellen mit der Faktentabelle Einschränkung der Dimensionen Verdichtung der Kennzahlen durch Gruppierung und Aggregation Allgemeine Form aggregierte Kennzahlen select g 1, g k, agg(f 1 ), agg (f m ) from D 1,, D n, F where group b g 1, g k sort b ; <Selektionsbedingung auf D 1 > and and <Selektionsbedingung auf D n > and D 1.d 1 = F.d 1 and and D n.d n = F.d n Relationen des StarSchemas JoinBedingungen ErgebnisDimensionalität Prof. E. Rahm 3 34
18 Beispiel eines StarJoin In welchen Jahren wurden von weiblichen Kunden in Sachsen im 1. Quartal die meisten Autos gekauft? select from where group b order b z.jahr as Jahr, sum (v.) as Gesamtzahl Filialen f, p, z, Kunden k, Verkauf v z.quartal = 1 and k.geschlecht = W and p.tp = Auto and f.land = Sachsen and v.datum = z.datum and v.nr = p.nr and v.filiale = f. FName and v.kundennr = k.kundennr z.jahr Gesamtzahl Descending; Jahr 2004 Gesamtzahl Prof. E. Rahm 3 35 Mehrdimensionale Aggregationen mit GroupB Attributanzahl in group bklausel bestimmt Dimensionalität select Hersteller, Jahr, sum () as from Verkauf v, p, z where v.nr = p.nr and v.datum= z.datum and p.tp = Auto group b Hersteller, Jahr; select Hersteller, sum () as from Verkauf v, p where v. = p. Nr and and p. tp = Auto group b Hersteller; select sum () as from Verkauf v, p where v. = p. Nr and p. tp = Auto ; Prof. E. Rahm 3 36 Hersteller BMW Ford Ford Ford Hersteller Ford BMW Jahr
19 Relationale Speicherung aggregierter Werte Kreuztabelle (CrosstabDarstellung) Jahr Hersteller BMW Ford Σ Prof. E. Rahm 3 37 Σ relationale Darstellung (2DCube) Hersteller BMW BMW BMW Ford Ford Ford BMW Ford Jahr Materialisierung von Aggregaten create table Auto2DCube (Hersteller varchar (20), Jahr integer, integer); insert into Auto2DCube (select p.hersteller, z.jahr, sum (v. ) from Verkauf v, p, z where v.nr = p.nr and p.tp = Auto and v.datum = z.datum group b z.jahr, p.hersteller) union (select p.hersteller,, sum (v.) from Verkauf v, p where v.nr = p.nr and p.tp = Auto group b p. Hersteller) union (select, z. Jahr, sum (v.) from Verkauf v, p, p where v.nr = p Nr and p.tp = Auto and v.datum = z.datum group b z. Jahr) union (select,, sum (v.) from Verkauf v, p where v.nr = p. Nr and p.tp = Auto ); Prof. E. Rahm 3 38
20 CubeOperator SQLErweiterung um CUBEOperator für ndimensionale Gruppierung und Aggregation Sntax: Group B CUBE (D 1, D 2, D n ) generiert als Ergebnis eine Tabelle mit aggregierten Ergebnissen (Tupel) implementiert in MS SQLServer, DB2, Oracle erspart mehrfache Berechnung der Aggregationen erspart 2 n unionanfragen (bei n Attributen in der group bklausel / n Dimensionen) einfache Formulierung von Anfragen effiziente Berechenbarkeit durch DBS (Wiederverwendung von Zwischenergebnisse) Beispiel select p. Hersteller, z. Jahr, k.geschlecht, sum (v. ) from Verkauf v, p, z, Kunde k where v.nr = p. Nr and p.tp = Auto and v.datum = z.datum group b cube (p.hersteller, z.jahr, k.geschlecht); Prof. E. Rahm DCube in relationaler Form Hersteller Jahr Geschl Hersteller Jahr Geschl BMW m w m w m m w CUBE Ford Ford 2001 m w m w m m Prof. E. Rahm 3 40
21 CubeAggregatgitter Dimensionalität (,, ) 0 (Hersteller,, ) (, Jahr, ) (,, Geschlecht) 1 (Hersteller, Jahr, ) (Hersteller,, Geschlecht) (, Jahr, Geschlecht) 2 (Hersteller, Jahr, Geschlecht) 3 niedrigdimensionale Aggregate / Cuboiden können aus höherdimensionalen abgeleitet werden Materialisierung / Caching häufiger benutzter Aggregate ermöglicht Anfrageoptimierung Prof. E. Rahm 3 41 ROLLUPOperator CUBEOperator: interdimensionale Gruppierung / Aggregierung generiert Aggregate für alle 2 n Kombinationsmöglichkeiten bei n Dimensionen zu aufwendig für RollUp / DrillDown innerhalb einer Dimension ROLLUPOperator: intradimensionale Aggregierung ROLLUP zu a1, a2,, an, f () liefert nur die Cuboide a1, a2,, an1,, f (), a1,,,, f (), (,, ),,,, f () Reihenfolge der Attribute relevant! Beispiel (Hersteller,, ) 0 1 select p. Hersteller, p. Marke, p.farbe, sum (v. ) from Verkauf v, Filiale p where v.nr = p. Nr and p.hersteller in (, ) group b rollup (p.hersteller, p.marke, p.farbe); (Hersteller, Marke, ) (Hersteller, Marke, Farbe) 2 3 Prof. E. Rahm 3 42
22 ROLLUPBeispiel Hersteller Marke Passat Passat Passat Golf Golf Golf Vectra Vectra Vectra Farbe rot weiß blau rot weiß blau rot rot weiß blau ROLLUP Hersteller Marke Passat Passat Passat Golf Golf Golf Vectra Vectra Vectra Passat Golf Vectra Farbe rot weiß blau rot weiß blau rot rot weiß blau Prof. E. Rahm 3 43 Grouping Sets mehrere Gruppierungen pro Anfrage GROUP BY GROUPING SETS ( <Gruppenspezifikationsliste> ) Gruppenspezifikation: (<Gruppenspezifikationsliste> ) CUBE <Gruppenspezifikationsliste> ROLLUP <Gruppenspezifikationsliste> leere Spezifikationsliste ( ) möglich: Aggregation über gesamte Tabelle Beispiel Hersteller Farbe select p. Hersteller, p.farbe, sum (v. ) from Verkauf v, p where v.nr = p. Nr and p.hersteller in (, ) groupbgroupingsets((p.hersteller), (p.farbe)); blau rot weiß CUBE, ROLLUP, herkömmliches GroupB entsprechen speziellen GroupingSets Prof. E. Rahm 3 44
23 Einzelschritte beim Entwurf eines multidimensionalen Schemas Welche Geschäftsprozesse sollen modelliert und analsiert werden? Festlegung der Kennzahlen Wo kommen sie her? Granularität der Fakten. Welche OLAPGenauigkeit ist notwendig? Bestimmung der Dimensionen Gemeinsame Eigenschaften der Kennzahlen Spezifikation der Dimensionsattribute Konstante vs. sich ändernde Dimensionsattribute Etablierung / Verwendung einer einheitlichen Terminologie Phsische DesignEntscheidungen Architektur (ROLAP/MOLAP/HOLAP) vorzuberechnende Aggregationen Speicherbedarf ermitteln Festlegung der Dauer der Historie, Behandlung alter Daten Aktualisierungsfrequenz bezüglich der Quellssteme Prof. E. Rahm 3 45 Prof. E. Rahm 3 46 Zusammenfassung Einfachheit des multidimensionalen Modellierungsansatzes wesentlich für Erfolg von Data Warehousing CubeRepräsentation mit Kennzahlen und hierarchischen Dimensionen Operationen: Slice and Dice, RollUp, DrillDown, Multidimensionale Speicherung Problem dünn besetzter Matrizen primär für aggregierte Daten relevant, weniger zur Verwaltung von DetailFakten Relationale Speicherung auf Basis von StarSchemas Unterstützung großer Datenmengen, Skalierbarkeit neue Anforderungen bezüglich effizienter Verarbeitung von StarJoins, mehrdimensionale Gruppierung und Aggregation Vorberechnung aggregierter Daten wesentlich für ausreichende Leistung Sprachansätze MDXAnweisungen für Cubes SQLErweiterungen: CUBE, ROLLUPOperator
24 Übungsaufgabe: WarehouseEntwurf a) Erstellen Sie ein StarSchema für ein großes deutsches Telefonunternehmen. Es soll Auswertungen über Anrufhäufigkeiten, generierte Umsätze und Dauer der Gespräche für die einzelnen Tarifarten über unterschiedliche en (Tageszeiten, Wochentage, Monate, Jahre) ermöglichen. Die Teilnehmer werden über ihre Adressen bzw. Telefonnummern Orten sowie Bundesländern zugeordnet. Es werden die üblichen Personenmerkmale für Analsezwecke erfasst, insbesondere Alter, Geschlecht und Beruf. b) Schätzen Sie den Speicherbedarf für eine Aufzeichnungsdauer von 3 Jahren, 40 Millionen Teilnehmern und durchschnittlich 10 Gesprächen pro Tag und Teilnehmer. c) Wie lautet für das Schema aus a) die SQLAnfrage zur Bestimmung des Umsatzes aller sächsischen Ferngespräche am Abend nach Tarif AKTIV++ für jeden Monat im Jahr? Prof. E. Rahm 3 47 Übungsaufgabe 2 Bestimmen Sie für die gezeigte Tabelle Goals das Ergebnis folgender SQL Anfragen: Select Spieler, Saison, Sum () as Tore From Goals Group BY ROLLUP (Spieler, Saison); Select Spieler, Saison, Sum () as Tore From Goals Group BY CUBE (Spieler, Saison); Select Spieler, Saison, Sum () as Tore From Goals Group BY GROUPING SETS ((Spieler), (Saison),()); Spieler Elber Elber Elber Scholl Scholl Scholl Scholl Scholl Saison Prof. E. Rahm 3 48
Data Warehousing. und Operationen. Dr. Andreas Thor Wintersemester 2009/10. Universität Leipzig Institut für Informatik.
Data Warehousing Kapitel 3: Mehrdimensionale Datenmodellierung und Operationen Dr. Andreas Thor Wintersemester 2009/10 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de WS09/10, Prof.
MehrData Warehousing Kapitel 3: Mehrdimensionale Datenmodellierung
Data Warehousing Kapitel 3: Mehrdimensionale Datenmodellierung und Operationen Michael Hartung Sommersemester 2011 Universität Leipzig Institut für Informatik y y y http://dbs.uni-leipzig.de SS11, Prof.
Mehr3. Mehrdimensionale Datenmodellierung. Cb Cube-Operator, Rollup-Operator, Grouping Sets SS08, Prof. Dr. E. Rahm 3-1 y yy
3. Mehrdimensionale Datenmodellierung und Operationen Grundlagen Kennzahlen, e, Dimensionen, esoe,cube Cuboide / Aggregationsgitter hierarchische Dimensionen / Konzepthierarchien Cube-Operationen Multi-dimensionale
Mehr3. Mehrdimensionale Datenmodellierung und Operationen Grundlagen
3. Mehrdimensionale Datenmodellierung und Operationen Grundlagen Kennzahlen, Dimensionen, Cube Cuboide / Aggregationsgitter hierarchische Dimensionen / Konzepthierarchien Cube-Operationen Multi-dimensionale
MehrDatenbanksysteme 2009
Datenbanksysteme 2009 Kapitel 17: Data Warehouse Oliver Vornberger Institut für Informatik Universität Osnabrück 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen
MehrAnfragen an multidimensionale Daten
Anfragen an multidimensionale Daten Alexander Heidrich - BID8 09.06.2005 Hintergrundbild: http://www.csc.calpoly.edu/~zwood/teaching/csc471/finalproj02/afternoon/mfouquet/cube.jpg Inhaltsübersicht Motivation
MehrKapitel 17: Date Warehouse
Kapitel 17: Date Warehouse 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen kleine, kurze Transaktionen jeweils auf jüngstem Zustand OLAP (Online Analytical
MehrUnterstützung der Unternehmenssteuerung durch Data Warehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen
Rückblick Unterstützung der Unternehmenssteuerung durch Data arehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen Online Transaction Processing (OLTP) und Online Analytical Processing unterscheiden
MehrData Cubes PG Wissensmangement Seminarphase
PG 402 - Wissensmangement Seminarphase 23.10.2001-25.10.2001 Hanna Köpcke Lehrstuhl für Künstliche Intelligenz Universität Dortmund Übersicht 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit
MehrDas Multidimensionale Datenmodell
Das Multidimensionale Datenmodell Konzeptuelle Modellierung Umsetzung des Modells Beispiel ER-Modell 2 / 36 Probleme ER-Modellierung Keine Unterscheidung Klassifikation, Attribute, Kenngrößen Dimension
MehrMultidimensionales Datenmodell
Multidimensionales Datenmodell Grundbegriffe fi Fakten, Dimensionen, Würfel Analyseoperationen fi Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung fi ME/R, ADAPT Relationale
MehrEinführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.
Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen
MehrBusiness Intelligence & Reporting. Michael Cordes Holger Oehring Matthias Rein
Business Intelligence & Reporting Michael Cordes Holger Oehring Matthias Rein Ziele Einführung Business Intelligence / Front Room Online Analytical Processing (OLAP) Arten des Reporting & Nutzergruppen
MehrData Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube
Fragen des Marketingleiters Data Warehousing Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt nach? Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon Technisch
MehrThemenblock: Erstellung eines Cube
Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen
MehrVorlesung Wissensentdeckung in Datenbanken
Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Uwe Ligges Informatik LS 8 22.04.2010 1 von 26 Gliederung 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der
MehrData Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen
Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen (Folien von A. Kemper zum Buch 'Datenbanksysteme') Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP
MehrEinführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH
Einführung in OLAP und Business Analysis Gunther Popp dc soft GmbH Überblick Wozu Business Analysis mit OLAP? OLAP Grundlagen Endlich... Technischer Background Microsoft SQL 7 & OLAP Services Folie 2 -
MehrData Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de
Data Warehouses Sommersemester 2011 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen Data Warehouse Architektur Data-Warehouse-System Teilsichten
MehrData Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:
Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse
MehrData Warehousing. Beispiel: : Amazon. Aufbau eines DWH OLAP <-> OLTP Datacube. FU-Berlin, DBS I 2006, Hinze / Scholz
Data Warehousing Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon 2 1 Datenbank 3 Fragen des Marketingleiters Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt
MehrKapitel 7 Grundlagen von Data
LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS DATABASE Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2014 Kapitel 7 Grundlagen von Data Warehouses Vorlesung: PD
MehrKapitel 6 Einführung in Data Warehouses
Kapitel 6 Einführung in Data Warehouses Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2008, LMU München 2008 Dr. Peer Kröger Dieses Skript basiert zu einem Teil auf dem Skript zur Vorlesung
MehrOLTP: Online Transaction Processing
Moderne Betriebliche Anwendungen von Datenbanksystemen Online Transaction Processing (bisheriger Fokus) Data Warehouse-Anwendungen Data Mining OLTP: Online Transaction Processing Beispiele Flugbuchungssystem
MehrOnline Kurse Modulbeschreibungen
Online Kurse Modulbeschreibungen K0100 SQL Basics M0101 DB Theorie Dieses Modul führt in die Thematik von Datenbanken und deren grundlegenden Begriffen und Konzepten ein. Es werden Fragen beantwortet,
MehrBetriebliche Anwendungen
Betriebliche nwendungen SP R/3: Enterprise Resource Modelling (ERP-System) OLTP Data Warehouse Data Mining WN (Internet) LN Kapitel 17 1 Relationales DBMS als Backend-Server (Oracle, Informix, DB2, MS
MehrAufgabe 1: [Logische Modellierung]
Aufgabe 1: [Logische Modellierung] a) Entwerfen Sie für das von Ihnen entworfene Modell aus Aufgabe 2 des 1. Übungsblattes ein Star-Schema. b) Entwerfen Sie für das vorangegangene Modell einen Teil eines
MehrData Warehousing. Ausführung von OLAP Operationen. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Ausführung von OLAP Operationen Ulf Leser Wissensmanagement in der Bioinformatik Variante 1 - Snowflake Year id year Productgroup id pg_name Month Id Month year_id Day Id day month_id
MehrData Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:
Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse
MehrFrühjahrsemester 2011. Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil
Frühjahrsemester Data Warehousing Kapitel 5: Data Warehousing H. Schuldt Wiederholung aus Kapitel 5. Einführung Tresgros Tresgros Tresgros Filiale Muttenz Filiale Allschwil Filiale Liestal Anfragen: Welches
MehrMultidimensionales Datenmodell, Anfrageverarbeitung und Anfrageoptimierung
Multidimensionales Datenmodell, Anfrageverarbeitung und Anfrageoptimierung Grundbegriffe Dimensionen, Fakten/Kennzahlen Eigenschaften von multidimensionalen Anfragen Relationale Umsetzung von Anfragen
MehrData-Warehouse-Technologien
Data-Warehouse-Technologien Prof. Dr.-Ing. Kai-Uwe Sattler 1 Prof. Dr. Gunter Saake 2 Dr. Veit Köppen 2 1 TU Ilmenau FG Datenbanken & Informationssysteme 2 Universität Magdeburg Institut für Technische
MehrKomponenten und Architekturen von Analytischen Informationssystemen (AIS)
Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation 27. Juni 2013 Hinweis Diese Folien ersetzen keinesfalls den Übungsstoff des zugehörigen e-learning-kurses.
MehrHetero-Homogene Data Warehouses
Hetero-Homogene Data Warehouses TDWI München 2011 Christoph Schütz http://hh-dw.dke.uni-linz.ac.at/ Institut für Wirtschaftsinformatik Data & Knowledge Engineering Juni 2011 1 Data-Warehouse-Modellierung
MehrData Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY
Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung
MehrDatenbanksysteme 2 Frühjahr-/Sommersemester 2014 28. Mai 2014
Lehrstuhl für Praktische Informatik III Prof. Dr. Guido Moerkotte Email: moer@db.informatik.uni-mannheim.de Marius Eich Email: marius.eich@uni-mannheim.de Datenbanksysteme 2 8. Übungsblatt Frühjahr-/Sommersemester
MehrData Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:
Kapitel 16 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining operationale DB operationale DB operationale DB Data Warehouse operationale
MehrKapitel 5: Vom relationalen zum multidimensionalen Datenmodell
Data Warehousing, Gliederung Kapitel 5: Vom relationalen zum multidimensionalen Datenmodell Dimensionen und Measures Schematypen für Data Warehousing Groupy und Data Cubes Operatoren für den Data Cube
MehrKomponenten und Architekturen von Analytischen Informationssystemen (AIS)
Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation Zusammenfassung OPAL 6. Übung Juni 2015 Agenda Hinweise zur Klausur Zusammenfassung OPAL Übungen / Kontrollfragen
MehrFrühjahrsemester 2010. Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil
Frühjahrsemester Data Warehousing Kapitel 5: Data Warehousing H. Schuldt Wiederholung aus Kapitel 5. Einführung Tresgros Tresgros Tresgros Filiale Muttenz Filiale Allschwil Filiale Liestal Anfragen: Welches
MehrData Warehouse Grundlagen
Seminarunterlage Version: 2.10 Version 2.10 vom 24. Juli 2015 Dieses Dokument wird durch die veröffentlicht.. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen sind Warenzeichen
MehrOLAP und Data Warehouses
OLP und Data Warehouses Überblick Monitoring & dministration Externe Quellen Operative Datenbanken Extraktion Transformation Laden Metadaten- Repository Data Warehouse OLP-Server nalyse Query/Reporting
MehrHinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen Fragen Vertiefung Modellierung
Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation Zusammenfassung OPAL 24. Juni 2014 Agenda Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen
MehrKapitel 5: Vom relationalen zum multidimensionalen Datenmodell
Kapitel 5: Vom relationalen zum multidimensionalen Datenmodell Data Warehousing und Mining 1 Data Warehousing, Gliederung Dimensionen und Measures Schematypen für Data Warehousing GroupBy und Data Cubes
MehrKapitel 5: Vom relationalen zum multidimensionalen Datenmodell
Data Warehousing, Gliederung Kapitel 5: Vom relationalen zum multidimensionalen Datenmodell Dimensionen und Measures Schematypen für Data Warehousing GroupBy und Data Cubes Operatoren für den Data Cube
Mehr7. XML-Datenbanksysteme und SQL/XML
7. XML-Datenbanksysteme und SQL/XML Native XML-DBS vs. XML-Erweiterungen von ORDBS Speicherung von XML-Dokumenten Speicherung von XML-Dokumenten als Ganzes Generische Dekomposition von XML-Dokumenten Schemabasierte
MehrAnfragen in Operativen Systemen und Data Warehouses
Data Warehouses Sommersemester 011 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen Anfragen in Operativen Systemen und Data Warehouses Anfragen Operative
MehrData Warehouse Technologien
Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............
Mehrd.h. zu Definitions-Stelle eindeutiger Funktionswert x X! y Y : (x,y) f umgekehrt: (x 1,y), (x 2,y) f ist o.k. X Y f(x) = y
Kapitel 7 Normalformen und DB-Entwurf Kap. 7.1 Normalformen Theorie Funktionale Abhängigkeit: f X Y f als Relation, d.h. Menge von Paaren {(x,y)} x: Definitions-Stelle, y: Funktionswert f ist Funktion
MehrFortgeschrittene OLAP Analysemodelle
Fortgeschrittene OLAP Analysemodelle Jens Kübler Imperfektion und erweiterte Konzepte im Data Warehousing 2 Grundlagen - Datenanalyse Systemmodell Datenmodell Eingaben System Schätzer Datentypen Datenoperationen
MehrVorlesung Datenbankmanagementsysteme
Vorlesung Datenbankmanagementsysteme SQL zur Datenanalyse & Einführung Online Analytical Processing (OLAP) (auf Basis von Oracle) Vorlesung Datenbankmanagementsysteme SQL zur Datenanalyse M. Lange, S.
MehrSeminar Data Warehousing. Seminar. Data Warehousing. Thema: Speichermodelle für Data-Warehouse-Strukturen
Seminar Data Warehousing Thema: Speichermodelle für Data-Warehouse-Strukturen Friedrich-Schiller-Universität Jena Fakultät für Mathematik und Informatik Institut für Informatik Lehrstuhl für Datenbanken
MehrVeit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien
Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...
MehrWiederholung VU Datenmodellierung
Wiederholung VU Datenmodellierung VU Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester
MehrWie modelliere ich mein Core Data Warehouse?
Wie modelliere ich mein Core Data Warehouse? Dani Schnider Trivadis AG Zürich/Glattbrugg, Schweiz Schlüsselworte: Data Warehouse, Datenmodellierung, Historisierung Einleitung Das Core dient im Data Warehouse
MehrAgenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL
Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining 2 Eigenschaften eines Data Warehouse Referenzarchitektur Integrierte Sicht auf beliebige Daten aus verschieden Datenbanken
MehrPartitionierungsstrategien für Data Vault
ierungsstrategien für Data Vault Dani Schnider Trivadis AG Zürich/Glattbrugg, Schweiz Einleitung Während das Laden von Tabellen in Data Vault in der Regel nicht zeitkritisch ist, stellt uns das effiziente
MehrSQL structured query language
Umfangreiche Datenmengen werden üblicherweise in relationalen Datenbank-Systemen (RDBMS) gespeichert Logische Struktur der Datenbank wird mittels Entity/Realtionship-Diagrammen dargestellt structured query
Mehr1 Business-Intelligence-Architektur 1
D3kjd3Di38lk323nnm xi 1 Business-Intelligence-Architektur 1 1.1 Data Warehouse....................................... 1 1.2 OLAP und mehrdimensionale Datenbanken.................. 4 1.3 Architekturvarianten....................................
MehrMotivation. Motivation /2. Dimensionen. Einfache Hierarchien. Hierarchien in Dimensionen. 3. Multidimensionales Datenmodell
3. Multidimensionales Datenmodell Grundbegriffe Dimensionen, Fakten/Kennzahlen, Würfel Analyseoperationen Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung ME/R, ADAPT, graphbasierte
MehrEinleitung. ROLLUP, CUBE und GROUPING. Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002)
Betrifft Autör: GROUPING_ID Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Quelle Aus dem Oracle9i Data Warehousing Guide und den Kursen New Features Oracle9i
Mehrinsert, update, delete Definition des Datenbankschemas select, from, where Rechteverwaltung, Transaktionskontrolle
Einführung in SQL insert, update, delete Definition des Datenbankschemas select, from, where Rechteverwaltung, Transaktionskontrolle Quelle Wikipedia, 3.9.2015 SQL zur Kommunikation mit dem DBMS SQL ist
MehrChristian Kurze BI-Praktikum IBM WS 2008/09
Einführung in die multidimensionale Datenmodellierung e mit ADAPT BI-Praktikum IBM WS 2008/09 1 Gliederung Einführung multidimensionale Datenmodellierung 1. Multidimensionales Modell BI-Praktikum IBM WS
Mehrbersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter
bersicht Niels Schršter EinfŸhrung GROUP BY Roll UpÔs Kreuztabellen Cubes Datenbank Ansammlung von Tabellen, die einen ãausschnitt der WeltÒ fÿr eine Benutzergruppe beschreiben. Sie beschreiben die funktionalen
MehrRealisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier
Realisierung von OLAP Operatoren in einem visuellen Analysetool Vortrag von Alexander Spachmann und Thomas Lindemeier Gliederung Ausgangssituation/Motivation Was ist OLAP? Anwendungen Was sind Operatoren?
MehrThemenblock: Data Warehousing (I)
Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining Agenda Einführung Data Warehouses Online Transactional Processing (OLTP) Datenmanipulation mit SQL Anfragen mit SQL Online
MehrMotivation. Dimensionen. Motivation /2. 3. Multidimensionales Datenmodell
3. Multidimensionales Datenmodell Grundbegriffe Dimensionen, Fakten/Kennzahlen, Würfel Analyseoperationen Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung ME/R, ADAPT, graphbasierte
MehrISU 1. Ue_08/02_Datenbanken/SQL. 08 Datenbanken. Übung. SQL Einführung. Eckbert Jankowski. www.iit.tu-cottbus.de
08 Datenbanken Übung SQL Einführung Eckbert Jankowski www.iit.tu-cottbus.de Datenmodell (Wiederholung, Zusammenfassung) Objekte und deren Eigenschaften definieren Beziehungen zwischen den Objekten erkennen/definieren
MehrMultidimensionales Datenmodell. Motivation. Motivation /2. Grundbegriffe. Analyseoperationen. Notationen zur konzeptuellen Modellierung
Multidimensionales Datenmodell Grundbegriffe Dimensionen, Fakten/Kennzahlen, Würfel Analyseoperationen Drill-Down, Roll-Up, Slice und Dice Notationen zur konzeptuellen Modellierung ME/R,ADAPT,graphbasierteAnsätze
MehrSQL/OLAP und Multidimensionalität in der Lehre
SQL/OLAP und Multidimensionalität in der Lehre Vortrag auf der DOAG 2008 Prof. Dr. Reinhold von Schwerin Hochschule Ulm, Fakultät für Informatik 1. Dezember 2008 Prof. Dr. Reinhold von Schwerin SQL/OLAP
MehrMengenvergleiche: Alle Konten außer das, mit dem größten Saldo.
Mengenvergleiche: Mehr Möglichkeiten als der in-operator bietet der θany und der θall-operator, also der Vergleich mit irgendeinem oder jedem Tupel der Unteranfrage. Alle Konten außer das, mit dem größten
MehrData Warehousing. Weitere Buzzwörter: OLAP, Decision Support, Data Mining
Data Warehousing Weitere Buzzwörter: OLAP, Decision Support, Data Mining Wichtige Hinweise Zu diesem Thema gibt es eine Spezialvorlesung im Sommersemester Hier nur grober Überblick über Idee und einige
MehrDatenbanken Grundlagen und Design
Frank Geisler Datenbanken Grundlagen und Design 3., aktualisierte und erweiterte Auflage mitp Vorwort 15 Teil I Grundlagen 19 i Einführung in das Thema Datenbanken 21 i.i Warum ist Datenbankdesign wichtig?
MehrMultidimensionales Datenmodell, Cognos
Data Warehousing (II): Multidimensionales Datenmodell, Cognos Praktikum: Data Warehousing und Mining Praktikum Data Warehousing und Mining, Sommersemester 2010 Vereinfachte Sicht auf die Referenzarchitektur
MehrKap. 6 Data Warehouse
1 Kap. 6 Data Warehouse 6.1 Was ist ein Data Warehouse, Motivation? 6.2 Data Cube und Cube-Operationen 6.3 Workshop: MS SQL Server, Cube Operationen 6.4 Physischer Entwurf, Implementierung von Cubes 6.5
MehrInhaltsverzeichnis. vii.
vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt 2 1.2 OLTP versus OLAP 4 1.2.1 OLAP-versus OLTP-Transaktionen 5 1.2.2 Vergleich von OLTP und OLAP 6 1.2.3 Abgrenzung: DBMS-Techniken
MehrEinführung in Data Warehouses
Kapitel l6 Einführung in Data Warehouses Vorlesung: Dr. Matthias Schubert Skript 2009 Matthias Schubert Dieses Skript basiert auf dem Skript zur Vorlesung Datenbanksysteme II von Prof. Dr. Christian Böhm
MehrDatenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken
Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken 31. V. 2016 Outline 1 Organisatorisches 2 SQL 3 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 4 Objekt-relationale Datenbanken Beispiel
MehrMIS by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001
MIS Glossar by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001 Aggregat Data Cube Data Marts Data Mining Data Warehouse (DWH) Daten Decision Support Systeme (DSS)
MehrNutzung der Oracle Database InMemory Option für SAP BW
Nutzung der Oracle Database InMemory Option für SAP BW Schlüsselworte Oracle, SAP-BW, InMemory, Star-Schema. Jörn Bartels Oracle München Einleitung In SAP BW wurde bisher ein erweitertes Snow Flake Schema
MehrBetriebliche Anwendungen
Betriebliche Anwendungen SAP R/3: Enterprise Resource Modelling (ERP-System) OLTP Data Warehouse Data Mining WAN (Internet) LAN Kapitel 7 Relationales DBMS als Backend-Server (Oracle, Informix, DB2, MS
MehrSeminar 2. SQL - DML(Data Manipulation Language) und. DDL(Data Definition Language) Befehle.
Seminar 2 SQL - DML(Data Manipulation Language) und DDL(Data Definition Language) Befehle. DML Befehle Aggregatfunktionen - werden auf eine Menge von Tupeln angewendet - Verdichtung einzelner Tupeln yu
MehrInhaltsverzeichnis. Teil I OLAP und der Microsoft SQL-Server 1. 1 Theoretische Grundlagen 3
vii Teil I OLAP und der Microsoft SQL-Server 1 1 Theoretische Grundlagen 3 1.1 Was ist OLAP?......................................... 3 1.1.1 Business Intelligence............................... 4 1.1.2
MehrVerwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein
1 Definitionen 1.1 Datenbank Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert Integriert, selbstbeschreibend, verwandt 1.2 Intension/Extension Intension: Menge der Attribute Extension:
MehrVertrautmachen mit Daten
Kapitel III Vertrautmachen mit Daten 2004 AIFB / FZI 1 III Vertrautmachen mit Daten (see also Data Preparation ) 2004 AIFB / FZI 2 III Vertrautmachen mit Daten III.1 OLAP III.1.1 Einführung in OLAP Wie
MehrIndexstrukturen in SQL
Indestrukturen in SQL Anlegen eines Primärinde in SQL: Anlegen eines Sekundärinde in SQL: Bsp: create table Dozenten ( DNr integer primary key, Name varchar(0), Geburt date, ) create [Unique] inde indename
MehrÜbung zur Einführung in die Wirtschaftsinformatik Cognos Powerplay als Beispiel für ein DSS
Übung zur Einführung in die Wirtschaftsinformatik 2006-05 - 10 Cognos Powerplay als Beispiel für ein DSS 1 Entscheidungsunterstützungssysteme (EUS) Decision Support Systems (DSS) EUS sollen das gemeinsame
MehrACCESS SQL ACCESS SQL
ACCESS SQL Datenbankabfragen mit der Query-Language ACCESS SQL Datenbankpraxis mit Access 34 Was ist SQL Structured Query Language Bestehend aus Datendefinitionssprache (DDL) Datenmanipulationssprache
MehrSeminar im Sommersemester 2004 an der Universität Karlsruhe (TH)
Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH) Verteilung und Integration von Informationen im Verkehrsbereich Thema: OLAP in verteilten Data-Warehouse- Umgebungen Vortrag: Christian
MehrLogische Modellierung von Data Warehouses
Logische Modellierung von Data Warehouses Vertiefungsarbeit von Karin Schäuble Gliederung. Einführung. Abgrenzung und Grundlagen. Anforderungen. Logische Modellierung. Methoden.. Star Schema.. Galaxy-Schema..
MehrDATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER
DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER INHALTSVERZEICHNIS 1. Datenbanken 2. SQL 1.1 Sinn und Zweck 1.2 Definition 1.3 Modelle 1.4 Relationales Datenbankmodell 2.1 Definition 2.2 Befehle 3.
MehrStar Join & Kostenbasierte Optimierung. Architektur von Datenbanksystemen II
Star Join & Kostenbasierte Optimierung Architektur von Datenbanksystemen II Star Join Übungsaufgabe zum 09.06.2015 JOIN-ALGORITHMUS für folgendes Scenario Große Faktentabelle F mit sehr vielen Einträgen
MehrOLAP mit dem SQL-Server
Hartmut Messerschmidt Kai Schweinsberg OLAP mit dem SQL-Server Eine Einführung in Theorie und Praxis IIIBibliothek V dpunkt.verlag Teil OLAP undder Microsoft SQL-Server 1 1 Theoretische Grundlagen 3 1.1
MehrInhaltsübersicht...IX Inhaltsverzeichnis...XI Abbildungsverzeichnis...XVII Tabellenverzeichnis... XXIII Abkürzungsverzeichnis...
Inhaltsübersicht...IX Inhaltsverzeichnis...XI Abbildungsverzeichnis...XVII Tabellenverzeichnis... XXIII Abkürzungsverzeichnis... XXV 1 Einführung... 1 1.1 Problemstellung... 1 1.2 Zielsetzung... 3 1.3
MehrDaten-Definitionssprache (DDL) Bisher: Realwelt -> ERM -> Relationen-Modell -> normalisiertes Relationen-Modell. Jetzt: -> Formulierung in DDL
Daten-Definitionssprache (DDL) Bisher: Realwelt -> ERM -> Relationen-Modell -> normalisiertes Relationen-Modell Jetzt: -> Formulierung in DDL Daten-Definitionssprache (DDL) DDL ist Teil von SQL (Structured
MehrRepetitorium. Data Warehousing und Data Mining 11/12. Sebastian Wandelt 13./16. Februar 2012
Repetitorium Data Warehousing und Data Mining 11/12 Sebastian Wandelt 13./16. Februar 2012 Inhalt Data Warehousing und Data Mining auf 40 Slides Weder in-, noch exklusiv! Subjektive Zusammenfassung pro
MehrVerbunde (Joins) und mengentheoretische Operationen in SQL
Verbunde (Joins) und mengentheoretische Operationen in SQL Ein Verbund (Join) verbindet zwei Tabellen Typischerweise wird die Verbindung durch Attribute hergestellt, die in beiden Tabellen existieren Mengentheoretische
MehrÜbersicht der wichtigsten MySQL-Befehle
Übersicht der wichtigsten MySQL-Befehle 1. Arbeiten mit Datenbanken 1.1 Datenbank anlegen Eine Datenbank kann man wie folgt erstellen. CREATE DATABASE db_namen; 1.2 Existierende Datenbanken anzeigen Mit
MehrInhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte
4. Data arehouses Inhalt 4. Motivation 4.2 Datenintegration 4.3 Konzeptuelle Modellierung 4.4 Anfragen an Data arehouses 4.5 Implementierungsaspekte 2 Literatur V. Köppen, G. Saake und K.-U. Sattler: Data
MehrDatenbanken zur Entscheidungsunterstützung - Data Warehousing. Prof. Dr. T. Kudraß 1
Datenbanken zur Entscheidungsunterstützung - Data Warehousing Prof. Dr. T. Kudraß 1 Einführung Zunehmender Bedarf nach Analyse aktueller und historischer Daten Identifizierung interessanter Patterns Entscheidungsfindung
Mehr