8.1 Überblick. 8 Data Warehousing. klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des (

Größe: px
Ab Seite anzeigen:

Download "8.1 Überblick. 8 Data Warehousing. klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des ("

Transkript

1 c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing Data Warehousing 8.1 Überblick In klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des ( operativen ) Tagesgeschäfts verwendet (z.b.: Buchungen, Einkauf/Verkauf, Personal,...) Operationen (Transaktionsprogramme) auf diesen Datenbanken typischerweise mit Zugriff auf kleine Datenmengen (z.b. Direktzugriff über Kontonummern), Durchführung weniger Änderungsoperationen bzw. kleiner Lesetransaktionen Anforderungen: hoher Parallelitätsgrad hoher Transaktionsdurchsatz (mehrere Hundert bis Tausend Transaktionen pro Sekunde!) hohe Verfügbarkeit ( mission critical ) OnLine Transaction Processing (OLTP) Charakteristik: normalisierte Relationen (geringer Update-Overhead) vgl.weise wenige Indexe (dto.)

2 Neue, zusätzliche Anwendungsgebiete für große Informationssysteme: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-2 Management-Informationssysteme Decision-Support Integration mehrerer operativer Datenbanken Hier sollen die vorhandenen Daten verdichtet werden, um globalere Zusammenhänge zu erkennen, beispielsweise: Wie hat sich die Auslastung der Transatlantikflüge über die letzten zwei Jahre entwickelt? Wie haben sich besondere offensive Marketingstrategien für bestimmte Produktlinien auf die Verkaufszahlen ausgewirkt? Anforderungen: große komplexe Anfragen mit hohem Aggregationsgrad, wenig oder keine Änderungen OnLine Analytical Processing (OLAP)

3 Typische Aspekte: Sehr große operative Datenbanken (> 1 TByte) Gewünschte Anfragen stellen Daten stark verdichtet aggregiert dar: relativ teuer können nicht parallel zum laufenden Betrieb gestellt werden. sollen unterschiedliche Präzisierungsgrade ermöglichen. Aus den operativen Datenbanken werden regelmässig (etwa 1x täglich oder 1x monatlich) Daten in eine zusätzliche (wesentlich kleinere) Datenbank, das Data Warehouse übertragen. Das Data Warehouse steht dann für beliebige Anfragen zur Verfügung. Gegebenenfalls wird das Data Warehouse in weitere Komponenten unterteilt, die sog. Data Marts. OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining operationale DB operationale DB Data Warehouse operationale DB operationale DB c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-3

4 Datenbankarchitektur: Ein Data Warehouse enthält üblicherweise zwei Arten von Informationen: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-4 eine (sehr große) Faktentabelle: Diese enthält pro Tupel einen einzelnen Geschäftsvorfall (einen Verkauf, einen Vertragsabschluß, einen Auftrag,...) enthält jeweils Fremdschlüssel der beteiligten Dimensionen sowie weitere Informationen Beispiele: Alle Verkäufe der letzten drei Jahre Alle Telefonate des letzten Jahres Alle Flugreservierungen der letzten fünf Jahre typischerweise eine normalisierte Relation verschiedene Dimensionstabellen: Jede Dimension beschreibt einen zentralen Aspekt für das Data Warehouse. Übliche Dimensionen sind: Lieferant, Produkt, Zeit, Region, Filiale, Kunde,... oftmals nicht normalisiert

5 c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-5 Ein wesentliches Problem ist etwa die adäquate Modellierung der Dimensionen Auftretende Probleme: Dimensionen haben eine hierarchische Gliederungsstruktur: Region: Kontinent Land Bundesland Stadt Straße Zeit: Jahr Monat Tag Manche Dimensionen haben mehrere nicht-kompatible Strukturen: Jahr Quartal Monat Tag Jahr Woche Tag Jahr Woche (KW) Quartal Monat Tag Dimensionsstrukturen können sich über die Zeit verändern, wenn sich das Anwendungsfeld verändert Anpassung alter Daten/Dimensionsinformation problematisch! Üblicherweise werden Anfragen an die Fakten-Tabelle im Zusammenhang mit einer oder mehreren Dimensionen gestellt (mehrfache Joins). Diese Anfragen enthalten oft Aggregierungen und sind nach den Dimensionen strukturiert Multidimensionale Anfragen

6 Beispiel: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-6 Abbildung 8-1: Multidimensionale Anfragen

7 Datenwürfel ( Cube ): Strukturierte Darstellung der vorhandenen Informationen: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-7 Hersteller Jahr Übliche Variationen: Abbildung 8-2: Ein Datenwürfel Hinzunahme/Wegnahme von Dimensionen: Steuerung durch group by-klausel Verfeinerung von Dimensionen

8 Da die spezielle Struktur eines Data Warehouse nur unzureichend von relationalen Datenbanken unterstützt wird, werden bei der Entwicklung adäquater Systeme insbesondere folgende Entwicklungslinien verfolgt: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-8 ROLAP: Das Data-Warehouse-System wird auf der Basis eines relationalen DBMS als Anwendungssystem realisiert. MOLAP: Die Daten werden in einer speziellen mehrdimensionalen Form gespeichert (etwa mehrdimensionale Arrays). Gegenwärtig haben viele Datenbankhersteller den SQL-Support fürs Data Warehousing wesentlich erweitert (so auch der aktuelle SQL-Standard)!

9 Wesentliche Anforderung: Das Data Warehouse soll unterschiedlichen Mitarbeitern und Problemstellungen gerecht werden. Deswegen werden auch unterschiedliche Anfragewerkzeuge eingesetzt: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-9 Standard-SQL-Aggregierungen Data Mining Tools (inkl. Neuronalen Netzwerken) Statistische Analysen Expertensysteme (Frage/Antwort-Systeme) Die adäquate Aufbereitung von Dimensionsanfragen ist durchaus aufwendig und nicht unproblematisch!

10 8.2 Adäquater Datenbankentwurf c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-10 Dimensionstabellen sind üblicherweise nicht normalisiert, d.h. es gibt eine Faktentabelle mit zugehörigen Dimensionstabellen. Dies nennt man auch Star-Schema. Abbildung 8-3: Ein Star-Schema

11 Zweck: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-11 Anzahl der Joins wird kleiner. spezieller Join: star-join kann gut optimiert werden Auftretende Redundanzen oft unproblematisch, da Dimensionsdaten sich nur wenig ändern und im wesentlichen Einfügungen enthalten. Normalisierte Dimensionen werden auch Snowflake-Schema genannt. Praktiker empfehlen üblicherweise das Starschema! ggf. weitere Variationen in bestimmten Anwendungsszenarien sinnvoll: Beispiel: Die Struktur einiger Dimensionen ändert sich sehr häufig: Hier kann es sinnvoll sein, ggf. diese Dimension durch eine Meta-Dimension zu ersetzen.

12 8.3 Datenwürfel und DW-Anfragen c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing entnommen aus (Kemper und Eickler 2001, Kapitel 17)

13 Das Stern-Schema: Handelsunternehmen Kunden Produkte Verkäufe Filialen Zeit Verkäufer

14 Das Stern-Schema: Krankenversicherung Patienten Ärzte Behandlungen Krankenhäuser Zeit Krankheiten

15 Stern-Schema Passau 25-Jul-00 Verkäufer Kunde Anzahl Produkt Filiale VerkDatum Verkäufe Bayern D Passau Bezirk Land FilialenKennung Filialen 43 Kemper 4711 wiealt Name KundenNr Kunden Elektronik Handyman 825 wiealt Manager Fachgebiet Name VerkäuferNr Verkäufer Faktentabelle (SEHR groß) Dimensionstabellen (relativ klein)

16 Stern-Schema (cont d) Weihnachten Dienstag Dec-01 Hochsommer Saison Dienstag Wochentag Jul-00 KW Quartal Jahr Monat Tag Datum Zeit.... Siemens Telekom Mobiltelekom Handy Hersteller Produkthauptgruppe Produktgruppe Produkttyp ProduktNr Produkte

17 Nicht-normalisierte Dimensionstabellen: effizientere Anfrageauswertung Zeit Datum Tag Monat Jahr Quartal KW Wochentag Saison 25-Jul Dienstag Hochsommer 18-Dec Dienstag Weihnachten Datum Monat Quartal ProduktNr Produkttyp Produkte Produktgruppe Produkthauptgruppe Hersteller Handy Mobiltelekom Telekom Siemens.... ProduktNr Produkttyp Produktgruppe Produkthauptgruppe

18 Normalisierung führt zum Schneeflocken-Schema Produkthauptgruppen Kunden Filialen Produktgruppen Produkttypen Zeit Verkäufe Verkäufer Produkte KWs Quartale

19 Anfragen im Sternschema select sum(v.anzahl), p.hersteller from Verkäufe v, Filialen f, Produkte p, Zeit z, Kunden k where z.saison = 'Weihnachten' and z.jahr = 2001 and k.wiealt < 30 and p.produkttyp = 'Handy' and f.bezirk = 'Bayern' and v.verkdatum = z.datum and v.produkt = p.produktnr and v.filiale = f.filialenkennung and v.kunde = k.kundennr group by p.hersteller; Einschränkung der Dimensionen Join-Prädikate

20 Algebra-Ausdruck σ(produkte) σ(filialen) A A Verkäufe A A σ(kunden) σ(zeit)

21 Roll-up/Drill-down-Anfragen select Jahr, Hersteller, sum(anzahl) from Verkäufe v, Produkte p, Zeit z where v.produkt = p.produktnr and v.verkdatum = z.datum and p.produkttyp = 'Handy' group by p.hersteller, z.jahr; select Jahr, sum(anzahl) from Verkäufe v, Produkte p, Zeit z where v.produkt = p.produktnr and v.verkdatum = z.datum and p.produkttyp = 'Handy' group by z.jahr; Roll-up Drill-down

22 Ultimative Verdichtung select sum(anzahl) from Verkäufe v, Produkte p where v.produkt = p.produktnr and p.produkttyp = 'Handy';

23 Rollup Drill- Down

24 Flexible Auswertungsmethoden: slice and dice Regionen Produktgruppen Kunden Regionen Regionen Produktgruppen Produktgruppen Kunden Kunden

25 Materialisierung von Aggregaten insert into Handy2DCube ( select p.hersteller, z.jahr, sum(v.anzahl) from Verkäufe v, Produkte p, Zeit z where v.produkt = p.produktnr and p.produkttyp = 'Handy' and v.verkdatum = z.datum group by z.jahr, p.hersteller ) union ( select p.hersteller, to_number(null), sum(v.anzahl) from Verkäufe v, Produkte p where v.produkt = p.produktnr and p.produkttyp = 'Handy' group by p.hersteller ) union ( select null, z.jahr, sum(v.anzahl) from Verkäufe v, Produkte p, Zeit z where v.produkt = p.produktnr and p.produkttyp = 'Handy' and v.verkdatum = z.datum group by z.jahr ) union ( select null, to_number(null), sum(v.anzahl) from Verkäufe v, Produkte p where v.produkt = p.produktnr and p.produkttyp = 'Handy' );

26 Relationale Struktur der Datenwürfel

27 Würfeldarstellung

28 Der cube-operator (SQL-3) select p.hersteller, z.jahr, f.land, sum(v.anzahl) from Verkäufe v, Produkte p, Zeit z, Filialen f where v.produkt = p.produktnr and p.produkttyp = 'Handy' and v.verkdatum = z.datum and v.filiale = f.filialenkennung group by cube (z.jahr, p.hersteller, f.land);

29 Wiederverwendung von Teil-Aggregaten insert into VerkäufeProduktFilialeJahr ( select v.produkt, v.filiale, z.jahr, sum(v.anzahl) from Verkäufe v, Zeit z where v.verkdatum = z.datum group by v.produkt, v.filiale, z.jahr ); select v.produkt, v.filiale, sum(v.anzahl) from Verkäufe v group by v.produkt, v.filiale

30 Wiederverwendung von Teil-Aggregaten select v.produkt, v.filiale, sum(v.anzahl) from VerkäufeProduktFilialeJahr v group by v.produkt, v.filiale select v.produkt, z.jahr, sum(v.anzahl) from Verkäufe v, Zeit z where v.verkdatum = z.datum group by v.produkt, z.jahr

31 Die Materialisierungs-Hierarchie { } {Produkt} {Jahr} {Filiale} {Produkt, Jahr} {Produkt, Filiale} {Filiale, Jahr} {Produkt, Filiale, Jahr} Teilaggregate T sind für eine Aggregation A wiederverwendbar wenn es einen gerichteten Pfad von T nach A gibt Also T A Man nennt diese Materialisierungshierarchie auch einen Verband (Engl. Lattice)

32 8.4 TPC-D-Benchmark c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-13 Decision-Support-Anfragen in einem hypothetischen Handelsunternehmen Inzwischen ist dieser Benchmark in zwei Benchmarks aufgeteilt (TPC-H und TPC-R). Abbildung 8-4: Das TPC-D-Datenmodell

33 Datenbankgröße skalierbar (SF=1,10,30,100,300,1000), dabei ergibt SF=1 ungefähr 1GB Nutz- Daten. 19 Anfragen: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-14 aufsummierender Preisbericht Gute Lieferanten für bestimmte Teile nichtabgearbeitete Lieferungen (sortiert nach Priorität)... Erzeugung neuer Bestellungen (SF*1500) Entfernung von überflüssigen oder überholten Informationen (ebenfalls SF*1500) Leistungsgrößen: Systempreis auf 5 Jahre TPC-D-Powermetrik QppD@Size: Anzahl der sequentiell ausgeführten Anfragen und Änderungen pro Stunde, gewichtet mit der Skalierung Durchsatz QthD@Size: Anzahl der Anfragen und Änderungen pro Stunde bei Parallelisierung Preis/Leistungsverhältnis (Dollar pro Anfrage pro Stunde): Hierbei wird für die Anzahl der Anfragen pro Stunde das geometrische Mittel von QppD@Size und QthD@Size verwendet. Gegenwärtige Werte (für eine 300-GB-Datenbank): QppD@300GB=2000, QthD@300GB=1200 bei einem Systempreis von 5 Mio $.

34 c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-15 Beispiel: Veränderung des Marktanteils einer Nation innerhalb zweier Jahre (Query 8) (Achtung: Hier SQL-2, nicht Oracle-SQL!) select o_year, sum(case when nation = " then volume else 0 end) / sum(volume) as mkt_share from ( select extract(year from o_orderdate) as o_year, l_extendedprice * (1 - l_discount) as volume, n2.n_name as nation from part,supplier,lineitem,orders,customer, nation n1,nation n2,region where p_partkey = l_partkey and s_suppkey = l_suppkey and l_orderkey = o_orderkey and o_custkey = c_custkey and c_nationkey = n1.n_nationkey and n1.n_regionkey = r_regionkey and r_name = " and s_nationkey = n2.n_nationkey and o_orderdate between date and date and p_type = " ) as all_nations group by o_year order by o_year;

35 Beispiel: Bestimmng des Brutto-Umsatzes bestimmter Produkte (Query 19) (Typische Anfrage für Data Mining-Tools) c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-16 select sum(l_extendedprice* (1 - l_discount)) as revenue from lineitem, part where ( p_partkey = l_partkey and p_brand = and p_container in ( SM CASE, SM BOX, SM PACK, SM PKG ) and l_quantity >= and l_quantity <= + 10 and p_size between 1 and 5 and l_shipmode in ( AIR, AIR REG ) and l_shipinstruct = DELIVER IN PERSON ) or ( p_partkey = l_partkey and p_brand = and p_container in ( MED BAG, MED BOX, MED PKG, MED PACK ) and l_quantity >= and l_quantity <= + 10 and p_size between 1 and 10 and l_shipmode in ( AIR, AIR REG ) and l_shipinstruct = DELIVER IN PERSON ) or ( p_partkey = l_partkey and p_brand = and p_container in ( LG CASE, LG BOX, LG PACK, LG PKG ) and l_quantity >= and l_quantity <= + 10 and p_size between 1 and 15 and l_shipmode in ( AIR, AIR REG ) and l_shipinstruct = DELIVER IN PERSON );

36 8.5 SQL-Support für Data Warehousing c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing Erweiterte Anfrageunterstützung In der SQL GROUP BY-Klausel können Rollup- und Cube-Anfragen direkt formuliert werden. Beispiel: EMP: EMPNO ENAME JOB MGR HIREDA SAL COMM DEPTNO SMITH CLERK ALLEN SALESMAN WARD SALESMAN JONES MANAGER MARTIN SALESMAN BLAKE MANAGER CLARK MANAGER SCOTT ANALYST KING PRESIDENT TURNER SALESMAN ADAMS CLERK JAMES CLERK FORD ANALYST MILLER CLERK DEPT: DEPTNO DNAME LOC ACCOUNTING NEW YORK 20 RESEARCH DALLAS 30 SALES CHICAGO 40 OPERATIONS BOSTON

37 Rollup-Anfragen: select deptno,job,count(*),sum(sal) from emp group by rollup (deptno,job) c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-18 DEPTNO JOB COUNT(*) SUM(SAL) CLERK MANAGER PRESIDENT ANALYST CLERK MANAGER CLERK MANAGER SALESMAN Wie sieht diese Anfrage ohne rollup aus?

38 Bestimmung aller Werte eines Datenwürfels: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-19 select deptno,job,sum(sal) DEPTNO JOB SUM(SAL) from emp group by cube(deptno,job); 10 CLERK MANAGER PRESIDENT ANALYST CLERK MANAGER CLERK MANAGER SALESMAN ANALYST 6000 CLERK 4150 MANAGER 8275 PRESIDENT 5000 SALESMAN

39 Weitere Beispiele: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-20 select deptno,job,count(*),sum(sal) from emp group by rollup (deptno,job) having grouping(job)=1 DEPTNO JOB COUNT(*) SUM(SAL)

40 c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-21 select decode(grouping(dname),1, All Departements,dname) AS departement, decode(grouping(job),1, All Jobs,job) AS job, count(*), sum(sal) from where emp,dept emp.deptno=dept.deptno group by rollup (dname,job) DEPARTEMENT JOB COUNT(*) SUM(SAL) ACCOUNTING CLERK ACCOUNTING MANAGER ACCOUNTING PRESIDENT ACCOUNTING All Jobs RESEARCH ANALYST RESEARCH CLERK RESEARCH MANAGER RESEARCH All Jobs SALES CLERK SALES MANAGER SALES SALESMAN SALES All Jobs All Departements All Jobs

41 Top-n/Bottom-n-Anfragen: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-22 oft interessieren nur die besten/schlechtesten Ergebnisse. SQL-3 bietet hierzu eine neue Klausel STOP AFTER n. Derartige Anfragetypen wurden zuvor von SQL nicht adäquat unterstützt. Beliebter Trick: Viele DBMSe nummerieren die Tupel in Tabellen und Anfrageergebnissen. Risiko: Fehlinterpretation der Nummerierung, Änderung der Implementierung des DBMS,... Beispiel: Oracle 8i: Attribut rownum enthält die Nummer eines Tupels Folgende Anfrage scheitert: select ename, sal ENAME SAL from emp where rownum < 6 ALLEN 1600 order by sal desc WARD 1250 MARTIN 1250 SMITH 800 In Oracle-8i wird erst rownum gesetzt und dann sortiert!

42 c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-23 Lauffähige Oracle8i-Lösungen: create or replace view emp_view as select * from emp order by sal desc select ename,sal from emp_view where rownum < 6 oder auch select ename,sal from (select * from emp order by sal desc) where rownum < 6 Ergebnis: ENAME SAL KING 5000 SCOTT 3000 FORD 3000 JONES 2975 BLAKE 2850

43 8.5.2 Datenmodellierung c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-24 Dimensionen können hierarchisch strukturiert werden. Dies kann in Anfragen und bei der Anfrageoptimierung (Materialisierung von Anfragen) effizient eingesetzt werden. Beispiel: (Oracle) Data-Warehouse-Tabellen: bundeslaender(bundeslaender code,budeslaender name) staedte(staedte code,staedte name,bundeslaender code) produkte(produkte code,produkte name,marke) verkaeufe(verkauf code,datum,betrag,produkte code,staedte code) zeit(datum,woche,monat, monats name,quartal,jahr,jahreszeit)

44 c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-25 Flexible Definition von Dimensionen: create dimension zeit_dim level datum is zeit.datum level woche is zeit.woche level monat is zeit.monat level quartal is zeit.quartal level jahreszeit is zeit.jahreszeit level jahr is zeit.jahr hierarchy kalender_rollup ( datum child of monat child of quartal child of jahr) hierarchy jahreszeit_rollup( datum child of jahreszeit child of jahr) hierarchy wochen_rollup ( datum child of woche child of jahr) attribute monat determines zeit.monats_name;

45 Normalisierte Dimensionen: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-26 create dimension regionen_dim level staedte_code is staedte.staedte_code level staedte_name is staedte.staedte_name level bundeslaender_code is bundeslaender.bundeslaender_code level bundeslaender_name is bundeslaender.bundeslaender_name hierarchy bundeslaender_rollup ( staedte_code CHILD OF bundeslaender_code JOIN KEY staedte.bundeslaender_code REFERENCES bundeslaender_code) ATTRIBUTE staedte_code determines staedte.staedte_name ATTRIBUTE bundeslaender_code DETERMINES bundeslaender.bundeslaender_name;

46 8.5.3 Optimierung von Data Warehouse-Anfragen c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-27 Wesentliches Problem: der Join mit den verschiedenen Dimensionen wird dauernd benötigt. Idee: Bestimmte Anfragen kommen immer wieder als Teilanfragen vor. Diese Anfragen werden als Sicht berechnet und gespeichert! ( Materialized View) Darauf basierende Anfragen greifen dann nicht mehr auf die Basistabellen, sondern auf den Materialized View zu. Dabei werden auch die in der HIERACHY-Klausel Dimensionen mitberücksichtigt! Beispiel: create materialized view verkaeufe_summary enable query rewrite as select p.marke, b.bundeslaender_code, s.staedte_name, z.monat, sum(v.betrag) as total_verkaeufe from verkaeufe v, staedte s, zeit z, bundeslaender b, produkte p where v.staedte_code = s.staedte_code and s.bundeslaender_code = b.bundeslaender_code and v.datum = z.datum and v.produkte_code = p.produkte_code group by p.marke, b. bundeslaender_code, s.staedte_name, z.monat;

47 Anfrage: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-28 select p.marke, b.bundeslaender_name, z.jahr, sum(v.betrag) as total_verkaeufe from verkaeufe v, staedte s, zeit z, bundeslaender b, produkte p where v.staedte_code = s.staedte_code and s.bundeslaender_code = b.bundeslaender_code and v.datum = z.datum and v.produkte_code = p.produkte_code group by p.marke, b. bundeslaender_name, z.jahr; Execution Plan SELECT STATEMENT Optimizer-CHOOSE SORT (GROUP BY) HASH JOIN HASH JOIN TABLE ACCESS (FULL) OF BUNDESLAENDER TABLE ACCESS (FULL) OF VERKAEUFE_SUMMARY VIEW SORT (UNIQUE) TABLE ACCESS (FULL) OF ZEIT

48 Weitere Optimierungsaspekte: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-29 Spezielle Algorithmen für Star-Joins Load-Strategien fürs Data Warehouse: Wie lädt man 1 TByte oder 20 Mio. Transaktionen in vier Stunden in das Data Warehouse?

49 8.6 Weitere Fragestellungen c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-30 Im Zusammenhang mit Data Warehouses werden eine ganze Reihe weiterer aktueller Forschungsfragen behandelt, darunter im Zusammenhang mit dem sog. ETL-Prozess (Extract Transform Load): (konsistente) Integration von Daten aus verschiedenen Quellen Auswahl der zu integrierenden Daten Auswahl einer gemeinsamen Darstellung (Modell) Bereinigung von Fehlern, Vervollständigung Erkennen von Änderungen in operationalen DBen (inkrementelles) Propagieren der Änderungen ins Warehouse erforderliche Meta-Daten...

50 ETL-Prozess c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-31 data warehouse data staging area Loading Completion Cleaning Integration aux. DB Completion Integration Cleaning Transformation Transformation Completion rules Monitoring & Extraction Monitoring & Extraction Monitoring & Extraction operational DB operational DB operational DB

51 8.7 Literaturhinweise c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-32 Chaudhuri, S. und U. Dayal (1997). An Overview of Data Warehousing and OLAP Technology. ACM SIGMOD Record, 26(1): Craig, R.S., J. Vivona und D. Bercovitch (1999). Microsoft Data Warehousing. Wiley. Debevoise, T. (1999). The data warehouse method. Prentice Hall. Inmon, W.H., K. Rudin, C. Buss und R. Sousa (1999). Data Warehouse Performance. Wiley. Kemper, A. und A. Eickler (2001). Datenbanksysteme: Eine Einführung. Oldenbourg, 4 Aufl. Kimball, R. (1996). The data warehouse toolkit: practical techniques for building dimensional data warehouses. Wiley. Kisseleff, A. (1999). Oracle8i Warehousing. In: 12. DOAG, Stuttgart. Kurz, A. (1999). Data Warehousing Enabling Technology. mitp Verlag, Bonn. TPC (1999). The TPC Benchmark H.

8.1 Überblick. 8 Data Warehousing. klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des (

8.1 Überblick. 8 Data Warehousing. klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des ( c M. Scholl, 2003/04 Informationssysteme: 8. Data Warehousing 8-1 8 Data Warehousing 8.1 Überblick In klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des ( operativen

Mehr

9 Data Warehousing. klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des (

9 Data Warehousing. klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des ( 9 Data Warehousing 9.1 Überblick In klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des ( operativen ) Tagesgeschäfts verwendet (z.b.: Buchungen, Einkauf/Verkauf, Personal,...)

Mehr

10.1 Überblick. 10 Data Warehousing. klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des (

10.1 Überblick. 10 Data Warehousing. klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des ( 10 Data Warehousing 10.1 Überblick In klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des ( operativen ) Tagesgeschäfts verwendet (z.b.: Buchungen, Einkauf/Verkauf, Personal,...)

Mehr

Datenbanksysteme 2009

Datenbanksysteme 2009 Datenbanksysteme 2009 Kapitel 17: Data Warehouse Oliver Vornberger Institut für Informatik Universität Osnabrück 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen

Mehr

Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen

Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen (Folien von A. Kemper zum Buch 'Datenbanksysteme') Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP

Mehr

Kapitel 17: Date Warehouse

Kapitel 17: Date Warehouse Kapitel 17: Date Warehouse 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen kleine, kurze Transaktionen jeweils auf jüngstem Zustand OLAP (Online Analytical

Mehr

Data Warehousing. Aufbau eines DWH OLAP <-> OLTP Datacube

Data Warehousing. Aufbau eines DWH OLAP <-> OLTP Datacube Data Warehousing Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon 2 Datenbank 3 Fragen des Marketingleiters Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt

Mehr

Data Warehousing. Beispiel: : Amazon. Aufbau eines DWH OLAP <-> OLTP Datacube. FU-Berlin, DBS I 2006, Hinze / Scholz

Data Warehousing. Beispiel: : Amazon. Aufbau eines DWH OLAP <-> OLTP Datacube. FU-Berlin, DBS I 2006, Hinze / Scholz Data Warehousing Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon 2 1 Datenbank 3 Fragen des Marketingleiters Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt

Mehr

Betriebliche Anwendungen

Betriebliche Anwendungen Betriebliche nwendungen SP R/3: Enterprise Resource Modelling (ERP-System) OLTP Data Warehouse Data Mining WN (Internet) LN Kapitel 17 1 Relationales DBMS als Backend-Server (Oracle, Informix, DB2, MS

Mehr

Betriebliche Anwendungen

Betriebliche Anwendungen Betriebliche Anwendungen OLTP Data Warehouse Data Mining Kapitel 7 OLTP: Online Transaction Processing Beispiele Flugbuchungssystem Bestellungen in einem Handelsunternehmen Charakterisierung Hoher Parallelitätsgrad

Mehr

Betriebliche Anwendungen

Betriebliche Anwendungen Betriebliche Anwendungen SAP R/3: Enterprise Resource Modelling (ERP-System) OLTP Data Warehouse Data Mining WAN (Internet) LAN Kapitel 7 Relationales DBMS als Backend-Server (Oracle, Informix, DB2, MS

Mehr

OLTP: Online Transaction Processing

OLTP: Online Transaction Processing Moderne Betriebliche Anwendungen von Datenbanksystemen Online Transaction Processing (bisheriger Fokus) Data Warehouse-Anwendungen Data Mining OLTP: Online Transaction Processing Beispiele Flugbuchungssystem

Mehr

Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube

Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube Fragen des Marketingleiters Data Warehousing Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt nach? Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon Technisch

Mehr

Datenbanksysteme 2009

Datenbanksysteme 2009 Datenbanksysteme 2009 Vorlesung vom 07.07.09 Kapitel 16 + 17 Sicherheit + Data Warehouse Oliver Vornberger Institut für Informatik Universität Osnabrück 1 Datenschutz Datenbank 2 Legislative Maßnahmen

Mehr

Data Warehouses und Data Mining

Data Warehouses und Data Mining Data Warehouses und Data Mining Online Transaction Processing Data Warehouse-Anwendungen Data Mining OLTP: Online Transaction Processing Beispiele: Flugbuchungssystem Bestellungen in einem Handelsunternehmen

Mehr

Betriebliche Anwendungen

Betriebliche Anwendungen Betriebliche Anwendungen OLTP Data Warehouse Data Mining OLTP: Online Transaction Processing Beispiele Flugbuchungssystem Bestellungen in einem Handelsunternehmen Charakterisierung Hoher Parallelitätsgrad

Mehr

Betriebliche Anwendungen

Betriebliche Anwendungen Betriebliche Anwendungen OLTP Data Warehouse Data Mining Kapitel 17 1 OLTP: Online Transaction Processing Beispiele Flugbuchungssystem Bestellungen in einem Handelsunternehmen Charakterisierung Hoher Parallelitätsgrad

Mehr

Prakt. Datenbankprogrammierung. Sommersemester 2005

Prakt. Datenbankprogrammierung. Sommersemester 2005 Prakt. Datenbankprogrammierung Sommersemester 2005 A,2: Hierarchische Anfragen Martin-Luther-Universität Halle, Institut für Informatik, Datenbanken Christian Goldberg Wann ist eine hierarchische Anfrage

Mehr

Prakt. Datenbankprogrammierung. Sommersemester Was sind Constraints? I,11: Verwendung von Constraints. Festlegung von Constraints

Prakt. Datenbankprogrammierung. Sommersemester Was sind Constraints? I,11: Verwendung von Constraints. Festlegung von Constraints Prakt. Datenbankprogrammierung Sommersemester 2005 I,11: Verwendung von Constraints Was sind Constraints? Constraints stellen Regeln auf Tabellenebene sicher. Constraints verhindern das Löschen aus einer

Mehr

Die bisher bereits bekannten Aggregatsfunktionen MIN, MAX, SUM, AVG, COUNT, VARIANCE und STDDEV wurden um FIRST und LAST erweitert.

Die bisher bereits bekannten Aggregatsfunktionen MIN, MAX, SUM, AVG, COUNT, VARIANCE und STDDEV wurden um FIRST und LAST erweitert. Betrifft Autor FIRST, LAST Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Quelle Aus dem NF9i-Kurs, NF9i-Techno-Circle der Trivadis und Oracle9i Data Warehousing

Mehr

Erzeugen von Constraints

Erzeugen von Constraints Erzeugen von Constraints Was sind Constraints? Durch Constraints werden Regeln auf einem bestimmtem Tabellen-Level erzwungen. Die folgenden Constraint-Typen sind in Oracle integriert: NOT NULL UNIQUE Key

Mehr

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse

Mehr

Mengen- oder SET-Operatoren fassen das Ergebnis von zwei oder mehreren Teilabfragen zu einem Ergebnis zusammen.

Mengen- oder SET-Operatoren fassen das Ergebnis von zwei oder mehreren Teilabfragen zu einem Ergebnis zusammen. Tipps & Tricks: Mengenoperatoren Bereich: DBA, SQL Erstellung: 06/2004 MP Versionsinfo: 10.1, 10.2, 11.1, 11.2 Letzte Überarbeitung: 06/2009 MA Mengenoperatoren Mengen- oder SET-Operatoren fassen das Ergebnis

Mehr

Einleitung. ROLLUP, CUBE und GROUPING. Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002)

Einleitung. ROLLUP, CUBE und GROUPING. Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Betrifft Autör: GROUPING_ID Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Quelle Aus dem Oracle9i Data Warehousing Guide und den Kursen New Features Oracle9i

Mehr

Datenbanken Unit 9: OLAP, OLTP, Data Warehouse Ranking Algorithmen

Datenbanken Unit 9: OLAP, OLTP, Data Warehouse Ranking Algorithmen Datenbanken Unit 9: OLAP, OLTP, Data Warehouse Ranking Algorithmen 28. V. 2018 Outline 1 Organisatorisches 2 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 3 Ranking 4 SQL Organisatorisches Ergebnisse

Mehr

Data Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 16 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining operationale DB operationale DB operationale DB Data Warehouse operationale

Mehr

Oracle 8i und 9i New Features. DOAG November Peter Jensch, Trivadis GmbH

Oracle 8i und 9i New Features. DOAG November Peter Jensch, Trivadis GmbH Oracle 8i und 9i New Features DOAG November 200 Peter Jensch, Trivadis GmbH Facts & Figures Über 300 Mitarbeiter (D und CH) Über 200 Oracle Consultant Über 300 Kunden (ohne Schulung) Über 000 Projekte

Mehr

Entspricht dem kartesischen Produkt von zwei oder mehr selektierten Tabellen ohne Join-Bedingung.

Entspricht dem kartesischen Produkt von zwei oder mehr selektierten Tabellen ohne Join-Bedingung. Tipps & Tricks: Neuerungen Joins Bereich: SQL Erstellung: 07/2004 HA Versionsinfo: 10.1, 10.2, 11.1, 11.2 Letzte Überarbeitung: 06/2009 MA Neuerungen zu Joins Ab Version 9i sind alle dem SQL:1999-Standard

Mehr

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse

Mehr

Views erzeugen. Datenbank - Objekte. Wozu braucht man Views? Was ist eine View?

Views erzeugen. Datenbank - Objekte. Wozu braucht man Views? Was ist eine View? Datenbank - Objekte Views erzeugen Objekt Tabelle View Sequence Index Synonym Objekt Beschreibung Basiseinheit zum Speichern; besteht aus Zeilen und Spalten; Logische Repräsentation; kann Teilmengen von

Mehr

Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken

Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken 31. V. 2016 Outline 1 Organisatorisches 2 SQL 3 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 4 Objekt-relationale Datenbanken Beispiel

Mehr

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem. Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen

Mehr

SQL-Einführung Teil 2

SQL-Einführung Teil 2 SQL-Einführung Teil 2 Prof. Dr. Waldemar Rohde Dipl.-Ing. Jörg Höppner 19.10.2006 1 Datenmanipulationssprache (DML) Select DML ermöglicht es Daten mit SELECT abzurufen UPDATE zu verändern Delete DML Update

Mehr

Themenblock: Erstellung eines Cube

Themenblock: Erstellung eines Cube Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen

Mehr

SQL. Datenmanipulation. Datenmanipulationssprache. Ein neues Tupel hinzufügen. Das INSERT Statement

SQL. Datenmanipulation. Datenmanipulationssprache. Ein neues Tupel hinzufügen. Das INSERT Statement SQL Datenmanipulation Datenmanipulationssprache Ein DML Statement wird ausgeführt wenn: neue Tupel eingefügt werden existierende Tupel geändert werden existierende Tupel aus der Tabelle gelöscht werden

Mehr

Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken

Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken 17. V. 2017 Outline 1 Organisatorisches 2 SQL 3 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 4 Objekt-relationale Datenbanken Beispiel

Mehr

Moderne Betriebliche Anwendungen von Datenbanksystemen

Moderne Betriebliche Anwendungen von Datenbanksystemen Moderne Betriebliche Anwendungen von Datenbanksystemen Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP R/3) Data Warehouse-Anwendungen Data Mining OLTP: Online Transaction

Mehr

Operative vs. Informationelle Systeme. Informationelle Systeme. Informationelle Systeme. Moderne Betriebliche Anwendungen von Datenbanksystemen

Operative vs. Informationelle Systeme. Informationelle Systeme. Informationelle Systeme. Moderne Betriebliche Anwendungen von Datenbanksystemen Moderne Betriebliche Anwendungen von Datenbanksystemen Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP R/) Data Warehouse-Anwendungen Data Mining Operative vs. Informationelle

Mehr

Art der Info: Technische Background Info Teil 2 (April 2002)

Art der Info: Technische Background Info Teil 2 (April 2002) Betrifft: Autor: Oracle 9i New Features SQL und PL/SQL Christine Hansen (christine.hansen@trivadis.com) Art der Info: Technische Background Info Teil 2 (April 2002) Quelle: Aus dem NF9i-Kurs und NF9i-Techno-Circle

Mehr

Die Datenmanipulationssprache SQL

Die Datenmanipulationssprache SQL Die Datenmanipulationssprache SQL Daten eingeben Daten ändern Datenbank-Inhalte aus Dateien laden Seite 1 Data Manipulation Language A DML statement is executed when you Add new rows to a table Modify

Mehr

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D.

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. Übung zur Vorlesung Einsatz und Realisierung von Datenbanksystemen im SoSe18 Alexander van Renen, Maximilian

Mehr

Multidimensionale Modellierung

Multidimensionale Modellierung Multidimensionale Modellierung Vorlesung: Übung: Patrick Schäfer Berlin, 27. November 2017 patrick.schaefer@hu-berlin.de https://hu.berlin/vl_dwhdm17 https://hu.berlin/ue_dwhdm17 Grundlagen Fakten (Kennzahlen/Messgrößen):

Mehr

Summarization-based Aggregation

Summarization-based Aggregation Summarization-based Aggregation Daten Generalisierung: Prozess, der Anwendungsdaten schrittweise von niedrigen auf höhere konzeptuelle Level aggregiert Conceptual levels 2 3 4 5 example: all federal states

Mehr

Anfragen an multidimensionale Daten

Anfragen an multidimensionale Daten Anfragen an multidimensionale Daten Alexander Heidrich - BID8 09.06.2005 Hintergrundbild: http://www.csc.calpoly.edu/~zwood/teaching/csc471/finalproj02/afternoon/mfouquet/cube.jpg Inhaltsübersicht Motivation

Mehr

Wiederholung VU Datenmodellierung

Wiederholung VU Datenmodellierung Wiederholung VU Datenmodellierung VU Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester

Mehr

Variable. Interaktive Skripte

Variable. Interaktive Skripte Interaktive Skripte Variable...sal =? deptno=?.. ename =?... Werte eingeben während der Laufzeit. Nutzer SQL1 basierend auf OAI-Kurs Copyright Oracle Corporation, 1998. All rights reserved SQL2 basierend

Mehr

Wiederholung VU Datenmodellierung

Wiederholung VU Datenmodellierung Wiederholung VU Datenmodellierung VL Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester

Mehr

Seminar Database Tuning & Administration. Irina Andrei Ketevan Karbelashvili

Seminar Database Tuning & Administration. Irina Andrei Ketevan Karbelashvili Seminar Database Tuning & Administration Irina Andrei Ketevan Karbelashvili Database Tuning Tuning ist die Summe aller Maßnahmen, welche die Optimierung der Antwortzeiten und die Verbesserung der Skalierbarkeit

Mehr

Teil II: Architektur eines Data-Warehouse-Systems... 57

Teil II: Architektur eines Data-Warehouse-Systems... 57 O:/Wiley/Reihe_Dummies/9783527714476_Gerken/3d/ftoc.3d from 08.08.2018 14:02:02 Auf einen Blick Einleitung... 19 Teil I: Was ist ein Data Warehouse?... 25 Kapitel 1: Ein Beispiel zur Einführung..... 27

Mehr

Die relationale Abfragesprache SQL Structured Query Language

Die relationale Abfragesprache SQL Structured Query Language Die relationale Abfragesprache SQL Structured Query Language Übersicht Einfache Abfragen SQL*Plus Auswahlbedingungen (where-klausel) Ein-Zeilen-Funktionen, Gruppenfunktionen Gruppierung von Daten Unter-Abfragen

Mehr

Data Warehousing. Weitere Buzzwörter: OLAP, Decision Support, Data Mining

Data Warehousing. Weitere Buzzwörter: OLAP, Decision Support, Data Mining Data Warehousing Weitere Buzzwörter: OLAP, Decision Support, Data Mining Wichtige Hinweise Zu diesem Thema gibt es eine Spezialvorlesung im Sommersemester Hier nur grober Überblick über Idee und einige

Mehr

Arbeit mit zusammengesetzten Datentypen

Arbeit mit zusammengesetzten Datentypen Arbeit mit zusammengesetzten Datentypen Zusammengesetzte Datentypen Typen: PL/SQL RECORDS PL/SQL TABELLEN Enthalten interne Komponenten Sind wiederverwendbar Copyright Oracle Corporation, 1998. All rights

Mehr

6.2 Datenmodellierung

6.2 Datenmodellierung Umsetzung des multidimensionalen Modells Interne Verwaltung der Daten durch - Relationale Strukturen (Tabellen) Relationales OLAP (ROLAP) Vorteile: Verfügbarkeit, Reife der Systeme - Multidimensionale

Mehr

Datenbanksysteme 2011

Datenbanksysteme 2011 Datenbanksysteme 2011 Kapitel 16: Objektorientierte Datenbanken Vorlesung vom 05.07.2011 Oliver Vornberger Institut für Informatik Universität Osnabrück 1 Schwächen relationaler Systeme Buch: {[ISBN, Verlag,

Mehr

Datenbanksysteme 2 Frühjahr-/Sommersemester 2014 28. Mai 2014

Datenbanksysteme 2 Frühjahr-/Sommersemester 2014 28. Mai 2014 Lehrstuhl für Praktische Informatik III Prof. Dr. Guido Moerkotte Email: moer@db.informatik.uni-mannheim.de Marius Eich Email: marius.eich@uni-mannheim.de Datenbanksysteme 2 8. Übungsblatt Frühjahr-/Sommersemester

Mehr

Database Tuning & Administration. von Andreas Engl und Dennis Stratmann

Database Tuning & Administration. von Andreas Engl und Dennis Stratmann Database Tuning & Administration von Andreas Engl und Dennis Stratmann Vorbereitung Wir haben uns in unserer Projektarbeit mit DB2 Express Edition von IBM beschäftigt. Unsere Aufgabe bestand aus mehreren

Mehr

Kapitel 6. Vorlesung: PD Dr. Peer Kröger

Kapitel 6. Vorlesung: PD Dr. Peer Kröger Kapitel 6 Einführung in Data Warehouses Vorlesung: PD Dr. Peer Kröger Dieses Skript basiert auf den Skripten zur Vorlesung Datenbanksysteme II an der LMU München Dieses Skript basiert auf den Skripten

Mehr

Vorlesung Wissensentdeckung in Datenbanken

Vorlesung Wissensentdeckung in Datenbanken Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Uwe Ligges Informatik LS 8 22.04.2010 1 von 26 Gliederung 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der

Mehr

Data-Warehouse-Technologien

Data-Warehouse-Technologien Data-Warehouse-Technologien Prof. Dr.-Ing. Kai-Uwe Sattler 1 Prof. Dr. Gunter Saake 2 1 TU Ilmenau FG Datenbanken & Informationssysteme 2 Universität Magdeburg Institut für Technische und Betriebliche

Mehr

Vorlesung Wissensentdeckung in Datenbanken

Vorlesung Wissensentdeckung in Datenbanken Gliederung Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Claus Weihs 14.07.2009 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der Cube-Operator 5 Implementierung

Mehr

Prakt. Datenbankprogrammierung. Sommersemester I,9: Datenmanipulation. Daten-Manipulations-Sprache. Das INSERT-Statement

Prakt. Datenbankprogrammierung. Sommersemester I,9: Datenmanipulation. Daten-Manipulations-Sprache. Das INSERT-Statement Prakt. Datenbankprogrammierung Sommersemester 2005 I,9: Datenmanipulation Daten-Manipulations-Sprache DML-Statements werden ausgeführt bei: Hinzufügen von Datensätzen Modifizieren von Datensätzen Löschen

Mehr

Skripte schreiben. Überblick SQL*Plus. Einloggen in SQL*Plus. Tabellenstrukturen anzeigen

Skripte schreiben. Überblick SQL*Plus. Einloggen in SQL*Plus. Tabellenstrukturen anzeigen Skripte schreiben Überblick Login in. Beschreiben der Tabellenstrukturen. Editieren der SQL-Anweisung Ausführen von SQL aus. SQL-Anweisungen in Dateien speichern bzw. SQL-Anweisungen anhängen. Ausführen

Mehr

Kapitel 7 Grundlagen von Data

Kapitel 7 Grundlagen von Data LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS DATABASE Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2014 Kapitel 7 Grundlagen von Data Warehouses Vorlesung: PD

Mehr

Oracle Analytic Functions

Oracle Analytic Functions Mittwoch, 13.02.2008, 17:00 Uhr Regionaltreffen München/Südbayern Oracle Analytic Functions Seit Jahren auf dem Markt (8.1.6), jedoch unbekannt und selten im Einsatz S e i t e 1 Agenda Einsatzmöglichkeiten

Mehr

Datenbanken Labor, MI : Übung 1 SQL - Abfragen Patrick Lipinski

Datenbanken Labor, MI : Übung 1 SQL - Abfragen Patrick Lipinski Aufgabe 1 Erstellen Sie eine Abfrage, die aus der EMP/DEPT-Tabelle die Felder Empno, Ename, Deptno und dname aller Mitarbeiter mit einem Gehalt von > 2500 ausgibt. select EMPNO, ENAME from EMP where SAL

Mehr

Art der Info: Technische Background Info Teil 3 (April 2002)

Art der Info: Technische Background Info Teil 3 (April 2002) Betrifft: Autor: Oracle9i New Features SQL und PL/SQL Patrick Malcherek (patrick.malcherek@trivadis.com) Art der Info: Technische Background Info Teil (April 00) Quelle: Aus dem NF9i-Kurs und NF9i-Techno-Circle

Mehr

Data Warehousing Kapitel 3: Mehrdimensionale Datenmodellierung

Data Warehousing Kapitel 3: Mehrdimensionale Datenmodellierung Data Warehousing Kapitel 3: Mehrdimensionale Datenmodellierung und Operationen Michael Hartung Sommersemester 2011 Universität Leipzig Institut für Informatik y y y http://dbs.uni-leipzig.de SS11, Prof.

Mehr

Unterstützung der Unternehmenssteuerung durch Data Warehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen

Unterstützung der Unternehmenssteuerung durch Data Warehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen Rückblick Unterstützung der Unternehmenssteuerung durch Data arehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen Online Transaction Processing (OLTP) und Online Analytical Processing unterscheiden

Mehr

Unterstützung der Unternehmenssteuerung durch Data Warehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen

Unterstützung der Unternehmenssteuerung durch Data Warehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen Rückblick Unterstützung der Unternehmenssteuerung durch Data arehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen Online Transaction Processing (OLTP) und Online Analytical Processing unterscheiden

Mehr

Data Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2004 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

Brücken bauen im dimensionalen Modell

Brücken bauen im dimensionalen Modell Brücken bauen im dimensionalen Modell DOAG Konferenz 2012 Dani Schnider Trivadis AG Nürnberg, BASEL BERN LAUSANNE ZÜRICH DÜSSELDORF FRANKFURT A.M. FREIBURG I.BR. HAMBURG MÜNCHEN STUTTGART WIEN 1 Dani Schnider

Mehr

Materialized Views. Jan-Peter Timmermann. DOAG Regiotreffen Hamburg: Materialized Views Seite 1

Materialized Views. Jan-Peter Timmermann. DOAG Regiotreffen Hamburg: Materialized Views Seite 1 Materialized Views Jan-Peter Timmermann DOAG Regiotreffen Hamburg: Materialized Views Seite 1 Klassische View Sind virtuelle Tabellen Erstellung nicht aufwendig, da nur ein Eintrag im Data Dictionary vorgenommen

Mehr

Oracle9i Data Warehouse Komponenten im praktischen Einsatz

Oracle9i Data Warehouse Komponenten im praktischen Einsatz Oracle9i Data Warehouse Komponenten im praktischen Einsatz Thomas Gutacker TechSpring GmbH 10. März 2004 Inhalt Data Warehouse Grundlagen Architektur des Projektes Umsetzung mit Oracle9i-Komponenten Data

Mehr

SQL Intensivpraktikum SS 2008

SQL Intensivpraktikum SS 2008 SQL Intensivpraktikum SS 2008 Aggregation von Daten Arbeit mit Gruppen SQL1 basierend auf OAI-Kurs Copyright Oracle Corporation, 1998. All rights reserved. Gruppenfunktionen Gruppenfunktionen verarbeiten

Mehr

Data Cube. 1. Einführung. 2. Aggregation in SQL, GROUP BY. 3. Probleme mit GROUP BY. 4. Der Cube-Operator. 5. Implementierung des Data Cube

Data Cube. 1. Einführung. 2. Aggregation in SQL, GROUP BY. 3. Probleme mit GROUP BY. 4. Der Cube-Operator. 5. Implementierung des Data Cube Data Cube 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator 5. Implementierung des Data Cube 6. Zusammenfassung und Ausblick Dank an Hanna Köpcke! 1 On-line Analytical

Mehr

ZWISCHEN ALBTRAUM UND OPTIMALER PERFORMANCE

ZWISCHEN ALBTRAUM UND OPTIMALER PERFORMANCE ZWISCHEN ALBTRAUM UND OPTIMALER PERFORMANCE Indexierungsstrategie im Data Warehouse Dani Schnider, Trivadis AG DOAG Konferenz, Nürnberg BASEL BERN LAUSANNE ZÜRICH DÜSSELDORF FRANKFURT A.M. FREIBURG I.BR.

Mehr

Einführung in Data Warehouses

Einführung in Data Warehouses Vorlesung Datebanksysteme II im SoSe 2015 Einführung in Data Warehouses Vorlesung: PD Dr. Peer Kröger Einführung in Data Warehouses Übersicht 1 Einleitung 2 Datenmodellierung 3 Anfragebearbeitung 2 Einführung

Mehr

Datenbanken Grundlagen und Design

Datenbanken Grundlagen und Design Frank Geisler Datenbanken Grundlagen und Design 3., aktualisierte und erweiterte Auflage mitp Vorwort 15 Teil I Grundlagen 19 i Einführung in das Thema Datenbanken 21 i.i Warum ist Datenbankdesign wichtig?

Mehr

Analytic Views: Einsatzgebiete im Data Warehouse

Analytic Views: Einsatzgebiete im Data Warehouse Analytic Views: Einsatzgebiete im Data Warehouse Dani Schnider Trivadis AG Zürich/Glattbrugg, Schweiz Einleitung Analytic Views sind eine der wesentlichen Erweiterungen in Oracle 12c Release 2. Durch zusätzliche

Mehr

SÄTZE MIT VARIABLER LÄNGE

SÄTZE MIT VARIABLER LÄNGE Sätze variabler Länge 1 SÄTZE MIT VARIABLER LÄNGE Generellere Struktur von Datensätzen: Ersetzen von Felder durch Gruppen von Feldern. Beispiel: n m E 1 E 2 e 1 e 2 e 11 e 12 e 21 e 22 e 23 e 24 variable

Mehr

Data Warehouse Grundlagen

Data Warehouse Grundlagen Seminarunterlage Version: 2.13 Version 2.13 vom 27. August 2018 Dieses Dokument wird durch die veröffentlicht.. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen sind Warenzeichen

Mehr

Data Cubes PG Wissensmangement Seminarphase

Data Cubes PG Wissensmangement Seminarphase PG 402 - Wissensmangement Seminarphase 23.10.2001-25.10.2001 Hanna Köpcke Lehrstuhl für Künstliche Intelligenz Universität Dortmund Übersicht 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit

Mehr

Datenbanken Implementierungstechniken SS2015

Datenbanken Implementierungstechniken SS2015 Hochschule für Technik, Wirtschaft und Kultur Leipzig Leipzig University of Applied Sciences Parallele DBMS Datenbanken Implementierungstechniken SS2015 Alexander Müller Fakultät Informatik, Mathematik

Mehr

5 Data Warehouses und Data Mining

5 Data Warehouses und Data Mining 5 Data Warehouses und Data Mining Mittels OLAP Techniken können große Datenmengen unterschiedlich stark verdichtet und gezielt aufbereitet werden. Mittels Data Mining können große Datenmengen nach bisher

Mehr

Erzeugung und Veränderung von Tabellen

Erzeugung und Veränderung von Tabellen Datenbanken - Objekte Erzeugung und Veränderung von Tabellen Objekt Tabelle View Sequence Index Synonym Basiseinheit zum Speichern; besteht aus Zeilen und Spalten; Logische Repräsentation; kann Teilmengen

Mehr

Prakt. Datenbankprogrammierung. Sommersemester I,5: Aggregieren von Daten mit Gruppen-Funktionen

Prakt. Datenbankprogrammierung. Sommersemester I,5: Aggregieren von Daten mit Gruppen-Funktionen Prakt. Datenbankprogrammierung Sommersemester 2005 I,5: Aggregieren von Daten mit Gruppen-Funktionen Martin-Luther-Universität Halle, Institut für Informatik, Datenbanken Christian Goldberg Was sind Gruppen-Funktionen?

Mehr

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D.

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. Übung zur Vorlesung Einführung in die Informatik 2 für Ingenieure (MSE) Alexander van Renen (renen@in.tum.de)

Mehr

Inhalt. Behandlung von Views durch den CBO View Merging Predicate Pushing Complex View Merging Hints in Views Globale Hints. Dr.

Inhalt. Behandlung von Views durch den CBO View Merging Predicate Pushing Complex View Merging Hints in Views Globale Hints. Dr. Inhalt Behandlung von Views durch den CBO View Merging Predicate Pushing Complex View Merging Hints in Views Globale Hints Dr.Frank Haney 1 Behandlung von Views durch den CBO View Merging bedeutet, daß

Mehr

5.4 Benchmarks für Data Warehouses

5.4 Benchmarks für Data Warehouses 5.4 Benchmarks für Data Warehouses Benchmark ( Massstab ) zum Vergleich der Leistungsfähigkeit von Systemen Für Datenbanken: Serie von Benchmarks des Transaction Processing Performance Council (www.tpc.org)

Mehr

Index- und Zugriffsstrukturen für. Holger Brämer, 05IND-P

Index- und Zugriffsstrukturen für. Holger Brämer, 05IND-P Index- und Zugriffsstrukturen für Data Warehousing Holger Brämer, 05IND-P Index- und Zugriffstrukturen für Data Warehousing Materialisierte Sichten Bitmap-Indexe Verbundindexe Materialisierte Sichten gehören

Mehr

Datenbanksysteme I WS 18/19 Teillösung Übungsblatt 4-6

Datenbanksysteme I WS 18/19 Teillösung Übungsblatt 4-6 Datenbanksysteme I WS 18/19 Teillösung Übungsblatt 4-6 Universität Leipzig, Institut für Informatik Abteilung Datenbanken Prof. Dr. E. Rahm, V. Christen, M. Franke DBS1 Blatt 4 Mitschreibbar 2 Welche Autoren

Mehr

Data Warehousing Grundbegriffe und Problemstellung

Data Warehousing Grundbegriffe und Problemstellung Data Warehousing Grundbegriffe und Problemstellung Dr. Andrea Kennel, Trivadis AG, Glattbrugg, Schweiz Andrea.Kennel@trivadis.com Schlüsselworte Data Warehouse, Cube, Data Mart, Bitmap Index, Star Queries,

Mehr

3. Mehrdimensionale Datenmodellierung und Operationen Grundlagen

3. Mehrdimensionale Datenmodellierung und Operationen Grundlagen 3. Mehrdimensionale Datenmodellierung und Operationen Grundlagen Kennzahlen, Dimensionen, Cube Cuboide / Aggregationsgitter hierarchische Dimensionen / Konzepthierarchien Cube-Operationen Multi-dimensionale

Mehr

INDEXIERUNGS- STRATEGIE IM DATA WAREHOUSE

INDEXIERUNGS- STRATEGIE IM DATA WAREHOUSE INDEXIERUNGS- STRATEGIE IM DATA WAREHOUSE ZWISCHEN ALBTRAUM UND OPTIMALER PERFORMANCE DOAG Konferenz 2011 Dani Schnider Trivadis AG Nürnberg, BASEL BERN LAUSANNE ZÜRICH DÜSSELDORF FRANKFURT A.M. FREIBURG

Mehr

4. Aufgabenblatt - Auswertung -

4. Aufgabenblatt - Auswertung - 4. Aufgabenblatt - Auswertung - Patrick Schäfer Berlin, 22. Januar 2017 patrick.schaefer@hu-berlin.de Agenda Aufgabe 4 Aufgabe 5: Naïve Bayes Daten (Wettbewerbsaufgabe!) - Gegeben sei eine Datenbank aller

Mehr

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

SQL/OLAP und Multidimensionalität in der Lehre

SQL/OLAP und Multidimensionalität in der Lehre SQL/OLAP und Multidimensionalität in der Lehre Vortrag auf der DOAG 2008 Prof. Dr. Reinhold von Schwerin Hochschule Ulm, Fakultät für Informatik 1. Dezember 2008 Prof. Dr. Reinhold von Schwerin SQL/OLAP

Mehr

Oracle OLAP 11g: Performance für das Oracle Data Warehouse

Oracle OLAP 11g: Performance für das Oracle Data Warehouse Oracle OLAP 11g: Performance für das Oracle Data Warehouse Marc Bastien Oracle BI Presales Agenda Performanceprobleme in Oracle DWH: gibt s das überhaupt? Mögliche Gründe und Lösungen

Mehr