8.1 Überblick. 8 Data Warehousing. klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des (
|
|
- Walther Tiedeman
- vor 7 Jahren
- Abrufe
Transkript
1 c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing Data Warehousing 8.1 Überblick In klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des ( operativen ) Tagesgeschäfts verwendet (z.b.: Buchungen, Einkauf/Verkauf, Personal,...) Operationen (Transaktionsprogramme) auf diesen Datenbanken typischerweise mit Zugriff auf kleine Datenmengen (z.b. Direktzugriff über Kontonummern), Durchführung weniger Änderungsoperationen bzw. kleiner Lesetransaktionen Anforderungen: hoher Parallelitätsgrad hoher Transaktionsdurchsatz (mehrere Hundert bis Tausend Transaktionen pro Sekunde!) hohe Verfügbarkeit ( mission critical ) OnLine Transaction Processing (OLTP) Charakteristik: normalisierte Relationen (geringer Update-Overhead) vgl.weise wenige Indexe (dto.)
2 Neue, zusätzliche Anwendungsgebiete für große Informationssysteme: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-2 Management-Informationssysteme Decision-Support Integration mehrerer operativer Datenbanken Hier sollen die vorhandenen Daten verdichtet werden, um globalere Zusammenhänge zu erkennen, beispielsweise: Wie hat sich die Auslastung der Transatlantikflüge über die letzten zwei Jahre entwickelt? Wie haben sich besondere offensive Marketingstrategien für bestimmte Produktlinien auf die Verkaufszahlen ausgewirkt? Anforderungen: große komplexe Anfragen mit hohem Aggregationsgrad, wenig oder keine Änderungen OnLine Analytical Processing (OLAP)
3 Typische Aspekte: Sehr große operative Datenbanken (> 1 TByte) Gewünschte Anfragen stellen Daten stark verdichtet aggregiert dar: relativ teuer können nicht parallel zum laufenden Betrieb gestellt werden. sollen unterschiedliche Präzisierungsgrade ermöglichen. Aus den operativen Datenbanken werden regelmässig (etwa 1x täglich oder 1x monatlich) Daten in eine zusätzliche (wesentlich kleinere) Datenbank, das Data Warehouse übertragen. Das Data Warehouse steht dann für beliebige Anfragen zur Verfügung. Gegebenenfalls wird das Data Warehouse in weitere Komponenten unterteilt, die sog. Data Marts. OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining operationale DB operationale DB Data Warehouse operationale DB operationale DB c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-3
4 Datenbankarchitektur: Ein Data Warehouse enthält üblicherweise zwei Arten von Informationen: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-4 eine (sehr große) Faktentabelle: Diese enthält pro Tupel einen einzelnen Geschäftsvorfall (einen Verkauf, einen Vertragsabschluß, einen Auftrag,...) enthält jeweils Fremdschlüssel der beteiligten Dimensionen sowie weitere Informationen Beispiele: Alle Verkäufe der letzten drei Jahre Alle Telefonate des letzten Jahres Alle Flugreservierungen der letzten fünf Jahre typischerweise eine normalisierte Relation verschiedene Dimensionstabellen: Jede Dimension beschreibt einen zentralen Aspekt für das Data Warehouse. Übliche Dimensionen sind: Lieferant, Produkt, Zeit, Region, Filiale, Kunde,... oftmals nicht normalisiert
5 c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-5 Ein wesentliches Problem ist etwa die adäquate Modellierung der Dimensionen Auftretende Probleme: Dimensionen haben eine hierarchische Gliederungsstruktur: Region: Kontinent Land Bundesland Stadt Straße Zeit: Jahr Monat Tag Manche Dimensionen haben mehrere nicht-kompatible Strukturen: Jahr Quartal Monat Tag Jahr Woche Tag Jahr Woche (KW) Quartal Monat Tag Dimensionsstrukturen können sich über die Zeit verändern, wenn sich das Anwendungsfeld verändert Anpassung alter Daten/Dimensionsinformation problematisch! Üblicherweise werden Anfragen an die Fakten-Tabelle im Zusammenhang mit einer oder mehreren Dimensionen gestellt (mehrfache Joins). Diese Anfragen enthalten oft Aggregierungen und sind nach den Dimensionen strukturiert Multidimensionale Anfragen
6 Beispiel: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-6 Abbildung 8-1: Multidimensionale Anfragen
7 Datenwürfel ( Cube ): Strukturierte Darstellung der vorhandenen Informationen: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-7 Hersteller Jahr Übliche Variationen: Abbildung 8-2: Ein Datenwürfel Hinzunahme/Wegnahme von Dimensionen: Steuerung durch group by-klausel Verfeinerung von Dimensionen
8 Da die spezielle Struktur eines Data Warehouse nur unzureichend von relationalen Datenbanken unterstützt wird, werden bei der Entwicklung adäquater Systeme insbesondere folgende Entwicklungslinien verfolgt: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-8 ROLAP: Das Data-Warehouse-System wird auf der Basis eines relationalen DBMS als Anwendungssystem realisiert. MOLAP: Die Daten werden in einer speziellen mehrdimensionalen Form gespeichert (etwa mehrdimensionale Arrays). Gegenwärtig haben viele Datenbankhersteller den SQL-Support fürs Data Warehousing wesentlich erweitert (so auch der aktuelle SQL-Standard)!
9 Wesentliche Anforderung: Das Data Warehouse soll unterschiedlichen Mitarbeitern und Problemstellungen gerecht werden. Deswegen werden auch unterschiedliche Anfragewerkzeuge eingesetzt: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-9 Standard-SQL-Aggregierungen Data Mining Tools (inkl. Neuronalen Netzwerken) Statistische Analysen Expertensysteme (Frage/Antwort-Systeme) Die adäquate Aufbereitung von Dimensionsanfragen ist durchaus aufwendig und nicht unproblematisch!
10 8.2 Adäquater Datenbankentwurf c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-10 Dimensionstabellen sind üblicherweise nicht normalisiert, d.h. es gibt eine Faktentabelle mit zugehörigen Dimensionstabellen. Dies nennt man auch Star-Schema. Abbildung 8-3: Ein Star-Schema
11 Zweck: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-11 Anzahl der Joins wird kleiner. spezieller Join: star-join kann gut optimiert werden Auftretende Redundanzen oft unproblematisch, da Dimensionsdaten sich nur wenig ändern und im wesentlichen Einfügungen enthalten. Normalisierte Dimensionen werden auch Snowflake-Schema genannt. Praktiker empfehlen üblicherweise das Starschema! ggf. weitere Variationen in bestimmten Anwendungsszenarien sinnvoll: Beispiel: Die Struktur einiger Dimensionen ändert sich sehr häufig: Hier kann es sinnvoll sein, ggf. diese Dimension durch eine Meta-Dimension zu ersetzen.
12 8.3 Datenwürfel und DW-Anfragen c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing entnommen aus (Kemper und Eickler 2001, Kapitel 17)
13 Das Stern-Schema: Handelsunternehmen Kunden Produkte Verkäufe Filialen Zeit Verkäufer
14 Das Stern-Schema: Krankenversicherung Patienten Ärzte Behandlungen Krankenhäuser Zeit Krankheiten
15 Stern-Schema Passau 25-Jul-00 Verkäufer Kunde Anzahl Produkt Filiale VerkDatum Verkäufe Bayern D Passau Bezirk Land FilialenKennung Filialen 43 Kemper 4711 wiealt Name KundenNr Kunden Elektronik Handyman 825 wiealt Manager Fachgebiet Name VerkäuferNr Verkäufer Faktentabelle (SEHR groß) Dimensionstabellen (relativ klein)
16 Stern-Schema (cont d) Weihnachten Dienstag Dec-01 Hochsommer Saison Dienstag Wochentag Jul-00 KW Quartal Jahr Monat Tag Datum Zeit.... Siemens Telekom Mobiltelekom Handy Hersteller Produkthauptgruppe Produktgruppe Produkttyp ProduktNr Produkte
17 Nicht-normalisierte Dimensionstabellen: effizientere Anfrageauswertung Zeit Datum Tag Monat Jahr Quartal KW Wochentag Saison 25-Jul Dienstag Hochsommer 18-Dec Dienstag Weihnachten Datum Monat Quartal ProduktNr Produkttyp Produkte Produktgruppe Produkthauptgruppe Hersteller Handy Mobiltelekom Telekom Siemens.... ProduktNr Produkttyp Produktgruppe Produkthauptgruppe
18 Normalisierung führt zum Schneeflocken-Schema Produkthauptgruppen Kunden Filialen Produktgruppen Produkttypen Zeit Verkäufe Verkäufer Produkte KWs Quartale
19 Anfragen im Sternschema select sum(v.anzahl), p.hersteller from Verkäufe v, Filialen f, Produkte p, Zeit z, Kunden k where z.saison = 'Weihnachten' and z.jahr = 2001 and k.wiealt < 30 and p.produkttyp = 'Handy' and f.bezirk = 'Bayern' and v.verkdatum = z.datum and v.produkt = p.produktnr and v.filiale = f.filialenkennung and v.kunde = k.kundennr group by p.hersteller; Einschränkung der Dimensionen Join-Prädikate
20 Algebra-Ausdruck σ(produkte) σ(filialen) A A Verkäufe A A σ(kunden) σ(zeit)
21 Roll-up/Drill-down-Anfragen select Jahr, Hersteller, sum(anzahl) from Verkäufe v, Produkte p, Zeit z where v.produkt = p.produktnr and v.verkdatum = z.datum and p.produkttyp = 'Handy' group by p.hersteller, z.jahr; select Jahr, sum(anzahl) from Verkäufe v, Produkte p, Zeit z where v.produkt = p.produktnr and v.verkdatum = z.datum and p.produkttyp = 'Handy' group by z.jahr; Roll-up Drill-down
22 Ultimative Verdichtung select sum(anzahl) from Verkäufe v, Produkte p where v.produkt = p.produktnr and p.produkttyp = 'Handy';
23 Rollup Drill- Down
24 Flexible Auswertungsmethoden: slice and dice Regionen Produktgruppen Kunden Regionen Regionen Produktgruppen Produktgruppen Kunden Kunden
25 Materialisierung von Aggregaten insert into Handy2DCube ( select p.hersteller, z.jahr, sum(v.anzahl) from Verkäufe v, Produkte p, Zeit z where v.produkt = p.produktnr and p.produkttyp = 'Handy' and v.verkdatum = z.datum group by z.jahr, p.hersteller ) union ( select p.hersteller, to_number(null), sum(v.anzahl) from Verkäufe v, Produkte p where v.produkt = p.produktnr and p.produkttyp = 'Handy' group by p.hersteller ) union ( select null, z.jahr, sum(v.anzahl) from Verkäufe v, Produkte p, Zeit z where v.produkt = p.produktnr and p.produkttyp = 'Handy' and v.verkdatum = z.datum group by z.jahr ) union ( select null, to_number(null), sum(v.anzahl) from Verkäufe v, Produkte p where v.produkt = p.produktnr and p.produkttyp = 'Handy' );
26 Relationale Struktur der Datenwürfel
27 Würfeldarstellung
28 Der cube-operator (SQL-3) select p.hersteller, z.jahr, f.land, sum(v.anzahl) from Verkäufe v, Produkte p, Zeit z, Filialen f where v.produkt = p.produktnr and p.produkttyp = 'Handy' and v.verkdatum = z.datum and v.filiale = f.filialenkennung group by cube (z.jahr, p.hersteller, f.land);
29 Wiederverwendung von Teil-Aggregaten insert into VerkäufeProduktFilialeJahr ( select v.produkt, v.filiale, z.jahr, sum(v.anzahl) from Verkäufe v, Zeit z where v.verkdatum = z.datum group by v.produkt, v.filiale, z.jahr ); select v.produkt, v.filiale, sum(v.anzahl) from Verkäufe v group by v.produkt, v.filiale
30 Wiederverwendung von Teil-Aggregaten select v.produkt, v.filiale, sum(v.anzahl) from VerkäufeProduktFilialeJahr v group by v.produkt, v.filiale select v.produkt, z.jahr, sum(v.anzahl) from Verkäufe v, Zeit z where v.verkdatum = z.datum group by v.produkt, z.jahr
31 Die Materialisierungs-Hierarchie { } {Produkt} {Jahr} {Filiale} {Produkt, Jahr} {Produkt, Filiale} {Filiale, Jahr} {Produkt, Filiale, Jahr} Teilaggregate T sind für eine Aggregation A wiederverwendbar wenn es einen gerichteten Pfad von T nach A gibt Also T A Man nennt diese Materialisierungshierarchie auch einen Verband (Engl. Lattice)
32 8.4 TPC-D-Benchmark c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-13 Decision-Support-Anfragen in einem hypothetischen Handelsunternehmen Inzwischen ist dieser Benchmark in zwei Benchmarks aufgeteilt (TPC-H und TPC-R). Abbildung 8-4: Das TPC-D-Datenmodell
33 Datenbankgröße skalierbar (SF=1,10,30,100,300,1000), dabei ergibt SF=1 ungefähr 1GB Nutz- Daten. 19 Anfragen: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-14 aufsummierender Preisbericht Gute Lieferanten für bestimmte Teile nichtabgearbeitete Lieferungen (sortiert nach Priorität)... Erzeugung neuer Bestellungen (SF*1500) Entfernung von überflüssigen oder überholten Informationen (ebenfalls SF*1500) Leistungsgrößen: Systempreis auf 5 Jahre TPC-D-Powermetrik QppD@Size: Anzahl der sequentiell ausgeführten Anfragen und Änderungen pro Stunde, gewichtet mit der Skalierung Durchsatz QthD@Size: Anzahl der Anfragen und Änderungen pro Stunde bei Parallelisierung Preis/Leistungsverhältnis (Dollar pro Anfrage pro Stunde): Hierbei wird für die Anzahl der Anfragen pro Stunde das geometrische Mittel von QppD@Size und QthD@Size verwendet. Gegenwärtige Werte (für eine 300-GB-Datenbank): QppD@300GB=2000, QthD@300GB=1200 bei einem Systempreis von 5 Mio $.
34 c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-15 Beispiel: Veränderung des Marktanteils einer Nation innerhalb zweier Jahre (Query 8) (Achtung: Hier SQL-2, nicht Oracle-SQL!) select o_year, sum(case when nation = " then volume else 0 end) / sum(volume) as mkt_share from ( select extract(year from o_orderdate) as o_year, l_extendedprice * (1 - l_discount) as volume, n2.n_name as nation from part,supplier,lineitem,orders,customer, nation n1,nation n2,region where p_partkey = l_partkey and s_suppkey = l_suppkey and l_orderkey = o_orderkey and o_custkey = c_custkey and c_nationkey = n1.n_nationkey and n1.n_regionkey = r_regionkey and r_name = " and s_nationkey = n2.n_nationkey and o_orderdate between date and date and p_type = " ) as all_nations group by o_year order by o_year;
35 Beispiel: Bestimmng des Brutto-Umsatzes bestimmter Produkte (Query 19) (Typische Anfrage für Data Mining-Tools) c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-16 select sum(l_extendedprice* (1 - l_discount)) as revenue from lineitem, part where ( p_partkey = l_partkey and p_brand = and p_container in ( SM CASE, SM BOX, SM PACK, SM PKG ) and l_quantity >= and l_quantity <= + 10 and p_size between 1 and 5 and l_shipmode in ( AIR, AIR REG ) and l_shipinstruct = DELIVER IN PERSON ) or ( p_partkey = l_partkey and p_brand = and p_container in ( MED BAG, MED BOX, MED PKG, MED PACK ) and l_quantity >= and l_quantity <= + 10 and p_size between 1 and 10 and l_shipmode in ( AIR, AIR REG ) and l_shipinstruct = DELIVER IN PERSON ) or ( p_partkey = l_partkey and p_brand = and p_container in ( LG CASE, LG BOX, LG PACK, LG PKG ) and l_quantity >= and l_quantity <= + 10 and p_size between 1 and 15 and l_shipmode in ( AIR, AIR REG ) and l_shipinstruct = DELIVER IN PERSON );
36 8.5 SQL-Support für Data Warehousing c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing Erweiterte Anfrageunterstützung In der SQL GROUP BY-Klausel können Rollup- und Cube-Anfragen direkt formuliert werden. Beispiel: EMP: EMPNO ENAME JOB MGR HIREDA SAL COMM DEPTNO SMITH CLERK ALLEN SALESMAN WARD SALESMAN JONES MANAGER MARTIN SALESMAN BLAKE MANAGER CLARK MANAGER SCOTT ANALYST KING PRESIDENT TURNER SALESMAN ADAMS CLERK JAMES CLERK FORD ANALYST MILLER CLERK DEPT: DEPTNO DNAME LOC ACCOUNTING NEW YORK 20 RESEARCH DALLAS 30 SALES CHICAGO 40 OPERATIONS BOSTON
37 Rollup-Anfragen: select deptno,job,count(*),sum(sal) from emp group by rollup (deptno,job) c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-18 DEPTNO JOB COUNT(*) SUM(SAL) CLERK MANAGER PRESIDENT ANALYST CLERK MANAGER CLERK MANAGER SALESMAN Wie sieht diese Anfrage ohne rollup aus?
38 Bestimmung aller Werte eines Datenwürfels: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-19 select deptno,job,sum(sal) DEPTNO JOB SUM(SAL) from emp group by cube(deptno,job); 10 CLERK MANAGER PRESIDENT ANALYST CLERK MANAGER CLERK MANAGER SALESMAN ANALYST 6000 CLERK 4150 MANAGER 8275 PRESIDENT 5000 SALESMAN
39 Weitere Beispiele: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-20 select deptno,job,count(*),sum(sal) from emp group by rollup (deptno,job) having grouping(job)=1 DEPTNO JOB COUNT(*) SUM(SAL)
40 c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-21 select decode(grouping(dname),1, All Departements,dname) AS departement, decode(grouping(job),1, All Jobs,job) AS job, count(*), sum(sal) from where emp,dept emp.deptno=dept.deptno group by rollup (dname,job) DEPARTEMENT JOB COUNT(*) SUM(SAL) ACCOUNTING CLERK ACCOUNTING MANAGER ACCOUNTING PRESIDENT ACCOUNTING All Jobs RESEARCH ANALYST RESEARCH CLERK RESEARCH MANAGER RESEARCH All Jobs SALES CLERK SALES MANAGER SALES SALESMAN SALES All Jobs All Departements All Jobs
41 Top-n/Bottom-n-Anfragen: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-22 oft interessieren nur die besten/schlechtesten Ergebnisse. SQL-3 bietet hierzu eine neue Klausel STOP AFTER n. Derartige Anfragetypen wurden zuvor von SQL nicht adäquat unterstützt. Beliebter Trick: Viele DBMSe nummerieren die Tupel in Tabellen und Anfrageergebnissen. Risiko: Fehlinterpretation der Nummerierung, Änderung der Implementierung des DBMS,... Beispiel: Oracle 8i: Attribut rownum enthält die Nummer eines Tupels Folgende Anfrage scheitert: select ename, sal ENAME SAL from emp where rownum < 6 ALLEN 1600 order by sal desc WARD 1250 MARTIN 1250 SMITH 800 In Oracle-8i wird erst rownum gesetzt und dann sortiert!
42 c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-23 Lauffähige Oracle8i-Lösungen: create or replace view emp_view as select * from emp order by sal desc select ename,sal from emp_view where rownum < 6 oder auch select ename,sal from (select * from emp order by sal desc) where rownum < 6 Ergebnis: ENAME SAL KING 5000 SCOTT 3000 FORD 3000 JONES 2975 BLAKE 2850
43 8.5.2 Datenmodellierung c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-24 Dimensionen können hierarchisch strukturiert werden. Dies kann in Anfragen und bei der Anfrageoptimierung (Materialisierung von Anfragen) effizient eingesetzt werden. Beispiel: (Oracle) Data-Warehouse-Tabellen: bundeslaender(bundeslaender code,budeslaender name) staedte(staedte code,staedte name,bundeslaender code) produkte(produkte code,produkte name,marke) verkaeufe(verkauf code,datum,betrag,produkte code,staedte code) zeit(datum,woche,monat, monats name,quartal,jahr,jahreszeit)
44 c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-25 Flexible Definition von Dimensionen: create dimension zeit_dim level datum is zeit.datum level woche is zeit.woche level monat is zeit.monat level quartal is zeit.quartal level jahreszeit is zeit.jahreszeit level jahr is zeit.jahr hierarchy kalender_rollup ( datum child of monat child of quartal child of jahr) hierarchy jahreszeit_rollup( datum child of jahreszeit child of jahr) hierarchy wochen_rollup ( datum child of woche child of jahr) attribute monat determines zeit.monats_name;
45 Normalisierte Dimensionen: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-26 create dimension regionen_dim level staedte_code is staedte.staedte_code level staedte_name is staedte.staedte_name level bundeslaender_code is bundeslaender.bundeslaender_code level bundeslaender_name is bundeslaender.bundeslaender_name hierarchy bundeslaender_rollup ( staedte_code CHILD OF bundeslaender_code JOIN KEY staedte.bundeslaender_code REFERENCES bundeslaender_code) ATTRIBUTE staedte_code determines staedte.staedte_name ATTRIBUTE bundeslaender_code DETERMINES bundeslaender.bundeslaender_name;
46 8.5.3 Optimierung von Data Warehouse-Anfragen c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-27 Wesentliches Problem: der Join mit den verschiedenen Dimensionen wird dauernd benötigt. Idee: Bestimmte Anfragen kommen immer wieder als Teilanfragen vor. Diese Anfragen werden als Sicht berechnet und gespeichert! ( Materialized View) Darauf basierende Anfragen greifen dann nicht mehr auf die Basistabellen, sondern auf den Materialized View zu. Dabei werden auch die in der HIERACHY-Klausel Dimensionen mitberücksichtigt! Beispiel: create materialized view verkaeufe_summary enable query rewrite as select p.marke, b.bundeslaender_code, s.staedte_name, z.monat, sum(v.betrag) as total_verkaeufe from verkaeufe v, staedte s, zeit z, bundeslaender b, produkte p where v.staedte_code = s.staedte_code and s.bundeslaender_code = b.bundeslaender_code and v.datum = z.datum and v.produkte_code = p.produkte_code group by p.marke, b. bundeslaender_code, s.staedte_name, z.monat;
47 Anfrage: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-28 select p.marke, b.bundeslaender_name, z.jahr, sum(v.betrag) as total_verkaeufe from verkaeufe v, staedte s, zeit z, bundeslaender b, produkte p where v.staedte_code = s.staedte_code and s.bundeslaender_code = b.bundeslaender_code and v.datum = z.datum and v.produkte_code = p.produkte_code group by p.marke, b. bundeslaender_name, z.jahr; Execution Plan SELECT STATEMENT Optimizer-CHOOSE SORT (GROUP BY) HASH JOIN HASH JOIN TABLE ACCESS (FULL) OF BUNDESLAENDER TABLE ACCESS (FULL) OF VERKAEUFE_SUMMARY VIEW SORT (UNIQUE) TABLE ACCESS (FULL) OF ZEIT
48 Weitere Optimierungsaspekte: c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-29 Spezielle Algorithmen für Star-Joins Load-Strategien fürs Data Warehouse: Wie lädt man 1 TByte oder 20 Mio. Transaktionen in vier Stunden in das Data Warehouse?
49 8.6 Weitere Fragestellungen c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-30 Im Zusammenhang mit Data Warehouses werden eine ganze Reihe weiterer aktueller Forschungsfragen behandelt, darunter im Zusammenhang mit dem sog. ETL-Prozess (Extract Transform Load): (konsistente) Integration von Daten aus verschiedenen Quellen Auswahl der zu integrierenden Daten Auswahl einer gemeinsamen Darstellung (Modell) Bereinigung von Fehlern, Vervollständigung Erkennen von Änderungen in operationalen DBen (inkrementelles) Propagieren der Änderungen ins Warehouse erforderliche Meta-Daten...
50 ETL-Prozess c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-31 data warehouse data staging area Loading Completion Cleaning Integration aux. DB Completion Integration Cleaning Transformation Transformation Completion rules Monitoring & Extraction Monitoring & Extraction Monitoring & Extraction operational DB operational DB operational DB
51 8.7 Literaturhinweise c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-32 Chaudhuri, S. und U. Dayal (1997). An Overview of Data Warehousing and OLAP Technology. ACM SIGMOD Record, 26(1): Craig, R.S., J. Vivona und D. Bercovitch (1999). Microsoft Data Warehousing. Wiley. Debevoise, T. (1999). The data warehouse method. Prentice Hall. Inmon, W.H., K. Rudin, C. Buss und R. Sousa (1999). Data Warehouse Performance. Wiley. Kemper, A. und A. Eickler (2001). Datenbanksysteme: Eine Einführung. Oldenbourg, 4 Aufl. Kimball, R. (1996). The data warehouse toolkit: practical techniques for building dimensional data warehouses. Wiley. Kisseleff, A. (1999). Oracle8i Warehousing. In: 12. DOAG, Stuttgart. Kurz, A. (1999). Data Warehousing Enabling Technology. mitp Verlag, Bonn. TPC (1999). The TPC Benchmark H.
8.1 Überblick. 8 Data Warehousing. klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des (
c M. Scholl, 2003/04 Informationssysteme: 8. Data Warehousing 8-1 8 Data Warehousing 8.1 Überblick In klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des ( operativen
Mehr9 Data Warehousing. klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des (
9 Data Warehousing 9.1 Überblick In klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des ( operativen ) Tagesgeschäfts verwendet (z.b.: Buchungen, Einkauf/Verkauf, Personal,...)
Mehr10.1 Überblick. 10 Data Warehousing. klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des (
10 Data Warehousing 10.1 Überblick In klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des ( operativen ) Tagesgeschäfts verwendet (z.b.: Buchungen, Einkauf/Verkauf, Personal,...)
MehrDatenbanksysteme 2009
Datenbanksysteme 2009 Kapitel 17: Data Warehouse Oliver Vornberger Institut für Informatik Universität Osnabrück 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen
MehrData Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen
Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen (Folien von A. Kemper zum Buch 'Datenbanksysteme') Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP
MehrKapitel 17: Date Warehouse
Kapitel 17: Date Warehouse 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen kleine, kurze Transaktionen jeweils auf jüngstem Zustand OLAP (Online Analytical
MehrData Warehousing. Aufbau eines DWH OLAP <-> OLTP Datacube
Data Warehousing Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon 2 Datenbank 3 Fragen des Marketingleiters Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt
MehrData Warehousing. Beispiel: : Amazon. Aufbau eines DWH OLAP <-> OLTP Datacube. FU-Berlin, DBS I 2006, Hinze / Scholz
Data Warehousing Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon 2 1 Datenbank 3 Fragen des Marketingleiters Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt
MehrBetriebliche Anwendungen
Betriebliche nwendungen SP R/3: Enterprise Resource Modelling (ERP-System) OLTP Data Warehouse Data Mining WN (Internet) LN Kapitel 17 1 Relationales DBMS als Backend-Server (Oracle, Informix, DB2, MS
MehrBetriebliche Anwendungen
Betriebliche Anwendungen OLTP Data Warehouse Data Mining Kapitel 7 OLTP: Online Transaction Processing Beispiele Flugbuchungssystem Bestellungen in einem Handelsunternehmen Charakterisierung Hoher Parallelitätsgrad
MehrBetriebliche Anwendungen
Betriebliche Anwendungen SAP R/3: Enterprise Resource Modelling (ERP-System) OLTP Data Warehouse Data Mining WAN (Internet) LAN Kapitel 7 Relationales DBMS als Backend-Server (Oracle, Informix, DB2, MS
MehrOLTP: Online Transaction Processing
Moderne Betriebliche Anwendungen von Datenbanksystemen Online Transaction Processing (bisheriger Fokus) Data Warehouse-Anwendungen Data Mining OLTP: Online Transaction Processing Beispiele Flugbuchungssystem
MehrData Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube
Fragen des Marketingleiters Data Warehousing Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt nach? Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon Technisch
MehrDatenbanksysteme 2009
Datenbanksysteme 2009 Vorlesung vom 07.07.09 Kapitel 16 + 17 Sicherheit + Data Warehouse Oliver Vornberger Institut für Informatik Universität Osnabrück 1 Datenschutz Datenbank 2 Legislative Maßnahmen
MehrData Warehouses und Data Mining
Data Warehouses und Data Mining Online Transaction Processing Data Warehouse-Anwendungen Data Mining OLTP: Online Transaction Processing Beispiele: Flugbuchungssystem Bestellungen in einem Handelsunternehmen
MehrBetriebliche Anwendungen
Betriebliche Anwendungen OLTP Data Warehouse Data Mining OLTP: Online Transaction Processing Beispiele Flugbuchungssystem Bestellungen in einem Handelsunternehmen Charakterisierung Hoher Parallelitätsgrad
MehrBetriebliche Anwendungen
Betriebliche Anwendungen OLTP Data Warehouse Data Mining Kapitel 17 1 OLTP: Online Transaction Processing Beispiele Flugbuchungssystem Bestellungen in einem Handelsunternehmen Charakterisierung Hoher Parallelitätsgrad
MehrPrakt. Datenbankprogrammierung. Sommersemester 2005
Prakt. Datenbankprogrammierung Sommersemester 2005 A,2: Hierarchische Anfragen Martin-Luther-Universität Halle, Institut für Informatik, Datenbanken Christian Goldberg Wann ist eine hierarchische Anfrage
MehrPrakt. Datenbankprogrammierung. Sommersemester Was sind Constraints? I,11: Verwendung von Constraints. Festlegung von Constraints
Prakt. Datenbankprogrammierung Sommersemester 2005 I,11: Verwendung von Constraints Was sind Constraints? Constraints stellen Regeln auf Tabellenebene sicher. Constraints verhindern das Löschen aus einer
MehrDie bisher bereits bekannten Aggregatsfunktionen MIN, MAX, SUM, AVG, COUNT, VARIANCE und STDDEV wurden um FIRST und LAST erweitert.
Betrifft Autor FIRST, LAST Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Quelle Aus dem NF9i-Kurs, NF9i-Techno-Circle der Trivadis und Oracle9i Data Warehousing
MehrErzeugen von Constraints
Erzeugen von Constraints Was sind Constraints? Durch Constraints werden Regeln auf einem bestimmtem Tabellen-Level erzwungen. Die folgenden Constraint-Typen sind in Oracle integriert: NOT NULL UNIQUE Key
MehrData Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:
Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse
MehrMengen- oder SET-Operatoren fassen das Ergebnis von zwei oder mehreren Teilabfragen zu einem Ergebnis zusammen.
Tipps & Tricks: Mengenoperatoren Bereich: DBA, SQL Erstellung: 06/2004 MP Versionsinfo: 10.1, 10.2, 11.1, 11.2 Letzte Überarbeitung: 06/2009 MA Mengenoperatoren Mengen- oder SET-Operatoren fassen das Ergebnis
MehrEinleitung. ROLLUP, CUBE und GROUPING. Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002)
Betrifft Autör: GROUPING_ID Markus Jägle (markus.jaegle@trivadis.com) Art der Info Technische Background Info (April 2002) Quelle Aus dem Oracle9i Data Warehousing Guide und den Kursen New Features Oracle9i
MehrDatenbanken Unit 9: OLAP, OLTP, Data Warehouse Ranking Algorithmen
Datenbanken Unit 9: OLAP, OLTP, Data Warehouse Ranking Algorithmen 28. V. 2018 Outline 1 Organisatorisches 2 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 3 Ranking 4 SQL Organisatorisches Ergebnisse
MehrData Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:
Kapitel 16 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining operationale DB operationale DB operationale DB Data Warehouse operationale
MehrOracle 8i und 9i New Features. DOAG November Peter Jensch, Trivadis GmbH
Oracle 8i und 9i New Features DOAG November 200 Peter Jensch, Trivadis GmbH Facts & Figures Über 300 Mitarbeiter (D und CH) Über 200 Oracle Consultant Über 300 Kunden (ohne Schulung) Über 000 Projekte
MehrEntspricht dem kartesischen Produkt von zwei oder mehr selektierten Tabellen ohne Join-Bedingung.
Tipps & Tricks: Neuerungen Joins Bereich: SQL Erstellung: 07/2004 HA Versionsinfo: 10.1, 10.2, 11.1, 11.2 Letzte Überarbeitung: 06/2009 MA Neuerungen zu Joins Ab Version 9i sind alle dem SQL:1999-Standard
MehrData Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:
Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse
MehrViews erzeugen. Datenbank - Objekte. Wozu braucht man Views? Was ist eine View?
Datenbank - Objekte Views erzeugen Objekt Tabelle View Sequence Index Synonym Objekt Beschreibung Basiseinheit zum Speichern; besteht aus Zeilen und Spalten; Logische Repräsentation; kann Teilmengen von
MehrDatenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken
Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken 31. V. 2016 Outline 1 Organisatorisches 2 SQL 3 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 4 Objekt-relationale Datenbanken Beispiel
MehrEinführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.
Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen
MehrSQL-Einführung Teil 2
SQL-Einführung Teil 2 Prof. Dr. Waldemar Rohde Dipl.-Ing. Jörg Höppner 19.10.2006 1 Datenmanipulationssprache (DML) Select DML ermöglicht es Daten mit SELECT abzurufen UPDATE zu verändern Delete DML Update
MehrThemenblock: Erstellung eines Cube
Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen
MehrSQL. Datenmanipulation. Datenmanipulationssprache. Ein neues Tupel hinzufügen. Das INSERT Statement
SQL Datenmanipulation Datenmanipulationssprache Ein DML Statement wird ausgeführt wenn: neue Tupel eingefügt werden existierende Tupel geändert werden existierende Tupel aus der Tabelle gelöscht werden
MehrDatenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken
Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken 17. V. 2017 Outline 1 Organisatorisches 2 SQL 3 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 4 Objekt-relationale Datenbanken Beispiel
MehrModerne Betriebliche Anwendungen von Datenbanksystemen
Moderne Betriebliche Anwendungen von Datenbanksystemen Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP R/3) Data Warehouse-Anwendungen Data Mining OLTP: Online Transaction
MehrOperative vs. Informationelle Systeme. Informationelle Systeme. Informationelle Systeme. Moderne Betriebliche Anwendungen von Datenbanksystemen
Moderne Betriebliche Anwendungen von Datenbanksystemen Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP R/) Data Warehouse-Anwendungen Data Mining Operative vs. Informationelle
MehrArt der Info: Technische Background Info Teil 2 (April 2002)
Betrifft: Autor: Oracle 9i New Features SQL und PL/SQL Christine Hansen (christine.hansen@trivadis.com) Art der Info: Technische Background Info Teil 2 (April 2002) Quelle: Aus dem NF9i-Kurs und NF9i-Techno-Circle
MehrDie Datenmanipulationssprache SQL
Die Datenmanipulationssprache SQL Daten eingeben Daten ändern Datenbank-Inhalte aus Dateien laden Seite 1 Data Manipulation Language A DML statement is executed when you Add new rows to a table Modify
MehrTU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D.
TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. Übung zur Vorlesung Einsatz und Realisierung von Datenbanksystemen im SoSe18 Alexander van Renen, Maximilian
MehrMultidimensionale Modellierung
Multidimensionale Modellierung Vorlesung: Übung: Patrick Schäfer Berlin, 27. November 2017 patrick.schaefer@hu-berlin.de https://hu.berlin/vl_dwhdm17 https://hu.berlin/ue_dwhdm17 Grundlagen Fakten (Kennzahlen/Messgrößen):
MehrSummarization-based Aggregation
Summarization-based Aggregation Daten Generalisierung: Prozess, der Anwendungsdaten schrittweise von niedrigen auf höhere konzeptuelle Level aggregiert Conceptual levels 2 3 4 5 example: all federal states
MehrAnfragen an multidimensionale Daten
Anfragen an multidimensionale Daten Alexander Heidrich - BID8 09.06.2005 Hintergrundbild: http://www.csc.calpoly.edu/~zwood/teaching/csc471/finalproj02/afternoon/mfouquet/cube.jpg Inhaltsübersicht Motivation
MehrWiederholung VU Datenmodellierung
Wiederholung VU Datenmodellierung VU Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester
MehrVariable. Interaktive Skripte
Interaktive Skripte Variable...sal =? deptno=?.. ename =?... Werte eingeben während der Laufzeit. Nutzer SQL1 basierend auf OAI-Kurs Copyright Oracle Corporation, 1998. All rights reserved SQL2 basierend
MehrWiederholung VU Datenmodellierung
Wiederholung VU Datenmodellierung VL Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester
MehrSeminar Database Tuning & Administration. Irina Andrei Ketevan Karbelashvili
Seminar Database Tuning & Administration Irina Andrei Ketevan Karbelashvili Database Tuning Tuning ist die Summe aller Maßnahmen, welche die Optimierung der Antwortzeiten und die Verbesserung der Skalierbarkeit
MehrTeil II: Architektur eines Data-Warehouse-Systems... 57
O:/Wiley/Reihe_Dummies/9783527714476_Gerken/3d/ftoc.3d from 08.08.2018 14:02:02 Auf einen Blick Einleitung... 19 Teil I: Was ist ein Data Warehouse?... 25 Kapitel 1: Ein Beispiel zur Einführung..... 27
MehrDie relationale Abfragesprache SQL Structured Query Language
Die relationale Abfragesprache SQL Structured Query Language Übersicht Einfache Abfragen SQL*Plus Auswahlbedingungen (where-klausel) Ein-Zeilen-Funktionen, Gruppenfunktionen Gruppierung von Daten Unter-Abfragen
MehrData Warehousing. Weitere Buzzwörter: OLAP, Decision Support, Data Mining
Data Warehousing Weitere Buzzwörter: OLAP, Decision Support, Data Mining Wichtige Hinweise Zu diesem Thema gibt es eine Spezialvorlesung im Sommersemester Hier nur grober Überblick über Idee und einige
MehrArbeit mit zusammengesetzten Datentypen
Arbeit mit zusammengesetzten Datentypen Zusammengesetzte Datentypen Typen: PL/SQL RECORDS PL/SQL TABELLEN Enthalten interne Komponenten Sind wiederverwendbar Copyright Oracle Corporation, 1998. All rights
Mehr6.2 Datenmodellierung
Umsetzung des multidimensionalen Modells Interne Verwaltung der Daten durch - Relationale Strukturen (Tabellen) Relationales OLAP (ROLAP) Vorteile: Verfügbarkeit, Reife der Systeme - Multidimensionale
MehrDatenbanksysteme 2011
Datenbanksysteme 2011 Kapitel 16: Objektorientierte Datenbanken Vorlesung vom 05.07.2011 Oliver Vornberger Institut für Informatik Universität Osnabrück 1 Schwächen relationaler Systeme Buch: {[ISBN, Verlag,
MehrDatenbanksysteme 2 Frühjahr-/Sommersemester 2014 28. Mai 2014
Lehrstuhl für Praktische Informatik III Prof. Dr. Guido Moerkotte Email: moer@db.informatik.uni-mannheim.de Marius Eich Email: marius.eich@uni-mannheim.de Datenbanksysteme 2 8. Übungsblatt Frühjahr-/Sommersemester
MehrDatabase Tuning & Administration. von Andreas Engl und Dennis Stratmann
Database Tuning & Administration von Andreas Engl und Dennis Stratmann Vorbereitung Wir haben uns in unserer Projektarbeit mit DB2 Express Edition von IBM beschäftigt. Unsere Aufgabe bestand aus mehreren
MehrKapitel 6. Vorlesung: PD Dr. Peer Kröger
Kapitel 6 Einführung in Data Warehouses Vorlesung: PD Dr. Peer Kröger Dieses Skript basiert auf den Skripten zur Vorlesung Datenbanksysteme II an der LMU München Dieses Skript basiert auf den Skripten
MehrVorlesung Wissensentdeckung in Datenbanken
Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Uwe Ligges Informatik LS 8 22.04.2010 1 von 26 Gliederung 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der
MehrData-Warehouse-Technologien
Data-Warehouse-Technologien Prof. Dr.-Ing. Kai-Uwe Sattler 1 Prof. Dr. Gunter Saake 2 1 TU Ilmenau FG Datenbanken & Informationssysteme 2 Universität Magdeburg Institut für Technische und Betriebliche
MehrVorlesung Wissensentdeckung in Datenbanken
Gliederung Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Claus Weihs 14.07.2009 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der Cube-Operator 5 Implementierung
MehrPrakt. Datenbankprogrammierung. Sommersemester I,9: Datenmanipulation. Daten-Manipulations-Sprache. Das INSERT-Statement
Prakt. Datenbankprogrammierung Sommersemester 2005 I,9: Datenmanipulation Daten-Manipulations-Sprache DML-Statements werden ausgeführt bei: Hinzufügen von Datensätzen Modifizieren von Datensätzen Löschen
MehrSkripte schreiben. Überblick SQL*Plus. Einloggen in SQL*Plus. Tabellenstrukturen anzeigen
Skripte schreiben Überblick Login in. Beschreiben der Tabellenstrukturen. Editieren der SQL-Anweisung Ausführen von SQL aus. SQL-Anweisungen in Dateien speichern bzw. SQL-Anweisungen anhängen. Ausführen
MehrKapitel 7 Grundlagen von Data
LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS DATABASE Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2014 Kapitel 7 Grundlagen von Data Warehouses Vorlesung: PD
MehrOracle Analytic Functions
Mittwoch, 13.02.2008, 17:00 Uhr Regionaltreffen München/Südbayern Oracle Analytic Functions Seit Jahren auf dem Markt (8.1.6), jedoch unbekannt und selten im Einsatz S e i t e 1 Agenda Einsatzmöglichkeiten
MehrDatenbanken Labor, MI : Übung 1 SQL - Abfragen Patrick Lipinski
Aufgabe 1 Erstellen Sie eine Abfrage, die aus der EMP/DEPT-Tabelle die Felder Empno, Ename, Deptno und dname aller Mitarbeiter mit einem Gehalt von > 2500 ausgibt. select EMPNO, ENAME from EMP where SAL
MehrArt der Info: Technische Background Info Teil 3 (April 2002)
Betrifft: Autor: Oracle9i New Features SQL und PL/SQL Patrick Malcherek (patrick.malcherek@trivadis.com) Art der Info: Technische Background Info Teil (April 00) Quelle: Aus dem NF9i-Kurs und NF9i-Techno-Circle
MehrData Warehousing Kapitel 3: Mehrdimensionale Datenmodellierung
Data Warehousing Kapitel 3: Mehrdimensionale Datenmodellierung und Operationen Michael Hartung Sommersemester 2011 Universität Leipzig Institut für Informatik y y y http://dbs.uni-leipzig.de SS11, Prof.
MehrUnterstützung der Unternehmenssteuerung durch Data Warehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen
Rückblick Unterstützung der Unternehmenssteuerung durch Data arehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen Online Transaction Processing (OLTP) und Online Analytical Processing unterscheiden
MehrUnterstützung der Unternehmenssteuerung durch Data Warehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen
Rückblick Unterstützung der Unternehmenssteuerung durch Data arehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen Online Transaction Processing (OLTP) und Online Analytical Processing unterscheiden
MehrData Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Sommersemester 2004 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte
MehrBrücken bauen im dimensionalen Modell
Brücken bauen im dimensionalen Modell DOAG Konferenz 2012 Dani Schnider Trivadis AG Nürnberg, BASEL BERN LAUSANNE ZÜRICH DÜSSELDORF FRANKFURT A.M. FREIBURG I.BR. HAMBURG MÜNCHEN STUTTGART WIEN 1 Dani Schnider
MehrMaterialized Views. Jan-Peter Timmermann. DOAG Regiotreffen Hamburg: Materialized Views Seite 1
Materialized Views Jan-Peter Timmermann DOAG Regiotreffen Hamburg: Materialized Views Seite 1 Klassische View Sind virtuelle Tabellen Erstellung nicht aufwendig, da nur ein Eintrag im Data Dictionary vorgenommen
MehrOracle9i Data Warehouse Komponenten im praktischen Einsatz
Oracle9i Data Warehouse Komponenten im praktischen Einsatz Thomas Gutacker TechSpring GmbH 10. März 2004 Inhalt Data Warehouse Grundlagen Architektur des Projektes Umsetzung mit Oracle9i-Komponenten Data
MehrSQL Intensivpraktikum SS 2008
SQL Intensivpraktikum SS 2008 Aggregation von Daten Arbeit mit Gruppen SQL1 basierend auf OAI-Kurs Copyright Oracle Corporation, 1998. All rights reserved. Gruppenfunktionen Gruppenfunktionen verarbeiten
MehrData Cube. 1. Einführung. 2. Aggregation in SQL, GROUP BY. 3. Probleme mit GROUP BY. 4. Der Cube-Operator. 5. Implementierung des Data Cube
Data Cube 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator 5. Implementierung des Data Cube 6. Zusammenfassung und Ausblick Dank an Hanna Köpcke! 1 On-line Analytical
MehrZWISCHEN ALBTRAUM UND OPTIMALER PERFORMANCE
ZWISCHEN ALBTRAUM UND OPTIMALER PERFORMANCE Indexierungsstrategie im Data Warehouse Dani Schnider, Trivadis AG DOAG Konferenz, Nürnberg BASEL BERN LAUSANNE ZÜRICH DÜSSELDORF FRANKFURT A.M. FREIBURG I.BR.
MehrEinführung in Data Warehouses
Vorlesung Datebanksysteme II im SoSe 2015 Einführung in Data Warehouses Vorlesung: PD Dr. Peer Kröger Einführung in Data Warehouses Übersicht 1 Einleitung 2 Datenmodellierung 3 Anfragebearbeitung 2 Einführung
MehrDatenbanken Grundlagen und Design
Frank Geisler Datenbanken Grundlagen und Design 3., aktualisierte und erweiterte Auflage mitp Vorwort 15 Teil I Grundlagen 19 i Einführung in das Thema Datenbanken 21 i.i Warum ist Datenbankdesign wichtig?
MehrAnalytic Views: Einsatzgebiete im Data Warehouse
Analytic Views: Einsatzgebiete im Data Warehouse Dani Schnider Trivadis AG Zürich/Glattbrugg, Schweiz Einleitung Analytic Views sind eine der wesentlichen Erweiterungen in Oracle 12c Release 2. Durch zusätzliche
MehrSÄTZE MIT VARIABLER LÄNGE
Sätze variabler Länge 1 SÄTZE MIT VARIABLER LÄNGE Generellere Struktur von Datensätzen: Ersetzen von Felder durch Gruppen von Feldern. Beispiel: n m E 1 E 2 e 1 e 2 e 11 e 12 e 21 e 22 e 23 e 24 variable
MehrData Warehouse Grundlagen
Seminarunterlage Version: 2.13 Version 2.13 vom 27. August 2018 Dieses Dokument wird durch die veröffentlicht.. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen sind Warenzeichen
MehrData Cubes PG Wissensmangement Seminarphase
PG 402 - Wissensmangement Seminarphase 23.10.2001-25.10.2001 Hanna Köpcke Lehrstuhl für Künstliche Intelligenz Universität Dortmund Übersicht 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit
MehrDatenbanken Implementierungstechniken SS2015
Hochschule für Technik, Wirtschaft und Kultur Leipzig Leipzig University of Applied Sciences Parallele DBMS Datenbanken Implementierungstechniken SS2015 Alexander Müller Fakultät Informatik, Mathematik
Mehr5 Data Warehouses und Data Mining
5 Data Warehouses und Data Mining Mittels OLAP Techniken können große Datenmengen unterschiedlich stark verdichtet und gezielt aufbereitet werden. Mittels Data Mining können große Datenmengen nach bisher
MehrErzeugung und Veränderung von Tabellen
Datenbanken - Objekte Erzeugung und Veränderung von Tabellen Objekt Tabelle View Sequence Index Synonym Basiseinheit zum Speichern; besteht aus Zeilen und Spalten; Logische Repräsentation; kann Teilmengen
MehrPrakt. Datenbankprogrammierung. Sommersemester I,5: Aggregieren von Daten mit Gruppen-Funktionen
Prakt. Datenbankprogrammierung Sommersemester 2005 I,5: Aggregieren von Daten mit Gruppen-Funktionen Martin-Luther-Universität Halle, Institut für Informatik, Datenbanken Christian Goldberg Was sind Gruppen-Funktionen?
MehrTU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D.
TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D. Übung zur Vorlesung Einführung in die Informatik 2 für Ingenieure (MSE) Alexander van Renen (renen@in.tum.de)
MehrInhalt. Behandlung von Views durch den CBO View Merging Predicate Pushing Complex View Merging Hints in Views Globale Hints. Dr.
Inhalt Behandlung von Views durch den CBO View Merging Predicate Pushing Complex View Merging Hints in Views Globale Hints Dr.Frank Haney 1 Behandlung von Views durch den CBO View Merging bedeutet, daß
Mehr5.4 Benchmarks für Data Warehouses
5.4 Benchmarks für Data Warehouses Benchmark ( Massstab ) zum Vergleich der Leistungsfähigkeit von Systemen Für Datenbanken: Serie von Benchmarks des Transaction Processing Performance Council (www.tpc.org)
MehrIndex- und Zugriffsstrukturen für. Holger Brämer, 05IND-P
Index- und Zugriffsstrukturen für Data Warehousing Holger Brämer, 05IND-P Index- und Zugriffstrukturen für Data Warehousing Materialisierte Sichten Bitmap-Indexe Verbundindexe Materialisierte Sichten gehören
MehrDatenbanksysteme I WS 18/19 Teillösung Übungsblatt 4-6
Datenbanksysteme I WS 18/19 Teillösung Übungsblatt 4-6 Universität Leipzig, Institut für Informatik Abteilung Datenbanken Prof. Dr. E. Rahm, V. Christen, M. Franke DBS1 Blatt 4 Mitschreibbar 2 Welche Autoren
MehrData Warehousing Grundbegriffe und Problemstellung
Data Warehousing Grundbegriffe und Problemstellung Dr. Andrea Kennel, Trivadis AG, Glattbrugg, Schweiz Andrea.Kennel@trivadis.com Schlüsselworte Data Warehouse, Cube, Data Mart, Bitmap Index, Star Queries,
Mehr3. Mehrdimensionale Datenmodellierung und Operationen Grundlagen
3. Mehrdimensionale Datenmodellierung und Operationen Grundlagen Kennzahlen, Dimensionen, Cube Cuboide / Aggregationsgitter hierarchische Dimensionen / Konzepthierarchien Cube-Operationen Multi-dimensionale
MehrINDEXIERUNGS- STRATEGIE IM DATA WAREHOUSE
INDEXIERUNGS- STRATEGIE IM DATA WAREHOUSE ZWISCHEN ALBTRAUM UND OPTIMALER PERFORMANCE DOAG Konferenz 2011 Dani Schnider Trivadis AG Nürnberg, BASEL BERN LAUSANNE ZÜRICH DÜSSELDORF FRANKFURT A.M. FREIBURG
Mehr4. Aufgabenblatt - Auswertung -
4. Aufgabenblatt - Auswertung - Patrick Schäfer Berlin, 22. Januar 2017 patrick.schaefer@hu-berlin.de Agenda Aufgabe 4 Aufgabe 5: Naïve Bayes Daten (Wettbewerbsaufgabe!) - Gegeben sei eine Datenbank aller
MehrData Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte
MehrSQL/OLAP und Multidimensionalität in der Lehre
SQL/OLAP und Multidimensionalität in der Lehre Vortrag auf der DOAG 2008 Prof. Dr. Reinhold von Schwerin Hochschule Ulm, Fakultät für Informatik 1. Dezember 2008 Prof. Dr. Reinhold von Schwerin SQL/OLAP
MehrOracle OLAP 11g: Performance für das Oracle Data Warehouse
Oracle OLAP 11g: Performance für das Oracle Data Warehouse Marc Bastien Oracle BI Presales Agenda Performanceprobleme in Oracle DWH: gibt s das überhaupt? Mögliche Gründe und Lösungen
Mehr