Data Warehouses und Data Mining
|
|
- Britta Kohler
- vor 7 Jahren
- Abrufe
Transkript
1 Data Warehouses und Data Mining Online Transaction Processing Data Warehouse-Anwendungen Data Mining
2 OLTP: Online Transaction Processing Beispiele: Flugbuchungssystem Bestellungen in einem Handelsunternehmen Charakteristisch: Hoher Parallelitätsgrad Viele (000+/sec) kurze Transaktionen Transaktionen bearbeiten nur ein kleines Datenvolumen "Mission-critical" für das Unternehmen Hohe Verfügbarkeit muss gewährleistet sein Normalisierte Relationen (möglichst wenig Update-Kosten) Nur wenige Indexe
3 Data Warehouse-Anwendungen: OLAP (Online Analytical Processing) Im Gegensatz zu OLTP stehen bei OLAP etwa folgende Fragestellungen im Zentrum: Wie hat sich die Auslastung der Transatlantikflüge über die letzten zwei Jahre entwickelt? oder Wie haben sich besondere offensive Marketingstrategien für bestimmte Produktlinien auf die Verkaufszahlen ausgewirkt?
4 Sammlung und periodische Auffrischung der Data Warehouse-Daten OLTP-Datenbanken und andere Datenquellen extract, transform, load OLAP-Anfragen Decision Support Data Mining Data Warehouse
5 Datenbank-Design für Data Warehouses: Stern-Schema Stern-Schema eines Date Warehouse: Eine sehr große Faktentabelle: Alle Verkäufe der letzten drei Jahre Alle Telefonate des letzten Jahres Alle Flugreservierungen der letzten fünf Jahre Normalisiert Mehrere Dimensionstabellen: Zeit Filialen Kunden Produkt Oft nicht normalisiert
6 Das Stern-Schema: Handelsunternehmen Kunden Produkte Verkäufe Filialen Zeit Fremdschlüsselbeziehungen Verkäufer
7 Das Stern-Schema: Krankenversicherung Patienten Ärzte Behandlungen Krankenhäuser Zeit Krankheiten
8 Stern-Schema Verkäufe VerkDatum Filiale Produkt Anzahl Kunde Verkäufer 25-Jul-00 Passau Faktentabelle (typischerweise SEHR groß, Tupel) Filialen Kunden FilialenKennung Land Bezirk KundenNr Name wiealt Passau D Bayern 47 Kemper 43 Dimensionstabellen (relativ klein) Verkäufer VerkäuferNr Name Fachgebiet Manager wiealt 825 Handyman Elektronik 9 23
9 Stern-Schema (cont d) Zeit Datum Tag Monat Jahr Quartal KW Wochentag Saison 25-Jul Dienstag Hochsommer 8-Dec Dienstag Weihnachten Typische Tupel-Anzahl: 000 (3 Jahre) Produkte ProduktNr Produkttyp Produktgruppe Produkthauptgruppe Hersteller Handy Mobiltelekom Telekom Siemens.... Typische Tupel-Anzahl: (Katalog)
10 Nicht-normalisierte Dimensionstabellen: Hierarchische Klassifizierung Zeit Datum Tag Monat Jahr Quartal KW Wochentag Saison 25-Jul Dienstag Hochsommer 8-Dec Dienstag Weihnachten Geltende FDs: Datum Monat Quartal ProduktNr Produkttyp Produkte Produktgruppe Produkthauptgruppe Hersteller Handy Mobiltelekom Telekom Siemens.... ProduktNr Produkttyp Produktgruppe Produkthauptgruppe
11 Normalisierung führt zum Schneeflocken-Schema Produkthauptgruppen Kunden Filialen Produktgruppen Produkttypen Zeit Verkäufe Verkäufer Produkte KWs Quartale
12 Typische Anfragen gegen Stern- Schemata: Analyse "Wieviele Handys welcher Hersteller haben junge Kunden in den Bayerischen Filialen zu Weihnachten 200 gekauft?" Verdichtung SELECT SUM(v.Anzahl), p.hersteller FROM Verkäufe v, Filialen f, Produkte p, Zeit z, Kunden k WHERE z.saison = 'Weihnachten' and Einschränkung z.jahr = 200 and k.wiealt < 30 and der Dimensionen p.produkttyp = 'Handy' and f.bezirk = 'Bayern' AND v.verkdatum = z.datum and v.produkt = p.produktnr and v.filiale = f.filialenkennung and v.kunde = k.kundennr GROUP BY p.hersteller; Verdichtung Join-Prädikate
13 Algebra-Ausdruck (Star Join) (Produkte) (Filialen) Verkäufe (Kunden) (Zeit)
14 Grad der Verdichtung: Roll-up/Drill-Down SELECT Jahr, Hersteller, SUM(v.Anzahl) FROM Verkäufe v, Produkte p, Zeit z WHERE v.produkt = p.produktnr AND v.verkdatum = z.datum AND p.produkttyp = 'Handy' GROUP BY p.hersteller, z.jahr; SELECT Jahr, SUM(v.Anzahl) FROM Verkäufe v, Produkte p, Zeit z WHERE v.produkt = p.produktnr AND v.verkdatum = z.datum AND p.produkttyp = 'Handy' GROUP BY z.jahr; Roll-up Drill-down
15 Analyse von Handyverkaufszahlen nach verschiedenen Dimensionen
16 Analyse von Handyverkaufszahlen nach verschiedenen Dimensionen Rollup Drill- Down
17 Data Cubes (n-dim. Datenwürfel) Die Darstellung derart verdichteter Information erfolgt in Decision-Support-Systemen oft spreadsheet-artig (cross tabulation): Dieser 2-dimensionale data cube fasst alle Anfrageergebnisse der vorhergenden Folie zusammen.
18 Ultimative Verdichtung Keine Gruppierung (keine GROUP BY-Klausel) alle Tupel bilden eine einzige Gruppe, bevor aggregiert wird: SELECT SUM(Anzahl) FROM Verkäufe v, Produkte p WHERE v.produkt = p.produktnr AND p.produkttyp = 'Handy';
19 Materialisierung von Aggregaten INSERT INTO Handy2DCube ( SELECT p.hersteller, z.jahr, SUM(v.Anzahl) FROM Verkäufe v, Produkte p, Zeit z WHERE v.produkt = p.produktnr and p.produkttyp = 'Handy' and v.verkdatum = z.datum GROUP BY z.jahr, p.hersteller ) UNION ( SELECT p.hersteller, NULL, SUM(v.Anzahl) FROM Verkäufe v, Produkte p WHERE v.produkt = p.produktnr and p.produkttyp = 'Handy' GROUP BY p.hersteller ) UNION ( SELECT NULL, z.jahr, SUM(v.Anzahl) FROM Verkäufe v, Produkte p, Zeit z WHERE v.produkt = p.produktnr and p.produkttyp = 'Handy' and v.verkdatum = z.datum GROUP BY z.jahr ) UNION ( SELECT NULL, NULL, SUM(v.Anzahl) FROM Verkäufe v, Produkte p WHERE v.produkt = p.produktnr and p.produkttyp = 'Handy' );
20 Relationale Struktur der Datenwürfel
21 Würfeldarstellung
22 Der CUBE-Operator (SQL:999) Die Materialisierung von Aggregaten führt zu aufwendigen Anfragen, deren Optimierung für das RDBMS schwierig ist: n Dimensionen 2 n Unterfragen, verbunden durch UNION Aggregate könnten hierarchisch berechnet werden Folgender CUBE-Operator ersetzt 2 3 Unteranfragen: SELECT p.hersteller, z.jahr, f.land, SUM(v.Anzahl) FROM Verkäufe v, Produkte p, Zeit z, Filialen f WHERE v.produkt = p.produktnr AND p.produkttyp = 'Handy' AND v.verkdatum = z.datum AND v.filiale = f.filialenkennung GROUP BY CUBE (z.jahr, p.hersteller, f.land);
23 Wiederverwendung von Teil-Aggregaten Annahme: Folgende Verdichtung liegt in der Datenbank vorausberechnet vor (materialisiert): INSERT INTO VerkäufeProduktFilialeJahr ( SELECT v.produkt, v.filiale, z.jahr, SUM(v.Anzahl) FROM Verkäufe v, Zeit z WHERE v.verkdatum = z.datum GROUP BY v.produkt, v.filiale, z.jahr ); Dann läßt sich folgende Anfrage auf der vorausberechneten Verdichtung VerkäufeProduktFilialeJahr berechnen (anstatt auf die Faktentabelle Verkäufe zugreifen zu müssen): SELECT v.produkt, v.filiale, SUM(v.Anzahl) FROM Verkäufe v VerkäufeProduktFilialeJahr v GROUP BY v.produkt, v.filiale
24 Die Materialisierungs-Hierarchie { } {Produkt} {Jahr} {Filiale} {Produkt, Jahr} {Produkt, Filiale} {Filiale, Jahr} {Produkt, Filiale, Jahr} Teilaggregate T sind für eine Aggregation A wiederverwendbar wenn es einen gerichteten Pfad von T nach A gibt Also T A Man nennt diese Materialisierungshierarchie auch einen Verband (Engl. lattice)
25 Die Zeit-Hierarchie Jahr Quartal Woche (KW) Monat Tag
26 Bitmap-Indexe Typische OLAP-Workloads lassen die Ausnutzung sehr spezifischer Index-Strukuren zu. Hier: Index auf spezifische Werte eines Attributes mit kleiner diskreter Domäne: Optimierung durch Komprimierung der Bitmaps Ausnutzung der dünnen Besetzung, bspw. durch runlengthcompression Speichere jeweils die Länge der Nullfolgen zwischen zwei Einsen
27 Bitmap-Indexe: Beispiel-Anfrage und Auswertung Marketing-Aktion: Extrahiere junge, gerade volljährige Kundinnen: SELECT k.name FROM Kunden k WHERE k.geschlecht = 'w' AND k.wiealt BETWEEN 8 AND 9; Unterstützung der Anfrage durch folgende Operation auf Bitmap-Indizes: (w 8 w 9 ) G w
28 Bitmap-Operationen
29 Bitmap-Indizes als Join-Indizes Klassischer Join-Index Bitmap-Join-Index Bitmap-Join-Index
30 B-Baum TID-V B-Baum TID-K (i,ii)(ii,i)(iii,ii)(iv,ii)(v,i)(vi,ii) (I,i)(I,v)(II,i)(II,iii)(II,iv)(II,vi)
31 5 5 B-Baum TID-V SELECT k.* FROM Verkäufe v, Kunden k WHERE v.produktid = 5 AND v.kundennr = k.kundennr (i,ii)(ii,i)(iii,ii)(iv,ii)(v,i)(vi,ii)
32 B-Baum TID-K SELECT v.* FROM Verkäufe v, Kunden k WHERE k.kundennr = 47 AND v.kundennr = k.kundennr (I,i)(I,v)(II,i)(II,iii)(II,iv)(II,vi)
33
34 Erinnerung: Star Join "Wieviele Handys welcher Hersteller haben junge Kunden in den Bayerischen Filialen zu Weihnachten 200 gekauft?" SELECT SUM(v.Anzahl), p.hersteller FROM Verkäufe v, Filialen f, Produkte p, Zeit z, Kunden k WHERE z.saison = 'Weihnachten' and Einschränkung z.jahr = 200 and k.wiealt < 30 and der Dimensionen p.produkttyp = 'Handy' and f.bezirk = 'Bayern' AND v.verkdatum = z.datum and v.produkt = p.produktnr and v.filiale = f.filialenkennung and v.kunde = k.kundennr GROUP BY p.hersteller; Join-Prädikate
35 Illustration des Star Join Zeit Verkäufe Kunden Filialen Produkte
36 Bitmap-Indexe für die Dimensions- Selektion Zeit Verkäufe Kunden Filialen Produkte
37 Bitmap-Indizes als Join-Indizes Klassischer Join-Index Bitmap-Join-Index Bitmap-Join-Index
38 Ausnutzung der Bitmap-Join-Indexe Zeit Verkäufe Kunden Filialen Produkte
39 Eine weitere Join-Methode: DiagJoin Geeignet zur Verfolgung von :N-Beziehungen Daten sind geballt (clustered) durch zeitlich nahe Einfügung in beide beteiligten Tabellen Beispiel: Order (Bestellung) Lineitem (Bestellposition) Order Lineitem Die Lineitems einer Order kommen zeitlich kurz hintereinander Grundidee des DiagJoins besteht darin, synchron über die beiden Relationen zu laufen Die Orders werden in einem Fenster (sliding window) gehalten
40 DiagJoin 232 Junker 3452 Lola 9965 Kaller 9876 Hummer 7765 Müller 5645 Maier 47 Kemper Order# Customer Order Handy 9876 Mixer Handy Papier 4 47 Fax 7765 Hub Toner 3 47 Drucker 2 47 Laptop 5645 PC 47 Preis Produkt Position Order# LineItem
41 DiagJoin 232 Junker 3452 Lola 9965 Kaller 9876 Hummer 7765 Müller 5645 Maier 47 Kemper Order# Customer Order Handy 9876 Mixer Handy Papier 4 47 Fax 7765 Hub Toner 3 47 Drucker 2 47 Laptop 5645 PC 47 Preis Produkt Position Order# LineItem
42 DiagJoin 232 Junker 3452 Lola 9965 Kaller 9876 Hummer 7765 Müller 5645 Maier 47 Kemper Order# Customer Order Handy 9876 Mixer Handy Papier 4 47 Fax 7765 Hub Toner 3 47 Drucker 2 47 Laptop 5645 PC 47 Preis Produkt Position Order# LineItem
43 DiagJoin 232 Junker 3452 Lola 9965 Kaller 9876 Hummer 7765 Müller 5645 Maier 47 Kemper Order# Customer Order Handy 9876 Mixer Handy Papier 4 47 Fax 7765 Hub Toner 3 47 Drucker 2 47 Laptop 5645 PC 47 Preis Produkt Position Order# LineItem
44 DiagJoin 232 Junker 3452 Lola 9965 Kaller 9876 Hummer 7765 Müller 5645 Maier 47 Kemper Order# Customer Order Handy 9876 Quirl 5 47 Mixer Handy Papier 4 47 Fax 7765 Hub Toner 3 47 Drucker 2 47 Laptop 5645 PC 47 Preis Produkt Position Order# LineItem
45 DiagJoin 232 Junker 3452 Lola 9965 Kaller 9876 Hummer 7765 Müller 5645 Maier 47 Kemper Order# Customer Order Handy 9876 Quirl 5 47 Mixer Handy Papier 4 47 Fax 7765 Hub Toner 3 47 Drucker 2 47 Laptop 5645 PC 47 Preis Produkt Position Order# LineItem Tupel muss zwischengespeichert und "nachbearbeitet" werden (temp file).
46 Anforderungen an den DiagJoin :N-Beziehung zwischen beteiligten Tabellen Die ""-er Tupel sind in etwa dersleben Reihenfolge gespeichert worden wie die "N"-er Tupel Die Tupel werden in der "time-of-creation"-reihenfolge wieder von der Platte gelesen (full table scan) Die referentielle Integrität sollte gewährleistet sein (Warum?) Das Fenster muss so groß sein, daß nur wenige Tupel nachbearbeitet werden müssen Nachbearbeitung bedeutet: Tupel auf dem Hintergrundspeicher (temp file) speichern Den zugehörigen Joinpartner in Order via Index auffinden Dafür ist ein Index auf Order.Order# hierfür notwendig Kein Index nötig für die erste Phase des DiagJoins
47 Data Mining Klassifikation Assoziationsregeln
48 Data Mining : Klassifikationsregeln Ziel des Data Mining: Durchsuchen großer Datenmengen nach bisher unbekannten Zusammenhängen (Knowledge discovery) Klassifikation: Treffe "Vorhersagen" auf der Basis bekannter Attributwerte Vorhersageattribute: V, V 2,, V n Vorhergesagtes Attribut: A Klassifikationsregel: P (V ) P 2 (V 2 ) P n (V n ) A = c Prädikate P, P 2,.., P n Konstante c Beispiel für eine Klassifikationsregel: (wiealt>35) (Geschlecht =`m ) (Autotyp=`Coupé ) (Risiko= hoch')
49 Klassifikations/Entscheidungsbaum Geschlecht m w wiealt geringes Risiko Jedes Blatt des Baumes entspricht einer Klassifikationsregel hohes Risiko <=35 >35 hohes Risiko Coupe Autotyp Van geringes Risiko
50 Klassifikations/Entscheidungsbaum Geschlecht m w wiealt geringes Risiko <=35 >35 hohes Risiko Autotyp Coupe Van (wiealt>35) (Geschlecht =`m ) (Autotyp=`Coupé ) (Risiko= hoch ) hohes Risiko geringes Risiko
51 Erstellung von Entscheidungs-/ Klassifikationsbäume Trainingsmenge Große Zahl von Datensätzen, die in der Vergangenheit gesammelt wurden Sie dient als Grundlage für die Vorhersage (= Klassifikation) von "neu ankommenden" Objekten Beispiel: neuer Versicherungskunde wird gemäß dem Verhalten seiner "Artgenossen" eingestuft Rekursives Partitionieren: Fange mit einem Attribut A an und spalte die Tupelmenge bzgl. ihrer A-Werte Jede dieser Teilmengen wird rekursiv weiter partitioniert Fortsetzen, bis nur noch gleichartige Objekte in der jeweiligen Partition sind
52 Data Mining : Assoziationsregeln Beispielregel: Wenn jemand einen PC kauft, dann kauft er/sie auch einen Drucker Confidence Dieser Wert legt fest, bei welchem Prozentsatz der Datenmenge, bei der die Voraussetzung (linke Seite) erfüllt ist, die Regel (rechte Seite) auch erfüllt ist. Eine Confidence von 80% für unsere Beispielregel sagt aus, dass vier Fünftel der Leute, die einen PC gekauft haben, auch einen Drucker dazu gekauft haben. Support Dieser Wert legt fest, wieviele Datensätze überhaupt gefunden wurden, um die Gültigkeit der Regel zu verifizieren. Bei einem Support von % wäre also jeder Hundertste Verkauf ein PC zusammen mit einem Drucker.
53 VerkaufsTransaktionen TransID Produkt Drucker Papier PC Toner 222 PC 222 Scanner 333 Drucker 333 Papier 333 Toner 444 Drucker 444 PC 555 Drucker 555 Papier 555 PC 555 Scanner 555 Toner Verkaufstransaktionen Warenkörbe Finde alle Assoziationsregeln L R mit einem Support größer als minsupp und einer Confidence von mindestens minconf Dazu sucht man zunächst die sogenannten frequent itemsets (FI), also Produktmengen, die in mindestens minsupp der Einkaufswägen/ Transaktionen enthalten sind Der A Priori-Algorithmus basiert auf der Erkenntnis, dass alle Teilmengen eines FI auch FIs sein müssen
54 A Priori Algorithmus für alle Produkte p überprüfe ob p ein frequent itemset (Kardinalität ) ist, also in mindestens minsupp Einkaufswägen enthalten ist k := iteriere solange für jeden frequent itemset I k mit k Produkten generiere alle itemsets I k + mit k+ Produkten und I k I k+ lies alle Einkäufe einmal (sequentieller Scan auf der Datenbank) und überprüfe, welche der (k+)-elementigen itemset- Kandidaten mindestens minsupp mal vorkommen k := k+ bis keine neuen frequent itemsets gefunden werden
55 VerkaufsTransaktionen TransID Produkt Drucker Papier PC Toner 222 PC 222 Scanner 333 Drucker 333 Papier 333 Toner 444 Drucker 444 PC 555 Drucker 555 Papier 555 PC 555 Scanner 555 Toner Minsupp=3/5 Disqualifiziert A Priori-Algorithmus FI-Kandidat {Drucker} {Papier} {PC} {Scanner} {Toner} {Drucker, Papier} {Drucker, PC} {Drucker, Scanner} {Drucker, Toner} {Papier, PC} {Papier, Scanner} {Papier, Toner} {PC, Scanner} {PC,Toner} {Scanner, Toner} Zwischenergebnisse Anzahl
56 VerkaufsTransaktionen TransID Produkt Drucker Papier PC Toner 222 PC 222 Scanner 333 Drucker 333 Papier 333 Toner 444 Drucker 444 PC 555 Drucker 555 Papier 555 PC 555 Scanner 555 Toner A Priori-Algorithmus Zwischenergebnisse FI-Kandidat Anzahl {Drucker, Papier} 3 {Drucker, PC} 3 {Drucker, Scanner} {Drucker, Toner} 3 {Papier, PC} 2 {Papier, Scanner} {Papier, Toner} 3 {PC, Scanner} {PC,Toner} 2 {Scanner, Toner} {Drucker, Papier, PC} 2 {Drucker, Papier, Toner} 3 {Drucker, PC, Toner} 2 {Papier, PC, Toner} 2
57 Ableitung von Assoziationsregeln aus den frequent itemsets Betrachte jeden FI mit hinreichend viel support Bilde alle nicht-leeren Teilmengen L FI und untersuche die Regel L FI L Die Confidence dieser Regel berechnet sich als: confidence(l FI L) = support(fi) / support(l) Falls die Confidence > minconf ist, behalte diese Regel Betrachte FI = {Drucker, Papier, Toner}, L = {Drucker} support(fi) = 3/5 Regel: {Drucker} {Papier, Toner} confidence = support({drucker, Papier, Toner}) / support({drucker}) = (3/5) / (4/5 = = 75 %
58 Erhöhung der Confidence Vergrößern der linken Seite (dadurch Verkleinern der rechten Seite) führt zur Erhöhung der Confidence Formal: L L +, R R - confidence(l R) <= confidence(l + R - ) Beispiel-Regel: {Drucker} {Papier, Toner} confidence = support({drucker, Papier, Toner}) / support({drucker}) = (3/5) / (4/5) = = 75% Beispiel-Regel: {Drucker,Papier} {Toner} Confidence = support({drucker,papier,toner}) / support({drucker,papier}) = (3/5) / (3/5) = = 00%
Datenbanksysteme 2009
Datenbanksysteme 2009 Kapitel 17: Data Warehouse Oliver Vornberger Institut für Informatik Universität Osnabrück 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen
MehrKapitel 17: Date Warehouse
Kapitel 17: Date Warehouse 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen kleine, kurze Transaktionen jeweils auf jüngstem Zustand OLAP (Online Analytical
MehrBetriebliche Anwendungen
Betriebliche nwendungen SP R/3: Enterprise Resource Modelling (ERP-System) OLTP Data Warehouse Data Mining WN (Internet) LN Kapitel 17 1 Relationales DBMS als Backend-Server (Oracle, Informix, DB2, MS
MehrBetriebliche Anwendungen
Betriebliche Anwendungen SAP R/3: Enterprise Resource Modelling (ERP-System) OLTP Data Warehouse Data Mining WAN (Internet) LAN Kapitel 7 Relationales DBMS als Backend-Server (Oracle, Informix, DB2, MS
MehrBetriebliche Anwendungen
Betriebliche Anwendungen OLTP Data Warehouse Data Mining Kapitel 7 OLTP: Online Transaction Processing Beispiele Flugbuchungssystem Bestellungen in einem Handelsunternehmen Charakterisierung Hoher Parallelitätsgrad
MehrOLTP: Online Transaction Processing
Moderne Betriebliche Anwendungen von Datenbanksystemen Online Transaction Processing (bisheriger Fokus) Data Warehouse-Anwendungen Data Mining OLTP: Online Transaction Processing Beispiele Flugbuchungssystem
MehrData Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen
Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen (Folien von A. Kemper zum Buch 'Datenbanksysteme') Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP
MehrBetriebliche Anwendungen
Betriebliche Anwendungen OLTP Data Warehouse Data Mining Kapitel 17 1 OLTP: Online Transaction Processing Beispiele Flugbuchungssystem Bestellungen in einem Handelsunternehmen Charakterisierung Hoher Parallelitätsgrad
MehrBetriebliche Anwendungen
Betriebliche Anwendungen OLTP Data Warehouse Data Mining OLTP: Online Transaction Processing Beispiele Flugbuchungssystem Bestellungen in einem Handelsunternehmen Charakterisierung Hoher Parallelitätsgrad
MehrData Warehousing. Aufbau eines DWH OLAP <-> OLTP Datacube
Data Warehousing Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon 2 Datenbank 3 Fragen des Marketingleiters Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt
MehrData Warehousing. Beispiel: : Amazon. Aufbau eines DWH OLAP <-> OLTP Datacube. FU-Berlin, DBS I 2006, Hinze / Scholz
Data Warehousing Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon 2 1 Datenbank 3 Fragen des Marketingleiters Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt
MehrDatenbanksysteme 2009
Datenbanksysteme 2009 Vorlesung vom 07.07.09 Kapitel 16 + 17 Sicherheit + Data Warehouse Oliver Vornberger Institut für Informatik Universität Osnabrück 1 Datenschutz Datenbank 2 Legislative Maßnahmen
MehrModerne Betriebliche Anwendungen von Datenbanksystemen
Moderne Betriebliche Anwendungen von Datenbanksystemen Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP R/3) Data Warehouse-Anwendungen Data Mining OLTP: Online Transaction
MehrData Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube
Fragen des Marketingleiters Data Warehousing Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt nach? Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon Technisch
MehrOperative vs. Informationelle Systeme. Informationelle Systeme. Informationelle Systeme. Moderne Betriebliche Anwendungen von Datenbanksystemen
Moderne Betriebliche Anwendungen von Datenbanksystemen Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP R/) Data Warehouse-Anwendungen Data Mining Operative vs. Informationelle
MehrData Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:
Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse
MehrData Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:
Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse
MehrData Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:
Kapitel 16 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining operationale DB operationale DB operationale DB Data Warehouse operationale
MehrDatenbanken Unit 9: OLAP, OLTP, Data Warehouse Ranking Algorithmen
Datenbanken Unit 9: OLAP, OLTP, Data Warehouse Ranking Algorithmen 28. V. 2018 Outline 1 Organisatorisches 2 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 3 Ranking 4 SQL Organisatorisches Ergebnisse
Mehr5 Data Warehouses und Data Mining
5 Data Warehouses und Data Mining Mittels OLAP Techniken können große Datenmengen unterschiedlich stark verdichtet und gezielt aufbereitet werden. Mittels Data Mining können große Datenmengen nach bisher
MehrDatenbanksysteme 2011
Datenbanksysteme 2011 Kapitel 16: Objektorientierte Datenbanken Vorlesung vom 05.07.2011 Oliver Vornberger Institut für Informatik Universität Osnabrück 1 Schwächen relationaler Systeme Buch: {[ISBN, Verlag,
MehrDatenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken
Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken 31. V. 2016 Outline 1 Organisatorisches 2 SQL 3 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 4 Objekt-relationale Datenbanken Beispiel
MehrDatenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken
Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken 17. V. 2017 Outline 1 Organisatorisches 2 SQL 3 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 4 Objekt-relationale Datenbanken Beispiel
MehrDatenbanksysteme 2 Frühjahr-/Sommersemester 2014 28. Mai 2014
Lehrstuhl für Praktische Informatik III Prof. Dr. Guido Moerkotte Email: moer@db.informatik.uni-mannheim.de Marius Eich Email: marius.eich@uni-mannheim.de Datenbanksysteme 2 8. Übungsblatt Frühjahr-/Sommersemester
MehrVorlesung Wissensentdeckung in Datenbanken
Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Uwe Ligges Informatik LS 8 22.04.2010 1 von 26 Gliederung 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der
MehrVorlesung Wissensentdeckung in Datenbanken
Gliederung Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Claus Weihs 14.07.2009 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der Cube-Operator 5 Implementierung
MehrData Cube. 1. Einführung. 2. Aggregation in SQL, GROUP BY. 3. Probleme mit GROUP BY. 4. Der Cube-Operator. 5. Implementierung des Data Cube
Data Cube 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator 5. Implementierung des Data Cube 6. Zusammenfassung und Ausblick Dank an Hanna Köpcke! 1 On-line Analytical
Mehr8.1 Überblick. 8 Data Warehousing. klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des (
c M. Scholl, 2005/06 Informationssysteme: 8. Data Warehousing 8-1 8 Data Warehousing 8.1 Überblick In klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des ( operativen
Mehr8.1 Überblick. 8 Data Warehousing. klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des (
c M. Scholl, 2003/04 Informationssysteme: 8. Data Warehousing 8-1 8 Data Warehousing 8.1 Überblick In klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des ( operativen
Mehr9 Data Warehousing. klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des (
9 Data Warehousing 9.1 Überblick In klassischen Datenbankanwendungen werden Datenbanken im wesentlichen zur Abwicklung des ( operativen ) Tagesgeschäfts verwendet (z.b.: Buchungen, Einkauf/Verkauf, Personal,...)
MehrData Cubes PG Wissensmangement Seminarphase
PG 402 - Wissensmangement Seminarphase 23.10.2001-25.10.2001 Hanna Köpcke Lehrstuhl für Künstliche Intelligenz Universität Dortmund Übersicht 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit
MehrEinführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.
Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen
MehrThemenblock: Erstellung eines Cube
Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen
MehrAnfragen an multidimensionale Daten
Anfragen an multidimensionale Daten Alexander Heidrich - BID8 09.06.2005 Hintergrundbild: http://www.csc.calpoly.edu/~zwood/teaching/csc471/finalproj02/afternoon/mfouquet/cube.jpg Inhaltsübersicht Motivation
MehrUnterstützung der Unternehmenssteuerung durch Data Warehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen
Rückblick Unterstützung der Unternehmenssteuerung durch Data arehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen Online Transaction Processing (OLTP) und Online Analytical Processing unterscheiden
MehrUnterstützung der Unternehmenssteuerung durch Data Warehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen
Rückblick Unterstützung der Unternehmenssteuerung durch Data arehouses mit ganzheitlicher Sicht auf Daten aus operativen Systemen Online Transaction Processing (OLTP) und Online Analytical Processing unterscheiden
MehrMultidimensionale Modellierung
Multidimensionale Modellierung Vorlesung: Übung: Patrick Schäfer Berlin, 27. November 2017 patrick.schaefer@hu-berlin.de https://hu.berlin/vl_dwhdm17 https://hu.berlin/ue_dwhdm17 Grundlagen Fakten (Kennzahlen/Messgrößen):
MehrData Warehousing Kapitel 3: Mehrdimensionale Datenmodellierung
Data Warehousing Kapitel 3: Mehrdimensionale Datenmodellierung und Operationen Michael Hartung Sommersemester 2011 Universität Leipzig Institut für Informatik y y y http://dbs.uni-leipzig.de SS11, Prof.
MehrDatenbanken Unit 10: Ranking und Data Mining Erstellen und Ändern von Datenbanken
Datenbanken Unit 10: Ranking und Data Mining Erstellen und Ändern von Datenbanken 7. VI. 2016 Organisatorisches nächste Woche am 14. Juni Abschlusstest (Gruppe 1: 10:00 11:15, Gruppe 2: 11:30 12:45 ) Übungsblatt
MehrAufgabe 1: [Logische Modellierung]
Aufgabe 1: [Logische Modellierung] a) Entwerfen Sie für das von Ihnen entworfene Modell aus Aufgabe 2 des 1. Übungsblattes ein Star-Schema. b) Entwerfen Sie für das vorangegangene Modell einen Teil eines
Mehr6.6 Vorlesung: Von OLAP zu Mining
6.6 Vorlesung: Von OLAP zu Mining Definition des Begriffs Data Mining. Wichtige Data Mining-Problemstellungen, Zusammenhang zu Data Warehousing,. OHO - 1 Definition Data Mining Menge von Techniken zum
MehrSummarization-based Aggregation
Summarization-based Aggregation Daten Generalisierung: Prozess, der Anwendungsdaten schrittweise von niedrigen auf höhere konzeptuelle Level aggregiert Conceptual levels 2 3 4 5 example: all federal states
MehrSQL - Datenbankdesign - Aufbau
SQL - Datenbankdesign - Aufbau Kompakt-Intensiv-Training Unsere fünftägige ANSI SQL Schulung vermittelt Ihnen alle nötigen Kenntnisse zur Erstellung von Datenauswertungen und Programmierung wiederkehrender
MehrMining über RDBMSe. von. Christian Widmer. Wie gut lässt sich Mining mit SQL realisieren?
Mining über RDBMSe von Christian Widmer Wie gut lässt sich Mining mit SQL realisieren? Müssen neue Konstrukte zur Verfügung gestellt werden, wenn ja welche? Vortragsüberblick Association Rules Apriori
MehrData Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY
Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung
MehrWissensentdeckung in Datenbanken
Wissensentdeckung in Datenbanken SQL, Häufige Mengen Nico Piatkowski und Uwe Ligges 11.05.2017 1 von 16 Überblick Was bisher geschah... Modellklassen Verlustfunktionen Numerische Optimierung Regularisierung
MehrVorlesung Wissensentdeckung in Datenbanken
Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Claus Weihs 21.04.2015 1 von 40 Gliederung 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der Cube-Operator
MehrData Warehousing. Weitere Buzzwörter: OLAP, Decision Support, Data Mining
Data Warehousing Weitere Buzzwörter: OLAP, Decision Support, Data Mining Wichtige Hinweise Zu diesem Thema gibt es eine Spezialvorlesung im Sommersemester Hier nur grober Überblick über Idee und einige
Mehr6.2 Datenmodellierung
Umsetzung des multidimensionalen Modells Interne Verwaltung der Daten durch - Relationale Strukturen (Tabellen) Relationales OLAP (ROLAP) Vorteile: Verfügbarkeit, Reife der Systeme - Multidimensionale
MehrAnfragesprachen für On-Line Analytical Processing (OLAP)
Anfragesprachen für On-Line Analytical Processing (OLAP) Seminar Business Intelligence Teil I: OLAP & Data Warehousing René Rondot rondot@informatik.uni-kl.de Universität Kaiserslautern Anfragesprachen
MehrWelche Kunden haben die gleiche Ware bestellt? select distinct a1.name, a2.name from Auftrag a1, Auftrag a2 where a1.ware = a2.ware.
*HVFKDFKWHOWH$QIUDJHQ In einer SQL-Anweisung können in der where-klausel, from-klausel, select-klausel wieder SQL-Anweisungen auftreten. Man spricht dann auch von einer geschachtelten Anfrage oder Unteranfrage.
MehrDatenbank Grundlagen. Performanceuntersuchungen
Vorlesung Datenbanken, Entwurfsarbeit 1 Fachbereich Automatisierung und Informatik Wernigerode Datenbank Grundlagen Performanceuntersuchungen Entwicklung einer Datenbank zur Verwaltung eines Bestellwesens
MehrRepetitorium. Data Warehousing und Data Mining 11/12. Sebastian Wandelt 13./16. Februar 2012
Repetitorium Data Warehousing und Data Mining 11/12 Sebastian Wandelt 13./16. Februar 2012 Inhalt Data Warehousing und Data Mining auf 40 Slides Weder in-, noch exklusiv! Subjektive Zusammenfassung pro
MehrDatenbanken Unit 4: Das Relationale Modell & Datenintegrität
Datenbanken Unit 4: Das Relationale Modell & Datenintegrität 15. III. 2016 Outline 1 Organisatorisches 2 SQL 3 Relationale Algebra Notation 4 Datenintegrität Organisatorisches Erster Zwischentest: nach
MehrDatenbanken Unit 5: Datenintegrität und funktionale Abhängigkeit
Datenbanken Unit 5: Datenintegrität und funktionale Abhängigkeit 23. IV. 2018 Outline 1 Organisatorisches 2 Relationale Algebra Notation 3 Datenintegrität 4 Funktionale Abhängigkeit 5 SQL Outline 1 Organisatorisches
MehrKap. 6 Data Warehouse
1 Kap. 6 Data Warehouse 6.1 Was ist ein Data Warehouse, Motivation? 6.2 Data Cube und Cube-Operationen 6.3 Workshop: MS SQL Server, Cube Operationen 6.4 Physischer Entwurf, Implementierung von Cubes 6.5
Mehr3. Mehrdimensionale Datenmodellierung und Operationen Grundlagen
3. Mehrdimensionale Datenmodellierung und Operationen Grundlagen Kennzahlen, Dimensionen, Cube Cuboide / Aggregationsgitter hierarchische Dimensionen / Konzepthierarchien Cube-Operationen Multi-dimensionale
MehrFrühjahrsemester 2011. Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil
Frühjahrsemester Data Warehousing Kapitel 5: Data Warehousing H. Schuldt Wiederholung aus Kapitel 5. Einführung Tresgros Tresgros Tresgros Filiale Muttenz Filiale Allschwil Filiale Liestal Anfragen: Welches
MehrTU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Dr. Thomas Neumann
TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Dr. Thomas Neumann Blatt Nr. 10 Übung zur Vorlesung Einsatz und Realisierung von Datenbanksystemen im SoSe15 Moritz Kaufmann (moritz.kaufmann@tum.de)
Mehr1 Vorstellung Kursbeispiel
1 Vorstellung Kursbeispiel Dieses Kapitel basiert auf den datenbanktheoretischen Grundlagen des Kapitel 1 und stellt die im Kurs verwendete Testdatenbank vor. Weiterhin soll grob skizziert werden, wie
MehrDatenbanken & Informationssysteme (WS 2016/2017)
Datenbanken & Informationssysteme (WS 2016/2017) Klaus Berberich (klaus.berberich@htwsaar.de) Wolfgang Braun (wolfgang.braun@htwsaar.de) 0. Organisatorisches Dozenten Klaus Berberich (klaus.berberich@htwsaar.de)
MehrData Warehouse Technologien
Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............
MehrIndex- und Zugriffsstrukturen für. Holger Brämer, 05IND-P
Index- und Zugriffsstrukturen für Data Warehousing Holger Brämer, 05IND-P Index- und Zugriffstrukturen für Data Warehousing Materialisierte Sichten Bitmap-Indexe Verbundindexe Materialisierte Sichten gehören
MehrKapitel 6. Vorlesung: PD Dr. Peer Kröger
Kapitel 6 Einführung in Data Warehouses Vorlesung: PD Dr. Peer Kröger Dieses Skript basiert auf den Skripten zur Vorlesung Datenbanksysteme II an der LMU München Dieses Skript basiert auf den Skripten
MehrFrühjahrsemester 2010. Data Warehousing Kapitel 5: Data Warehousing. H. Schuldt. 5.1 Einführung. Filiale Allschwil
Frühjahrsemester Data Warehousing Kapitel 5: Data Warehousing H. Schuldt Wiederholung aus Kapitel 5. Einführung Tresgros Tresgros Tresgros Filiale Muttenz Filiale Allschwil Filiale Liestal Anfragen: Welches
MehrVeit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien
Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...
MehrISU 1. Ue_08/02_Datenbanken/SQL. 08 Datenbanken. Übung. SQL Einführung. Eckbert Jankowski. www.iit.tu-cottbus.de
08 Datenbanken Übung SQL Einführung Eckbert Jankowski www.iit.tu-cottbus.de Datenmodell (Wiederholung, Zusammenfassung) Objekte und deren Eigenschaften definieren Beziehungen zwischen den Objekten erkennen/definieren
MehrDatenbanken Unit 11: Data Mining
Datenbanken Unit 11: Data Mining 11. VI. 2018 Organisatorisches Diesen Mittwoch UE-Abschlusstest (Gruppe 1: 17:30 18:30, Gruppe 2: 16:15 17:15 ) Klassifikation Outline 1 Organisatorisches 2 Data Mining
MehrZWISCHEN ALBTRAUM UND OPTIMALER PERFORMANCE
ZWISCHEN ALBTRAUM UND OPTIMALER PERFORMANCE Indexierungsstrategie im Data Warehouse Dani Schnider, Trivadis AG DOAG Konferenz, Nürnberg BASEL BERN LAUSANNE ZÜRICH DÜSSELDORF FRANKFURT A.M. FREIBURG I.BR.
MehrData Warehousing. und Operationen. Dr. Andreas Thor Wintersemester 2009/10. Universität Leipzig Institut für Informatik.
Data Warehousing Kapitel 3: Mehrdimensionale Datenmodellierung und Operationen Dr. Andreas Thor Wintersemester 2009/10 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de WS09/10, Prof.
MehrOracle 10g Einführung
Kurs Oracle 10g Einführung Teil 5 Einführung Timo Meyer Administration von Oracle-Datenbanken Timo Meyer Sommersemester 2006 Seite 1 von 16 Seite 1 von 16 Agenda 1 Tabellen und Views erstellen 2 Indizes
MehrIndexe. Ein Index = eine Struktur auf Platte, die einer Tabelle oder Sicht zugeordent ist, um die Tupeln in der Tabelle oder Sicht schneller abzurufen
Indexe im Praxis Indexe Ein Index = eine Struktur auf Platte, die einer Tabelle oder Sicht zugeordent ist, um die Tupeln in der Tabelle oder Sicht schneller abzurufen Gute Indexierung schnelle Applikation
MehrKapitel 7 Grundlagen von Data
LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS DATABASE Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2014 Kapitel 7 Grundlagen von Data Warehouses Vorlesung: PD
MehrVertrautmachen mit Daten
Kapitel III Vertrautmachen mit Daten 2004 AIFB / FZI 1 III Vertrautmachen mit Daten (see also Data Preparation ) 2004 AIFB / FZI 2 III Vertrautmachen mit Daten III.1 OLAP III.1.1 Einführung in OLAP Wie
MehrDatenbanken Grundlagen und Design
Frank Geisler Datenbanken Grundlagen und Design 3., aktualisierte und erweiterte Auflage mitp Vorwort 15 Teil I Grundlagen 19 i Einführung in das Thema Datenbanken 21 i.i Warum ist Datenbankdesign wichtig?
Mehr23. Daten-Analyse. Datenwarenhäuser. Grundlagen des OLAP (On-Line Analytical Processing)
23. Daten-Analyse Datenwarenhäuser Grundlagen des OLAP (On-Line Analytical Processing) Data Mining: Klassifikation, Assoziationsregeln, Sequenzanalyse Datenmodelle, Datenbanksprachen und Datenbankmanagement-Systeme,
MehrDimensionen, Measures
... Operationen und peicherung Multi-dimensionaler Daten Aggregate um RED WHITE BLUE Group By (with total) By Color um Cross Tab Chevy Ford By Color RED WHITE BLUE By Make um By Make & Year By Year FORD
MehrWiederholung VU Datenmodellierung
Wiederholung VU Datenmodellierung VU Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester
MehrData Mining auf Datenströmen Andreas M. Weiner
Technische Universität Kaiserslautern Fachbereich Informatik Lehrgebiet Datenverwaltungssysteme Integriertes Seminar Datenbanken und Informationssysteme Sommersemester 2005 Thema: Data Streams Andreas
MehrWiederholung VU Datenmodellierung
Wiederholung VU Datenmodellierung VL Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester
MehrINTELLIGENTE DATENANALYSE IN MATLAB. Unüberwachtes Lernen: Clustern von Attributen
INTELLIGENTE DATENANALYSE IN MATLAB Unüberwachtes Lernen: Clustern von Attributen Literatur J. Han, M. Kamber: Data Mining Concepts and Techniques. J. Han et. al: Mining Frequent Patterns without Candidate
MehrXML & Intelligente Systeme. - XQuery Teil 2 - Datamining auf XML Dokumenten
- XQuery Teil 2 - Datamining auf XML Dokumenten Seminarvortrag von Dominik Westhues dwesthue@techfak.uni-bielefeld.de 21.11.2005 Überblick XQuery & Datamining Verknüpfungsregeln Apriori Algorithmus Verknüpfungsregel
MehrVorlesung Wissensentdeckung in Datenbanken
Vorlesung Wissensentdeckung in Datenbanken Data Cube Kristian Kersting, (Katharina Morik), Claus Weihs Informatik LS 8 Computergestützte Statistik Technische Universität Dortmund 15.04.2014 1 von 43 Was
MehrVorlesung Datenbankmanagementsysteme
Vorlesung Datenbankmanagementsysteme SQL zur Datenanalyse & Einführung Online Analytical Processing (OLAP) (auf Basis von Oracle) Vorlesung Datenbankmanagementsysteme SQL zur Datenanalyse M. Lange, S.
MehrFakultät Angewandte Informatik Programmierung verteilter Systeme Übungen zur Vorlesung Informatik II, Blatt 6 - Musterlösung
WS 2011/12 Fakultät Angewandte Informatik Programmierung verteilter Systeme 05.12.2011 Prof. Dr. Bernhard Bauer Übungen zur Vorlesung Informatik II, Blatt 6 - Musterlösung Aufgabe 21 * (Objektrelationale
MehrTU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D.
TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof Alfons Kemper, PhD Blatt Nr 2 Übung zur Vorlesung Grundlagen: Datenbanken im WS5/6 Harald Lang, Linnea Passing (gdb@intumde) http://www-dbintumde/teaching/ws56/grundlagen/
MehrPartitionierungsstrategien für Data Vault
ierungsstrategien für Data Vault Dani Schnider Trivadis AG Zürich/Glattbrugg, Schweiz Einleitung Während das Laden von Tabellen in Data Vault in der Regel nicht zeitkritisch ist, stellt uns das effiziente
Mehr3. Mehrdimensionale Datenmodellierung und Operationen Grundlagen. multi-dimensionale Speicherung (MOLAP)
3. Mehrdimensionale Datenmodellierung und Operationen Grundlagen Kennzahlen, Dimensionen, Cube Cuboide / Aggregationsgitter hierarchische Dimensionen / Konzepthierarchien Cube-Operationen multi-dimensionale
MehrDatenbank-Tuning. Folien zum Datenbankpraktikum Wintersemester 2009/10 LMU München
Kapitel 7 Datenbank-Tuning Folien zum Datenbankpraktikum Wintersemester 2009/10 LMU München 2008 Thomas Bernecker, Tobias Emrich unter Verwendung der Folien des Datenbankpraktikums aus dem Wintersemester
MehrKonzeptbeschreibung Ziel: Methode: Vorgehen: Entfernen von Attributen Verallgemeinerung von Attributen Relevanzanalyse der restlichen Attribute
Konzeptbeschreibung Ziel: Knappe Charakterisierung einer Datenmenge im Vergleich zu einer anderen Datenmenge (Kontrastmenge) Methode: Herausfinden charakteristischer Attribute auf angemessener Abstraktionsebene
MehrStructured Query Language (SQL) als standardisierte Anfragesprache für relationale Datenbanken
Rückblick Structured Query Language (SQL) als standardisierte Anfragesprache für relationale Datenbanken Data Definition Language zur Schemadefinition (z.b. CREATE TABLE zum Anlegen von Tabellen) Data
MehrInformationsmaß. Konzeptbeschreibung. Beispiel für Konzept-Charakterisierung (1) Beispiel für Konzept-Charakterisierung (2)
Konzeptbeschreibung Ziel: Knappe Charakterisierung einer Datenmenge im Vergleich zu einer anderen Datenmenge (Kontrastmenge) Methode: Herausfinden charakteristischer Attribute auf angemessener Abstraktionsebene
MehrKapitel 3: Datenbanksysteme
LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Skript zur Vorlesung: Einführung in die Informatik: Systeme und Anwendungen Sommersemester 2009 Kapitel : Datenbanksysteme Vorlesung:
MehrDatenbanken zur Entscheidungsunterstützung - Data Warehousing. Prof. Dr. T. Kudraß 1
Datenbanken zur Entscheidungsunterstützung - Data Warehousing Prof. Dr. T. Kudraß 1 Einführung Zunehmender Bedarf nach Analyse aktueller und historischer Daten Identifizierung interessanter Patterns Entscheidungsfindung
MehrTeil II: Architektur eines Data-Warehouse-Systems... 57
O:/Wiley/Reihe_Dummies/9783527714476_Gerken/3d/ftoc.3d from 08.08.2018 14:02:02 Auf einen Blick Einleitung... 19 Teil I: Was ist ein Data Warehouse?... 25 Kapitel 1: Ein Beispiel zur Einführung..... 27
MehrHäufige Mengen ohne Kandidatengenerierung. FP-Tree: Transaktionen. Konstruktion eines FP-Trees. FP-Tree: Items
Häufige Mengen ohne Kandidatengenerierung Jiawei Han, Micheline Kamber 2006 (2nd ed.)! Ziel 1: Kompression der Datenbank in eine Frequent-Pattern Tree Struktur (FP-Tree)! Stark komprimiert, vollständig
Mehr