OLTP: Online Transaction Processing



Ähnliche Dokumente
Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen

Betriebliche Anwendungen

Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube

Kapitel 17: Date Warehouse

Betriebliche Anwendungen

Datenbanksysteme 2 Frühjahr-/Sommersemester Mai 2014

Data Warehousing. Aufbau eines DWH OLAP <-> OLTP Datacube

Data Warehousing. Beispiel: : Amazon. Aufbau eines DWH OLAP <-> OLTP Datacube. FU-Berlin, DBS I 2006, Hinze / Scholz

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Operative vs. Informationelle Systeme. Informationelle Systeme. Informationelle Systeme. Moderne Betriebliche Anwendungen von Datenbanksystemen

Objektorientierte Datenbanken

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Aufgabe 1: [Logische Modellierung]

5 Data Warehouses und Data Mining

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Whitepaper. Produkt: combit Relationship Manager. Einbindung externer FiBu-/Warenwirtschaftsdaten. combit GmbH Untere Laube Konstanz

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

Die Invaliden-Versicherung ändert sich

DB Restore mit SQL Server7

Whitepaper. Produkt: combit Relationship Manager. Einbindung externer FiBu-/Warenwirtschaftsdaten. combit GmbH Untere Laube Konstanz

Updatehinweise für die Version forma 5.5.5

7. Übung - Datenbanken

Allgemeines zu Datenbanken

Kampagnenmanagement mit Siebel Marketing/Oracle BI ein Praxisbericht

pro4controlling - Whitepaper [DEU] Whitepaper zur CfMD-Lösung pro4controlling Seite 1 von 9

Data Warehouse Definition (1)

SJ OFFICE - Update 3.0

Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum:

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Mengenvergleiche: Alle Konten außer das, mit dem größten Saldo.

OKB Die MS SQL-Volltextsuche für organice SQL einrichten

Ihre Lizenz ändern. Stand 01/2015

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

Vermeiden Sie es sich bei einer deutlich erfahreneren Person "dranzuhängen", Sie sind persönlich verantwortlich für Ihren Lernerfolg.

Was meinen die Leute eigentlich mit: Grexit?

DOKUMENTATION PASY. Patientendaten verwalten

Zentrum. Zentrum Ideenmanagement. Zentrum Ideenmanagement. Umfrage zur Nutzung von mobilen Endgeräten im Ideenmanagement

3. Stored Procedures und PL/SQL

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Data Mining-Modelle und -Algorithmen

Die Post hat eine Umfrage gemacht

Datenbanken Unit 9: OLAP, OLTP, Data Warehouse Ranking Algorithmen

oder ein Account einer teilnehmenden Einrichtung also

Dieses Dokument soll dem Administrator helfen, die ENiQ-Software als Client auf dem Zielrechner zu installieren und zu konfigurieren.

Österreichische Trachtenjugend

Handbuch zur Anlage von Turnieren auf der NÖEV-Homepage

MdtTax Programm. Programm Dokumentation. Datenbank Schnittstelle. Das Hauptmenü. Die Bedienung des Programms geht über das Hauptmenü.

Die Bundes-Zentrale für politische Bildung stellt sich vor

Version 1.0 [Wiederherstellung der Active Directory] Stand: Professionelle Datensicherung mit SafeUndSave.com. Beschreibung.

ACDSee Pro 2. ACDSee Pro 2 Tutorials: Übertragung von Fotos (+ Datenbank) auf einen anderen Computer. Über Metadaten und die Datenbank

Die Gesellschaftsformen

Anleitung zum erstellen einer PDF-Datei aus Microsoft Word

Relationale Datenbanken Datenbankgrundlagen

Mit der Maus im Menü links auf den Menüpunkt 'Seiten' gehen und auf 'Erstellen klicken.

Professionelle Seminare im Bereich MS-Office

Universität Augsburg, Institut für Informatik WS 2006/2007 Dr. W.-T. Balke 27. Nov M. Endres, A. Huhn, T. Preisinger Lösungsblatt 5

Terminabgleich mit Mobiltelefonen

Entwicklung des Dentalmarktes in 2010 und Papier versus Plastik.

Bei der Anlage von Pauschalen ist folgendes zu beachten!!!!!!!!

Downloadfehler in DEHSt-VPSMail. Workaround zum Umgang mit einem Downloadfehler

Lehrer: Einschreibemethoden

Datenbanken I - Übung 1

SHAREPOINT Unterschiede zwischen SharePoint 2010 & 2013

Business Intelligence Praktikum 1

Kinderarmut. 1. Kapitel: Kinderarmut in der Welt

WAS finde ich WO im Beipackzettel

Eva Douma: Die Vorteile und Nachteile der Ökonomisierung in der Sozialen Arbeit

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Wir gehen aus von euklidischen Anschauungsraum bzw. von der euklidischen Zeichenebene. Parallele Geraden schneiden einander nicht.

Programmieren für mobile Endgeräte SS 2013/2014. Dozenten: Patrick Förster, Michael Hasseler

Fachhochschule Deggendorf Platzziffer:...

Erstellen einer in OWA (Outlook Web App)

teamsync Kurzanleitung

Was ist PDF? Portable Document Format, von Adobe Systems entwickelt Multiplattformfähigkeit,

How-To-Do. Fernwartung einer VIPA Steuerung via Ethernet

INFORMATIONEN FÜR DIE PRAXIS

Anleitung zur Nutzung des SharePort Utility

Installation der SAS Foundation Software auf Windows

Mit dem Tool Stundenverwaltung von Hanno Kniebel erhalten Sie die Möglichkeit zur effizienten Verwaltung von Montagezeiten Ihrer Mitarbeiter.

Anleitung Abwesenheitsmeldung und -Weiterleitung (Kundencenter)

4. Mathematik Olympiade 2. Stufe (Kreisolympiade) Klasse 8 Saison 1964/1965 Aufgaben und Lösungen

Vorratsgesellschaften Der schnelle Weg zum eigenen Unternehmen interna

Benutzerhandbuch MedHQ-App

MORE Profile. Pass- und Lizenzverwaltungssystem. Stand: MORE Projects GmbH

BERECHNUNG DER FRIST ZUR STELLUNGNAHME DES BETRIEBSRATES BEI KÜNDIGUNG

Der monatliche Tarif für ein Handy wurde als lineare Funktion der Form f(x) = k x + d modelliert (siehe Grafik).

BlueEvidence Services in Elexis

ACDSee 10. ACDSee 10: Fotos gruppieren und schneller durchsuchen. Was ist Gruppieren? Fotos gruppieren. Das Inhaltsverzeichnis zum Gruppieren nutzen

2.5.2 Primärschlüssel

Leitfaden zur ersten Nutzung der R FOM Portable-Version für Windows (Version 1.0)

Transkript:

Moderne Betriebliche Anwendungen von Datenbanksystemen Online Transaction Processing (bisheriger Fokus) Data Warehouse-Anwendungen Data Mining OLTP: Online Transaction Processing Beispiele Flugbuchungssystem Bestellungen in einem Handelsunternehmen Charakterisierung Hoher Parallelitätsgrad Viele (Tausende pro Sekunde) kurze Transaktionen TAs bearbeiten nur ein kleines Datenvolumen mission-critical für das Unternehmen Hohe Verfügbarkeit muss gewährleistet sein Normalisierte Relationen (möglichst wenig Update-Kosten) Nur wenige Indexe (wegen Fortschreibungskosten) 1 A. Kemper / A. Eickler 2 Enterprise Resource Modelling (ERP-System, z.b. SAP) Dreistufige Client/Server-Architektur (3 Tier) WAN (Internet) sehr viele (Tausende) Clients Sehr schnelles LAN (z.b. FDDI) ein Datenbank- Server mehrere Applikations- Server zur Skalierung LAN langsame Netzverbindung (WAN, Internet, Telefon, ) Relationales DBMS als Backend-Server (Oracle, Informix, DB2, MS SQL-Server, Adabas) A. Kemper / A. Eickler 3 A. Kemper / A. Eickler 4 1

Data Warehouse-Anwendungen: OLAP~Online Analytical Processing Wie hat sich die Auslastung der Transatlantikflüge über die letzten zwei Jahre entwickelt? Sammlung und periodische Auffrischung der Data Warehouse-Daten OLTP-Datenbanken und andere Datenquellen OLAP-Anfragen Decision Support Data Mining oder Wie haben sich besondere offensive Marketingstrategien für bestimmte Produktlinien auf die Verkaufszahlen ausgewirkt? Data Warehouse A. Kemper / A. Eickler 5 A. Kemper / A. Eickler 6 Das Stern-Schema Stern-Schema bei Data Warehouse- Anwendungen Eine sehr große Faktentabelle Alle Verkäufe der letzten drei Jahre Alle Telefonate des letzten Jahres Alle Flugreservierungen der letzten fünf Jahre normalisiert Mehrere Dimensionstabellen Zeit Filialen Produkt Oft nicht normalisiert A. Kemper / A. Eickler 7 A. Kemper / A. Eickler 8 2

Das Stern-Schema: Handelsunternehmen Das Stern-Schema: Krankenversicherung Produkte Patienten Ärzte Verkäufe Filialen Behandlungen Krankenhäuser Zeit Zeit Verkäufer Krankheiten A. Kemper / A. Eickler 9 A. Kemper / A. Eickler 10 Stern-Schema Verkäufe VerkDatum Filiale Produkt Anzahl Kunde Verkäufer 25-Jul-00 Passau 1347 1 4711 825 Faktentabelle (SEHR groß) Filialen FilialenKennung Land Bezirk Nr Name wiealt Passau D Bayern 4711 Kemper 43 Dimensionstabellen (relativ klein) Verkäufer VerkäuferNr Name Fachgebiet Manager wiealt 825 Handyman Elektronik 119 23 A. Kemper / A. Eickler 11 Stern-Schema (cont d) Zeit Datum Tag Monat Jahr Quartal KW Wochentag Saison 25-Jul-00 25 7 2000 3 30 Dienstag Hochsommer 18-Dec-01 18 12 2001 4 52 Dienstag Weihnachten Produkte ProduktNr Produkttyp Produktgruppe Produkthauptgruppe Hersteller.. 1347 Handy Mobiltelekom Telekom Siemens.... A. Kemper / A. Eickler 12 3

Nicht-normalisierte Dimensionstabellen: effizientere Anfrageauswertung Zeit Datum Tag Monat Jahr Quartal KW Wochentag Saison 25-Jul-00 25 7 2000 3 30 Dienstag Hochsommer 18-Dec-01 18 12 2001 4 52 Dienstag Weihnachten Datum Monat Quartal Produkte ProduktNr Produkttyp Produktgruppe Produkthauptgruppe Hersteller.. 1347 Handy Mobiltelekom Telekom Siemens.... ProduktNr Produkttyp Produktgruppe Produkthauptgruppe A. Kemper / A. Eickler 13 Normalisierung führt zum Schneeflocken-Schema KWs Zeit Quartale Verkäufe Filialen Verkäufer Produkthauptgruppen Produktgruppen Produkttypen Produkte A. Kemper / A. Eickler 14 Anfragen im Sternschema Algebra-Ausdruck select sum(v.anzahl), p.hersteller from Verkäufe v, Filialen f, Produkte p, Zeit z, k where z.saison = 'Weihnachten' and Einschränkung z.jahr = 2001 and k.wiealt < 30 and der Dimensionen p.produkttyp = 'Handy' and f.bezirk = 'Bayern' and v.verkdatum = z.datum and v.produkt = p.produktnr and v.filiale = f.filialenkennung and v.kunde = k.nr group by p.hersteller; Join-Prädikate σ(produkte) σ() Verkäufe σ(filialen) σ(zeit) A. Kemper / A. Eickler 15 A. Kemper / A. Eickler 16 4

Roll-up/Drill-down-Anfragen select Jahr, Hersteller, sum(anzahl) from Verkäufe v, Produkte p, Zeit z where v.produkt = p.produktnr and v.verkdatum = z.datum and p.produkttyp = 'Handy' group by p.hersteller, z.jahr; Roll-up select Jahr, sum(anzahl) from Verkäufe v, Produkte p, Zeit z where v.produkt = p.produktnr and v.verkdatum = z.datum and p.produkttyp = 'Handy' group by z.jahr; Drill-down Ultimative Verdichtung select sum(anzahl) from Verkäufe v, Produkte p where v.produkt = p.produktnr and p.produkttyp = 'Handy'; A. Kemper / A. Eickler 17 A. Kemper / A. Eickler 18 Rollup Drill- Down A. Kemper / A. Eickler 19 A. Kemper / A. Eickler 20 5

Flexible Auswertungsmethoden: slice and dice Regionen Produktgruppen Regionen Produktgruppen Regionen Produktgruppen A. Kemper / A. Eickler 21 Materialisierung von Aggregaten insert into Handy2DCube ( select p.hersteller, z.jahr, sum(v.anzahl) from Verkäufe v, Produkte p, Zeit z where v.produkt = p.produktnr and p.produkttyp = 'Handy' and v.verkdatum = z.datum group by z.jahr, p.hersteller ) union ( select p.hersteller, to_number(null), sum(v.anzahl) from Verkäufe v, Produkte p where v.produkt = p.produktnr and p.produkttyp = 'Handy' group by p.hersteller ) union ( select null, z.jahr, sum(v.anzahl) from Verkäufe v, Produkte p, Zeit z where v.produkt = p.produktnr and p.produkttyp = 'Handy' and v.verkdatum = z.datum group by z.jahr ) union ( select null, to_number(null), sum(v.anzahl) from Verkäufe v, Produkte p where v.produkt = p.produktnr and p.produkttyp = 'Handy' ); A. Kemper / A. Eickler 22 Relationale Struktur der Datenwürfel Würfeldarstellung A. Kemper / A. Eickler 23 A. Kemper / A. Eickler 24 6

Der cube-operator select p.hersteller, z.jahr, f.land, sum(v.anzahl) from Verkäufe v, Produkte p, Zeit z, Filialen f where v.produkt = p.produktnr and p.produkttyp = 'Handy' and v.verkdatum = z.datum and v.filiale = f.filialenkennung group by cube (z.jahr, p.hersteller, f.land); Wiederverwendung von Teil-Aggregaten insert into VerkäufeProduktFilialeJahr ( select v.produkt, v.filiale, z.jahr, sum(v.anzahl) from Verkäufe v, Zeit z where v.verkdatum = z.datum group by v.produkt, v.filiale, z.jahr ); select v.produkt, v.filiale, sum(v.anzahl) from Verkäufe v group by v.produkt, v.filiale A. Kemper / A. Eickler 25 A. Kemper / A. Eickler 26 Wiederverwendung von Teil-Aggregaten select v.produkt, v.filiale, sum(v.anzahl) from VerkäufeProduktFilialeJahr v group by v.produkt, v.filiale Die Materialisierungs-Hierarchie { } {Produkt} {Jahr} {Filiale} select v.produkt, z.jahr, sum(v.anzahl) from Verkäufe v, Zeit z where v.verkdatum = z.datum group by v.produkt, z.jahr A. Kemper / A. Eickler 27 {Produkt, Jahr} {Produkt, Filiale} {Produkt, Filiale, Jahr} {Filiale, Jahr} Teilaggregate T sind für eine Aggregation A wiederverwendbar wenn es einen gerichteten Pfad von T nach A gibt Also T A Man nennt diese Materialisierungshierarchie auch einen Verband (Engl. Lattice) A. Kemper / A. Eickler 28 7

Die Zeit-Hierarchie Jahr Bitmap-Indexe (zusätzliche Zugriffsstruktur) Quartal Woche (KW) Tag Monat A. Kemper / A. Eickler 29 Optimierung durch Komprimierung der Bitmaps Ausnutzung der dünnen Besetzung Runlength-compression Grundidee: speichere jeweils die Länge der Nullfolgen zwischen zwei Einsen Mehrmodus-Komprimierung: bei langen Null/Einsfolgen speichere deren Länge Sonst speichere das Bitmuster A. Kemper / A. Eickler 30 Beispiel-Anfrage und Auswertung Bitmap-Operationen A. Kemper / A. Eickler 31 A. Kemper / A. Eickler 32 8

Data Mining Klassifikation Assoziationsregeln Klassifikationsregeln Vorhersageattribute V1, V2,, Vn Vorhergesagtes Attribut A Klassifikationsregel P1(V1) P2(V2) Pn(Vn) A = c Prädikate P1, P2,.., Pn Konstante c Beispielregel (wiealt>35) (Geschlecht =`m ) (Autotyp=`Coupé ) (= hoch ) Clustering 33 A. Kemper / A. Eickler 34 Klassifikations/Entscheidungsbaum Klassifikations/Entscheidungsbaum Geschlecht <=35 wiealt Geschlecht m >35 Coupe Autotyp A. Kemper / A. Eickler 35 w Van <=35 wiealt m >35 Coupe Autotyp A. Kemper / A. Eickler 36 w Van 9

Klassifikations/Entscheidungsbaum wiealt Geschlecht m w Wie werden Entscheidungs/ Klassifikationsbäume erstellt Trainingsmenge Große Zahl von Datensätzen, die in der Vergangenheit gesammelt wurden Sie dient als Grundlage für die Vorhersage von neu ankommenden Objekten Beispiel: neuer Versicherungskunde wird gemäß dem Verhalten seiner Artgenossen eingestuft <=35 >35 Autotyp Coupe Van (wiealt>35) (Geschlecht =`m ) (Autotyp=`Coupé ) (= hoch ) A. Kemper / A. Eickler 37 A. Kemper / A. Eickler 38 Assoziationsregeln Beispielregel Wenn jemand einen PC kauft, dann kauft er/sie auch einen Drucker Confidence Dieser Wert legt fest, bei welchem Prozentsatz der Datenmenge, bei der die Voraussetzung (linke Seite) erfüllt ist, die Regel (rechte Seite) auch erfüllt ist. Eine Confidence von 80% für unsere Beispielregel sagt aus, dass vier Fünftel der Leute, die einen PC gekauft haben, auch einen Drucker dazu gekauft haben. Support Dieser Wert legt fest, wieviele Datensätze überhaupt gefunden wurden, um die Gültigkeit der Regel zu verifizieren. Bei einem Support von 1% wäre also jeder Hundertste Verkauf ein PC zusammen mit einem Drucker. A. Kemper / A. Eickler 39 Clustering Schadenshöhe Outlier Alter der Fahrer A. Kemper / A. Eickler 40 10