Beispiele und Eigenschaften von Unternehmensanwendungen. Dr. Matthias Uflacker, Stefan Klauck 18. April 2018

Ähnliche Dokumente
Charakteristika von Unternehmensanwendungen

Eigenschaften von Unternehmensanwendungen. Dr. Matthias Uflacker, Stefan Halfpap, Dr. Werner Sinzig 17. April 2019

Unternehmensanwendungen. Dr. Matthias Uflacker, Stefan Klauck 16. April 2018

Einführung in Hauptspeicherdatenbanken

Datenbanken: Weitere Konzepte. Dr. Matthias Uflacker, Stefan Klauck 7. Mai 2018

Charakteris*ka von Unternehmensanwendungen

Datenbanken: Datenkompression. Dr. Matthias Uflacker, Stefan Klauck 2. Mai 2018

Datenbanken Grundlagen und Design

1 Einführung Ziele der Vorlesung Die Idee Lernkarte Selbsttest-Frage 3 Literaturhinweise 3

Datenbanken Unit 9: OLAP, OLTP, Data Warehouse Ranking Algorithmen

Datenbanken: Relationales Modell und SQL. Dr. Matthias Uflacker, Stefan Klauck 23. April 2018

Datenbanken: Tabellenrepräsentation im Speicher. Dr. Matthias Uflacker, Stefan Klauck 25. April 2018

Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken

Neues aus der nicht-, semi- und relationalen Welt

Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken

Einführung in Hauptspeicherdatenbanken

Inhaltsverzeichnis. Teil I Die Zukunft von Enterprise-Computing... 1 I I 2 3 3

Oracle Database 12c In-Memory Option 7/18/2014. Eckart Mader Oracle Deutschland B.V. & Co. KG. Karlsruhe, den

SODA. Die Datenbank als Document Store. Rainer Willems. Master Principal Sales Consultant Oracle Deutschland B.V. & Co. KG

Inhaltsverzeichnis. Vorwort Kapitel 1 Einleitung... 15

Exadata und In-Memory Datenbewirtschaftung und Analyse Extrem mit Exadata und InMemory (Erfahrungsbericht)

Wir bauen uns ein Data Warehouse mit MySQL

Inhaltsverzeichnis. Vorwort 13. Kapitel 1 Einleitung 15

Auf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort... 13

Auf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort 13

SAP HANA ist schnell erklärt. TOBA Trainerwochenende vom Mai 2013 in Prag

Vorwort zur 5. Auflage Über den Autor... 16

Skalierbare Webanwendungen

2 Datenbanksysteme, Datenbankanwendungen und Middleware... 45

IN RAM we trust! In- Memory- Datenbanken SAP HANA. BI & Big Data Juli 2015 Seite 56

Einsatz von BI-Methoden in der simulativen Geschäftsprozessmodellierung

Datenbank-Tuning. Folien zum Datenbankpraktikum Wintersemester 2009/10 LMU München

Arbeiten im Arbeitsspeicher

eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator

SS 2010 IBB4C Datenmanagement Fr 15:15 16:45 R Vorlesung #1. Datenmanagement

Konzeptueller Entwurf

Data Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik

SAFE HARBOR STATEMENT

ZWISCHEN ALBTRAUM UND OPTIMALER PERFORMANCE

Teil II: Architektur eines Data-Warehouse-Systems... 57

Big Data Neue Erkenntnisse aus Daten gewinnen

Inhaltsverzeichnis. Vorwort... 11

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.

Bearbeitung eines Kundenauftrages

Themenblock: Erstellung eines Cube

<Insert Picture Here> 8. Business Intelligence & Data Warehouse Konferenz

Visualisierung in Informatik und Naturwissenschaften

SAP BW auf HANA Frank Riesner, Solution Architect, SAP (Schweiz) AG

Produktionscontrolling auf dem Weg zur Industrie 4.0

II Heterogenität und Architekturen

OXO³ technische Aspekte der Oracle EMEA internen BI Implementierung

1. Übungsblatt. Besprechung: (Gruppe A), (Gruppe B), (Gruppe C)

Marketing Intelligence Vorstellung der Softwarekomponenten. Josef Kolbitsch Manuela Reinisch

AKTUELLE LÖSUNGSARCHITEKTUR DER SAP IM BEREICH BUSINESS INTELLIGENCE UND ANALYTICS

Business Intelligence & Reporting. Michael Cordes Holger Oehring Matthias Rein

SS 2011 IBB4C Datenmanagement Fr 15:15 16:45 R Vorlesung #1

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird.

Oracle BI&W Referenz Architektur Big Data und High Performance Analytics

8. Datenbank-Benchmarks Benchmark-Anforderungen TPC-Benchmarks OLTP-Benchmarks

Aufbau eines Kennzahlensystems in der Logistik mit Oracle BI

Datenbanken. Datenbanken. Grundlagen und Design. Grundlagen und Design. Frank. Geisler. 4. Auflage

9. Sicherheitsaspekte

Roadshow - What s new in SQL Server 2016

InspireIT. SAP HANA Sesam öffne dich. Stefan Kühnlein Solution Architekt OPITZ CONSULTING Deutschland GmbH. Frankfurt am Main,

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004

Inhaltsverzeichnis Vorwort zur vierten Auflage Vorwort zur dritten Auflage Vorwort zur zweiten Auflage Vorwort zur ersten Auflage Hinweise zur CD

Praktische SQL-Befehle

Business Intelligence mit DeltaMaster Sehen, verstehen, handeln!

Übersicht SAP-BI. DOAG Regionaltreffen

Indexe. Ein Index = eine Struktur auf Platte, die einer Tabelle oder Sicht zugeordent ist, um die Tupeln in der Tabelle oder Sicht schneller abzurufen

Grundlagen von SQL. Informatik 2, FS18. Dr. Hermann Lehner (Material von Dr. Markus Dahinden) Departement Informatik, ETH Zürich

5/14/18. Grundlagen von SQL. Grundlagen von SQL. Google, Facebook und Co. setzen auf SQL. Whatsapp

Datenbanken & Informationssysteme (WS 2016/2017)

Wirtschaftsinformatik 7a: Datenbanken. Hochschule für Wirtschaft und Recht SS 16 Dozent: R. Witte

Oracle OLAP 11g: Performance für das Oracle Data Warehouse

Präsentation der Bachelorarbeit

105.3 SQL-Datenverwaltung

Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen

Vorlesung Wissensentdeckung in Datenbanken

SAP BO Web Intelligence auf SQL Server [A4] Üetliberg,

Vorlesung Wissensentdeckung in Datenbanken

ORM & OLAP. Object-oriented Enterprise Application Programming Model for In-Memory Databases. Sebastian Oergel

Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH

Performance Tuning and Optimizing SQL Databases MOC 10987

DATA WAREHOUSE. Big Data Alfred Schlaucher, Oracle

Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing

Multidimensionale Modellierung

Oracle In-Memory & Data Warehouse: Die perfekte Kombination?

Vorlesung Methodische Grundlagen des Software-Engineering im Sommersemester 2014

Datenbanksysteme 2009

Sinn (und Unsinn) für Informix Benutzer

Rolf Däßler. Das Einsteigersem. MySQL 5

Objektorientierte Datenbanken

Oracle 12cR1 In-Memory Real World POC and what s coming up with 12cR2 Christian Pfundtner DB Masters GmbH Stammersdorfer Str Gerasdorf

SAP Analytics in der Praxis Einfach und verständlich erklärt. UnitCon/ARITHNEA Kundentag, Benedikt Bonnmann

Transkript:

Beispiele und Eigenschaften von Unternehmensanwendungen Dr. Matthias Uflacker, Stefan Klauck 18. April 2018

Vorlesungsinhalte/-aufbau Phase 1 Einführung zu Unternehmensanwendungen (2 Vorlesungen) Grundlagen von spaltenorientierten Hauptspeicherdatenbanken (4 Vorlesungen) Wöchentliche Übungsblätter Phase 2 Grundlagen des IT-gestützten Rechnungswesens und Planung (3 Vorlesungen) Programmiermodelle für Unternehmensanwendungen (1 Vorlesung) Zwei praktische Programmierübungen Klausur 2

Überblick Unternehmensanwendungen Beispiele für Unternehmensanwendungen Datenbankanfrageeigenschaften von Unternehmensanwendungen OLTP vs. OLAP Trennung in eigenständige Systeme Optimierung eines Systems für beide Anfragearten Eigenschaften von Unternehmensdaten Zusammenfassung Übungsblatt 1 3

Enterprise applications are about the display, manipulation, and storage of large amounts of often complex data and the support or automation of business processes with that data. Martin Fowler Patterns of Enterprise Application Architecture Patterns (2002) Große komplexe Datenmengen, die in der realen Welt existierende Entitäten abbilden Unterstützung/Automatisierung von Geschäftsprozessen auf Basis dieser Daten Nutzen üblicherweise (relationale) Datenbanken 4

Beispiele für Unternehmensanwendungen Klassische Domäne ERP, SCM, CRM (siehe 01_Unternehmensanwendungen) Erweiterte Domäne Neue Technologien haben Einfluss auf Unternehmensanwendungen. Informationsintegration aus unterschiedlichen Quellen bietet neue Möglichkeiten zur Anreicherung und dadurch Optimierung der klassischen Unternehmensprozesse. Sensordaten in Produktionsüberwachung Unstrukturierte Daten wie medizinische Behandlungsberichte und Röntgenbilder Posts im Web und auf sozialen Netzwerken zum Einfluss von Produkten 5

Beispiele für Unternehmensanwendungen Klassische Domäne: Abwicklung eines Kaufauftrags Frank Körsgen SAP R/3 Arbeitsbuch (2005) Prozesse im Vertrieb werden durch Vertriebs-/Verkaufsbelege abgebildet Kundenanfrage Angebot Auftrag Lieferung Rechnung Buchhaltungsbeleg 6

Beispiele für Unternehmensanwendungen Klassische Domäne: Abwicklung eines Kaufauftrags Vorkommende teils aufwändige Prozesse Preisfindung Verfügbarkeitsprüfung Bedarfsübergabe (an Einkauf und/oder Fertigung) Versandterminierung Versandstellen- und Routenermittlung Kreditlimitprüfung 7

Beispiele für Unternehmensanwendungen Klassische Domäne: Abwicklung eines Kaufauftrags Verfügbarkeitsprüfung Zugänge zum Wunschliefertermin Abgänge zum Wunschliefertermin Fertigungsaufträge Lieferungen Bestellungen Aufträge Bestand verfügbare Menge Basiered auf Frank Körsgen SAP R/3 Arbeitsbuch (2005) 8

Datenbankanfrageeigenschaften Online Transaction Processing (OLTP) Beispiele: Auftrag anlegen, Rechnung erstellen, Kontenbuchung, Anlegen und Anzeigen von Stammdaten Transaktionsorientierung Dateneingabe und abruf Einzelne Tupel Online Analytical Processing (OLAP) Beispiele: Mahnlauf, Verfügbarkeitsprüfung, Cross-Selling, Operationales Reporting (Auflistung offenen Rechnungen) Decision Support Mehrdimensionale Analyseanfragen Viele Tupel, aber wenige Attribute 9

Systemtrennung Unternehmensanwendungen beinhalten sowohl transaktionale als auch analytische Anfragen Aber: Anforderungen an OLAP- und OLTP-Datenbanksysteme sind widersprüchlich (historischer) Ansatz 1: Trennung in eigenständige Systeme (Tuning der Datenspeicherung und des Schemas) Data Warehouse: separate optimierte OLAP-Datenbank Effizientere Bearbeitung komplexer analytischer Anfragen Daten vieler Datenbanken können integriert werden (moderner) Ansatz 2: Optimierung eines Systems für beide Anfragearten (mit Kompromissen) 10

Systemtrennung: Datensicht im Data-Warehouse Mehrdimensionale Datensicht: Datenwürfel (OLAP-Würfel) Store Relationale Umsetzung im Sternschema mit Denormalisierungen aus Performanzgründen R(elational)OLAP Product Patrick O'Neil The Star Schema Benchmark and Augmented Fact Table Indexing (2009) Umsetzung mittels spezialisierter Datenstruktur zum Teil mit materialisierten Aggregaten M(ultidimensional)OLAP 11

Nachteile der Systemtrennung Datenredundanz Synchronisierung der Systeme durch Extract, Transform, Load (ETL) Kostenintensiver Prozess ETL verursacht eine Zeitverzögerung Unterschiedliche Daten Schemas erzeugen ein höhere Komplexität für Anwendungen, die beide Systeme nutzen (OLAP-Systeme halten eine vordefinierte Untermenge aller Daten) 12

Kombination von OLTP und OLAP in einem System Eine Datenbasis als Wahrheitsquelle ( Single source of truth ) Ziel sind ad-hoc-analysen auf dem transaktionalen Schema ohne materialisierte Sichten (z.b. vorberechnete Aggregate) Mixed Workloads auf einem System -> Vereinfachte Anwendungen (nur eine DB mit allen Datenpunkten anfragen) und Datenbankstrukturen (weniger Indexe, keine materialisierte Sichten) Ermöglicht durch modernere Hardware Dennoch: für spezielle Charakteristiken optimierte Datenbanksysteme sind One size fits all Systemen überlegen Michael Stonebraker One Size Fits All: An Idea Whose Time Has Come and Gone (2005) 13

Vielseitige Anfrageeigenschaften ( Mixed Workloads ) Vereinen Eigenschaften von OLTP und OLAP Komplette Zeilenoperationen und Materialisierung weniger Spalten Einfache und komplexe Abfragen Tuple Wiederherstellung und Aggregationen, Gruppierungen, Joins INSERTS, UPDATES und viele SELECTS Kurze und lange Transaktionen Vordefinierte und ad-hoc Abfragen 14

Anfrageeigenschaften: OLTP Datenzugriffsmythos Workload Analysen von Unternehmensanwendungen zeigen: OLTP und OLAP Workloads unterscheiden sich NICHT wesentlich bezüglich ihres Schreibanteil Workload 100% 90 % 80 % 70 % 60 % 50 % 40 % 30 % 20 % 10 % 0 % TPC-C Delete Modification Insert Read Workload 100% 90 % 80 % 70 % 60 % 50 % 40 % 30 % 20 % 10 % 0 % OLTP OLAP Delete Modification Insert Read Workload 100% 90 % 80 % 70 % 60 % 50 % 40 % 30 % 20 % 10 % 0 % Classic Simplified* SAP Financials Delete Modification Insert Read (a) TPC-C Benchmark (b) Workload Analysis Krueger et al. VLDB 11 (c) SAP Financials Workload Analysis Hasso Plattner The Impact of Columnar In-Memory Databases on Enterprise Systems (2014) 15

Eigenschaften von Unternehmensdaten Viele Tabellen haben hunderte von Attributen Viele Attribute werden in der Regel NICHT benutzt Für viele Attribute dominieren NULL oder DEFAULT-Werte Viele Attribute haben eine geringe Kardinalität (Anzahl verschiedener Attributwerte) Tabellen sind breit und spärlich gefüllt -> erlaubt effiziente Komprimierung Detaillierte Informationen in Jens Krüger Fast Updates on Read-Optimized Databases Using Multi-Core CPUs (2011) http://www.vldb.org/pvldb/vol5/p061_jenskrueger_vldb2012.pdf 16

Zusammenfassung Unternehmensanwendungen beinhalten sowohl transaktionale als auch analytische Anfragen; Insbesondere analytische Anforderungen sind mit der Zeit gewachsen Tabellen von Unternehmensanwendungen sind breit und spärlich gefüllt Zwei Ansätze: Separat optimierte Systeme vs. Vereinigung in einem System Vereinigung überwindet viele Nachteile der Systemtrennung Entsprechende Datenbankarchitekturen beinhalten viele Optimierungen, die den Anfrageund Datencharakteristiken gerecht werden (kommende Vorlesungen) 17

Übungsblatt 1 Unternehmensanwendungen Sommersemester 2018: Übung 1 Aufgabe 1 Lesen Sie Hasso Plattners Paper The Impact of Columnar In-Memory Databases on Enterprise Systems und beantworten Sie folgende Fragen: a) Was sind transaction-maintained Aggregate? b) Welche Nachteile haben diese? c) Beschreiben Sie die grundlegende Idee des Aggregate Caches? d) Welche Anwendungen werden im Paper genannt, die sowohl analytische als auch transaktionale Anfragemuster aufweisen? Kennen Sie weitere Anwendungen? e) Warum werden Inserts in Unternehmensanwendungen durch den Umstieg auf spaltenbasierte Hauptspeicherdatenbanken nicht unbedingt langsamer als in einer Zeilendatenbank? f) In welchem Fall ist eine zeilenbasierte Datenbank mit materialisierten Aggregaten einer Spaltendatenbank für Mengenoperationen überlegen? g) Erklären Sie warum spaltenbasierte Datenbanken die Entwicklung neuer Unternehmensanwendungen vereinfachen können. h) Was ist die Idee hinter der Datenpartitionierung von Unternehmensdaten in heiße und kalte Daten? Aufgabe 2 Installieren Sie die SAP HANA Tools. Fügen Sie in der Oberfläche die folgende HANA-Instanz zu Ihren (Datenbank-)Systemen hinzu: (Der Zugriff auf die Datenbank ist nur aus dem HPI-Netz möglich.) Host Name: syene Instance Nummer: 02 User Name: STUDENTS Password: Students2 Die Nutzung der SQL-Konsole des SAP HANA Tools ist für die zweite Übung empfohlen. Abgabeanweisung Die Aufgaben dürfen in Zweierteams bearbeitet werden. Senden Sie eine pdf-datei mit ihren Lösungen mit den Betreff [Unternehmensanwendungen Übung1] NACHNAME1 NACHNAME2 an stefan.klauck@hpi.de. Abgabefrist: 30. April Anywhere on Earth (AoE). Die pünktliche Abgabe und das Bestehen der Übungsblätter sind Voraussetzung für die Zulassung zur Klausur. 18