Data Warehousing und Data Mining
|
|
- Walther Albert
- vor 6 Jahren
- Abrufe
Transkript
1 Data Warehousing und Data Mining Architektur und Komponenten von Data Warehouses Ulf Leser Wissensmanagement in der Bioinformatik
2 Data Warehouse Redundante Datenhaltung DWH kann unabhängig von Quellen entworfen werden Optimiert für andere Arten von Anfragen Quellen werden nur bei periodischen Uploads belastet Heterogenität muss beim Upload abgefangen werden Ulf Leser: Data Warehousing and Data Mining 2
3 Inhalt dieser Vorlesung Definition & Einbettung Architektur & Komponenten ETL: Extraction, Transformation, Load Ulf Leser: Data Warehousing and Data Mining 3
4 Definition DWH A DWH is a subject-oriented, integrated, non-volatile, and time-variant collection of data in support of management s decisions [Inm96] Subj-oriented: Verkäufe, Personen, Produkte, etc. Integrated: Erstellt aus vielen Quellen Non-Volatile: Hält Daten unverändert über die Zeit Time-Variant: Vergleich von Daten über die Zeit Decisions: Wichtige Daten rein, unwichtige raus Ulf Leser: Data Warehousing and Data Mining 4
5 Geschichte von DWH Managementinformationssysteme (MIS), Decision Support Systeme (DSS), Executive Information Systeme (EIS) Seit den 60er Jahren Feste, programmierte Reports Doppelte Datenhaltung teuer Downtimes für operative Sys. Nur einfachste Analysemethoden (Data Mining) Keine User-Interaktion, keine Ad-Hoc Queries Schattendasein Ulf Leser: Data Warehousing and Data Mining 5
6 Erfolg von DWH Top-Thema seit Mitte der 90er Jahre Voraussetzungen Extreme Verbilligung von Plattenspeicherplatz Relationale Modellierung: Anwendungsneutral IT in allen Unternehmensbereichen (z.b. SAP R/3) Vernetzung und Standardisierung (SQL) Trend zur rationalen Entscheidungsfindung im Unternehmen Grafische Nutzerinterfaces, Trend zur Interaktion Aber Vision der vollständigen Integration scheitert bisher (immer wieder aufs neue) Soziale versus technische Aspekte Ulf Leser: Data Warehousing and Data Mining 6
7 Betriebswirtschaftliche Sicht Ein DWH Ermöglicht viele neue Fragen Verbessert viele Antworten erheblich... durch... Direkter Zugriff auf integrierte Daten Übergreifende, vergleichende, historische Analysen Produkte, Niederlassungen, Kunden, Bessere Datenqualität Fehlerminimierung, Ergänzung, Plausibilitätschecks Korrektur von Fehlern ist im DWH vertretbar, aber nicht in den operativen Systemen (Originaldaten) Anreicherung mit externen Daten Externe Kundenprofile, geographische Daten, Ulf Leser: Data Warehousing and Data Mining 7
8 Informatische Sicht Operative Systeme Kassensysteme, Bestellabwicklung, Lagerverwaltung Viele Benutzer, kurze Transaktionen, einfache Queries Echtzeit -Anforderungen Kurzes Gedächtnis OLTP (Online Transaction Processing) DWH Sortimentplanung, Kapazitätsplanung, Marketing Wenige(r) Benutzer, komplexe Queries, nur lesend Zeitlich weniger kritisch Historische Daten OLAP (Online Analytical Processing) Ulf Leser: Data Warehousing and Data Mining 8
9 OLTP Beispiel Login Willkommen Bestellung Best. löschen SELECT pw FROM kunde WHERE login=... UPDATE kunde SET last_acc=date, tries=0 WHERE... COMMIT SELECT k_id, name FROM kunde WHERE login=... SELECT last_pur FROM purchase WHERE k_id= COMMIT SELECT av_qty FROM stock WHERE p_id=... UPDATE stock SET av_qty=av_qty-1 where... INSERT INTO shop_cart VALUES( o_id, k_id, COMMIT DELETE FROM shop_cart WHERE o_id=... UPDATE stock SET av_qty=av_qty+1 where COMMIT Ulf Leser: Data Warehousing and Data Mining 9
10 OLAP Beispiel Welche Produkte hatten im letzten Jahr im Bereich Bamberg einen Umsatzrückgang um mehr als 10%? Welche Produktgruppen sind davon betroffen? Welche Lieferanten haben diese Produkte? Welche Kunden haben über die letzten 5 Jahre eine Bestellung über 50 Euro innerhalb von 4 Wochen nach einem persönlichen Anschreiben aufgegeben? Wie hoch waren die Bestellungen im Schnitt? Wie hoch waren die Bestellungen im Vergleich zu den durchschnittlich. Bestellungen des selben Kunden in einem vergleichbaren Zeitraum? Lohnen sich Mailing-Aktionen? Haben Zweigstellen einen höheren Umsatz, die gemeinsam gekaufte Produkte zusammen stellen? Welche Produkte werden überhaupt zusammen gekauft und wo? Ulf Leser: Data Warehousing and Data Mining 10
11 OLAP versus OLTP Typische Operationen OLTP Insert, Update, Delete, Select OLAP Select (Bulk-Inserts) Transaktionen Viele und kurz Nur lesend Typische Anfragen Einfache Queries, Primärschlüsselzugriff, Schnelle Abfolgen von Selects/inserts/updates/ deletes Komplexe Queries: Aggregate, Gruppierung, Subselects, etc. Bereichsanfragen über mehrere Attribute Aggregate mit komp. Rechnungen Daten pro Operation Wenige Tupel Mega-/ Gigabyte Datenmenge in DB Gigabyte Terabyte Datenart Erwartete Antwortzeiten Rohdaten, häufige Änderungen, nur intern Echtzeit bis wenige Sekunden Abgeleitete Daten, historisch & stabil, externe Daten I.A. nicht zeitkritisch (aber UI-Erlebnis) Modellierung Anwendungsorientiert Themenorientiert Typische Benutzer Elektronische Systeme (Sachbearbeiter) Management Ulf Leser: Data Warehousing and Data Mining 11
12 Inhalt dieser Vorlesung Definition & Einbettung Architektur & Komponenten ETL: Extraction, Transformation, Load Ulf Leser: Data Warehousing and Data Mining 12
13 Grobarchitektur: Hubs and Spokes Abgeleitete Sichten Mart 1 Mart 2 Mart 3 Mart 4 Aktualisierungen DWH Basisdatenbank Quelle 1 RDBMS Quelle 2 IMS Quelle 3 Textfile Quellsysteme Ulf Leser: Data Warehousing and Data Mining 13
14 Verfeinerung: DWH Architektur Monitoring Qrtl. 2. Qrtl. 3. Qrtl. Analysewerkzeuge Data Mining Ost West Nord 4. Qrtl. Quelle 1 RDBMS Staging Area Metadaten Mart 2 Quelle 2 IMS Staging Area Cube Mart 1 Datenquellen Arbeitsbereich Basisdaten Abgeleitete Sichten Ulf Leser: Data Warehousing and Data Mining 14
15 Langlebigkeit Qrtl. 2. Qrtl. 3. Qrtl. 4. Qrtl. Ost West Nord Quelle 1 RDBMS Metadaten Staging Area Mart 2 Quelle 2 IMS Staging Area Cube Mart 1 Flüchtig Persistent Ulf Leser: Data Warehousing and Data Mining 15
16 Alternativen Physikalische Aufteilung variabel Data Marts auf eigenen Rechnern (Laptop) Staging Area auf eigenen Servern Metadaten auf eigenem Server (Repository) Metadaten Quelle 1 RDBMS Quelle 2 IMS Staging Area Staging Area Cube Mart 2 Mart 1 Ulf Leser: Data Warehousing and Data Mining 16
17 Datenquellen Meist heterogen Technisch: RDBMS, IMS, Access Mainframe, COBOL, Textfiles,... Logisch: Schema, Format, Repräsentation,... Syntaktisch: Datum, Währung,... Qualität: Fehlende / falsche Werte, Duplikate,... Rechtlich: Datenschutz (Kunden & Mitarbeiter) Zugriff Push: Quelle erzeugt (regelmäßig) Extrakte Pull: DWH fragt Änderungen ab Individuelle Behandlung notwendig Qrtl. Qrtl. Qrtl. Qrtl. Ulf Leser: Data Warehousing and Data Mining 17
18 Arbeitsbereich Qrtl. Qrtl. Qrtl. Qrtl. Temporärer Speicher ETL Arbeitsschritte effizienter implementierbar Mengenoperationen, SQL Zugriff auf Basisdatenbank möglich Vergleich zwischen Datenquellen möglich Filtern: Nur einwandfreie Daten in Basisdatenbank übernehmen Ulf Leser: Data Warehousing and Data Mining 18
19 Basisdatenbank (Cube) Qrtl. Qrtl. Qrtl. Qrtl. Zentrale Komponente des DWH Speichert Daten in feinster Auflösung Einzelne Verkäufe, einzelne Bons, Historische Daten Große Datenmengen Spezielle Modellierung Spezielle Optimierungsstrategien Ulf Leser: Data Warehousing and Data Mining 19
20 Analyseorientiertes DWH Klassische Datenmodellierung Ziele: Redundanzvermeidung / Integritätswahrung / hoher Durchsatz bei nebenläufigem Zugriff Normalformen, Fremdschlüssel, Satzsperren Für Lesen und Schreiben geeignet Ergebnis: Viele Relationen, unübersichtliches Schema Orientiert sich an technischen Anforderungen Nur für Informatiker Im DWH: Multidimensionale Modellierung Modellierung von Business Entities (Produkte, Kunde, ) Zentriert auf Geschäftsziel: Verkäufe (meistens) Übersichtliches, leicht verständliches Modell Für Nicht-Informatiker Ulf Leser: Data Warehousing and Data Mining 20
21 Beispiel: Normalisiertes Schema year id year customer id name cust_class discount customer_id productg_id discount line_item order_id product_id amount single_price productgroup id name product id productgroup_id month id Month year_id day id day month_id session id cust_id day_id time order id session_id supply_id total_amount order_status order_id supply_id status supply_station id region_id region id name Ulf Leser: Data Warehousing and Data Mining 21
22 Multidimensionales Schema customer id name cust_class time id day month year line_item order_id product_id amount single_price discount_rate product id name product_group supply id region Technische Informationen raus (Session) Vereinfachung / Denormalierung (discount_rate) Fokus auf Verkäufe (line_item) Ulf Leser: Data Warehousing and Data Mining 22
23 time Cube DVD Verkäufe in Hessen in Sales Cube Hessen NRW region Bücher CD Gesch. DVD produkt_group Ulf Leser: Data Warehousing and Data Mining 23
24 Abgeleitete Sichten Typische Anfragen Aggregiert und gruppiert Verkäufe nach Monat und Lieferant nach Niederlassung und Produkt Probleme bei Auswertung Queries scannen sehr großer Datenbestände Hohe Detailstufe des Cubes für viele Anfragen nicht notwendig Vorab-Erstellung von abgeleiteten Daten Technisch: Materialisierte Sichten Prä-aggregiert, angereichert, gefiltert, automatisch aktualisiert Architektur: Data Marts Qrtl. Qrtl. Qrtl. Qrtl. Ulf Leser: Data Warehousing and Data Mining 24
25 Datenanalyse OLAP Operationen Viele kommerzielle Systeme SAS, SPSS, BusinessObjects, Cognos, Excel, Funktionalität Grafische Oberflächen zur Navigation (Cube) Interaktive Datenauswahl, Filtering, Chaining,... Präsentation: Grafiken, Tabellen, Reports,... Management: Zugriffsrechte, Scheduling, Standardreports versus Ad-hoc Anfragen Gutes UI verlangt sehr schnelle Antwortzeiten Qrtl. Qrtl. Qrtl. Qrtl. Ulf Leser: Data Warehousing and Data Mining 25
26 Data Mining Finden verborgender, nicht-trivialer Informationen Bereiche Statistische Analyse Maschinelle Lernverfahren Knowledge Discovery in Databases (KDD) Suche nach Auffälligkeiten, Mustern, Regeln Viele Kunden, die Windeln kaufen, kaufen auch Bier Suche nach Erklärungsmodellen Modell: Abstraktion der Wirklichkeit Korrelation versus Kausalität Ulf Leser: Data Warehousing and Data Mining 26
27 Metadatenrepository Qrtl. Qrtl. Qrtl. Qrtl.... key success factor in DWH... Quellbeschreibungen, Datentypen, Skripte, Prozessbeschreibungen, Schema, Zugriffsgruppen, Sichtdefinitionen, Versionskontrolle, Konfigurationsmanagement,... Erweiterung des klassischen DB-Systemkatalogs Ziele Nachvollziehbarkeit der Prozesse Zentrale Steuerung der Prozesse Standards: IRDS, OIM, CWM,... Ulf Leser: Data Warehousing and Data Mining 27
28 Oracle Warehouse Builder Ulf Leser: Data Warehousing and Data Mining 28
29 Inhalt dieser Vorlesung Qrtl. Qrtl. Qrtl. Qrtl. Definition & Einbettung Architektur & Komponenten ETL: Extraction, Transformation, Load Ulf Leser: Data Warehousing and Data Mining 29
30 ETL - Extraktion Filtern der richtigen Daten aus den Quellen Korrekt und relevant (für das Ziel des DWH) Bereitstellung der Datenfiles im gewünschten Format zum gewünschten Zeitpunkt am gewünschten Ort Kontinuierliche Datenversorgung des DWH Producer - Consumer Quelle informiert über Änderungen DWH konsumiert Änderungen Ulf Leser: Data Warehousing and Data Mining 30
31 ETL - Transformation Transformation der Daten in eine DWH-gerechte Form Schema, Format, Semantik Laden soll so schnell wie möglich gehen Erledigung vieler Teilschritte außerhalb des DWH Arten von Transformationen Schema-/ Formattransformationen Datentransformationen Transformationen möglich an zwei Stellen Transformation der Quell-Extrakte in Load-Files Transformation von Staging-Area nach Basis-DB Ulf Leser: Data Warehousing and Data Mining 31
32 ETL - Laden Effizientes Einbringen der neuen Daten in das DWH Techniken SQL Satzbasiert Standardschnittstellen: Embedded SQL, JDBC,... Einzelne Operationen oder proprietäre Erweiterungen Array Insert Beachtung und Aktivierung aller Datenbankverfahren Trigger, Indexaktualisierung, Transaktionen,... BULK Loader Funktionen DB-spezifische Erweiterungen zum Laden großer Datenmengen Benutzung von Anwendungsschnittstellen Bei manchen Produkten notwendig (SAP) Ulf Leser: Data Warehousing and Data Mining 32
33 Beispiel Handelshaus, Daten einer Woche, 1 Filiale Laden mit voller Qualitätskontrolle Laden mit partieller Datenverbesserung Nur Laden 10 min 2 min 45 sec Handelshaus, Daten einer Woche, 2000 Filiale Laden mit voller Qualitätskontrolle 330h = 14d Laden mit partieller Datenverbesserung 67 h = 2,8d Nur Laden 25h = 1d Ulf Leser: Data Warehousing and Data Mining 33
Data Warehousing und Data Mining
Data Warehousing und Data Mining Architektur und Komponenten von Data Warehouses Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Architektur Komponenten ETL Ulf Leser: Data Warehousing
MehrInformationsintegration
Informationsintegration Data Warehouse (= Materialisierte Integration) Ulf Leser Sebastian Wandelt Inhalt dieser Vorlesung Data Warehouses OLAP versus OLTP Multidimensionale Modellierung ETL Prozess Vergleich:
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Architektur und Komponenten von Data Warehouses Ulf Leser Wissensmanagement in der Bioinformatik Bücher im Internet bestellen Backup Durchsatz Loadbalancing Portfolio Umsatz
MehrData Warehousing. Architektur Komponenten Prozesse. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Architektur Komponenten Prozesse Ulf Leser Wissensmanagement in der Bioinformatik Zusammenfassung letzte Vorlesung Aufbau eines Data Warehouse Redundante, transformierte Datenhaltung Asynchrone
MehrDatenbanksysteme I Data Warehouses Felix Naumann
Datenbanksysteme I Data Warehouses 13.7.2009 Felix Naumann Überblick 2 Einsatzgebiete OLAP versus OLTP Multimensionale i l Modellierung OLAP Operationen Relationale Implementierung Folien zu DWH: Ulf Leser
MehrDatenbanksysteme I Data Warehouses Felix Naumann
Datenbanksysteme I Data Warehouses 5.7.2010 Felix Naumann Überblick 2 Einsatzgebiete OLAP versus OLTP Multimensionale i l Modellierung OLAP Operationen Relationale Implementierung Neue Architekturen Folien
MehrData Warehousing. Komponenten Prozesse. Architektur. Wissensmanagement in der. Bioinformatik. Ulf Leser
Data Warehousing Architektur Komponenten Prozesse Ulf Leser Wissensmanagement in der Bioinformatik Zusammenfassung letzte Vorlesung 1 Aufbau eines Data Warehouse Redundante, transformierte Datenhaltung
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Wintersemester 2014 / 2015 Ulf Leser Wissensmanagement in der Bioinformatik Datenbanken und Datenanalyse... Der typische Wal-Mart Kaufagent verwendet täglich mächtige Data
MehrMultidimensionale Modellierung
Multidimensionale Modellierung Vorlesung: Übung: Patrick Schäfer Berlin, 27. November 2017 patrick.schaefer@hu-berlin.de https://hu.berlin/vl_dwhdm17 https://hu.berlin/ue_dwhdm17 Grundlagen Fakten (Kennzahlen/Messgrößen):
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Wintersemester 2017 / 2018 Ulf Leser Wissensmanagement in der Bioinformatik ecommerce Daten bank Ulf Leser: Data Warehousing und Data Mining 2 Datenbanken und Datenanalyse...
MehrData Warehousing. Sommersemester Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Sommersemester 2004 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Sommersemester 2007 Ulf Leser Wissensmanagement in der Bioinformatik Große Datenbanken... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge,
MehrData Warehousing. Ausführung von OLAP Operationen. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Ausführung von OLAP Operationen Ulf Leser Wissensmanagement in der Bioinformatik Variante 1 - Snowflake Year id year Productgroup id pg_name Month Id Month year_id Day Id day month_id
MehrData Warehousing. Beispiel: : Amazon. Aufbau eines DWH OLAP <-> OLTP Datacube. FU-Berlin, DBS I 2006, Hinze / Scholz
Data Warehousing Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon 2 1 Datenbank 3 Fragen des Marketingleiters Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt
MehrData Warehousing. Aufbau eines DWH OLAP <-> OLTP Datacube
Data Warehousing Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon 2 Datenbank 3 Fragen des Marketingleiters Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt
MehrKapitel 6. Vorlesung: PD Dr. Peer Kröger
Kapitel 6 Einführung in Data Warehouses Vorlesung: PD Dr. Peer Kröger Dieses Skript basiert auf den Skripten zur Vorlesung Datenbanksysteme II an der LMU München Dieses Skript basiert auf den Skripten
MehrÜbung zur Einführung in die Wirtschaftsinformatik Cognos Powerplay als Beispiel für ein DSS
Übung zur Einführung in die Wirtschaftsinformatik 2006-05 - 10 Cognos Powerplay als Beispiel für ein DSS 1 Entscheidungsunterstützungssysteme (EUS) Decision Support Systems (DSS) EUS sollen das gemeinsame
MehrInformationsintegration
Informationsintegration Data Warehouse (= Materialisierte Integration) Ulf Leser Inhalt dieser Vorlesung Data Warehouses OLAP versus OLTP Multidimensionale Modellierung ETL Prozess Beispiel: Columba Vergleich:
MehrData Warehousing. Einleitung und Motivation. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Einleitung und Motivation Ulf Leser Wissensmanagement in der Bioinformatik Bücher im Internet bestellen Backup Durchsatz Loadbalancing Portfolio Umsatz Werbung Daten bank Ulf Leser: Data
MehrEinführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.
Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen
MehrThemenblock: Erstellung eines Cube
Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik DWH Grobarchitektur: Hubs and Spokes Abgeleitete Sichten Mart 1 Mart 2 Mart 3 Mart 4
MehrData Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube
Fragen des Marketingleiters Data Warehousing Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt nach? Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon Technisch
MehrOracle9i Data Warehouse Komponenten im praktischen Einsatz
Oracle9i Data Warehouse Komponenten im praktischen Einsatz Thomas Gutacker TechSpring GmbH 10. März 2004 Inhalt Data Warehouse Grundlagen Architektur des Projektes Umsetzung mit Oracle9i-Komponenten Data
MehrDatenbanken Grundlagen und Design
Frank Geisler Datenbanken Grundlagen und Design 3., aktualisierte und erweiterte Auflage mitp Vorwort 15 Teil I Grundlagen 19 i Einführung in das Thema Datenbanken 21 i.i Warum ist Datenbankdesign wichtig?
MehrData Warehousing. DWH Projekte. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing DWH Projekte Ulf Leser Wissensmanagement in der Bioinformatik Inhalt DWH Projekte Spezifika Die kritischen Punkte Warum scheitern DWH Projekte? Ulf Leser: Data Warehousing, Vorlesung,
MehrSeminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing
Seminar in der Seminarreihe Business Intelligence 1 OLAP und Datawarehousing OLAP & Warehousing Die wichtigsten Produkte Die Gliederung Produkt Bewertung & Vergleiche Die Marktentwicklung Der aktuelle
MehrInhaltsverzeichnis. 1 Einleitung 1. 2 Aufbau von Data-Warehouse-Systemen 15. Lehner, Wolfgang Datenbanktechnologie für Data-Warehouse-Systeme 2003
1 Einleitung 1 1.1 Betriebswirtschaftlicher Ursprung des Data Warehousing 2 1.2 Statistischer Ursprung des Data Warehousing 5 1.3 Fòderativer Ursprung des Data Warehousing 7 1.4 Definition eines Data-Warehouse-Systems
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Wintersemester 2011 / 2012 Ulf Leser Wissensmanagement in der Bioinformatik Datenbanken und Datenanalyse... Der typische Wal-Mart Kaufagent verwendet täglich mächtige Data
MehrWir bauen uns ein Data Warehouse mit MySQL
Wir bauen uns ein Data Warehouse mit MySQL Oli Sennhauser FromDual GmbH Uster / Schweiz Schlüsselworte MySQL, DWH, Data Warehouse, ETL, BI, Business Intelligence, OLAP Einleitung MySQL Datenbanken verbreiten
MehrDatenbanken Unit 9: OLAP, OLTP, Data Warehouse Ranking Algorithmen
Datenbanken Unit 9: OLAP, OLTP, Data Warehouse Ranking Algorithmen 28. V. 2018 Outline 1 Organisatorisches 2 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 3 Ranking 4 SQL Organisatorisches Ergebnisse
Mehr8. Datenbank-Benchmarks Benchmark-Anforderungen TPC-Benchmarks OLTP-Benchmarks
8. Datenbank-Benchmarks Benchmark-Anforderungen TPC-Benchmarks OLTP-Benchmarks TPC-C TPC-E Decision Support Benchmark: TPC-H WS10/11, Prof. Dr. E. Rahm 8-1 Anforderungen an geeignete Benchmarks* Domain-spezifische
MehrMIS by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001
MIS Glossar by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001 Aggregat Data Cube Data Marts Data Mining Data Warehouse (DWH) Daten Decision Support Systeme (DSS)
MehrData Warehouse und Data Mining
Einführungsseminar Data Mining Seminarvortrag zum Thema: Data Warehouse und Data Mining Von gehalten am Betreuer: Dr. M. Grabert Einführung Problemstellung Seite 2 Einführung Unternehmen bekommen eine
MehrTeil II: Architektur eines Data-Warehouse-Systems... 57
O:/Wiley/Reihe_Dummies/9783527714476_Gerken/3d/ftoc.3d from 08.08.2018 14:02:02 Auf einen Blick Einleitung... 19 Teil I: Was ist ein Data Warehouse?... 25 Kapitel 1: Ein Beispiel zur Einführung..... 27
MehrOLAP und Data Warehouses
OLP und Data Warehouses Überblick Monitoring & dministration Externe Quellen Operative Datenbanken Extraktion Transformation Laden Metadaten- Repository Data Warehouse OLP-Server nalyse Query/Reporting
MehrDatenqualität-Der GQM- Ansatz und das DWQ- Projekt
Datenqualität-Der GQM- Ansatz und das DWQ- Projekt Guy Hermann Ngassa Imperfektion und erweiterte Konzepte im Data Warehousing 2 Überblick Einleitung Data-Warehouse-Qualität-Projekt (DWQ-Projekt) Bezug
MehrBusiness Intelligence Data Warehouse. Jan Weinschenker
Business Intelligence Data Warehouse Jan Weinschenker 28.06.2005 Inhaltsverzeichnis Einleitung eines Data Warehouse Data Warehouse im Zusammenfassung Fragen 3 Einleitung Definition: Data Warehouse A data
MehrDatenbanksysteme 2009
Datenbanksysteme 2009 Kapitel 17: Data Warehouse Oliver Vornberger Institut für Informatik Universität Osnabrück 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen
MehrMarketing Intelligence Vorstellung der Softwarekomponenten. Josef Kolbitsch Manuela Reinisch
Marketing Intelligence Vorstellung der Softwarekomponenten Josef Kolbitsch Manuela Reinisch Übersicht Übersicht über die Systemlandschaft Übersicht über die Werkzeuge Workshop Systemlandschaft 1/8 Klassische
MehrCommon Warehouse Metamodel und Imperfektion
Common Warehouse Metamodel und Imperfektion Christoph Goebel Imperfektion und erweiterte Konzepte im Data Warehousing 2 Fragestellungen Welche Bedeutung haben Metadaten in der Information Supply Chain
MehrBIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004
BIW - Überblick Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004 Annegret Warnecke Senior Sales Consultant Oracle Deutschland GmbH Berlin Agenda Überblick
MehrWelche BI-Architektur braucht Ihr Reporting?
Welche BI-Architektur braucht Ihr Reporting? Variante 1: Direkter Zugriff Keine redundanten Daten Schnelle Erkenntnisse Echte Daten für PoCs Echtzeit-Reporting ohne Zwischenstufen Belastung der operativen
MehrKapitel 4: Data Warehouse Architektur
Kapitel 4: Data Warehouse Architektur Data Warehousing und Mining 1 Data Warehousing, Motivation Zugriff auf und Kombination von Daten aus mehreren unterschiedlichen Quellen, Source Source Source komplexe
MehrIntegration genomischer Daten. Ulf Leser
Integration genomischer Daten Ulf Leser Topics Today Data Integration Data Integration for the Life Sciences Integration within the project Ulf Leser: Semesterprojekt Genome-Browsing, Integration, WS 15/16
MehrDatenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken
Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken 31. V. 2016 Outline 1 Organisatorisches 2 SQL 3 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 4 Objekt-relationale Datenbanken Beispiel
MehrData Warehouse Theorie und Praxis. Ali Khabbazian T-Systems
Data Warehouse Theorie und Praxis Ali Khabbazian T-Systems Agenda Was ist Data Warehouse? Warum Data Warehouse? Architektur und Komponenten Wie realisiere ich mein Data-Warehouse- System? (Tools und Technik)
MehrPräsentation der Bachelorarbeit
Präsentation der Bachelorarbeit Einrichtung einer BI-Referenzumgebung mit Oracle 11gR1 Jörg Bellan Hochschule Ulm Fakultät Informatik Institut für Betriebliche Informationssysteme 15. Oktober 2009 Agenda
MehrData Warehouse schnell gemacht Performanceaspekte im Oracle DWH
Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH Dani Schnider Principal Consultant Business Intelligence BI Trilogie, Zürich/Basel 25./26. November 2009 Basel Baden Bern Lausanne Zürich
MehrDatenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken
Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken 17. V. 2017 Outline 1 Organisatorisches 2 SQL 3 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 4 Objekt-relationale Datenbanken Beispiel
MehrÜbersicht SAP-BI. DOAG Regionaltreffen
Übersicht SAP-BI DOAG Regionaltreffen 14.12.2010 Übersicht Überblick BI Datenablage Datenfluß im BI Analysen Sonstiges - Schlüsselbereiche des BI - Wo werden die Daten gespeichert? - Wie kommen die Daten
MehrVorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII
Vorwort zur zweiten Auflage...V Vorwort zur ersten Auflage... VIII 1 Management Support Systeme und Business Intelligence Anwendungssysteme zur Unterstützung von Managementaufgaben...1 1.1 Computergestützte
MehrAgile BI Was ist das eigentlich? Hochschule Ulm - V. Herbort & Prof. Dr. R. von Schwerin
Agile BI Was ist das eigentlich? Hochschule Ulm - V. Herbort & Prof. Dr. R. von Schwerin Inhalt Agilität in der Business Intelligence Agile Software-Projekte Agile Data Warehousing / Self-Service BI 29.10.10
MehrEinführungsveranstaltung: Data Warehouse
Einführungsveranstaltung: 1 Anwendungsbeispiele Berichtswesen Analyse Planung Forecasting/Prognose Darstellung/Analyse von Zeitreihen Performancevergleiche (z.b. zwischen Organisationseinheiten) Monitoring
MehrBusiness Intelligence & Reporting. Michael Cordes Holger Oehring Matthias Rein
Business Intelligence & Reporting Michael Cordes Holger Oehring Matthias Rein Ziele Einführung Business Intelligence / Front Room Online Analytical Processing (OLAP) Arten des Reporting & Nutzergruppen
MehrZWISCHEN ALBTRAUM UND OPTIMALER PERFORMANCE
ZWISCHEN ALBTRAUM UND OPTIMALER PERFORMANCE Indexierungsstrategie im Data Warehouse Dani Schnider, Trivadis AG DOAG Konferenz, Nürnberg BASEL BERN LAUSANNE ZÜRICH DÜSSELDORF FRANKFURT A.M. FREIBURG I.BR.
MehrVorlesung Methodische Grundlagen des Software-Engineering im Sommersemester 2014
Vorlesung des Software-Engineering im Sommersemester 2014 Prof. Dr. Jan Jürjens TU Dortmund, Fakultät Informatik, Lehrstuhl XIV Teil 2.8: Werkzeugunterstützung für Process-Mining v. 09.06.2014 1 für Process-Mining
MehrTHEMA: SAS DATA INTEGRATION STUDIO FÜR MEHR TRANSPARENZ IM DATENMANAGEMENT EVA-MARIA KEGELMANN
WEBINAR@LUNCHTIME THEMA: SAS DATA INTEGRATION STUDIO FÜR MEHR TRANSPARENZ IM DATENMANAGEMENT EVA-MARIA KEGELMANN HERZLICH WILLKOMMEN BEI WEBINAR@LUNCHTIME Moderation Anne K. Bogner-Hamleh SAS Institute
MehrWiederholung VU Datenmodellierung
Wiederholung VU Datenmodellierung VU Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester
MehrAKTUELLE LÖSUNGSARCHITEKTUR DER SAP IM BEREICH BUSINESS INTELLIGENCE UND ANALYTICS
AKTUELLE LÖSUNGSARCHITEKTUR DER SAP IM BEREICH BUSINESS INTELLIGENCE UND ANALYTICS X-CASE Trainer-/Expertentreffen 2018 S/4HANA, BW/4HANA und SAP-Entwicklung Aktuelle Neuerungen Vorstellung Jörg Bauditz
MehrTobias Braunschober DAS GENERISCHE DWH WENIGER CODE WENIGER KOSTEN
Tobias Braunschober DAS GENERISCHE DWH WENIGER CODE WENIGER KOSTEN Seite 1 Tobias Braunschober POSITION Senior Consultant Competence Center DWH AUSBILDUNG Diplom Mathematiker EXPERTISE Spezialisierung
MehrVorlesung Methodische Grundlagen des Software-Engineering im Sommersemester 2013
Vorlesung des Software-Engineering im Sommersemester 2013 Prof. Dr. Jan Jürjens TU Dortmund, Fakultät Informatik, Lehrstuhl XIV Teil 2.9: Werkzeugunterstützung v. 13.05.2013 1 [mit freundlicher Genehmigung
MehrWiederholung VU Datenmodellierung
Wiederholung VU Datenmodellierung VL Datenbanksysteme Reinhard Pichler Arbeitsbereich Datenbanken und Artificial Intelligence Institut für Informationssysteme Technische Universität Wien Wintersemester
MehrEinführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH
Einführung in OLAP und Business Analysis Gunther Popp dc soft GmbH Überblick Wozu Business Analysis mit OLAP? OLAP Grundlagen Endlich... Technischer Background Microsoft SQL 7 & OLAP Services Folie 2 -
MehrData Warehouse in der Telekommunikation
Data Warehouse in der Telekommunikation Hans-Friedrich Pfeiffer Talkline GmbH & Co.KG Elmshorn, 11.06.2007 Übersicht Historie Struktureller Aufbau des Dara Warehouse Anforderungen an das Data Warehouse
MehrKapitel 7 Grundlagen von Data
LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS DATABASE Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2014 Kapitel 7 Grundlagen von Data Warehouses Vorlesung: PD
MehrInhaltsverzeichnis. Vorwort Kapitel 1 Einleitung... 15
Vorwort..................................................... 13 Kapitel 1 Einleitung.......................................... 15 Kapitel 2 SQL der Standard relationaler Datenbanken... 19 2.1 Die Geschichte................................
MehrDatenqualitätsportal für das Data Warehouse mit APEX und Regelwerk
DATA WAREHOUSE Datenqualitätsportal für das Data Warehouse mit APEX und Regelwerk Alfred Schlaucher, Oracle Data Warehouse Themen Wo wird geprüft Was wird geprüft Dokumentation und Steuerung der Prüfungen
MehrDWH Best Practices das QUNIS Framework 80 Jahre Erfahrung bei der Modellierung & dem Betrieb von DWH. Referent: Ilona Tag
DWH Best Practices das QUNIS Framework 80 Jahre Erfahrung bei der Modellierung & dem Betrieb von DWH Referent: Ilona Tag Agenda 10.00 10.30 Begrüßung & aktuelle Entwicklungen bei QUNIS 10.30 11.00 11.00
MehrDatenbank-Tuning. Folien zum Datenbankpraktikum Wintersemester 2009/10 LMU München
Kapitel 7 Datenbank-Tuning Folien zum Datenbankpraktikum Wintersemester 2009/10 LMU München 2008 Thomas Bernecker, Tobias Emrich unter Verwendung der Folien des Datenbankpraktikums aus dem Wintersemester
MehrDOAG SIG Day E-Business Suite
DOAG SIG Day E-Business Suite Planung und Simulation in, um und um die Oracle E-Business Suite herum München 15. Juni 2005 Dr. Frank Schönthaler PROMATIS software GmbH 1 Gliederung Gliederung Traditionelle
MehrExadata und In-Memory Datenbewirtschaftung und Analyse Extrem mit Exadata und InMemory (Erfahrungsbericht)
Exadata und In-Memory Datenbewirtschaftung und Analyse Extrem mit Exadata und InMemory (Erfahrungsbericht) Christian Haag, DATA MART Consulting Consulting Manager Oracle DWH Team Inhalt Thematik (Einordnung
MehrDIMEX Data Import/Export
DIMEX Data Import/Export PROCOS Professional Controlling Systems AG Gewerbeweg 15 FL- 9490 Vaduz PROCOS Professional Controlling Systems AG Inhaltsverzeichnis 1 ALLGEMEIN...3 2 GRUNDLEGENDE FUNKTIONEN...4
MehrInhaltsverzeichnis. Vorwort 13. Kapitel 1 Einleitung 15
Vorwort 13 Kapitel 1 Einleitung 15 Kapitel 2 SQL-der Standard relationaler Datenbanken... 19 2.1 Die Geschichte 19 2.2 Die Bestandteile 20 2.3 Die Verarbeitung einer SQL-Anweisung 22 2.4 Die Struktur von
MehrBusiness Intelligence
Hochschule Darmstadt Business Intelligence Fachbereich Informatik Praktikumsaufgabe 3 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 11.06.2007 Business Intelligence Aufgabenstellung 1.
MehrData Warehousing. Einleitung und Motivation. Wissensmanagement in der. Bioinformatik. Ulf Leser
Data Warehousing Einleitung und Motivation Ulf Leser Wissensmanagement in der Bioinformatik Backup Durchsatz Loadbalancing Bücher im Internet bestellen Portfolio Umsatz Werbung Daten bank Ulf Leser: Data
MehrFischen im Datensee FOLIO Reporting
Fischen im Datensee FOLIO Reporting Ingolf Kuss, hbz NRW FOLIO Informationstage, Göttingen 26. April 2018 Reporting SIG trifft sich seit April 2017 wöchentlich z.zt. 29 Mitglieder 2 Mitglieder aus Deutschland
MehrDatenbanken. Datenbanken. Grundlagen und Design. Grundlagen und Design. Frank. Geisler. 4. Auflage
Datenbanksysteme, Datenbankanwendungen und Middleware Das relationale Datenbankmodell ER-Datenbankmodellierung und Normalisierung SQL-Grundlagen Projektablauf bei der Erstellung einer Datenbank Transaktionen
MehrInformationsintegration
Informationsintegration Anwendungsszenarien Abgrenzung Extension und Intension Ulf Leser Wissensmanagement in der Bioinformatik Client-Server JAVA (JDBC) JAVA (JDBC) JAVA (JDBC) DB1- Server Sekundärspeicher
MehrVisualisierung in Informatik und Naturwissenschaften
Visualisierung in Informatik und Naturwissenschaften Datenbankvisualisierung Sven Bernhard 12.06.1999 Datenbankvisualisierung Datenbanktheorie in 5 Minuten Visualisierung vs. Datenbanken Visualisierung
MehrData Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte
MehrDatenbanksysteme. Donald Kossmann TU München
Datenbanksysteme Donald Kossmann TU München Übersicht Wie benutze ich ein Datenbanksystem? Datenmodellierung (ER, UML, Theorie) Datenbankprogrammierung (SQL) Wie baue ich ein Datenbanksystem? Anfrageoptimierung
MehrData Warehousing. Kapitel 1: Data-Warehousing-Architektur. Folien teilweise übernommen von Matthias Gimbel
Data Warehousing Kapitel 1: Data-Warehousing-Architektur Folien teilweise übernommen von Matthias Gimbel 2 Analyse von Geschäftsprozessen Mögliche Fragestellungen Wie entwickelt sich unser Umsatz im Vergleich
MehrData Warehousing Grundbegriffe und Problemstellung
Data Warehousing Grundbegriffe und Problemstellung Dr. Andrea Kennel, Trivadis AG, Glattbrugg, Schweiz Andrea.Kennel@trivadis.com Schlüsselworte Data Warehouse, Cube, Data Mart, Bitmap Index, Star Queries,
MehrData Warehousing. Modellierung im DWH Das multidimensionale Datenmodell. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing Modellierung im DWH Das multidimensionale Datenmodell Ulf Leser Wissensmanagement in der Bioinformatik Zusammenfassung: Hubs and Spokes Mart 1 Mart 2 Mart 3 Mart 4 DWH Quelle 1 RDBMS Quelle
MehrDatenbanken zur Entscheidungsunterstützung - Data Warehousing. Prof. Dr. T. Kudraß 1
Datenbanken zur Entscheidungsunterstützung - Data Warehousing Prof. Dr. T. Kudraß 1 Einführung Zunehmender Bedarf nach Analyse aktueller und historischer Daten Identifizierung interessanter Patterns Entscheidungsfindung
MehrXML-Datenaustausch in der Praxis Projekt TOMIS bei der ThyssenKrupp Stahl AG
Mittwoch, 9. November 2005 13h00, Bruno-Schmitz-Saal 18. Deutsche ORACLE-Anwenderkonferenz XML-Datenaustausch in der Praxis Projekt TOMIS bei der ThyssenKrupp Stahl AG Volker Husemann Thyssen Krupp Stahl
MehrData-Warehouse-Praktikum
Data-Warehouse-Praktikum WS 18/19 Universität Leipzig, Institut für Informatik Abteilung Datenbanken Prof. Dr. E. Rahm V. Christen, M. Franke, Z. Sehili {christen, franke, sehili}@informatik.uni-leipzig.de
MehrKapitel 9. Embedded SQL. Prof. Dr. Wolfgang Weber Vorlesung Datenbanken 1
Kapitel 9 Embedded SQL Vorlesung Datenbanken 1 Embedded SQL (siehe auch [Date00]) Arbeitsweise ähnlich PL/SQL, allerdings: Normale Programmiersprache mit eingestreuten SQL-Befehlen und anderen Befehlen
MehrAuf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort... 13
Auf einen Blick Vorwort... 13 Teil 1 Vorbereitung Kapitel 1 Einleitung... 17 Kapitel 2 SQL der Standard relationaler Datenbanken... 21 Kapitel 3 Die Beispieldatenbanken... 39 Teil 2 Abfrage und Bearbeitung
MehrKapitel 17: Date Warehouse
Kapitel 17: Date Warehouse 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen kleine, kurze Transaktionen jeweils auf jüngstem Zustand OLAP (Online Analytical
MehrData Warehouse Technologien
Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............
MehrFrühjahrsemester cs243 Datenbanken Kapitel 1: Einführung. H. Schuldt. Anwendungsbeispiel. Filiale Allschwil
Frühjahrsemester 2013 cs243 Datenbanken Kapitel 1: Einführung H. Schuldt Anwendungsbeispiel Filiale Muttenz Filiale Allschwil Filiale Liestal Anfragen: Welches Produkt hat sich am 26.02.2013 in der Filiale
MehrZERO.ONE.DATA Die Bahn, ein agiler Tanker im Digitalisierungszeitalter. Gudio van Husen, Christopher Muth DB Systel GmbH Hanau
ZERO.ONE.DATA Die Bahn, ein agiler Tanker im Digitalisierungszeitalter Gudio van Husen, Christopher Muth DB Systel GmbH Hanau 28.02.2018 Foto: DB Systel DB Systel GmbH Die Digitalisierung der Bahn erfolgreich
MehrModellierung agiler Data Warehouses mit Data Vault Dani Schnider, Trivadis AG DOAG Konferenz 2015
Modellierung agiler Data Warehouses mit Data Vault Dani Schnider, Trivadis AG DOAG Konferenz 2015 BASEL BERN BRUGG DÜSSELDORF FRANKFURT A.M. FREIBURG I.BR. GENEVA HAMBURG COPENHAGEN LAUSANNE MUNICH STUTTGART
Mehr