Data Warehousing und Data Mining

Größe: px
Ab Seite anzeigen:

Download "Data Warehousing und Data Mining"

Transkript

1 Data Warehousing und Data Mining Wintersemester 2011 / 2012 Ulf Leser Wissensmanagement in der Bioinformatik

2 Datenbanken und Datenanalyse... Der typische Wal-Mart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte Datenbank zu erforschen [Jim Gray, Computer Zeitung 17/2003] Today, Wal-Mart is logging one million customer transactions per hour and feeding information into databases estimated at 2.5 petabytes in size. [Rogers, Big Data is Scaling BI and Analytics] Fragen Was verkaufen wir wo am häufigsten? Gibt es einen Zusammenhang zwischen der Regalposition und den Umsatzzahlen von Produkten? Wie lange müssen wir Produkt X durchschnittlich lagern und wo? Ulf Leser: Data Warehousing und Data Mining 2

3 Data Warehousing und Data Mining Halbkurs Di, Uhr, RUD 26, Do, Uhr, RUD 26, Übung (Sebastian Wandelt) Do, Uhr, RUD 25, Do, Uhr, RUD 26, Erster Termin: Donnerstag, , Uhr Teilnahme und Bestehen ist Voraussetzung für Prüfung Anmeldung über GOYA Sprechstunde Nach Vereinbarung IV.105, (030) , leser(...)informatik.hu-berlin.de Ulf Leser: Data Warehousing und Data Mining 3

4 Einbettung Voraussetzung: DBS-I Relationales Modell und Algebra ER-Modell Joins, Grundzüge der Anfrageoptimierung SQL Keine Voraussetzung: DBS-II Anrechenbar Diplomhauptstudium, Praktische Informatik Monobachelor Informatik, Wahlpflichtbereich (8SP) Ulf Leser: Data Warehousing und Data Mining 4

5 Inhaltsübersicht 1- Einleitung & Motivation Was ist ein DWH? Architektur & Prozesse Qrtl. Qrtl Qrtl. Qrtl. Konzepte & Komponenten Modellierung von DWH Multimensionale Modellierung OLAP Operationen Umsetzung des multimensionalen Datenmodells Relationale Abbildungen SQL-basierte OLAP-Operatoren MDX Ulf Leser: Data Warehousing und Data Mining 5

6 Inhaltsübersicht Extraction, Transformation Load (ETL) Integrationsprobleme Datenqualität und -bereinigung Indexstrukturen für DWH Bitmap-Index, Join-Index, Multimensionale Indexstrukturen: Gr-File, KD Trees Logische Optimierung Star-Join, Partitionierung Materialisierte Sichten Auswahl, Aktualisierung, Verwendung Qrtl. Qrtl Qrtl. Qrtl. Ulf Leser: Data Warehousing und Data Mining 6

7 Inhaltsübersicht 3- Datenaufbereitung Clustering K-Means, nearest neighbor DBSCAN und BIRCH Klassifikation Decision Trees, Naive Bayes SPRINT, RainForest Assoziationsregeln Warenkorbanalyse, A-Priori Algorithmus Ableitung von Kaufempfehlungen Collaborative Filtering Qrtl. Qrtl Qrtl. Qrtl. Ulf Leser: Data Warehousing und Data Mining 7

8 Literatur Primär Lehner: Datenbanktechnologie für Data Warehouse Systeme, dpunkt.verlag, 2003 Han/Kamber: Data Mining, Morgan Kaufmann, 2006 Weitere Bauer/Günzel: Data Warehouse Systeme, dpunkt.verlag, 2004 Ester/Sander: Knowledge Discovery in Databases, Springer Oehler: OLAP: Grundlagen, Modellierung und betriebswirtschaftliche Grundlagen, Hanser Verlag, 2000 Übersichtsartikel Chaudhuri, Dayal: An Overview of Data Warehousing and OLAP Technology, SIGMOD Record, 1997 Jensen et al. (2010). "Multimensional Databases and Data Warehousing", Morgan & Claypool Publishers. Fayyad: From Data Mining to Knowledge Discovery in Databases, Ai Magazine, 1996 Ulf Leser: Data Warehousing und Data Mining 8

9 Gäste : Prof. Edlich, FHTW, NoSQL Datenbanken : Dr. Dresing, Oracle, Oracle Data Integrator Ulf Leser: Data Warehousing und Data Mining 9

10 Webseite Ulf Leser: Data Warehousing und Data Mining 10

11 Feedback SoSe 2007 Semester Regelmäßiger Besuch Angemessene Stoffmenge Stoff zu Leicht? Nachvollziehbar Fehlende Kenntnisse? Dozent kennt sich aus Gut vorbereitet Engagierter Dozent Zwischenfragen Schnelligkeit Anregender Stil Angemessene Folien Klare Folien Neues gelernt Nutzbringend? Gesamteindruck Übung: Regelmüssig Übung: Schwierigkeit Übung: Motivation DWH & DM 8 2,0 2,0 3,0 2,0 4,0 1,0 2,0 1,0 1,0 2,0 2,0 1,0 2,0 1,0 2,0 2,0 3,0 1,0 DWH & DM 8 2,0 2,0 3,0 1,0 4,0 1,0 1,0 1,0 1,0 2,0 1,0 3,0 2,0 1,0 1,0 1,0 3,0 2,0 DWH & DM 21 1,0 3,0 2,0 2,0 5,0 2,0 2,0 2,0 1,0 4,0 2,0 3,0 3,0 4,0 3,0 2,0 1,0 3,0 2,0 DWH & DM 6 1,0 3,0 3,0 1,0 3,0 1,0 1,0 1,0 1,0 2,0 1,0 3,0 1,0 1,0 1,0 1,0 1,0 3,0 3,0 DWH & DM 6 1,0 2,0 3,0 2,0 3,0 1,0 1,0 1,0 1,0 2,0 2,0 3,0 2,0 1,0 2,0 2,0 1,0 3,0 1,0 DWH & DM 10 2,0 3,0 3,0 2,0 3,0 1,0 3,0 1,0 1,0 2,0 2,0 3,0 2,0 2,0 2,0 1,0 1,0 3,0 2,0 DWH & DM 7 2,0 3,0 3,0 1,0 4,0 1,0 2,0 1,0 1,0 3,0 2,0 3,0 2,0 4,0 2,0 1,0 1,0 3,0 2,0 DWH & DM 10 1,0 3,0 3,0 1,0 3,0 1,0 1,0 1,0 1,0 3,0 1,0 3,0 2,0 2,0 1,0 1,0 1,0 3,0 1,0 DWH & DM 10 2,0 3,0 3,0 1,0 3,0 1,0 2,0 1,0 2,0 1,0 3,0 3,0 4,0 1,0 1,0 1,0 3,0 3,0 3,0 DWH & DM 8 3,0 3,0 3,0 1,0 3,0 1,0 2,0 1,0 1,0 2,0 2,0 2,0 3,0 1,0 2,0 2,0 4,0 3,0 1,0 DWH & DM 6 2,0 2,0 3,0 2,0 4,0 1,0 1,0 1,0 1,0 2,0 2,0 2,0 3,0 1,0 1,0 1,0 3,0 1,0 DWH & DM 6 1,0 2,0 4,0 1,0 2,0 1,0 2,0 2,0 1,0 2,0 2,0 2,0 3,0 1,0 1,0 2,0 1,0 3,0 2,0 DWH & DM 10 1,0 3,0 3,0 1,0 5,0 2,0 1,0 1,0 1,0 2,0 1,0 2,0 1,0 1,0 1,0 1,0 1,0 3,0 1,0 DWH & DM 8 1,0 3,0 3,0 1,0 5,0 1,0 2,0 1,0 1,0 2,0 1,0 3,0 1,0 2,0 1,0 1,0 1,0 2,0 1,0 DWH & DM 8 1,0 3,0 3,0 1,0 4,0 1,0 1,0 2,0 3,0 1,0 3,0 1,0 2,0 2,0 1,0 3,0 2,0 DWH & DM 8 1,0 2,0 3,0 2,0 4,0 2,0 2,0 2,0 1,0 3,0 2,0 3,0 2,0 3,0 2,0 2,0 1,0 2,0 3,0 DWH & DM 2,0 3,0 3,0 2,0 4,0 1,0 2,0 1,0 1,0 3,0 2,0 3,0 2,0 3,0 3,0 2,0 1,0 3,0 3,0 DWH & DM 12 1,0 3,0 3,0 1,0 5,0 1,0 1,0 1,0 1,0 2,0 1,0 3,0 1,0 1,0 2,0 1,0 2,0 1,0 DWH & DM 10 1,0 2,0 3,0 1,0 4,0 1,0 1,0 1,0 1,0 3,0 2,0 3,0 2,0 1,0 1,0 1,0 1,0 3,0 1,0 DWH & DM 8 1,0 2,0 3,0 1,0 5,0 1,0 1,0 1,0 1,0 2,0 2,0 3,0 2,0 1,0 1,0 2,0 1,0 3,0 1,0 DWH & DM 8 1,0 3,0 3,0 1,0 5,0 1,0 1,0 1,0 1,0 3,0 1,0 3,0 1,0 1,0 1,0 1,0 1,0 3,0 1,0 DWH & DM 2,0 3,0 3,0 3,0 5,0 1,0 2,0 1,0 1,0 3,0 2,0 3,0 2,0 2,0 2,0 1,0 2,0 3,0 2,0 Durchschnitt 8,9 1,5 2,6 3,0 1,4 4,0 1,1 1,5 1,1 1,1 2,4 1,7 2,7 2,0 1,7 1,6 1,4 1,4 2,9 1,7 Wunschzahl 1,0 3,0 3,0 1,0 5,0 1,0 1,0 1,0 1,0 3,0 1,0 3,0 1,0 1,0 1,0 1,0 1,0 3,0 1,0 Abweichung -0,5 0,4 0,0-0,4 1,0-0,1-0,5-0,1-0,1 0,6-0,7 0,3-1,0-0,7-0,6-0,4-0,4 0,1-0,7 Ulf Leser: Data Warehousing und Data Mining 11

12 7*Wiederholung gut 3*Stil sehr gut Intuitive Vorkenntnisse formal untermauert 2*Lieber langsamer und tiefer 3*Zu schnell Folien vorher ins Netz Folien gut Zu wenig Interaktion Probeklausur wäre gut Stoff für die Prüfung eingrenzen Zu Oracle-lastig. Mindestens DB2 sollte dazu kommen Zu viel Redundanz mit InfoInt 2*Beispiele gut Teilweise theoretischer Stoff Was wird denn wirklich angewandt? Zu viele Fehler auf den Folien Sehr engagiert Wichtige Aussagen stärker betonen DWH hätte gereicht Korrektur der Folien sehr gut 2*Folien zu voll 2*Zu wenig Praxis, Gastdozent nicht gut Fehlende Praxisnähe wirkt negativ Zu viele Folien, wirkt erschlagend Fazit: "Das machen doch eh alles die Tools, ich werde mein Wissen nie mehr brauchen" Mehr DM, auch in der Übung Feedback Vorlesung Ulf Leser: Data Warehousing und Data Mining 12

13 Feedback Übung 7*Wettbewerb sehr gut 3*Aufgabenstellungen nicht immer klar 2*Guter Umfang, Bezug zur VL immer klar Lösungen vortragen war gut 2*Gruppen zu gross, jeder macht nur eine Aufgabe Blog für Änderungen in den Aufgaben Richtzeiten oder Zwischenergebnisse im Wettbewerb veröffentlichen Lieber Semesterprojekt als Einzelaufgaben Ulf Leser: Data Warehousing und Data Mining 13

14 Fragen Diplominformatiker? Semester? Prüfung? Spezielle Erwartungen? Sonstige Fragen? Ulf Leser: Data Warehousing und Data Mining 14

15 Bücher im Internet bestellen Backup Durchsatz Loadbalancing Portfolio Umsatz Marketing Daten bank Ulf Leser: Data Warehousing und Data Mining 15

16 Die (Spielzeug-)Datenbank dazu year year customer name cust_class discount customer_ productg_ discount line_item order_ product_ amount single_price productgroup name product productgroup_ month Month year_ day day month_ session cust_ day_ time order session_ supply_ total_amount order_status order_ supply_ status supply_station region_ region name Ulf Leser: Data Warehousing und Data Mining 16

17 Fragen eines Marketingleiters Wie viele abgeschlossene Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt nach Produktgruppen und Promotion? year year customer name cust_class discount customer_ productg_ discount line_item order_ product_ amount single_price name productgroup product productgroup_ month Month year_ day day month_ session cust_ day_ time order session_ supply_ total_amount order_status order_ supply_ status supply_station region_ name region Ulf Leser: Data Warehousing und Data Mining 17

18 SELECT Y.year, PG.name, DI.disc, count(*) FROM year Y, month M, day D, session S, line_item I, order O, product P, productgroup PG, discount DI, order_status OS WHERE M.year_ = Y. and D.month_ = M. and S.day_ = D. and O.session_ = S. and I.order_ = O. and I.product_ = P. and P.productgroup_ customer = PG. and DI.productgroup_ = PG. and name O. = OS.order_ cust_class D.day < 24 and M.month = 12 and OS.status= FINISHED GROUP BY Y.year, PG.name, DI.discount year year ORDER BY Y.year, DI.discount discount customer_ productg_ discount line_item order_ product_ amount single_price Technisch name productgroup product productgroup_ month Month year_ day day month_ session cust_ day_ time order session_ supply_ total_amount supply_station region_ name region order_status order_ supply_ Ulf Leser: Data Warehousing und Data Mining status 18

19 Ergebnis 9 Joins year: month: day: 3650 Records session: order: line_item: order_status: product: productgroup: 100 discount: 50 SELECT Y.year, PG.name, DI.disc, count(*) FROM year Y, month M, day D, session S, line_item I, order O, product P, productgroup PG, discount DI, order_status OS WHERE M.year_ = Y. and D.month_ = M. and S.day_ = D. and O.session_ = S. and I.order_ = O. and I.product_ = P. and P.productgroup_ = PG. and DI.productgroup_ = PG. and O. = OS.order_ D.day < 24 and M.month = 12 and OS.status= FINISHED GROUP BY Y.year, PG.name, DI.discount 10 Records ORDER BY Y.year, DI.discount 120 Records Problem! Schwierig zu optimieren (Join-Order) Ja nach Ausführungsplan riesige Zwischenergebnisse Ähnliche Anfragen ähnlich riesige Zwischenergebnisse Ulf Leser: Data Warehousing und Data Mining 19

20 In Wahrheit... DE FR UK IT AT Ulf Leser: Data Warehousing und Data Mining 20

21 Eine Möglichkeit CREATE VIEW christmas AS SELECT FROM WHERE... ORDER BY UNION ALL... SELECT FROM WHERE... ORDER BY SELECT FROM GROUP BY ORDER BY Y.year, PG.name, DI.disc, count(*) AS o_count FR.year Y, FR.month M, FR.day D, FR.session S, M.year = Y. and Y.year, DI.discount Y.year, PG.name, DI.disc, count(*) AS o_count EN.year Y, EN.month M, EN.day D, EN.session S, M.year = Y. and Y.year, DI.discount year, name, disc, sum(o_count) christmas year, name, disc year, disc Ulf Leser: Data Warehousing und Data Mining 21

22 Probleme Count über Union über verteilte Datenbanken? Heterogenitätsproblem Quellen werden Schemata verändern Länderspezifischer Eigenheiten (MWST, Versandkosten, Sonderaktionen,...) Oftmals verborgene Änderungen in der Semantik der Daten Datenmengenproblem Transport großer Datenmengen durchs Netz Anforderungsmismatch Operative Systeme brauchen die historischen Daten nicht Ziel: Frühes löschen (abgeschlossene Bestellungen) Planung braucht historische Perspektive Ziel: Alles aufheben Ulf Leser: Data Warehousing und Data Mining 22

23 Lösung Heterogenitätsproblem? Zentrale Datenbank Probleme Zweigstellen schreiben übers Netz Lange Antwortzeiten im operativen Betrieb Ulf Leser: Data Warehousing und Data Mining 23

24 Lösung Anfragezeiten? Probleme EN FR DE Schnelle lokale Anfragen Lange Antwortzeiten für strategische Anfragen Heterogenitätsproblem bleibt Ulf Leser: Data Warehousing und Data Mining 24

25 Lösung? A A A Probleme Replikation Replikation Lokale Anfrage arbeiten auf riesigen Tabellen Verzögerung im operativen Betrieb Ulf Leser: Data Warehousing und Data Mining 25

26 Data Warehouse Redundante Datenhaltung Spezielle Modellierung Transformierte und selektierte Daten Asynchrone Aktualisierung Ulf Leser: Data Warehousing und Data Mining 26

27 Inhalt dieser Vorlesung Szenario Definition & Geschichte & Abgrenzung Sichtweisen Typische Anwendungsgebiete Grosse Datenmengen und TPC-H Ulf Leser: Data Warehousing und Data Mining 27

28 Beispielszenario Ein beliebiges Handelsunternehmen Physikalische Datenverteilung Viele Niederlassungen (bis zu mehrere tausend) Noch mehr Registerkassen Aber: Zentrale Planung, Beschaffung, Verteilung Strategische Unternehmensentscheungen Erfordert Zentrale Übersicht über Umsätze, Kunden, Produkte, Integration von Lieferanten-, Kunden-, Produkt-, daten Ulf Leser: Data Warehousing und Data Mining 28

29 Handels - DWH FILIALE 3 FILIALE 1... FILIALE 2 DWH Artikeldaten Analyse Kundendaten Lieferantendaten Ulf Leser: Data Warehousing und Data Mining 29

30 Definition DWH A DWH is a subject-oriented, integrated, non-volatile, and time-variant collection of data in support of management s decisions [Inm96] Subj-oriented: Verkäufe, Personen, Produkte, etc. Integrated: Erstellt aus vielen Quellen Non-Volatile: Hält Daten unverändert über die Zeit Time-Variant: Vergleich von Daten über die Zeit Decisions: Wichtige Daten rein, unwichtige raus Ulf Leser: Data Warehousing und Data Mining 30

31 Geschichte von DWH Managementinformationssysteme (MIS), Decision Support Systeme (DSS), Executive Information Systeme (EIS) Seit den 60er Jahren Feste, programmierte Reports Redundante Datenhaltung sehr teuer dadurch langsam, oft Downtimes für operative Systeme Analysemethoden ungenügend (Data Mining) Schwierig zu bedienen Teuer und unflexibel Schattendasein Ulf Leser: Data Warehousing und Data Mining 31

32 Erfolg von DWH Top-Thema seit Mitte der 90er Jahre Voraussetzungen Extreme Verbilligung von Plattenspeicherplatz Relationale Modellierung: Anwendungsneutral IT in allen Unternehmensbereichen (SAP R/3) Vernetzung und Standardisierung (SQL) Trend zur rationalen Entscheungsfindung im Unternehmen Trend zu interaktiven Anwendungen Aber Vision der vollständigen Integration scheitert bisher (immer wieder aufs neue) Soziale versus technische Aspekte Ulf Leser: Data Warehousing und Data Mining 32

33 Abgrenzung Parallele Datenbanken Blendet Heterogenität aus Laufen auf einem Rechner, keine physikalische Verteilung Ziel: Ausfallsicherheit und Performanceverbesserung Technik zur Realisierung eines DWH Verteilte Datenbanken Gewollte Verteilung zur besseren Lastverteilung Keine physische Integration der Daten (Materialisierung) Ggf. Vorstufe zum DWH Föderierte Datenbanken Höhere Autonomie und Heterogenität Verteilung bleibt erhalten Ulf Leser: Data Warehousing und Data Mining 33

34 Inhalt dieser Vorlesung Szenario Definition & Geschichte & Abgrenzung Sichtweisen Betriebswirtschaftliche Sichtweise Informatiker Sichtweise: OLAP versus OLTP Typische Anwendungsgebiete Grosse Datenmengen und TPC-H Ulf Leser: Data Warehousing und Data Mining 34

35 Betriebswirtschaftliche Sicht Ein DWH Ermöglicht viele neue Fragen Verbessert viele Antworten erheblich... durch... Zugriff auf integrierte Daten Quellen- / Niederlassungsübergreifende Analysen Bessere Datenqualität Fehlerminimierung, Ergänzung, Plausibilitätschecks Korrektur von Fehlern ist im DWH vertretbar, aber nicht in den operativen Systemen (Originaldaten) Anreicherung mit externen Daten Externe Kundenprofile, geographische Daten, Ulf Leser: Data Warehousing und Data Mining 35

36 Informatische Sicht Operative Systeme Kassensysteme, Bestellabwicklung, Lagerverwaltung Viele Benutzer, kurze Transaktionen, einfache Queries Echtzeitanforderungen Kurzes Gedächtnis OLTP (Online Transaction Processing) DWH Sortimentplanung, Kapazitätsplanung, Marketing Wenige(r) Benutzer, komplexe Queries, nur lesend Zeitlich weniger kritisch Historische Daten OLAP (Online Analytical Processing) Ulf Leser: Data Warehousing und Data Mining 36

37 OLTP Beispiel Login Willkommen Bestellung Best. löschen SELECT pw FROM kunde WHERE login=... UPDATE kunde SET last_acc=date, tries=0 WHERE... COMMIT SELECT k_, name FROM kunde WHERE login=... SELECT last_pur FROM purchase WHERE k_= COMMIT SELECT av_qty FROM stock WHERE p_=... UPDATE stock SET av_qty=av_qty-1 where... INSERT INTO shop_cart VALUES( o_, k_, COMMIT DELETE FROM shop_cart WHERE o_=... UPDATE stock SET av_qty=av_qty+1 where COMMIT Ulf Leser: Data Warehousing und Data Mining 37

38 OLAP Beispiel Welche Produkte hatten im letzten Jahr im Bereich Bamberg einen Umsatzrückgang um mehr als 10%? Welche Produktgruppen sind davon betroffen? Welche Lieferanten haben diese Produkte? Welche Kunden haben über die letzten 5 Jahre eine Bestellung über 50 Euro innerhalb von 4 Wochen nach einem persönlichen Anschreiben aufgegeben? Wie hoch waren die Bestellungen im Schnitt? Wie hoch waren die Bestellungen im Vergleich zu den durchschnittlich. Bestellungen des jew. Kunden in einem vergleichbaren Zeitraum? Lohnen sich Mailing-Aktionen? Haben Zweigstellen einen höheren Umsatz, die gemeinsam gekaufte Produkte zusammen stellen? Welche Produkte werden überhaupt zusammen gekauft und wo? Ulf Leser: Data Warehousing und Data Mining 38

39 Modellierung im DWH Modellierung in operativen Systemen: Normalisierung year year month Month year_ day day month_ customer name cust_class session cust_ day_ time discount customer_ productg_ discount line_item order_ product_ amount single_price discount_ order session_ supply_ total_amount order_status order_ supply_ status name productgroup product productgroup_ supply_station region_ name region Modellierung in DWH: Dimensionen und Fakten year region Sachen Hessen Bücher CD Geschenke DVD produktgroup Ulf Leser: Data Warehousing und Data Mining 39

40 OLAP versus OLTP OLTP OLAP Typische Operationen Insert, Update, Delete, Select Select Bulk-Inserts Transaktionen Viele und kurz Lesetransaktionen Typische Anfragen Einfache Queries, Primärschlüsselzugriff, Schnelle Abfolgen von Selects/inserts/updates/deletes Komplexe Queries: Aggregate, Gruppierung, Subselects, etc. Bereichsanfragen über mehrere Attribute Daten pro Operation Wenige Tupel Mega-/ Gigabyte Datenmenge in DB Gigabyte Terabyte Datenart Rohdaten, häufige Änderungen Abgeleitete Daten, historisch & stabil Erwartete Antwortzeiten Echtzeit bis wenige Sekunden Minuten Modellierung Anwendungsorientiert Themenorientiert Typische Benutzer Sachbearbeiter Management Ulf Leser: Data Warehousing und Data Mining 40

41 Inhalt dieser Vorlesung Szenario Definition & Geschichte & Abgrenzung Sichtweisen Typische Anwendungsgebiete Grosse Datenmengen und TPC-H Ulf Leser: Data Warehousing und Data Mining 41

42 Wal Mart Größe Kunden pro Woche, Geschäfte Wal-Mart... will expand its data-warehouse system, which handles 50,000 queries a week, from 7.5 to 24 terabytes. [Info. Week, 1997] At 70 terabytes and growing... [2000, Wes] Terabyte Datenbank [2003, Computerzeitung] Ca. 480 Terabyte (11/04, New York Times) Ca. 2.5 Petabyte (9/11, Information Management Magazine] Datenbank: Teradata, NCR Täglich bis zu DW-Anfragen Die meisten Analysen laufen auf Shop-, nicht auf Kundenebene Überprüfung des Warensortiments zur Erkennung von Ladenhütern oder Verkaufsschlagern Standortanalyse, Rentabilität von Niederlassungen Untersuchung der Wirksamkeit von Marketing-Aktionen Ulf Leser: Data Warehousing und Data Mining 42

43 CRM: Customer Relationship Management Vertriebswege, Vertriebsorganisationen Kundenkäufe, Präferenzen, Kontaktdaten, Reklamationen, Bonität Wer sind Premiumkunden -> Sonderbehandlung Beratungssysteme, Personalisierung, Mailings Amazon Customers who bought X also bought Y Personalisierte Empfehlungen Neuerscheinungen Ulf Leser: Data Warehousing und Data Mining 43

44 Weitere Anwendungsgebiete Controlling & Accounting Kostenstellen, Kostenträger, Kostenarten Bilanzierung Plan Ist Zahlen, Szenarios Kennzahlensysteme Logistik Flottenmanagement Disposition Tracking Finanzen Kreditkartenanalyse Risikoanalysen Fraud Detection Ulf Leser: Data Warehousing und Data Mining 44

45 TPC.ORG: Benchmarks Vergleich der Leistungsfähigkeit von Datenbanken TPC-C OLTP Benchmark TPC-H Ad-Hoc Decision Support (variable Anfragen) TPC-R Reporting Decision Support (feste Anfragen) TPC-W ecommerce Transaktionsverarbeitung [TPC-D Abgelöst durch H und R] TPC-E Neuer OLTP Benchmark TPC-H Vorgegebene Schemata (Lieferwesen) Schema-, Anfrage- und Datengeneratoren Unterschiedliche DB-Größen 100 GB GB - 1 TB - 3 TB Ulf Leser: Data Warehousing und Data Mining 45

46 TPC-H Ergebnisse 3000 GB, 2003 Ulf Leser: Data Warehousing und Data Mining 46

47 TPC-H Ergebnisse 3000 GB, 2007 Ulf Leser: Data Warehousing und Data Mining 47

48 TPC-H Ergebnisse 3000 GB, 2011 Ulf Leser: Data Warehousing und Data Mining 48

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

Data Warehousing. Einleitung und Motivation. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Einleitung und Motivation. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Einleitung und Motivation Ulf Leser Wissensmanagement in der Bioinformatik Bücher im Internet bestellen Backup Durchsatz Loadbalancing Portfolio Umsatz Werbung Daten bank Ulf Leser: Data

Mehr

Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube

Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube Fragen des Marketingleiters Data Warehousing Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt nach? Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon Technisch

Mehr

Data Warehousing. Einleitung und Motivation. Wissensmanagement in der. Bioinformatik. Ulf Leser

Data Warehousing. Einleitung und Motivation. Wissensmanagement in der. Bioinformatik. Ulf Leser Data Warehousing Einleitung und Motivation Ulf Leser Wissensmanagement in der Bioinformatik Backup Durchsatz Loadbalancing Bücher im Internet bestellen Portfolio Umsatz Werbung Daten bank Ulf Leser: Data

Mehr

Data Warehouses. Kapitel 1 Einführung. Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de

Data Warehouses. Kapitel 1 Einführung. Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de Data Warehouses Sommersemester 2011 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen Kapitel 1 Einführung Vorstellung Organisatorisches Data Warehouses

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Architektur und Komponenten von Data Warehouses Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Architektur Komponenten ETL Ulf Leser: Data Warehousing

Mehr

OLAP und Data Warehouses

OLAP und Data Warehouses OLP und Data Warehouses Überblick Monitoring & dministration Externe Quellen Operative Datenbanken Extraktion Transformation Laden Metadaten- Repository Data Warehouse OLP-Server nalyse Query/Reporting

Mehr

Themenblock: Erstellung eines Cube

Themenblock: Erstellung eines Cube Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen

Mehr

Kap. 7: DB/TP Benchmarks

Kap. 7: DB/TP Benchmarks Kap. 7: DB/TP Benchmarks Einleitung Anforderungen an Benchmarks TPC-Benchmarks TPC-C TPC-W TPC-H 7-1 Benchmarks Leistungsbewertung eines DBMS bzw. Transaktionssystems für standardisierte Last und Ausführungsbedingungen

Mehr

Kapitel II. Datenbereitstellung 2004 AIFB / FZI 1. Vorlesung Knowledge Discovery

Kapitel II. Datenbereitstellung 2004 AIFB / FZI 1. Vorlesung Knowledge Discovery Kapitel II Datenbereitstellung 2004 AIFB / FZI 1 II. Datenbereitstellung 2004 AIFB / FZI 2 II. Datenbereitstellung Collect Initial Data identify relevant attributes identify inconsistencies between sources

Mehr

Einführungsveranstaltung: Data Warehouse

Einführungsveranstaltung: Data Warehouse Einführungsveranstaltung: 1 Anwendungsbeispiele Berichtswesen Analyse Planung Forecasting/Prognose Darstellung/Analyse von Zeitreihen Performancevergleiche (z.b. zwischen Organisationseinheiten) Monitoring

Mehr

Kapitel II. Datenbereitstellung. II. Datenbereitstellung. II.1 Grundlagen. II. Datenbereitstellung. Collect Initial Data. II.

Kapitel II. Datenbereitstellung. II. Datenbereitstellung. II.1 Grundlagen. II. Datenbereitstellung. Collect Initial Data. II. II. bereitstellung Kapitel II bereitstellung 1 2 II. bereitstellung II.1 Grundlagen Collect Initial Data identify relevant attributes identify inconsistencies between sources Describe Data characterize

Mehr

5.4 Benchmarks für Data Warehouses

5.4 Benchmarks für Data Warehouses 5.4 Benchmarks für Data Warehouses Benchmark ( Massstab ) zum Vergleich der Leistungsfähigkeit von Systemen Für Datenbanken: Serie von Benchmarks des Transaction Processing Performance Council (www.tpc.org)

Mehr

Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen

Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen (Folien von A. Kemper zum Buch 'Datenbanksysteme') Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP

Mehr

Data Warehousing. Kapitel 1: Data-Warehousing-Architektur. Folien teilweise übernommen von Matthias Gimbel

Data Warehousing. Kapitel 1: Data-Warehousing-Architektur. Folien teilweise übernommen von Matthias Gimbel Data Warehousing Kapitel 1: Data-Warehousing-Architektur Folien teilweise übernommen von Matthias Gimbel 2 Analyse von Geschäftsprozessen Mögliche Fragestellungen Wie entwickelt sich unser Umsatz im Vergleich

Mehr

Data Warehousing. Architektur Komponenten Prozesse. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Architektur Komponenten Prozesse. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Architektur Komponenten Prozesse Ulf Leser Wissensmanagement in der Bioinformatik Zusammenfassung letzte Vorlesung Aufbau eines Data Warehouse Redundante, transformierte Datenhaltung Asynchrone

Mehr

Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick. Volker.Hinz@microsoft.com

Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick. Volker.Hinz@microsoft.com Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick Volker.Hinz@microsoft.com Was sagt der Markt? Fakten Meinung der Analysten zu Microsofts Angeboten Nutzen

Mehr

Data Warehousing: Anwendungsbeispiel

Data Warehousing: Anwendungsbeispiel Frühjahrsemester 2012 cs242 Data Warehousing / cs243 Datenbanken Kapitel 1: Einführung H. Schuldt Data Warehousing: Anwendungsbeispiel Tresgros Tresgros Tresgros Filiale Muttenz Filiale Allschwil Filiale

Mehr

BARC-Studie Data Warehousing und Datenintegration

BARC-Studie Data Warehousing und Datenintegration Ergebnisse der BARC-Studie Data Warehouse Plattformen Dr. Carsten Bange BARC-Studie Data Warehousing und Datenintegration Data-Warehouse -Plattformen und Datenintegrationswerkzeuge im direkten Vergleich

Mehr

1. Einführung. Szenario: Getränkemarkt. DB-Schema. Motivation Überblick Anwendungen Abgrenzung Begriff Data Warehouse DW-Architektur Benchmarks

1. Einführung. Szenario: Getränkemarkt. DB-Schema. Motivation Überblick Anwendungen Abgrenzung Begriff Data Warehouse DW-Architektur Benchmarks . Einführung Motivation Überblick Anwendungen Abgrenzung Begriff Data Warehouse DW-Architektur Benchmarks Sattler / Saake Data-Warehouse-Technologien Szenario: Getränkemarkt Umsatz, Portfolio SSaufland

Mehr

Marketing Intelligence Übersicht über Business Intelligence. Josef Kolbitsch Manuela Reinisch

Marketing Intelligence Übersicht über Business Intelligence. Josef Kolbitsch Manuela Reinisch Marketing Intelligence Übersicht über Business Intelligence Josef Kolbitsch Manuela Reinisch Übersicht Beispiel: Pantara Holding Der Begriff Business Intelligence Übersicht über ein klassisches BI-System

Mehr

Erfolgreiche Unternehmensführung durch den Einsatz von Corporate Performance Management

Erfolgreiche Unternehmensführung durch den Einsatz von Corporate Performance Management Andrei Buhrymenka Erfolgreiche Unternehmensführung durch den Einsatz von Corporate Performance Management Für Unternehmen mit Business Intelligence Diplomica Verlag Andrei Buhrymenka Erfolgreiche Unternehmensführung

Mehr

Data Warehouse Technologien

Data Warehouse Technologien mitp Professional Data Warehouse Technologien von Veit Köppen, Gunter Saake, Kai-Uwe Sattler 2. Auflage 2014 Data Warehouse Technologien Köppen / Saake / Sattler schnell und portofrei erhältlich bei beck-shop.de

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Logische Optimierung Ulf Leser Wissensmanagement in der Bioinformatik Inhaltsübersicht Vorlesung Einleitung & Motivation Architektur Modellierung von Daten im DWH Umsetzung

Mehr

Index- und Zugriffsstrukturen für. Holger Brämer, 05IND-P

Index- und Zugriffsstrukturen für. Holger Brämer, 05IND-P Index- und Zugriffsstrukturen für Data Warehousing Holger Brämer, 05IND-P Index- und Zugriffstrukturen für Data Warehousing Materialisierte Sichten Bitmap-Indexe Verbundindexe Materialisierte Sichten gehören

Mehr

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII Vorwort zur zweiten Auflage...V Vorwort zur ersten Auflage... VIII 1 Management Support Systeme und Business Intelligence Anwendungssysteme zur Unterstützung von Managementaufgaben...1 1.1 Computergestützte

Mehr

Logische Modellierung von Data Warehouses

Logische Modellierung von Data Warehouses Logische Modellierung von Data Warehouses Vertiefungsarbeit von Karin Schäuble Gliederung. Einführung. Abgrenzung und Grundlagen. Anforderungen. Logische Modellierung. Methoden.. Star Schema.. Galaxy-Schema..

Mehr

REAL-TIME DATA WAREHOUSING

REAL-TIME DATA WAREHOUSING REAL-TIME DATA WAREHOUSING Lisa Wenige Seminarvortrag Data Warehousing und Analytische Datenbanken Friedrich-Schiller-Universität Jena - 19.01.12 Lisa Wenige 19.01.2012 2 Agenda 1. Motivation 2. Begriffsbestimmung

Mehr

Datenbanktechnologie für Data-Warehouse-Systeme

Datenbanktechnologie für Data-Warehouse-Systeme Wolfgang Lehner Datenbanktechnologie für Data-Warehouse-Systeme Konzepte und Methoden dpunkt.verlag 1 1.1 1.2 1.3 1.4 1. 5 2 2.1 2.2 2.3 Einleitung 1 Betriebswirtschaftlicher Ursprung des Data Warehousing...

Mehr

Überblick. Informationsintegration Materialisierte vs. Virtuelle Integration. 1.11.2005 Felix Naumann. Ankündigungen

Überblick. Informationsintegration Materialisierte vs. Virtuelle Integration. 1.11.2005 Felix Naumann. Ankündigungen Informationsintegration Materialisierte vs. Virtuelle Integration 1.11.2005 Felix Naumann Ankündigungen Überblick 2 Szenarien der Informationsintegration Data Warehouse Föderierte Datenbanken Einführung

Mehr

1 Einleitung. Betriebswirtschaftlich administrative Systeme

1 Einleitung. Betriebswirtschaftlich administrative Systeme 1 1 Einleitung Data Warehousing hat sich in den letzten Jahren zu einem der zentralen Themen der Informationstechnologie entwickelt. Es wird als strategisches Werkzeug zur Bereitstellung von Informationen

Mehr

Marketing Intelligence Vorstellung der Softwarekomponenten. Josef Kolbitsch Manuela Reinisch

Marketing Intelligence Vorstellung der Softwarekomponenten. Josef Kolbitsch Manuela Reinisch Marketing Intelligence Vorstellung der Softwarekomponenten Josef Kolbitsch Manuela Reinisch Übersicht Übersicht über die Systemlandschaft Übersicht über die Werkzeuge Workshop Systemlandschaft 1/8 Klassische

Mehr

eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator

eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator Agenda Was ist Business Intelligence? Was ist OLAP? Unterschied zwischen OLAP und OLTP? Bestandteile

Mehr

Hauptspeicher- Datenbanksysteme. Hardware-Entwicklungen Column- versus Row-Store...

Hauptspeicher- Datenbanksysteme. Hardware-Entwicklungen Column- versus Row-Store... Hauptspeicher- Datenbanksysteme Hardware-Entwicklungen Column- versus Row-Store... Hauptspeicher-Datenbanksysteme Disk is Tape, Tape is dead Jim Gray Die Zeit ist reif für ein Re-engineering der Datenbanksysteme

Mehr

Unterabfragen (Subqueries)

Unterabfragen (Subqueries) Unterabfragen (Subqueries) Die kürzeste Formulierung ist folgende: SELECT Felderliste FROM Tabelle1 WHERE Tabelle1.Feldname Operator (SELECT Feldname FROM Tabelle2 WHERE Bedingung); wobei Tabelle1 und

Mehr

fi Data Warehouse: Sammlung von Technologien zur Unterstützung von Entscheidungsprozessen fi Herausforderung an Datenbanktechnologien

fi Data Warehouse: Sammlung von Technologien zur Unterstützung von Entscheidungsprozessen fi Herausforderung an Datenbanktechnologien Einführung Gegenstand der Vorlesung fi Data Warehouse: Sammlung von Technologien zur Unterstützung von Entscheidungsprozessen fi Herausforderung an Datenbanktechnologien Datenvolumen (effiziente Speicherung

Mehr

Data Warehouse Grundlagen

Data Warehouse Grundlagen Seminarunterlage Version: 2.10 Version 2.10 vom 24. Juli 2015 Dieses Dokument wird durch die veröffentlicht.. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen sind Warenzeichen

Mehr

Informationsintegration

Informationsintegration Informationsintegration Grundlegende Architekturen Ulf Leser Inhalt diese Vorlesung Klassifikation verteilter, autonomer, heterogener Systeme Weitere Klassifikationskriterien Schichtenaufbau integrierter

Mehr

2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung

2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung 2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung Reporting, Analyse und Data Mining André Henkel, initions AG 22. und 23. Oktober 2013 in Hamburg

Mehr

Data Warehousing Grundbegriffe und Problemstellung

Data Warehousing Grundbegriffe und Problemstellung Data Warehousing Grundbegriffe und Problemstellung Dr. Andrea Kennel, Trivadis AG, Glattbrugg, Schweiz Andrea.Kennel@trivadis.com Schlüsselworte Data Warehouse, Cube, Data Mart, Bitmap Index, Star Queries,

Mehr

Self Service BI. - Business Intelligence im Mittelstand - schnelle Ergebnisse, nachhaltige Erfolge

Self Service BI. - Business Intelligence im Mittelstand - schnelle Ergebnisse, nachhaltige Erfolge Self Service BI - Business Intelligence im Mittelstand - schnelle Ergebnisse, nachhaltige Erfolge 04. Juli 2013 Cubeware GmbH zu Gast im Hause der Raber+Märcker GmbH Referent: Uwe van Laak Presales Consultant

Mehr

Kapitel 2 Terminologie und Definition

Kapitel 2 Terminologie und Definition Kapitel 2 Terminologie und Definition In zahlreichen Publikationen und Fachzeitschriften tauchen die Begriffe Data Warehouse, Data Warehousing, Data-Warehouse-System, Metadaten, Dimension, multidimensionale

Mehr

Kap. 7: DB/TP Benchmarks

Kap. 7: DB/TP Benchmarks Kap. 7: DB/TP Benchmarks Einleitung Anforderungen an Benchmarks TPC-Benchmarks OLTP: TPC-C und TPC-E OLAP: TPC-H und TPC-DS Big Data Benchmarks BigBench 7-1 Benchmarks Leistungsbewertung eines DBMS / Transaktionssystems

Mehr

The integration of business intelligence and knowledge management

The integration of business intelligence and knowledge management The integration of business intelligence and knowledge management Seminar: Business Intelligence Ketevan Karbelashvili Master IE, 3. Semester Universität Konstanz Inhalt Knowledge Management Business intelligence

Mehr

Technologischen Rahmenbedingungen und Werkzeuge für eine wertschöpfende Controller-Rolle

Technologischen Rahmenbedingungen und Werkzeuge für eine wertschöpfende Controller-Rolle Technologischen Rahmenbedingungen und Werkzeuge für eine wertschöpfende Controller-Rolle 40. Congress der Controller, Themenzentrum C, München Steffen Vierkorn, Geschäftsführer Qunis GmbH, Neubeuern Die

Mehr

Performanceoptimierung mit Exadata Verarbeitung extremer Datenmengen mit PL/SQL basierter Datenbewirtschaftung (Erfahrungsbericht)

Performanceoptimierung mit Exadata Verarbeitung extremer Datenmengen mit PL/SQL basierter Datenbewirtschaftung (Erfahrungsbericht) Performanceoptimierung mit Exadata Verarbeitung extremer Datenmengen mit PL/SQL basierter Datenbewirtschaftung (Erfahrungsbericht) Christian Haag, DATA MART Consulting Consulting Manager Oracle DWH Team

Mehr

Kapitel 3: Datenbanksysteme

Kapitel 3: Datenbanksysteme LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Skript zur Vorlesung: Einführung in die Informatik: Systeme und Anwendungen Sommersemester 2015 Kapitel 3: Datenbanksysteme Vorlesung:

Mehr

EXASOL AG Zahlen & Fakten

EXASOL AG Zahlen & Fakten Big Data Management mit In-Memory-Technologie EXASOL AG Zahlen & Fakten Name: EXASOL AG Gründung: 2000 Tochterges.: Management: Produkte: Firmensitz: Niederlassung: EXASOL Cloud Computing GmbH Steffen

Mehr

DATA WAREHOUSE. Big Data Alfred Schlaucher, Oracle

DATA WAREHOUSE. Big Data Alfred Schlaucher, Oracle DATA WAREHOUSE Big Data Alfred Schlaucher, Oracle Scale up Unternehmensdaten zusammenfassen Noch mehr Informationen aus Unternehmens- Daten ziehen! Datenmengen, Performance und Kosten Daten als Geschäftsmodell

Mehr

Datenintegration & Datenherkunft Verteilung, Autonomie und Heterogenität

Datenintegration & Datenherkunft Verteilung, Autonomie und Heterogenität Datenintegration & Datenherkunft Verteilung, Autonomie und Heterogenität Wintersemester 2010/11 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen 1

Mehr

Datawarehouse Architekturen. Einheitliche Unternehmenssicht

Datawarehouse Architekturen. Einheitliche Unternehmenssicht Datawarehouse Architekturen Einheitliche Unternehmenssicht Was ist Datawarehousing? Welches sind die Key Words? Was bedeuten sie? DATA PROFILING STAGING AREA OWB ETL OMB*PLUS SAS DI DATA WAREHOUSE DATA

Mehr

Big-Data-Technologien - Überblick - Prof. Dr. Jens Albrecht

Big-Data-Technologien - Überblick - Prof. Dr. Jens Albrecht Big-Data-Technologien - Überblick - Quelle: http://www.ingenieur.de/panorama/fussball-wm-in-brasilien/elektronischer-fussball-smartphone-app-helfen-training Big-Data-Anwendungen im Unternehmen Logistik

Mehr

Einführung in Hauptspeicherdatenbanken

Einführung in Hauptspeicherdatenbanken Einführung in Hauptspeicherdatenbanken Harald Zankl Probevorlesung 13. 01., 13:15 14:00, HS C Inhaltsverzeichnis Organisation Überblick Konklusion Harald Zankl (LFU) Hauptspeicherdatenbanken 2/16 Organisation

Mehr

O-BIEE Einführung mit Beispielen aus der Praxis

O-BIEE Einführung mit Beispielen aus der Praxis O-BIEE Einführung mit Beispielen aus der Praxis Stefan Hess Business Intelligence Trivadis GmbH, Stuttgart 2. Dezember 2008 Basel Baden Bern Lausanne Zürich Düsseldorf Frankfurt/M. Freiburg i. Br. Hamburg

Mehr

Data Warehousing in der Lehre

Data Warehousing in der Lehre Data Warehousing in der Lehre Prof. Dr.-Ing. Tomas Benz Dipl.-Inform. Med. Alexander Roth Agenda Vorstellung Fachhochschule Heilbronn Vorstellung i3g Vorlesungen im DWH-Bereich Seminare Projekte Studien-

Mehr

SAP HANA ist schnell erklärt. TOBA Trainerwochenende vom 09. - 12. Mai 2013 in Prag

SAP HANA ist schnell erklärt. TOBA Trainerwochenende vom 09. - 12. Mai 2013 in Prag SAP HANA ist schnell erklärt TOBA Trainerwochenende vom 09. - 12. Mai 2013 in Prag Ihr Referent Steckbrief Name: Miroslav Antolovic Jahrgang: 1975 Stationen: SAP, Walldorf 1999-2004 Realtech, Walldorf

Mehr

Oracle 10g revolutioniert Business Intelligence & Warehouse

Oracle 10g revolutioniert Business Intelligence & Warehouse 10g revolutioniert Business Intelligence & Warehouse Marcus Bender Strategisch Technische Unterstützung (STU) Hamburg 1-1 BI&W Market Trends DWH werden zu VLDW Weniger Systeme, mehr Daten DWH werden konsolidiert

Mehr

Business Intelligence im Krankenhaus

Business Intelligence im Krankenhaus Business Intelligence im Krankenhaus Dr. Thomas Lux Holger Raphael IT-Trends in der Medizin 03.September 2008 Essen Gliederung Herausforderungen für das Management im Krankenhaus Business Intelligence

Mehr

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Prof. Dr. Anett Mehler-Bicher Fachhochschule Mainz, Fachbereich Wirtschaft Prof. Dr. Klaus Böhm health&media GmbH 2011 health&media

Mehr

Kapitel 4: Data Warehouse Architektur

Kapitel 4: Data Warehouse Architektur Data Warehousing, Motivation Zugriff auf und Kombination von Daten aus mehreren unterschiedlichen Quellen, Kapitel 4: Data Warehousing und Mining 1 komplexe Datenanalyse über mehrere Quellen, multidimensionale

Mehr

Data Mining - Marketing-Schlagwort oder ernstzunehmende Innovation?

Data Mining - Marketing-Schlagwort oder ernstzunehmende Innovation? 1. Konferenz der A Benutzer KFE in Forschung und Entwicklung Data Mining - Marketing-chlagwort oder ernstzunehmende Innovation? Hans-Peter Höschel,, Heidelberg 1. Konferenz der A Benutzer KFE in Forschung

Mehr

Datenbanksysteme II Architektur und Implementierung von Datenbanksystemen

Datenbanksysteme II Architektur und Implementierung von Datenbanksystemen Datenbanksysteme II Architektur und Implementierung von Datenbanksystemen Winter 2009/10 Melanie Herschel Willhelm-Schickard-Institut für Informatik Kapitel 1 Einführung Vorstellung Überblick Organisatorisches

Mehr

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß Fachgruppe Statistik, Risikoanalyse & Computing STAT672 Data Mining Sommersemester 2007 Prof. Dr. R. D. Reiß Überblick Data Mining Begrifflichkeit Unter Data Mining versteht man die Computergestützte Suche

Mehr

MIS by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001

MIS by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001 MIS Glossar by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001 Aggregat Data Cube Data Marts Data Mining Data Warehouse (DWH) Daten Decision Support Systeme (DSS)

Mehr

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL

Agenda. Themenblock: Data Warehousing (I) Referenzarchitektur. Eigenschaften eines Data Warehouse. Einführung Data Warehouse Data Access mit SQL Themenblock: Data Warehousing (I) Praktikum: Data Warehousing und Data Mining 2 Eigenschaften eines Data Warehouse Referenzarchitektur Integrierte Sicht auf beliebige Daten aus verschieden Datenbanken

Mehr

Spezialisierung Business Intelligence

Spezialisierung Business Intelligence Spezialisierung Business Intelligence Peter Becker Fachbereich Informatik Hochschule Bonn-Rhein-Sieg peter.becker@h-brs.de 10. Juni 2015 Was ist Business Intelligence? Allgemein umfasst der Begriff Business

Mehr

Data Warehouses. Kapitel 2 Architektur. Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de

Data Warehouses. Kapitel 2 Architektur. Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de Data Warehouses Sommersemester 2011 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen Kapitel 2 Architektur Bestandteile eines DW Konfigurationen ETL

Mehr

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH Einführung in OLAP und Business Analysis Gunther Popp dc soft GmbH Überblick Wozu Business Analysis mit OLAP? OLAP Grundlagen Endlich... Technischer Background Microsoft SQL 7 & OLAP Services Folie 2 -

Mehr

Event Stream Processing & Complex Event Processing. Dirk Bade

Event Stream Processing & Complex Event Processing. Dirk Bade Event Stream Processing & Complex Event Processing Dirk Bade Die Folien sind angelehnt an eine Präsentation der Orientation in Objects GmbH, 2009 Motivation Business Activity Monitoring Sammlung, Analyse

Mehr

25.06.2014 TDWI Konferenz DWH Architektur Agilität durch Data Vault Modeling. Twitter: #TDWI #DataVault @DV_Modeling @BLUEFORTE @TDWI_EU

25.06.2014 TDWI Konferenz DWH Architektur Agilität durch Data Vault Modeling. Twitter: #TDWI #DataVault @DV_Modeling @BLUEFORTE @TDWI_EU BLUEFORTE GmbH Dirk Lerner 25.06.2014 TDWI Konferenz DWH Architektur Agilität durch Data Vault Modeling Twitter: #TDWI #DataVault @DV_Modeling @BLUEFORTE @TDWI_EU 1 Elemente des Data Vault (Basic) HUB

Mehr

Big Data Hype und Wirklichkeit Bringtmehrauchmehr?

Big Data Hype und Wirklichkeit Bringtmehrauchmehr? Big Data Hype und Wirklichkeit Bringtmehrauchmehr? Günther Stürner, Vice President Sales Consulting 1 Copyright 2011, Oracle and/or its affiliates. All rights Überschrift 2 Copyright 2011, Oracle and/or

Mehr

Fachbereich Informatik Praktikum 1

Fachbereich Informatik Praktikum 1 Hochschule Darmstadt DATA WAREHOUSE SS2015 Fachbereich Informatik Praktikum 1 Prof. Dr. S. Karczewski Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 14.April.2015 1. Kurzbeschreibung In diesem Praktikum geht

Mehr

Data-Warehouse-Systeme

Data-Warehouse-Systeme Vorlesung im Wintersemester 2008/09 Data-Warehouse-Systeme Dr. Stefanie Rinderle-Ma Institut für Datenbanken und Informationssysteme Universität Ulm stefanie.rinderle@uni-ulm.de Übersicht 1) Einführung

Mehr

Einführung in die Wissensverarbeitung und Data Mining

Einführung in die Wissensverarbeitung und Data Mining Einführung in die Wissensverarbeitung und Data Mining Peter Becker FH Bonn-Rhein-Sieg Fachbereich Angewandte Informatik!" $# Vorlesung Wintersemester 2001/02 1. Einführung Vorbemerkungen 1 Einführung Vorbemerkungen

Mehr

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria Analyse von unstrukturierten Daten Peter Jeitschko, Nikolaus Schemel Oracle Austria Evolution von Business Intelligence Manuelle Analyse Berichte Datenbanken (strukturiert) Manuelle Analyse Dashboards

Mehr

Neue Strategien und Innovationen im Umfeld von Kundenprozessen

Neue Strategien und Innovationen im Umfeld von Kundenprozessen Neue Strategien und Innovationen im Umfeld von Kundenprozessen BPM Forum 2011 Daniel Liebhart, Dozent für Informatik an der Hochschule für Technik Zürich, Solution Manager, Trivadis AG Agenda Einleitung:

Mehr

Management Information System SuperX status quo and perspectives

Management Information System SuperX status quo and perspectives Management Information System SuperX status quo and perspectives 1 Agenda 1. Business Intelligence: Basics 2. SuperX: Data Warehouse for Universities 3. Joolap: OLAP for Universities 4. Cooperative reporting

Mehr

Download:.../~rieche. gehalten am 2. Februar 2004. Stephan Rieche. Vortrag. Thema: Index Selection. von. Seminar Advanced Data Warehouse

Download:.../~rieche. gehalten am 2. Februar 2004. Stephan Rieche. Vortrag. Thema: Index Selection. von. Seminar Advanced Data Warehouse Seminar Advanced Data Warehouse Thema: Index Selection Vortrag von Stephan Rieche gehalten am 2. Februar 2004 Download:.../~rieche Inhalt des Vortrages 1. Einleitung - Was ist das Index Selection Problem?

Mehr

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher

Mehr

Business Intelligence Center of Excellence

Business Intelligence Center of Excellence Center of Excellence Eine Businessinitiative von Systematika und Kybeidos Werner Bundschuh Was ist das? In der Praxis versteht man in den meisten Fällen unter die Automatisierung des Berichtswesens (Reporting).

Mehr

Lehrgebiet Informationssysteme

Lehrgebiet Informationssysteme Lehrgebiet AG Datenbanken und (Prof. Michel, Prof. Härder) AG Heterogene (Prof. Deßloch) http://wwwlgis.informatik.uni-kl.de/ Was sind? Computergestützte Programmsysteme, die Informationen erfassen, dauerhaft

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2014, SS 2014 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source: http://arxiv.org/abs/1312.6082,

Mehr

Open Source Datawarehouse für das IT-Management

Open Source Datawarehouse für das IT-Management Open Source Datawarehouse für das IT-Management 09.06.2010 Linuxtag Berlin Referent: Bernd Erk Agenda DESTINATION TIME REMARK KURZVORSTELLUNG ÜBERBLICK DATAWAREHOUSE DATENINTEGRATION DATENHALTUNG DATENORGANISATION

Mehr

Data Warehousing. Weitere Buzzwörter: OLAP, Decision Support, Data Mining

Data Warehousing. Weitere Buzzwörter: OLAP, Decision Support, Data Mining Data Warehousing Weitere Buzzwörter: OLAP, Decision Support, Data Mining Wichtige Hinweise Zu diesem Thema gibt es eine Spezialvorlesung im Sommersemester Hier nur grober Überblick über Idee und einige

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2012, SS 2012 1 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen

Mehr

Andrea Held. Motivation ILM: Definition und Strategien Lösungen für Oracle Datenbanken. Empfehlungen

Andrea Held. Motivation ILM: Definition und Strategien Lösungen für Oracle Datenbanken. Empfehlungen Andrea Held Motivation ILM: Definition und Strategien Lösungen für Oracle Datenbanken Partitionierung Komprimierung ILM Assistant Flashback Data Archive Empfehlungen 1 Datenwachstum Wachsende Kosten Schlechtere

Mehr

IBM Informix Tuning und Monitoring

IBM Informix Tuning und Monitoring Seminarunterlage Version: 11.01 Copyright Version 11.01 vom 25. Juli 2012 Dieses Dokument wird durch die veröffentlicht. Copyright. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen

Mehr

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung

Mehr

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse

Mehr

Die Bedeutung der Prozessmodellierung bei der Weiterentwicklung des DWHs der DAK Der Innovator als Missing Link

Die Bedeutung der Prozessmodellierung bei der Weiterentwicklung des DWHs der DAK Der Innovator als Missing Link Die Bedeutung der Prozessmodellierung bei der Weiterentwicklung des DWHs der DAK Der Innovator als Missing Link Konrad Linner, solvistas GmbH Nürnberg, 20.November 2012 Inhaltsverzeichnis Vorstellung solvistas

Mehr

Cassandra Query Language (CQL)

Cassandra Query Language (CQL) Cassandra Query Language (CQL) Seminar: NoSQL Wintersemester 2013/2014 Cassandra Zwischenpräsentation 1 Gliederung Basic facts Datentypen DDL/DML ähnlich zu SQL Besonderheiten Basic facts CQL kurz für

Mehr

Complex Event Processing. Sebastian Schmidbauer 18.01.2011

Complex Event Processing. Sebastian Schmidbauer 18.01.2011 Complex Event Processing Sebastian Schmidbauer 18.01.2011 Cirquent im Profil Zahlen Kompetenzen 350 300 250 200 150 100 50 0 1748 1747 1722 1515 1041 1180 286 266 247 260 165 139 2003 2004 2005 2006 2007

Mehr

Vergleich von Open-Source und kommerziellen Programmen zur Durchführung eines ETL-Prozesses

Vergleich von Open-Source und kommerziellen Programmen zur Durchführung eines ETL-Prozesses Vergleich von Open-Source und kommerziellen Programmen zur Durchführung eines ETL-Prozesses Exposé zur Diplomarbeit Humboldt-Universität zu Berlin Mathematisch-Naturwissenschaftliche Fakultät II Institut

Mehr

Business Intelligence Praktikum 1

Business Intelligence Praktikum 1 Hochschule Darmstadt Business Intelligence SS 2014 Fachbereich Informatik Praktikumsversuch 1 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 07.05.2014 Business Intelligence Praktikum

Mehr

Data-Warehouse-Technologien

Data-Warehouse-Technologien Data-Warehouse-Technologien Prof. Dr.-Ing. Kai-Uwe Sattler 1 Prof. Dr. Gunter Saake 2 Dr. Veit Köppen 2 1 TU Ilmenau FG Datenbanken & Informationssysteme 2 Universität Magdeburg Institut für Technische

Mehr

Big Data Vom Hype zum Geschäftsnutzen

Big Data Vom Hype zum Geschäftsnutzen Big Data Vom Hype zum Geschäftsnutzen IBM IM Forum, Berlin, 16.04.2013 Dr. Carsten Bange, Gründer und Geschäftsführer BARC Hype 15.04.2013 BARC 2013 2 1 Interesse an Big Data Nature 09-2008 Economist 03-2010

Mehr

Oracle Datenbank / Ubuntu

Oracle Datenbank / Ubuntu Oracle Datenbank / Ubuntu Sebastian Gath & Hannes Schwarz Seminar Database Tuning & Administration Universität Konstanz - SS 2007 Administration Vorbereitung Zeitmessung Erste Zeitmessung 2 Ausgangssituation

Mehr

DW Data Warehousing Funktionsweise, Einsatz- und Problemfelder

DW Data Warehousing Funktionsweise, Einsatz- und Problemfelder DW Data Warehousing Funktionsweise, Einsatz- und Problemfelder Andreas Meier, Universität Fribourg Folie 1 DW Cartoon Quelle: Knoll M., Meier A. (Hrsg): Web & Data Mining. Praxis der Wirtschaftsinformatik,

Mehr

Data Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 16 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining operationale DB operationale DB operationale DB Data Warehouse operationale

Mehr