Data Warehouse. Prof. Dr. W. Riggert

Größe: px
Ab Seite anzeigen:

Download "Data Warehouse. Prof. Dr. W. Riggert"

Transkript

1 Data Warehouse Prof. Dr. W. Riggert

2 Gliederung Ausgangssituation : Motiv und Hintergrund Definition und Architektur Operative Systeme vs Data Warehouse OLAP und Beispiel Data Mining 2

3 Motiv Marktentwicklungen und Wettbewerb zwingen zu - kürzeren Entscheidungsprozessen - besserer Entscheidungsunterstützung durch Information - flacheren Strukturen - Business Process Reengineering Data Warehouse Technische Entwicklungen ermöglichen bessere Lösungen - starke Endbenutzerwerkzeuge - Client-Server Technologie - preisgünstige Hard- und Software Quelle : Software AG 3

4 Motiv Könnten Sie mir schnell das wichtigste auf einer Seite zusammenfassen? 4

5 Ursache Flut nicht relevanter Informationen erschwert das Herausfiltern entscheidungsbedeutender Informationen: Im WWW findet keine Selektion statt -Verkehr steigt exponentiell Moderne Informations- und Kommunikationstechnologien sind Wegbereiter der Datenflut, da Speicherkapazität keine limitierende Ressource darstellt 5

6 Hintergrund Hinter den Daten transaktionsorientierter Anwendungen verbergen sich wichtige Informationen, z.b. Aussagen über : Kaufverhalten Kundenwünsche Markttrends Qualitätssituation Geschäftsperformance Wettbewerber 6

7 Ist-Situation Die Daten sind in zu vielen Datenbanken verstreut und nicht vergleichbar. (Datumsformate, Währungen, etc.) Es gibt keinen zentralen Ort zur Speicherung externer Zahlen (z.b. Marktforschungen oder Daten über Konkurrenten.) Auf die vorhandenen Datenbanken ist Zugriff nur bedingt möglich. Es fällt schwer, aus den vorhandenen Systemen geeignete Daten zu extrahieren. Extraktion liegt in der Hand der SQL-Kenner. 7

8 Gliederung Ausgangssituation : Motiv und Hintergrund Definition und Architektur Operative Systeme vs Data Warehouse OLAP und Beispiel Data Mining 8

9 Ziele Zusammenführung (Integration) und Verdichtung (Aggregation) von Daten aus mehreren heterogenen Quellen in einer zentralen Datenbank 9

10 Definition : Annäherung Nicht jede Datensammlung ist ein Data Warehouse! Ein Data Warehouse (DW) ist ein Datenlager, das nach einem bestimmten Konzept strukturiert ist, um flexible und schnelle Auswertungen zu ermöglichen 10

11 Definition - exakt 1 "Ein Data Warehouse ist eine Themenorientiert Die Daten werden nach dem betriebswirtschaftlichen Umfeld des Unternehmens organisiert. "Alles über Kunden, Produkte oder..." Zeitorientiert Daten eines Data Warehouses werden langfristig gespeichert. Jedes Data Warehouse beinhaltet auch die Dimension Zeit. Periodische Ergänzung um aktuelle Daten, u.u. Verdichtung älterer Informationen 11

12 Definition - exakt 2 integriert Das Data Warehouse wird aus einer Vielzahl interner wie externer Datenquellen bewirtschaftet. Dabei spielt die Datenqualität eine wesentliche Rolle. Zusammenführung und Konsolidierung verteilter Daten Unveränderlich Die Daten werden persistent gespeichert. Daten sind nur lesbar. Datensammlung für Managemententscheidungen." (W.H. Inmon, "Building the Data Warehouse") 12

13 Data Warehouse Merkmale Themenorientierung: Data Warehouses befriedigen den Informationsbedarf bezüglich Sachverhalten, die das Handeln des Unternehmens bestimmen Integration: Data Warehouses vereinheitlichen die Daten der Vorsysteme: Anpassung an Datenformate Vereinheitlichung von Datumsfeldern Umrechnung von Werteinheiten Währungsumrechnungen Beständigkeit: Die im Data Warehouse abgelegten Daten werden nicht mehr verändert nur Lese-Zugriff Zeitraumbezug: Data Warehouses beinhalten zeitraumbezogene, historisierte Daten 13

14 Merkmale Bestimmende Merkmale: Vereinheitlichung: aus aus verschiedenen Datenbeständen in in eine eine homogene Datenwelt zusammengeführt Themenausrichtung: auf auf die die Informationsbedürfnisse des des Anwenders ausgerichtet Zeitorientierung: Einbeziehung von von historischen Werten (aber (aber auch auch von von Planzahlen) Dauerhaftigkeit: jederzeitige Wiederholbarkeit einer einer Abfrage 14

15 Data Warehouse Einordnung 15

16 Data Warehouse Architektur Data Marts (DM) ASCII Endbenutzeranalysen Staging Area Core DWH Clients Host Relat. DB [ ] Extraktion Transformation Aggregation Metadaten-Management Analyse Quelle : Diplomarbeit Herrera 16

17 Data Warehouse Anforderungen 1 Das Data Warehouse bietet einen Zugang zu allen relevanten Daten des Unternehmens. Die Daten eines Data Warehouses sind konsistent, d.h. frei von logischen Widersprüchen Daten im Data Warehouse können nach jeder beliebigen und möglichen betrieblichen Kennzahl getrennt und kombiniert werden 17

18 Data Warehouse Anforderungen 2 Das Data Warehouse besteht nicht nur aus Daten. Zum Gesamtsystem gehören auch verschiedene Tools um die Daten abzufragen, analysieren und darzustellen Das Veröffentlichen der Daten ist die Kernaufgabe des Data Warehouses. Die Daten werden an einem zentralen Ort gesammelt, sorgfältig transformiert und qualitätsgesichert Das Data Warehouse kann keine mangelhafte Datenqualität beheben. 18

19 Data Warehouse Ziele Ein Data Warehouse führt Daten aus unterschiedlichen internen und externen Quellen zusammen, um mit Abfrage- und Analysewerkzeugen neue Informationen zu gewinnen besitzt eine eigenen physische Datenhaltung, um operative Anwendungen nicht zu beeinträchtigen nutzt sämtliche Datenformate: relationale Daten, unstrukturierten Text, Fotos, Videos beinhaltet aggregierte Daten über einen längeren Zeitraum 19

20 Data Mart Ein Data Mart ist eine logische und physikalische Teilmenge eines Data Warehouse mit subjekt- oder abteilungsspezifischem Charakter Dabei ist es nicht erforderlich, die Daten unmittelbar aus dem Data Warehouse zu laden, sondern eine Übernahme direkt aus den operativen Daten ist möglich. 20

21 Data Mart Eigenschaften Data Marts sind abteilungs- oder themenbezogene Datenbanken, die eine Untermenge der im zentralen Data Warehouse gespeicherten operativen Daten enthalten Data Marts werden eingeführt, um die Systemleistung bei Datenabfragen zu verbessern und die Abhängigkeit von unternehmensweiten Warehouse-Daten zu verringern. 21

22 Data-Mart Architektur Data Marts (DM) ASCII Endbenutzer- Analysen Staging Area Clients Host Relat.DB [ ] Extraktion Transformation Aggregation Metadaten-Management Analyse Quelle : Diplomarbeit Herrera 22

23 Datenübernahme: ETL-Prozess Die Datenübernahme ist ein dreistufiger Prozess: Extraktion: Selektion der Daten aus den Quellen und Ablage in einen Zwischenspeicher. Arten: Periodische Extraktion Extraktion auf Anfrage Ereignisgesteuerte Extraktion Transformation: Beseitigung von Qualitätsmängeln der Daten aufgrund Inkorrekter Daten Inkonsistenter Daten Unvollständiger Daten Doppelter Daten Veralteter Daten Irrelevanter Daten 23

24 Transformation Die Qualität wird durch mehrere Maßnahmen gesichert: Bereinigung durch Ausgleich syntaktischer und semantischer Mängel Harmonisierung durch die Vereinheitlichung unterschiedlicher Codierungen; z.b. m/w oder 0/1 und Blank für Unternehmen Verdichtung durch Aggregation auf verschiedenen Stufen Anreicherung durch weitere Kennzahlen 24

25 Transformation: Konflikte bei der Datenintegration Semantische Konflikte: In zwei Datenquellen wird das gleiche Objekt mit unterschiedlichen Attributen beschrieben Beschreibungskonflikte: für Attribute der selben Objekte werden synonyme Bezeichnungen, verschiedenen Datentypen, Wertebereiche oder unterschiedliche Maßeinheiten verwendet Falsche Daten: Eingabefehler oder veraltete Daten Unterschiedliche Repräsentation: gleicher semantischer Sachverhalt wird unterschiedlich abgebildet: Schulnote als 1 bis 6 oder als sehr gut bis unzureichend 25

26 Transformation: Konfliktbereinigung Konvertierungs- und Normalisierungsfunktionen: Zurückführung unterschiedlicher Einheiten auf einen festgelegten Standard Domänenspezifische Bereinigung: Korrektur der Daten durch Hintergrundwissen aus dem Fachgebiet, z.b. Adressdaten Domänenunabhängige Bereinigung: Zusammenführung unterschiedlicher Datenmodelle durch Prüfung von Ähnlichkeiten bezüglich der Objekte, z.b. entspricht die Bestellnummer in Schema 1 derjenigen in Schema 2 mit einer gewissen Wahrscheinlichkeit Regelbasierte Bereinigung: automatische, programmgestützte Anpassung von Objekten 26

27 Laden Die Übernahme der Daten unterscheidet zwei Ausprägungen: Initiales Füllen Zyklische Aktualisierung: Komplette Datenübernahme bei jedem Zyklus Übernahme jeweiliger Änderungen inkrementell Auswahl protokollierter Daten 27

28 Laden: Aktualisierung Vollständige Aktualisierung - Full Refresh. Der gesamte Datenbestand der operativen Quellen wird geladen Inkrementelle Aktualisierung - Incremental Refresh Nur die Änderungen der operativen Daten werden geladen. Dabei entstehen zwei Probleme : Erkennen und Identifizieren der Änderungen Einarbeitung der Änderungen in den Datenbestand unter Berücksichtigung historischer Bestände. 28

29 Laden: Aktualisierung 2 Wie aktuell müssen die bereitgestellten Daten sein? Daten des Vormonates, der vergangenen Woche oder von gestern? In welcher Aggregationsform sollen die Daten vorliegen? Von Interesse sind keine einzelnen Aktivitäten, sondern zusammengefasste Vorgänge. 29

30 Analysen, Trends Berichte ETL: Interne/Externe Datenquellen? Einkauf Lager/Bestände Personal Vertrieb Finanzen Interne Informationsressourcen Data Warehouse Externe Informationsressourcen Kunden Lieferanten Markt Wettbewerb 30

31 ETL: Datenquellen und -arten Online Daten- Banken / Internet Operative Verfahren sammeln, filtern, bewerten bereinigen, strukturieren, ergänzen Datenquelle intern extern Marktvolumen, Marktanteile, Verbrauchs- Kennzahlen,... Auftragseingang, Umsatz, Kosten Deckungsbeitrag, Produktivität,... Presse- Meldungen, Patente, Gutachten,... Kundenbesuchs- Berichte, Projektberichte,... quantitativ qualitativ Datenart Nach: Meier, M., Fülleborn, A., Integration, externer Führungsinformationen..., WI 41(1999)5, S 449 ff. 31

32 DW-Architektur im Überblick Δ LH DB TUI Δ MOLAP Δ Δ ROLAP Datenquellen Extraktion Transformation Warehouse-DB Analyse-Schicht Präsentation Metadaten Prozessmanagement Quelle : sd&m 32

33 Meta-Datenverwaltung Meta-Daten sind Daten über Daten Welche Daten liegen im Data Warehouse? In welcher Form existieren sie? Wer ist für die Pflege verantwortlich? Wann fand die letzte Aktualisierung statt? Welche Berichte sind vorgesehen? 33

34 Eigenschaften Subjekt-orientierter Aufbau : Unternehmensdaten nach dem Informationsbedarf des Managements Zeitvariante Daten : Datenprotokollierung über längere Zeiträume Nicht-flüchtige Sammlung von Daten : Aktualisierung der Datenbestände in festgelegten Zeitabständen Integrativer Inhalt : Verbindung entscheidungsrelevanter Daten aus unterschiedlichen operativen Anwendungen 34

35 Gliederung Ausgangssituation : Motiv und Hintergrund Definition und Architektur Operative Systeme vs Data Warehouse OLAP und Beispiel Data Mining 35

36 Vergleich : operativ vs. Data Warehouse 1 Operative Systeme Data Warehouse Die Struktur operativer Systeme ist an der Abwicklung von Geschäftsprozessen orientiert. Sie enthält keine Redundanzen Datenstruktur Detaillierungsgrad Ein Data Warehouse enthält managementrelevante Objekte als Dimension ohne in dritter Normalform vorzuliegen. Operative Systeme enthalten Data Warehouses enthalten detaillierte Daten verdichtete Daten Zeitraumbezug Operative Systeme enthalten aktuelle Daten Data Warehouses bestehen aus historischen, aktuellen und prognostizierten Daten 36

37 Vergleich : operativ vs. Data Warehouse 2 Operative Systeme Data Warehouse Aktualisierungszeitraum Die Daten in einer operativen Die Daten eines Data Warehouses Datenbank sind einer permanenten werden zu vordefinierten Änderung unterlegen Zeitpunkten durch die Extraktionsprogramme aktualisiert Systemlast Die Auslastung operativer Systeme Die Systemlast bei Data Warehouseist bekannt, insbesondere wann Nutzung schwankt stark. Allerdings Spitzenzeiten mit einer Vielzahl von werden nur wenig Transaktionen Transaktionen existieren durchgeführt. Verfügbarkeit Operative Systeme haben einen hohen Anspruch an die Verfügbarkeit Geringe Anforderungen an die Verfügbarkeit. 37

38 Vergleich : operativ vs. Data Warehouse 3 Einfügen Laden Operative Datenbank Data Warehouse Änderung Löschung Ersetzung Zugreifen Daten werden auf Record-Basis bearbeitet Daten werden ins Warehouse geladen und dort zugegriffen. Wenn ein Snapshot gemacht wird, verändern sich die Daten anschließend nicht mehr. 38

39 Vergleich : operative vs. Managementunterstützung Merkmal Datenstruktur Identifikationskriterium Operative DV-Systeme flache, nicht hierarchische Tabellen eindimensional Managementunterstützende Systeme multidimensionale Strukturen mehrdimensional Datenmanipulation zeilenbezogen sichtspezifisch Datenmenge/ Transaktion Betrachtungsebene klein detailliert umfangreich aggregiert Zeithorizont gegenwärtig historisch, gegenwärtig, zukünftig 39

40 Gliederung Ausgangssituation : Motiv und Hintergrund Definition und Architektur Operative Systeme vs Data Warehouse OLAP und Beispiel Data Mining 40

41 12 OLAP-Regeln (nach Codd) Basisregeln 1 Mehrdimensionale Perspektive Intuitive Datenmanipulation Zugriffsmöglichkeiten Datenintegration Ein Bericht sollte durch Slice und Dice per Mausklick veränderbar sein Einfache Navigation durch Drill-up, Drill-down oder Drillthrough Ein Benutzer soll nicht wissen müssen, wo die gerade verwendeten Daten herkommen Ein OLAP-System soll Daten in einem eigenständigen Prozess übernehmen und ein Drill-through gestatten Client/Server Architektur OLAP-Anwendungen werden über ein Netzwerk nach diesem Verteilungsprinzip betrieben, um ressourcenintensive Prozesse auf einem Server auszuführen 41

42 Basisregeln 2 Unterstützung verschiedener Analysemodelle Categorical = historische Daten, Exegetical = interaktive Analyse, Contemplativ = Wenn/dann -Anaylse Formulatic = formelbasierte Analyse Mehrbenutzerfähigkeit Transparenz Es ist ein gleichzeitiger Zugriff mehrerer Benutzer gestattet Daten stammen aus integriertem Datenbestand oder aus heterogenen externen Quellen 42

43 Spezielle Regeln Trennung denormalisierter Daten Trennung Uneingeschränkte Anzahl von Dimensionen Null- und Fehlwerte Daten in OLAP-Datenbanken werden denormalisiert gespeichert OLAP-Daten sind von Produktivdaten getrennt abzulegen OLAP-Datenbanken geben keine Einschränkung bezüglich der Dimension vor Da in einem Datenwürfel nicht jede Zelle gefüllt ist, müssen leere Zellen einen Fehlwert tragen, der nicht den Wert Null besitzt 43

44 Kritik Unscharfe Trennung zwischen fachlich-konzeptionellen Anforderungen und technischer Realisierung Keine Klarheit, ob mehrdimensionale Datensichten ein eigenes Datenmodell benötigen 44

45 Begriffe OLAP = Online Analytical Processing = Analyse und Auswertung von multidimensional aufbereiteten Daten, um Informationen für Unternehmensentscheidungen zu gewinnen OLTP = Online Transaction Processing Die operativen Geschäftsprozesse und IT- Systeme eines Unternehmens MOLAP = Multidimensional OLAP auf Basis einer proprietären, multidimensionalen Datenbank ROLAP = Relational OLAP auf Basis einer relationalen Datenbank Data Mart = spezielle Teildatenmenge eines DW, z.b. für eine bestimmte Abteilung des Unternehmens, ist aufgebaut wie das DW selbst und wird auch mit den gleichen Methoden und Tools ausgewertet. 45

46 OLAP-Werkzeuge Würfel (Cube) als Synonym für OLAP-Datenbanken - 3 Dimensionen (bei 4 oder mehr Dimensionen spricht man von sog. Hybercubes) Individuelle Sicht auf die Daten des Würfels durch Pivotisierung: Daten aus verschiedenen Perspektiven nach verschiedenen Kriterien analysieren Rotation: Vertauschen der Dimensionen Slice and Dice: herausschneiden einzelner Scheiben bzw. Betrachtung kleinerer Teilwürfel 46

47 OLAP-Grundfunktionen Slice (Schneiden): Einschränkung der Anzahl der Dimensionen eines Würfels Dice (Drehen): Vertauschen der Dimensionen eines Würfels und dadurch Drehung Drill-Down (Herunterbrechen): Verfeinerung der Dimesionen des Würfels Drill Through: Durchgriff auf die Daten des Ursprungssystems 47

48 Dimensionen und Fakten 1/3 Fakten entsprechen Kennzahlen, die für eine bestimmte Kombination von Dimensionswerten Gültigkeit haben. Beispiel: Erlös der Produktgruppe Kühlschränke im Monat Dezember 2000 in München Eine typische Abfrage auf einem Data Warehouse-Datenbestand besteht darin, eine oder mehrere Kennzahlen bezüglich einer bestimmten Dimensionskombination darzustellen, wobei bzgl. einiger Dimensionen eingeschränkt wird anderer Dimensionen aufgerissen wird (Zeilen oder Spalten) der restlichen Dimensionen aggregiert wird Quelle : sd&m 48

49 Dimensionen und Fakten 2/3 Dimensionen sind endliche Wertebereiche typische Dimensionen sind Zeit, einzelne Monate oder auch Kalendertage eines definierten Zeitraums Ort, z.b. eine Postadresse aber auch Kategorien, z.b. Produktgruppe: Kühlgeräte, Fernseher,... Werttyp: Plan, Ist, Soll Dimensionen sind häufig hierarchisch organisiert (Tag -> Monat -> Quartal -> Jahr) und können auch noch weitere Merkmale haben (Kalenderwoche, Wochentag, Feiertag) Quelle : sd&m 49

50 Dimensionen und Fakten 3/3 Eine Kennzahl ist aggregierbar bezüglich einer Dimension, wenn es eine fachlich sinnvolle (kommutative und assoziative) Aggregationsfunktion gibt (zumeist Summe, gelegentlich auch Mittelwertbildung). Beispiel: Der Umsatz einer Firma ist bezüglich der Dimensionen Zeit, Verkaufsorganisation und Verkaufsort sinnvoll aggregierbar durch Summenbildung. Der Kundenbestand ist durch Summierung zwar bezüglich der Verkaufsorganisation aggregierbar, nicht jedoch bezüglich der Zeitdimension; hier ist eine Mittelwertbildung sinnvoll Entsprechend verdichtete Ergebnisse heißen Aggregate. Die Abbildung der Aggregationsfunktionen werden bei einem relationalen Data Warehouse in SQL- Statements formuliert, die Berechnung leistet die Datenbank. Quelle : sd&m 50

51 Beispiel Produkt Region Branche Dimensions-Relation Produkt-Nr Filial-Nr Kunden-Nr Datum Anzahl Umsatz Ost West Nord Region PKW PC Kaffee Fahrzeuge Elektronik Lebensmittel Produktgruppe Branche Quelle für folgende Beispiele : Prof. E. Rahm 51

52 Mehrdimensionale Datensicht Hierarchische Dimensionierung PKW Region Zeit PC Jahr Kaffee Bundesland 1Q 2Q 3Q Fahrzeuge Elektronik Lebensmittel Branche Ort Quartal Monat Woche Zeit Tag 52

53 Multidimensionale Daten Fakt/Kennzahl (z.b. Absatz) Region Produkt Produkt Region Quartal Absatz Radio Hessen Quartal Radio Radio Hessen Hessen Radio Hessen Radio Bayern Dimensionen Radio Radio Bayern Bayern Radio Bayern

54 Relational vs. Multidimensional Bestellnr Region Branche Zeit Menge 1406 Ost Fahrzeug 2Q West Elektronik 1Q 58 PKW 7829 Nord Fahrzeug 2Q 30 PC 5327 Ost Lebensmittel 3Q 300 Kaffee Nord Ost Lebensmittel Elektronik 1Q 3Q Q 2Q 3Q Fahrzeuge Elektronik Lebensmittel Branche Zeit Relation : Untermenge des Kreuzproduktes aller Wertebereiche Multidimensional : Kreuzprodukte aller Wertebereiche mit aggregiertem Wert pro Kombination 54

55 Multidimensionale Strukturen Unterschiedliche Ebenen der Datendarstellung nach Informationsbedürfnis und organisatorischer Stellung Zeit Produkt Ort 55

56 OLAP am Beispiel: Navigation in einem 3D-Würfel Gebietsleiter: Alle Produkte und Monate für ein Gebiet Produktmanager: Alle Gebiete und Monate für ein Produkt Umsatz Umsatz Produkt Produkt Gebiet Gebiet Umsatz Finanzmanager: Alle Produkte und Gebiete für einen Monat Monat Geschäftsleitung: Alle Produkte und Gebiete für alle Monate Umsatz Umsatz 56

57 Navigation in multidimensionalen Daten 3 Kosten/Erlöse Erlös Fracht Einkaufspreis 2 Plan / Ist Plan Ist Gebiete Nord West Süd 46 Jan Feb Mar Slicing 5 Perioden Kühlgeräte Fernseher Videorecorder Drill Down, Roll up Kühlschrank Gefrierschr. Minibar Dicing 1 Produktgruppen 14 Produkte Quelle : sd&m 57

58 Multidimensionale OLAP (MOLAP) Speicherung in multidimensionaler Datenbank (genauer Aufbau ist Geheimnis des Herstellers) auf einem speziellen Server Alle möglichen Aggregate sind vorberechnet! Aufbau der multidimensionalen Datenbank (also Einladen der Grunddaten und Berechnung der Aggregate) kann mehrere Stunden in Anspruch nehmen insgesamt derzeit geringere Datenmengen speicherbar als beim ROLAP- Ansatz Zugriff auf den Würfel ist extrem schnell, da keine Berechnungen mehr nötig. Dafür muss der Würfel regelmäßig berechnet werden. Werkzeuge (Server): Oracle-Express-Server, Hyperion-Essbase, Cognos PowerPlay, u.a. Quelle : sd&m 58

59 Relationales OLAP (ROLAP) Speicherung in relationaler Datenbank (Stern- oder Snow-Flake Schema) Die Ergebnismenge wird in der Datenbank berechnet und zum Client bzw. Server übertragen. Größe ist beschränkt, Würfel aber schnell modifiziert und neu erstellt Anwender stellt die Abfragen mit grafischer Oberfläche zusammen, Tools generieren die SQL-Zugriffe auf die Datenbank Berechnung der Ergebnisse bei jedem Zugriff auf die Datenbank, kann je nach Datenmenge mehrere Minuten in Anspruch nehmen Werkzeuge (Clients): Business Objects, insight, Crystal Info u.a Quelle : sd&m 59

60 MOLAP oder ROLAP? MOLAP / Multidimensionale DB + Optimiert für den OLAP-Analyse (Zugriff auf Schichten im multidimensionalen Würfel.) + Sehr schnell und Benutzerfreundlich Keine standardisierten Zugriffsmethoden (proprietäre Datenhaltung) und Programmierschnittstellen i.a. komplexere Architektur als bei ROLAP Würfel müssen vorberechnet werden ROLAP / Relationale DB (Abbildung des mehrdimensionalen Würfels durch "Stern-Schema ) + Große Datenmengen möglich ( > 100 GB) + Gut für Standardreporting + offenes System langsam bei uneingeschränkten OLAP-Analysen Quelle : sd&m 60

61 Relationale Modellierung Die relationale Modellierung favorisiert zwei Vorschlaäge Star-Schema Snowflake-Schema Beide berücksichtigen Fakten und Dimensionen Star-Schema: für jede Dimension wird eine Tabelle eingerichtet. Diese Tabellen sind nicht miteinander verknüpft, sondern stehen nur mit der Faktentabelle über die Primärschlüssel in Beziehung. Snowflake-Schema: normalisiertes Star-Schema, um keine redundanten Einträge in den Dimensionstabellen zu haben; allerdings steigt die Anzahl der Tabellenverknüpfungen über Joins 61

62 Star-Schema - Aufbau Hauptkomponenten des Star-Schemas sind so genannten Fakttabellen und Dimensionstabellen, wobei die Dimensionstabellen sternförmig um die Fakttabellen mittels Primary-Key / Foreign-Key Beziehungen angeordnet sind 62

63 Star-Schema - Beispiel 1 Denormalisierte Dimensionstabellen Kunde Zeit Kunden-Nr Kundenname Beruf Alter Produkt Produkt-Nr Produktname Produktgruppe Branche Hersteller Farbe Preis Verkauf Kunden-Nr Produkt-Nr Datum Filiale Anzahl Umsatz Zentrale Tabelle und eine Tabelle pro Dimension Datum Tag Monat Quartal Jahr Filialen Filialname Ort Land Region 63

64 Star-Schema - Beispiel 2 Zeit Zeit-Nr. Quartal-Nr. Quartalsname Datum Monat-Nr. Monatsname Tag-Nr. Wochentag Saison Kunde Kunden-Nr. Key Account-Nr. Key Account-Name Kundenname Kundentyp Branche Verkauf Orts-ID Zeit-Nr. Kunden-Nr. Produkt-Nr. Umsatz Menge Sitz Orts-ID Region-Nr. Regionalleiter Länder-Nr. PLZ Ort Produkt Produkt-Nr. Produktname Spartename Spartenleiter Produktlinien-Nr. Produktlinie Produktlinienleiter Farbe Modell-Nr. 64

65 Snowflake-Schema Beispiel 1 PGruppe Kunde Kunden-Nr Kundenname Beruf Alter Produktgruppe Branche Produkt Produkt-Nr Produktname Produktgruppe Hersteller Farbe Preis Normalisierte Dimensionstabellen Verkauf Kunden-Nr Produkt-Nr Datum Filiale Anzahl Umsatz Zeit Datum Tag Monat Jahr Filialen Filialname Ort Explizite Darstellung der Dimensionshierarchie MonatQ Monat Quartal OrtL Ort Land LandR Land Region 65

66 Snowflake-Schema Beispiel 2 Region Region-Nr. Regionalleiter Land Länder-Nr. Länder-Name Lager PLZ Lagerort Lagerleiter Kundenattribute Kunden-Nr. Kundenname Kundentyp Branche Sitz Orts-ID Region-Nr. Länder-Nr. PLZ Produkt Produkt-Nr. Farbe Modell-Nr. Kunde Kunden-Nr. Key Account-Nr. Verkauf Orts-ID Zeit-Nr. Kunden-Nr. Produkt-Nr. Umsatz Menge Produkt Produkt-Nr. Produktlinien-Nr. Sparten-Nr. Key Account Key Account-Nr. Key Account-Name Zeit Zeit-Nr. Jahr-Nr. Quartal-Nr. M onat-nr. Tag-Nr. Produktlinie Sparte Produktlinien-N r. Sparten-Nr. Produktlinienleiter Spartename Spartenleiter Quartal Quartal-Nr. Quartalsname Monat Monat-Nr. Monatsname Tag Tag-Nr. Wochentag Saison 66

67 Snowflake-Schema - Aufbau Das Snowflake-Schema besteht ebenfalls aus den beiden Komponenten Faktentabelle und Dimensionstabelle. Die Dimensionstabellen werden jedoch im Gegensatz zum Star-Schema normalisiert. Durch die Normalisierung entstehen zusätzliche Tabellen. Vorteil dieses Schemas ist die Vermeidung der redundanten Datenhaltung und somit die Einsparung von Speicherplatz. Nachteil dagegen ist die komplexere Modellstruktur und zusätzlich notwendige Tabellen-Joins, die wiederum die Abfrage-Performance verschlechtern 67

68 Gliederung Ausgangssituation : Motiv und Hintergrund Definition und Architektur Operative Systeme vs Data Warehouse OLAP und Beispiel Data Mining 68

69 Data Mining: Motiv 69

70 Data Mining 1 Data Data Mining Miningversucht auf auf der der Basis Basis der der vorhandenen Daten Daten eine eine Mustererkennung, Segmentierung und und Faktorenanalyse, um um die die Faktoren zu zu identifizieren, die die signifikanten Einfluss auf auf die die Kenngrößen des des Unternehmens besitzen. Für Für Erfolgsindikatoren wie wie Rentabilität, Marktanteil oder oder Kundenbindung wird wird analysiert, welche welche Kräfte Kräfte diese diese beeinflussen, so so dass dass ein ein vollständiges Bild Bild der der Ursache-Wirkung-Beziehungen entsteht. 70

71 Data Mining 2 Data Data Mining Miningbezeichnet einen einen mehrstufigen Prozess, in in dem dem bisher bisher unbekannte aber aber wichtige Zusammenhänge, Muster Muster und und Trends Trends durch durch gezieltes Aufbereiten und und Auswerten großer großer Datenmengen entdeckt werden. 71

72 Data-Mining-Verfahren Musterkennung Clusteranalyse Segmentierung Musterbeschreibung Statistische Verfahren Assoziation - Warenkorbanalyse 72

73 Data Mining : Nutzung Hypothesen- Testing Wie läuft die Produktion Wie entwickelt sich meine Abteilung? Wo steht aktuell VB Maier? Entdecken Berichten, veröffentlichen verteilen & durchsehen Leistungsbemessung Ad-hoc- Anfragen Soll ich den Vertrieb unterstützen? Welche Abhängigkeiten zwischen Produkten gibt es? Analyse Verifizieren Erkennen von Zusammenhängen 73

74 Zusammenfassung Problem : Integration heterogener Datenbestände und Bereinigung der Primärdaten Anforderungen Große Datenvolumina Multidimensionale Auswertung Temporäre Anfragen Notwendigkeit neuer Aggregate Spezielle Indexstrukturen Parallele Anfrageverarbeitung 74

75 Web-Links Data Warehousing on the WWW Ralph Kimballs Homepage OLAP Council Die Informationweek besitzt einen sehr interessanten Data Warehousing-Bereich The Data Warehousing Information Center Data Warehouse Institute: Hier gibt es eine gute Sammlung von technischen Whitepapers von verschiedenen Tool- Anbieter Marktanalysen. The OLAP Report: Interessante und hilfreiche Echte Fundgrube für Whitepapers, Produktbesprechungen und Auflistung von Anbietern für Spezialthemen. Whitepapers und ausführliche Produktbeschreibung vieler OLAP-Werkzeuge. 75

76 76

Analytische Informationssysteme

Analytische Informationssysteme Analytische Informationssysteme Prof. Dr. W. Riggert ANS08 Studienmodul der AKAD Gliederung Ausgangssituation : Motiv und Hintergrund Definition und Architektur Operative Systeme vs Data Warehouse OLAP

Mehr

OLAP und Data Warehouses

OLAP und Data Warehouses OLP und Data Warehouses Überblick Monitoring & dministration Externe Quellen Operative Datenbanken Extraktion Transformation Laden Metadaten- Repository Data Warehouse OLP-Server nalyse Query/Reporting

Mehr

Logische Modellierung von Data Warehouses

Logische Modellierung von Data Warehouses Logische Modellierung von Data Warehouses Vertiefungsarbeit von Karin Schäuble Gliederung. Einführung. Abgrenzung und Grundlagen. Anforderungen. Logische Modellierung. Methoden.. Star Schema.. Galaxy-Schema..

Mehr

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH Einführung in OLAP und Business Analysis Gunther Popp dc soft GmbH Überblick Wozu Business Analysis mit OLAP? OLAP Grundlagen Endlich... Technischer Background Microsoft SQL 7 & OLAP Services Folie 2 -

Mehr

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher

Mehr

MIS by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001

MIS by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001 MIS Glossar by Franziska Täschler, Winformation GmbH ftaeschler@winformation-gmbh.ch Ausgabe 01/2001 Aggregat Data Cube Data Marts Data Mining Data Warehouse (DWH) Daten Decision Support Systeme (DSS)

Mehr

Einführungsveranstaltung: Data Warehouse

Einführungsveranstaltung: Data Warehouse Einführungsveranstaltung: 1 Anwendungsbeispiele Berichtswesen Analyse Planung Forecasting/Prognose Darstellung/Analyse von Zeitreihen Performancevergleiche (z.b. zwischen Organisationseinheiten) Monitoring

Mehr

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation 27. Juni 2013 Hinweis Diese Folien ersetzen keinesfalls den Übungsstoff des zugehörigen e-learning-kurses.

Mehr

Data Warehouse ??? Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle

Data Warehouse ??? Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle ??? Zusammenfassung, Ergänzung, Querverbindungen, Beispiele A.Kaiser; WU-Wien MIS 188 Data Warehouse Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle

Mehr

Data Warehouse Grundlagen

Data Warehouse Grundlagen Seminarunterlage Version: 2.10 Version 2.10 vom 24. Juli 2015 Dieses Dokument wird durch die veröffentlicht.. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen sind Warenzeichen

Mehr

Online Analytical Processing

Online Analytical Processing Online Analytical Processing Online Analytical Processing Online Analytical Processing (OLAP) ermöglicht die multidimensionale Betrachtung von Daten zwecks E rmittlung eines entscheidungsunterstützenden

Mehr

Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen

Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen Data Warehouses und Moderne Betriebliche Anwendungen von Datenbanksystemen (Folien von A. Kemper zum Buch 'Datenbanksysteme') Online Transaction Processing Betriebswirtschaftliche Standard- Software (SAP

Mehr

ENTERBRAIN Reporting & Business Intelligence

ENTERBRAIN Reporting & Business Intelligence Überblick Vorhandene Listen/Analysen in ENTERBRAIN Die Daten in ENTERBRAIN Das Fundament des BI - Hauses Details zur ENTERBRAIN Staging Area Reports und Cubes auf Basis der Staging Area Data Mining mit

Mehr

eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator

eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator Agenda Was ist Business Intelligence? Was ist OLAP? Unterschied zwischen OLAP und OLTP? Bestandteile

Mehr

Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube

Data Warehousing. Fragen des Marketingleiters. Beispiel: : Amazon. Technisch... Amazon weltweit... Datenbank. Aufbau eines DWH OLAP <-> OLTP Datacube Fragen des Marketingleiters Data Warehousing Wie viele Bestellungen haben wir jeweils im Monat vor Weihnachten, aufgeschlüsselt nach? Aufbau eines DWH OLAP OLTP Datacube Beispiel: : Amazon Technisch

Mehr

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem.

Einführung relationale Datenbanken. Themenblock: Erstellung eines Cube. Schlüssel. Relationenmodell Relationenname Attribut. Problem. Themenblock: Erstellung eines Cube Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Praktikum: Data Warehousing und Data Mining Idee Speicherung der Daten in Form von Tabellen

Mehr

Themenblock: Erstellung eines Cube

Themenblock: Erstellung eines Cube Themenblock: Erstellung eines Cube Praktikum: Data Warehousing und Data Mining Einführung relationale Datenbanken Problem Verwaltung großer Mengen von Daten Idee Speicherung der Daten in Form von Tabellen

Mehr

Vertrautmachen mit Daten

Vertrautmachen mit Daten Kapitel III Vertrautmachen mit Daten 2004 AIFB / FZI 1 III Vertrautmachen mit Daten (see also Data Preparation ) 2004 AIFB / FZI 2 III Vertrautmachen mit Daten III.1 OLAP III.1.1 Einführung in OLAP Wie

Mehr

Das Multidimensionale Datenmodell

Das Multidimensionale Datenmodell Das Multidimensionale Datenmodell Konzeptuelle Modellierung Umsetzung des Modells Beispiel ER-Modell 2 / 36 Probleme ER-Modellierung Keine Unterscheidung Klassifikation, Attribute, Kenngrößen Dimension

Mehr

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...

Mehr

Zusammenspiel von Business Intelligence mit betrieblicher Anwendungssoftware Falk Neubert, Universität Osnabrück

Zusammenspiel von Business Intelligence mit betrieblicher Anwendungssoftware Falk Neubert, Universität Osnabrück Zusammenspiel von Business Intelligence mit betrieblicher Anwendungssoftware 14. März 2013, IHK Osnabrück-Emsland-Grafschaft Bentheim Geschichte Kassenbuch des Liederkranz, 1886 Hutmachergesangvereins

Mehr

Data Warehouse Technologien

Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............

Mehr

10. Vorlesung: Datenorganisation SS 2007

10. Vorlesung: Datenorganisation SS 2007 10. Vorlesung: Datenorganisation SS 2007 8 Parallele Transaktionen 9 9.1 Drei-Ebenen Ebenen-Architektur 9.2 Verteilte Datenbanken 9.3 Client-Server Server-Datenbanken 9.4 Föderierte Datenbanken 9.5 Das

Mehr

Mala Bachmann September 2000

Mala Bachmann September 2000 Mala Bachmann September 2000 Wein-Shop (1) Umsatz pro Zeit und Produkt Umsatz Jan Feb Mrz Q1 Apr 2000 Merlot 33 55 56 144 18 760 Cabernet-S. 72 136 117 325 74 1338 Shiraz 85 128 99 312 92 1662 Rotweine

Mehr

Einsatz von Anwendungssystemen

Einsatz von Anwendungssystemen Einsatz von Anwendungssystemen WS 2013/14 7 Führungssysteme 7.1 Data Warehouse 7.2 Planungssysteme 7.3 Balanced Scorecard (BSC) 7.4 Business Intelligence 7 Führungssysteme 7.1 Data Warehouse Ein Data Warehouse

Mehr

WAHLPFLICHTBEREICH WIRTSCHAFTSINFORMATIK 'DATA WAREHOUSE'

WAHLPFLICHTBEREICH WIRTSCHAFTSINFORMATIK 'DATA WAREHOUSE' Take control of your decision support WAHLPFLICHTBEREICH WIRTSCHAFTSINFORMATIK 'DATA WAREHOUSE' Sommersemester 2008 Gliederung Business Intelligence und Data Warehousing On-Line Analytical Processing Ziel

Mehr

ANTARES Informations-Systeme GmbH Stuttgarter Strasse 99 D-73312 Geislingen Tel. +49 73 31 / 30 76-0 Fax +49 73 31 / 30 76-76 www.antares-is.

ANTARES Informations-Systeme GmbH Stuttgarter Strasse 99 D-73312 Geislingen Tel. +49 73 31 / 30 76-0 Fax +49 73 31 / 30 76-76 www.antares-is. ANTARES Informations-Systeme GmbH Stuttgarter Strasse 99 D-73312 Geislingen Tel. +49 73 31 / 30 76-0 Fax +49 73 31 / 30 76-76 www.antares-is.de insight und dynasight sind eingetragene Markenzeichen der

Mehr

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse

Mehr

Data Warehouse. für den Microsoft SQL SERVER 2000/2005

Data Warehouse. für den Microsoft SQL SERVER 2000/2005 Warehouse für den Microsoft SQL SERVER 2000/2005 Begriffe 1 DWH ( Warehouse) ist eine fachübergreifende Zusammenfassung von Datentabellen. Mart ist die Gesamtheit aller Datentabellen für einen fachlich

Mehr

Self Service BI. - Business Intelligence im Mittelstand - schnelle Ergebnisse, nachhaltige Erfolge

Self Service BI. - Business Intelligence im Mittelstand - schnelle Ergebnisse, nachhaltige Erfolge Self Service BI - Business Intelligence im Mittelstand - schnelle Ergebnisse, nachhaltige Erfolge 04. Juli 2013 Cubeware GmbH zu Gast im Hause der Raber+Märcker GmbH Referent: Uwe van Laak Presales Consultant

Mehr

Objektorientierte Datenbanken

Objektorientierte Datenbanken OODB 11 Slide 1 Objektorientierte Datenbanken Vorlesung 11 vom 01.07.2004 Dr. Sebastian Iwanowski FH Wedel OODB 11 Slide 2 Inhalt heute: Datenbanken in betriebswirtschaftlichen Anwendungen OTLP (SAP) Data

Mehr

Aufgabe 1: [Logische Modellierung]

Aufgabe 1: [Logische Modellierung] Aufgabe 1: [Logische Modellierung] a) Entwerfen Sie für das von Ihnen entworfene Modell aus Aufgabe 2 des 1. Übungsblattes ein Star-Schema. b) Entwerfen Sie für das vorangegangene Modell einen Teil eines

Mehr

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation Zusammenfassung OPAL 6. Übung Juni 2015 Agenda Hinweise zur Klausur Zusammenfassung OPAL Übungen / Kontrollfragen

Mehr

1Ralph Schock RM NEO REPORTING

1Ralph Schock RM NEO REPORTING 1Ralph Schock RM NEO REPORTING Bereit für den Erfolg Business Intelligence Lösungen Bessere Entscheidungen Wir wollen alle Mitarbeiter in die Lage versetzen, bessere Entscheidungen schneller zu treffen

Mehr

Multidimensionales Datenmodell, Cognos

Multidimensionales Datenmodell, Cognos Data Warehousing (II): Multidimensionales Datenmodell, Cognos Praktikum: Data Warehousing und Mining Praktikum Data Warehousing und Mining, Sommersemester 2010 Vereinfachte Sicht auf die Referenzarchitektur

Mehr

Vorwort zur 5. Auflage... 15 Über den Autor... 16

Vorwort zur 5. Auflage... 15 Über den Autor... 16 Vorwort zur 5. Auflage...................................... 15 Über den Autor............................................ 16 Teil I Grundlagen.............................................. 17 1 Einführung

Mehr

Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen Fragen Vertiefung Modellierung

Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen Fragen Vertiefung Modellierung Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation Zusammenfassung OPAL 24. Juni 2014 Agenda Hinweise zur Klausur Zusammenfassung OPAL-Übungen / Kontrollfragen

Mehr

Datenbanktechnologie für Data-Warehouse-Systeme

Datenbanktechnologie für Data-Warehouse-Systeme Wolfgang Lehner Datenbanktechnologie für Data-Warehouse-Systeme Konzepte und Methoden dpunkt.verlag 1 1.1 1.2 1.3 1.4 1. 5 2 2.1 2.2 2.3 Einleitung 1 Betriebswirtschaftlicher Ursprung des Data Warehousing...

Mehr

Marketing Intelligence Architektur und Konzepte. Josef Kolbitsch Manuela Reinisch

Marketing Intelligence Architektur und Konzepte. Josef Kolbitsch Manuela Reinisch Marketing Intelligence Architektur und Konzepte Josef Kolbitsch Manuela Reinisch Übersicht Mehrstufiges BI-System Architektur eines Data Warehouses Architektur eines Reporting-Systems Benutzerrollen in

Mehr

1 Einleitung. Betriebswirtschaftlich administrative Systeme

1 Einleitung. Betriebswirtschaftlich administrative Systeme 1 1 Einleitung Data Warehousing hat sich in den letzten Jahren zu einem der zentralen Themen der Informationstechnologie entwickelt. Es wird als strategisches Werkzeug zur Bereitstellung von Informationen

Mehr

Intelligente Kanzlei

Intelligente Kanzlei Seite 1 von 5 Intelligente Kanzlei Datawarehouse und OLAP in der Steuerkanzlei Notwendigkeit eines Kanzleiinformationssystems Seit einigen Jahren sind enorme Veränderungen am Beratungsmarkt durch einen

Mehr

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Prof. Dr. Anett Mehler-Bicher Fachhochschule Mainz, Fachbereich Wirtschaft Prof. Dr. Klaus Böhm health&media GmbH 2011 health&media

Mehr

Folien zum Textbuch. Kapitel 6: Managementunterstützungssysteme. Teil 2: Textbuch-Seiten 794-825

Folien zum Textbuch. Kapitel 6: Managementunterstützungssysteme. Teil 2: Textbuch-Seiten 794-825 Folien zum Textbuch Kapitel 6: Managementunterstützungssysteme Teil 2: Managementunterstützung auf strategischer Ebene Datenverwaltung und -auswertung Textbuch-Seiten 794-825 WI 1 MUS MUS auf strategischer

Mehr

Contents. Ebenen. Data Warehouse - ETL Prozess Version: July 10, 2007. 1 Ebenen. Andreas Geyer-Schulz und Anke Thede. 2 Problemquelle Quellsysteme 4

Contents. Ebenen. Data Warehouse - ETL Prozess Version: July 10, 2007. 1 Ebenen. Andreas Geyer-Schulz und Anke Thede. 2 Problemquelle Quellsysteme 4 Contents Data Warehouse - ETL Prozess Version: July 10, 2007 Andreas Geyer-Schulz und Anke Thede Schroff-Stiftungslehrstuhl Informationsdienste und Elektronische Märkte Fakultät für Wirtschaftswissenschaften

Mehr

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?

Mehr

Data Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 16. Abbildung 16.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 16 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining operationale DB operationale DB operationale DB Data Warehouse operationale

Mehr

Business Intelligence

Business Intelligence Business Intelligence Anwendungssysteme (BIAS) Lösung Aufgabe 1 Übung WS 2012/13 Business Intelligence Erläutern Sie den Begriff Business Intelligence. Gehen Sie bei der Definition von Business Intelligence

Mehr

1 Einführung. Unbekannte Begriffe: Business Intelligence, Knowledge Management, Unternehmensportale, Information Warehouse.

1 Einführung. Unbekannte Begriffe: Business Intelligence, Knowledge Management, Unternehmensportale, Information Warehouse. 1 Einführung mysap Business Intelligence stellt mit Hilfe von Knowledge Management die Verbindung zwischen denen, die etwas wissen und denen, die etwas wissen müssen her. mysap Business Intelligence integriert

Mehr

OLAP und der MS SQL Server

OLAP und der MS SQL Server OLAP und der MS SQL Server OLAP und der MS SQL Server OLAP-Systeme werden wie umfangreiche Berichtssysteme heute nicht mehr von Grund auf neu entwickelt. Stattdessen konzentriert man sich auf die individuellen

Mehr

Data Warehouse Technologien

Data Warehouse Technologien mitp Professional Data Warehouse Technologien von Veit Köppen, Gunter Saake, Kai-Uwe Sattler 2. Auflage 2014 Data Warehouse Technologien Köppen / Saake / Sattler schnell und portofrei erhältlich bei beck-shop.de

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining 2 Data Warehousing und Data Mining Kapitel 1: Data-Warehousing-Architektur von Geschäftsprozessen Mögliche Fragestellungen Wie entwickelt sich unser Umsatz im Vergleich zum letzten Jahr? In welchen Regionen

Mehr

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse

Mehr

Business Intelligence. Data Warehouse / Analyse Sven Elvers 2005-07-06

Business Intelligence. Data Warehouse / Analyse Sven Elvers 2005-07-06 Business Intelligence Data Warehouse / Analyse Sven Elvers 2005-07-06 Einleitung Dieses Dokument beschreibt einen für das Verständnis relevanten Teil der Präsentation. Business Intelligence Motivation

Mehr

Data Warehouse und Data Mining

Data Warehouse und Data Mining Einführungsseminar Data Mining Seminarvortrag zum Thema: Data Warehouse und Data Mining Von gehalten am Betreuer: Dr. M. Grabert Einführung Problemstellung Seite 2 Einführung Unternehmen bekommen eine

Mehr

Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing

Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing Seminar in der Seminarreihe Business Intelligence 1 OLAP und Datawarehousing OLAP & Warehousing Die wichtigsten Produkte Die Gliederung Produkt Bewertung & Vergleiche Die Marktentwicklung Der aktuelle

Mehr

Inhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte

Inhalt. 4.1 Motivation. 4.2 Datenintegration. 4.3 Konzeptuelle Modellierung. 4.4 Anfragen an Data Warehouses. 4.5 Implementierungsaspekte 4. Data Warehouses Inhalt 4.1 Motivation 4.2 Datenintegration 4.3 Konzeptuelle Modellierung 4.4 Anfragen an Data Warehouses 4.5 Implementierungsaspekte 2 Literatur V. Köppen, G. Saake und K.-U. Sattler:

Mehr

Business Intelligence Funktionsweise und technische Grundlagen

Business Intelligence Funktionsweise und technische Grundlagen Business Intelligence Funktionsweise und technische Grundlagen Whitepaper 1/5 HINTERGRUND Die richtige Information zur richtigen Zeit abrufen zu können kann für ein Unternehmen entscheidend sein. Doch

Mehr

1. Data Warehouses - Einführung

1. Data Warehouses - Einführung 1. s - Einführung Definition Einsatzbeispiele OLTP vs. OLAP Grobarchitektur Virtuelle vs. physische Datenintegration Mehrdimensionale Datensicht Star-Schema, -Anfragen Data Mining Prof. E. Rahm 1-1 y yy

Mehr

good. better. outperform.

good. better. outperform. good. better. outperform. Quo Vadis Oracle BI Relational oder besser multidimensional? DOAG 2013 Business Intelligence, 17.04.2013 Dirk Fleischmann Director Business Intelligence & DWH Business Intelligence

Mehr

Business Intelligence. Business Intelligence Seminar, WS 2007/08

Business Intelligence. Business Intelligence Seminar, WS 2007/08 Business Intelligence Seminar, WS 2007/08 Prof. Dr. Knut Hinkelmann Fachhochschule Nordwestschweiz knut.hinkelmann@fhnw.ch Business Intelligence Entscheidungsorientierte Sammlung, Aufbereitung und Darstellung

Mehr

Kapitel 2 Terminologie und Definition

Kapitel 2 Terminologie und Definition Kapitel 2 Terminologie und Definition In zahlreichen Publikationen und Fachzeitschriften tauchen die Begriffe Data Warehouse, Data Warehousing, Data-Warehouse-System, Metadaten, Dimension, multidimensionale

Mehr

OLTP: Online Transaction Processing

OLTP: Online Transaction Processing Moderne Betriebliche Anwendungen von Datenbanksystemen Online Transaction Processing (bisheriger Fokus) Data Warehouse-Anwendungen Data Mining OLTP: Online Transaction Processing Beispiele Flugbuchungssystem

Mehr

Business Intelligence im Krankenhaus

Business Intelligence im Krankenhaus Business Intelligence im Krankenhaus Dr. Thomas Lux Holger Raphael IT-Trends in der Medizin 03.September 2008 Essen Gliederung Herausforderungen für das Management im Krankenhaus Business Intelligence

Mehr

Zeitgemäße Verfahren für ganzheitliche Auswertungen

Zeitgemäße Verfahren für ganzheitliche Auswertungen Intelligente Vernetzung von Unternehmensbereichen Zeitgemäße Verfahren für ganzheitliche Auswertungen Sächsische Industrie- und Technologiemesse Chemnitz, 27. Juni 2012, Markus Blum 2012 TIQ Solutions

Mehr

BI Konsolidierung: Anspruch & Wirklichkeit. Jacqueline Bloemen. in Kooperation mit

BI Konsolidierung: Anspruch & Wirklichkeit. Jacqueline Bloemen. in Kooperation mit BI Konsolidierung: Anspruch & Wirklichkeit Jacqueline Bloemen in Kooperation mit Agenda: Anspruch BI Konsolidierung Treiber Was sind die aktuellen Treiber für ein Konsolidierungsvorhaben? Kimball vs. Inmon

Mehr

Datawarehouse Architekturen. Einheitliche Unternehmenssicht

Datawarehouse Architekturen. Einheitliche Unternehmenssicht Datawarehouse Architekturen Einheitliche Unternehmenssicht Was ist Datawarehousing? Welches sind die Key Words? Was bedeuten sie? DATA PROFILING STAGING AREA OWB ETL OMB*PLUS SAS DI DATA WAREHOUSE DATA

Mehr

VisualCockpit. agile business analytics

VisualCockpit. agile business analytics VisualCockpit agile business analytics Agile Business Analytics mit VisualCockpit Für Unternehmen wird es immer wichtiger die gesamte Wertschöpfungskette aus Daten, sowohl für das operative Geschäft als

Mehr

Nach Data Warehousing kommt Business Intelligence

Nach Data Warehousing kommt Business Intelligence Nach Data Warehousing kommt Business Intelligence Andrea Kennel Trivadis AG Glattbrugg, Schweiz Schlüsselworte: Business Intelligence, Data Warehouse Zusammenfassung Data Warehouse bedeutet, dass operative

Mehr

QUICK-START EVALUIERUNG

QUICK-START EVALUIERUNG Pentaho 30 für 30 Webinar QUICK-START EVALUIERUNG Ressourcen & Tipps Leo Cardinaals Sales Engineer 1 Mit Pentaho Business Analytics haben Sie eine moderne und umfassende Plattform für Datenintegration

Mehr

Oracle-Statistiken im Data Warehouse effizient nutzen

Oracle-Statistiken im Data Warehouse effizient nutzen Oracle-Statistiken im Data Warehouse effizient nutzen Reinhard Mense ARETO Consulting Köln Schlüsselworte: DWH, Data Warehouse, Statistiken, Optimizer, Performance, Laufzeiten Einleitung Für die performante

Mehr

Intelligence (BI): Von der. Nürnberg, 29. November 2011

Intelligence (BI): Von der. Nürnberg, 29. November 2011 Modelle für Business Intelligence (BI): Von der Anforderung zum Würfel Nürnberg, 29. November 2011 Warum Modelle für Business Intelligence (BI)? Warum Modelle für Business Intelligence (BI)? Bis zur Auswertung

Mehr

Kapitel 6 Einführung in Data Warehouses

Kapitel 6 Einführung in Data Warehouses Kapitel 6 Einführung in Data Warehouses Skript zur Vorlesung: Datenbanksysteme II Sommersemester 2008, LMU München 2008 Dr. Peer Kröger Dieses Skript basiert zu einem Teil auf dem Skript zur Vorlesung

Mehr

Integration Services Übersicht

Integration Services Übersicht Integration Services Übersicht Integration Services Übersicht Integration Services stellt umfangreiche integrierte Tasks, Container, Transformationen und Datenadapter für die En t- wicklung von Geschäftsanwendungen

Mehr

Data Warehousing Grundbegriffe und Problemstellung

Data Warehousing Grundbegriffe und Problemstellung Data Warehousing Grundbegriffe und Problemstellung Dr. Andrea Kennel, Trivadis AG, Glattbrugg, Schweiz Andrea.Kennel@trivadis.com Schlüsselworte Data Warehouse, Cube, Data Mart, Bitmap Index, Star Queries,

Mehr

Von der spezialisierten Eigenentwicklung zum universellen Analysetool. Das Controlling-Informationssystem der WestLB Systems

Von der spezialisierten Eigenentwicklung zum universellen Analysetool. Das Controlling-Informationssystem der WestLB Systems Von der spezialisierten Eigenentwicklung zum universellen Analysetool Das Controlling-Informationssystem der WestLB Systems Begriffe und Definitionen Data Warehouse - Datensammlung oder Konzept?! Data

Mehr

Data Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de

Data Warehouses. Data Warehouse Architektur ... Sommersemester 2011. Melanie Herschel melanie.herschel@uni-tuebingen.de Data Warehouses Sommersemester 2011 Melanie Herschel melanie.herschel@uni-tuebingen.de Lehrstuhl für Datenbanksysteme, Universität Tübingen Data Warehouse Architektur Data-Warehouse-System Teilsichten

Mehr

Fördercontrolling im öffentlichen Bereich Aspekte beim Aufbau eines DWH. Software mit Format.

Fördercontrolling im öffentlichen Bereich Aspekte beim Aufbau eines DWH. Software mit Format. Fördercontrolling im öffentlichen Bereich Aspekte beim Aufbau eines DWH Gerd Schandert, Neuss den 18.03.2014 Agenda 1. Vorstellung Auftraggeber 2. Förderung allgemein 3. Schichten im Data Warehouse 4.

Mehr

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier Realisierung von OLAP Operatoren in einem visuellen Analysetool Vortrag von Alexander Spachmann und Thomas Lindemeier Gliederung Ausgangssituation/Motivation Was ist OLAP? Anwendungen Was sind Operatoren?

Mehr

Managementinformationen beschaffen u. aufbereiten

Managementinformationen beschaffen u. aufbereiten Managementinformationen beschaffen u. aufbereiten Informationsbedarf... 2 Geschäftsinformationen... 2 Managementinformationen... 2 Eigenschaften ERM... 2 Eigenschaften multidimensionales Modell... 2 Relevante

Mehr

Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH

Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH Dani Schnider Principal Consultant Business Intelligence BI Trilogie, Zürich/Basel 25./26. November 2009 Basel Baden Bern Lausanne Zürich

Mehr

Business Intelligence

Business Intelligence Hochschule Darmstadt Business Intelligence und Wissensmanagement Fachbereich Informatik Praktikumsversuch BI, Teil 1 Prof. Dr. C. Wentzel, Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 03.04.2006 1. Kurzbeschreibung

Mehr

Business Intelligence Praktikum 2

Business Intelligence Praktikum 2 Hochschule Darmstadt Business Intelligence SS 2014 Fachbereich Informatik Praktikumsversuch 2 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 14.05.2014 1. Kurzbeschreibung Business Intelligence

Mehr

Microsoft SQL-Server 2008 R2/2012 Reporting und OLAP

Microsoft SQL-Server 2008 R2/2012 Reporting und OLAP Microsoft SQL-Server 2008 R2/2012 Reporting und OLAP Kompakt-Intensiv-Training OLAP gilt als Schlüsseltechnologie auf dem Gebiet Business Intelligence. In unserer Schulung "Microsoft SQL-Server 2008 R2/2012

Mehr

Informationssysteme für das Management

Informationssysteme für das Management FHBB l Departement Wirtschaft l Informationssysteme für das Management Michael Pülz, Hanspeter Knechtli Lernziele Den Unterschied zwischen operativen und analytischen Informationssystemen beschreiben können

Mehr

Technologischen Rahmenbedingungen und Werkzeuge für eine wertschöpfende Controller-Rolle

Technologischen Rahmenbedingungen und Werkzeuge für eine wertschöpfende Controller-Rolle Technologischen Rahmenbedingungen und Werkzeuge für eine wertschöpfende Controller-Rolle 40. Congress der Controller, Themenzentrum C, München Steffen Vierkorn, Geschäftsführer Qunis GmbH, Neubeuern Die

Mehr

Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben. Die Hypercube-Technologie

Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben. Die Hypercube-Technologie Mit Transbase Hypercube Data Warehouse Anwendungen effizient betreiben Transbase Hypercube ist eine Transbase -Option, die die innovative Hypercube-Technologie für komplexe analytische Anwendungen (OLAP)

Mehr

2 Datenbanksysteme, Datenbankanwendungen und Middleware... 45

2 Datenbanksysteme, Datenbankanwendungen und Middleware... 45 Vorwort 15 Teil I Grundlagen 19 i Einführung In das Thema Datenbanken 21 I.I Warum ist Datenbankdesign wichtig? 26 i.2 Dateisystem und Datenbanken 28 1.2.1 Historische Wurzeln 29 1.2.2 Probleme bei der

Mehr

Asklepius-DA Die intelligente Technologie für die umfassende Analyse medizinischer Daten Leistungsbeschreibung

Asklepius-DA Die intelligente Technologie für die umfassende Analyse medizinischer Daten Leistungsbeschreibung Asklepius-DA Die intelligente Technologie für die umfassende Analyse medizinischer Daten Leistungsbeschreibung Datei: Asklepius DA Flyer_Leistung_2 Seite: 1 von:5 1 Umfassende Datenanalyse Mit Asklepius-DA

Mehr

Modellbasierte Business Intelligence in der Praxis. Nürnberg, 10.11.2009

Modellbasierte Business Intelligence in der Praxis. Nürnberg, 10.11.2009 Modellbasierte Business Intelligence in der Praxis Nürnberg, 10.11.2009 I N H A L T 1. Warum Modelle für Business Intelligence (BI)? 2. Inhalte von Datenmodellen für BI 3. Inhalte von Prozessmodellen 4.

Mehr

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004 BIW - Überblick Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004 Annegret Warnecke Senior Sales Consultant Oracle Deutschland GmbH Berlin Agenda Überblick

Mehr

Star - Schema. AnPr. Name Klasse Datum. ANPR_StarSchema_v03.docx Seite 1

Star - Schema. AnPr. Name Klasse Datum. ANPR_StarSchema_v03.docx Seite 1 Name Klasse Datum 1 OLAP vs. OLTP In den RDBMS Konfigurationen unterscheidet man zwei verschiedene Grundtypen: OLTP: OnLine Transactional Processing ist für die Transaktionsprozesse und somit zur funktionalen

Mehr

Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH)

Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH) Seminar im Sommersemester 2004 an der Universität Karlsruhe (TH) Verteilung und Integration von Informationen im Verkehrsbereich Thema: OLAP in verteilten Data-Warehouse- Umgebungen Vortrag: Christian

Mehr

Auswertung für Warenwirtschaft/ERP, Interbase und ODBC... 2

Auswertung für Warenwirtschaft/ERP, Interbase und ODBC... 2 Cubix O.L.A.P... 2 Auswertung für Warenwirtschaft/ERP, Interbase und ODBC... 2 Datenverbindung über ODBC... 4 Datenbereitstellung über SQL... 5 Festlegung der Dimensionen... 6 Festlegung der Summen...

Mehr

Logische Modelle für OLAP. Burkhard Schäfer

Logische Modelle für OLAP. Burkhard Schäfer Logische Modelle für OLAP Burkhard Schäfer Übersicht Einführung in OLAP Multidimensionale Daten: Hypercubes Operationen Formale Grundlagen Zusammenfassung Einführung in OLAP Verfahren zur Analyse großer

Mehr

Extraktion, Transformation, Laden (ETL)

Extraktion, Transformation, Laden (ETL) Extraktion, Transformation, Laden (ETL) ETL-Prozeß Integrationsschritte Integrationsprobleme fi Konflikte und deren Klassifikation fi Behebung von Konflikten Data Cleaning VL Data Warehouses, WS 2000/2001

Mehr

Kapitel 4: Data Warehouse Architektur

Kapitel 4: Data Warehouse Architektur Data Warehousing, Motivation Zugriff auf und Kombination von Daten aus mehreren unterschiedlichen Quellen, Kapitel 4: Data Warehousing und Mining 1 komplexe Datenanalyse über mehrere Quellen, multidimensionale

Mehr

Inhaltsverzeichnis. Teil I OLAP und der Microsoft SQL-Server 1. 1 Theoretische Grundlagen 3

Inhaltsverzeichnis. Teil I OLAP und der Microsoft SQL-Server 1. 1 Theoretische Grundlagen 3 vii Teil I OLAP und der Microsoft SQL-Server 1 1 Theoretische Grundlagen 3 1.1 Was ist OLAP?......................................... 3 1.1.1 Business Intelligence............................... 4 1.1.2

Mehr

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein

Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert. Entität kann in einer oder mehreren Unterklassen sein 1 Definitionen 1.1 Datenbank Verwandt, logisch kohärent, zweckspezifisch, an reale Welt orientiert Integriert, selbstbeschreibend, verwandt 1.2 Intension/Extension Intension: Menge der Attribute Extension:

Mehr

Datenmanagement. Simone Unfried, Passau Vitaly Aleev, Passau Claus Schönleber, Passau. Strategisches Informationsmanagement 1 (01/2006)

Datenmanagement. Simone Unfried, Passau Vitaly Aleev, Passau Claus Schönleber, Passau. Strategisches Informationsmanagement 1 (01/2006) Simone Unfried, Passau Vitaly Aleev, Passau Claus Schönleber, Passau (01/2006) Strategisches Informationsmanagement 1 Definition Notwendige Vermaischung der Daten in der Vorstufe zur Destillation von hochprozentiger

Mehr