Data Warehouse. für den Microsoft SQL SERVER 2000/2005



Ähnliche Dokumente
Marketing Intelligence Vorstellung der Softwarekomponenten. Josef Kolbitsch Manuela Reinisch

1Ralph Schock RM NEO REPORTING

Survival Guide für Ihr Business Intelligence-Projekt

BI Konsolidierung: Anspruch & Wirklichkeit. Jacqueline Bloemen. in Kooperation mit

eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator

Business Intelligence

Marketing Intelligence Schwierigkeiten bei der Umsetzung. Josef Kolbitsch Manuela Reinisch

Data Warehouse ??? Ein Data Warehouse ist keine von der Stange zu kaufende Standardsoftware, sondern immer eine unternehmensindividuelle

C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl

pro4controlling - Whitepaper [DEU] Whitepaper zur CfMD-Lösung pro4controlling Seite 1 von 9

ENTERBRAIN Reporting & Business Intelligence

Seminar C16 - Datenmodellierung für SAP BW

Business Intelligence Praktikum 1

Die Bedeutung der Prozessmodellierung bei der Weiterentwicklung des DWHs der DAK Der Innovator als Missing Link

Datawarehouse Architekturen. Einheitliche Unternehmenssicht

Lars Priebe Senior Systemberater. ORACLE Deutschland GmbH

Spezialisierung Business Intelligence

Marketing Intelligence Architektur und Konzepte. Josef Kolbitsch Manuela Reinisch

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004

Marketing Intelligence Vorstellung der Übungsaufgabe. Josef Kolbitsch Manuela Reinisch

SQL Server 2012 und SharePoint im Unternehmenseinsatz. Referent Daniel Caesar

Getting Started Guide CRM Online, 2013 & 2015 xrm1 Verpflegungspauschalen

Schritt 1: Verwenden von Excel zum Erstellen von Verbindungen zu SQL Server Analysis Services-Daten

Seminar C02 - Praxisvergleich OLAP Tools

Datenbanken. Prof. Dr. Bernhard Schiefer.

Schritt 1: Verwenden von Excel zum Erstellen von Verbindungen mit SQL Server-Daten

White Paper WinLine "Business Intelligence"

Customer Data Control. - verwalten und steuern -

System Center Essentials 2010

Big, Bigger, CRM: Warum Sie auch im Kundenmanagement eine Big-Data-Strategie brauchen

Infrastruktur fit machen für Hochverfügbarkeit, Workload Management und Skalierbarkeit

Allgemeines zu Datenbanken

Strategisches Informationsmanagement auf Basis von Data Warehouse-Systemen

Star-Schema-Modellierung mit ERwin - eine kritische Reflexion der Leistungspotentiale und Anwendungsmöglichkeiten

Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH

Ein subjektiver Vergleich zwischen SSIS und Kettle mit Ausblick auf die Generierung von BI-Lösungen

Data Lineage goes Traceability - oder was Requirements Engineering von Business Intelligence lernen kann

Modellbasierte Business Intelligence in der Praxis. Nürnberg,

Wie aus Steuerungsinformation öffentliche Statistik wird

Mai Hauptseminar: Nichtrelationale Datenbanken Historisch-Kulturwissenschaftliche Informationsverarbeitung Universität zu Köln

SharePoint Demonstration

OLAP und der MS SQL Server

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

So importieren Sie einen KPI mithilfe des Assistenten zum Erstellen einer Scorecard

Business Intelligence in NRW

DWH Szenarien.

THEMA: "SAS STORED PROCESSES - SCHNELL GEZAUBERT" HELENE SCHMITZ

Daten verstehen. Prozessoptimierung Applikationsmanagement Systemintegration. Daten- u. Prozessmodellierung Applikationsentwicklung Systemintegration

SemTalk Services Stand: Februar 2015

Master Data Management

Infor PM 10 auf SAP. Bernhard Rummich Presales Manager PM Uhr

Data Warehouse Definition (1)

Business Intelligence Praktikum 1

Auslesen der Fahrtdaten wiederholen Schritt für Schritt erklärt (Funktion Abfrage zur Datensicherung erstellen )

MetaNavigation der effizienteste Weg maximalen Mehrwert aus BI Metadaten zu ziehen

BITMARCK VERNETZT DER KUNDENTAG

Kampagnenmanagement mit Siebel Marketing/Oracle BI ein Praxisbericht

Best Practice Infor PM 10 auf Infor Blending

Installation & Konfiguration AddOn Excel Export Restriction

Referenzielle Integrität SQL

PRESman. Presentation Manager. Reduzieren Sie nachhaltig die Kosten für das. Erstellen, Verwalten und Verteilen Ihrer

Intelligence (BI): Von der. Nürnberg, 29. November 2011

Apache HBase. A BigTable Column Store on top of Hadoop

Fragenkatalog zum Kurs 1666 (Datenbanken in Rechnernetzen) Kurstext von SS 96

Virtual Roundtable: Business Intelligence - Trends

Erstellen von Business Intelligence mit Office XP und SQL 2000 Analysis Services

organice CRM 2012 Die Neuerungen für den Entscheider

Aufgabe 1: [Logische Modellierung]

Terminologie zwischen normativer Referenz und deskriptiver Dokumentation. Dr. Birte Lönneker-Rodman, Across Systems GmbH

Von der spezialisierten Eigenentwicklung zum universellen Analysetool. Das Controlling-Informationssystem der WestLB Systems

2006 COGNOSCO AG, 8057 ZUERICH, SWITZERLAND All rights reserved. Performance Management Markterfolg dank Kundenrating

HANDBUCH LSM GRUNDLAGEN LSM

Design Pattern - Strukturmuster. CAS SWE - OOAD Marco Hunziker Klaus Imfeld Frédéric Bächler Marcel Lüthi

Studierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen

Um ein solches Dokument zu erzeugen, muss eine Serienbriefvorlage in Word erstellt werden, das auf die von BüroWARE erstellte Datei zugreift.

Neue Funktionen in Innovator 11 R5

FlowFact Alle Versionen

Die Installation eines MS SQL Server 2000 mit SP3a wird in diesem Artikel nicht beschrieben und vorausgesetzt.

Neuerungen Analysis Services

ORACLE PROFIL UND REFERENZEN

Closed-loop STADTWERKE MAINZ AG. 17. SAP - Konferenz, 17. November Quelle: CRM für die Versorgungswirtschaft, Die Integration von mysap CRM

PRINZIP PARTNERSCHAFT

GESCHÄFTSSTELLENERÖFFNUNG HAMBURG, 25. APRIL 2013

BI in der Cloud eine valide Alternative Überblick zum Leistungsspektrum und erste Erfahrungen

Anleitung OpenCms 8 Webformular Auswertung

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Neue Strategien und Innovationen im Umfeld von Kundenprozessen

Entwurf einer einfachen Datenbank zur Wunschzettel- Verwaltung

Einführung in OLAP und Business Analysis. Gunther Popp dc soft GmbH

Bachelor of Eng. (Wirtschafts-Ing.-wesen)

Was ist neu in Sage CRM 6.1

ZWISCHEN ALBTRAUM UND OPTIMALER PERFORMANCE

Business Intelligence für Controller

Dimensionale Modellierung mit Oracle BI EE und Oracle OLAP Tipps und Tricks aus der Praxis

SERVICE SUCHE ZUR UNTERSTÜTZUNG

Installationsanleitung. triomis vat calculator for Dynamics CRM 2011

Agenda. TERRA CLOUD GmbH Zahlen, Daten, Fakten Private & Hybrid Cloud Szenarien Public Cloud Szenarien Lessons Learned

Schritt für Schritt zur Krankenstandsstatistik

Richtige und schnelle Entscheidungen trotz sich änderner Anforderungen mit Microsoft Dynamics AX und Microsoft SQL Server Reporting Services

Transkript:

Warehouse für den Microsoft SQL SERVER 2000/2005

Begriffe 1 DWH ( Warehouse) ist eine fachübergreifende Zusammenfassung von Datentabellen. Mart ist die Gesamtheit aller Datentabellen für einen fachlich abgegrenzten Bereich. Zum Beispiel: Vertrieb, Finanzen, Produktion. Dimension, ist eine Menge miteinander verknüpfter Entitäten, nach der Maßzahlen aggregiert werden können und die zu ihrer Interpretation herangezogen wird. Beispiel: zeitliche Dimension (Tag, Monat, Quartal, Jahr), Produktkategorie Measure, ist eine Information, die zur Bewertung der Leistung oder des Verhaltens eines Geschäftsprozesses dienen kann. Faktentabelle, ist eine Menge miteinander verknüpfter Maßzahlen und ihrer zugehörigen Dimensionen. 2

Begriffe 2 Stagingarea ist eine Datenbank in der alle extrahierten Daten eines Quellsystems gespeichert werden. Deltaarea besteht oft aus mehreren Datenbanken. Das Ziel ist, zu einem möglichst frühen Zeitpunkt nur die tatsächlichen Veränderungen des Quellsystems weiter zu verarbeiten. Performanceoptimierung! Transformationsarea, eine Datenbank, in der die Deltadaten einem clearing (d.h. inhaltlich und faktisch bereinigt) unterworfen werden und vorhandene Daten je nach Bedarf transformiert werden. Z.B. entsteht aus einem Begriff ein Schlüssel, es werden Werte umgerechnet usw. Warehouse, aus der Transformationsarea wird das DWH aufgebaut. Mart, aus dem Warehouse werden die Marts erstellt. Cubebereich, aus dem Warehouse/Marts werden die Dimensionen und Faktentabellen für die Cubes erstellt. 3

Modellierung Modellierung

Aufgabenblöcke Modellieren Stagingarea mit den einzelnen Ebenen Modellierung der Ebenen der Stagingarea je Quellsystem Modellierung der Transformationsarea je Quellsystem Modellierung der Dimensionen und Faktentabellen Modellierung der Dimensionen und Faktentabellen je Quellsystem Integration Dimensionen/Faktentabellen je Quellsystem ins DWH Modellierung des DWH mit nach gelagerten Systemen Modellierung von Marts und Cubes Entwicklung von Design Guides für einzelne Aufgabenblöcke Konkretisierung der Vorgehensweise (Teil 1 Teil 5) 5

Modellieren Stagingarea mit den einzelnen Ebenen Je Quellsystem: Datenbank Extraktion Datenbank Delta Datenbank Transformation Fehlerdatenbank Stagingarea Übergeordnet: Qualitätsdatenbank Datenbank Hilfstabellen Ebenen der Stagingarea 6

Modellierung der Ebenen der Stagingarea je Quellsystem Unterstützung bei der Modellierung der einzelnen Ebenen innerhalb der Stagingarea für das jeweilige Quellsystem. Je Quellsystem: Datenbank Extraktion Datenbank Delta Datenbank Transformation Fehlerdatenbank Stagingarea Übergeordnet: Qualitätsdatenbank Datenbank Hilfstabellen Modellierte Ebenen der Stagingarea 7

Modellierung der Transformationsarea je Quellsystem Schlüsselbehandlung z.b. ein Präfix = KD oder CRM Anpassung Datentyp z.b. von Char 010 in int 010 Konvertierung von Codierungen über Ersetzungstabelle den Wert 2 in PRODUKT ändern Ersetzen Zeichenfolge Ändern Feldinhalte über Ersetzungstabelle oder neues Feld erzeugen Vereinheitlichen Zeichenketten z.b. eliminieren von Leerstellen Adam in Adam Datum in einem Feld z.b. 1.August 2003 in 01.08.2003" Datum in mehreren Feldern aus Tabelle Monat und Tabelle Jahr in neues Feld = 12.2006 Berechnungen z.b. Menge * Preis = Wert Kombination Attributwerte mehrere Feldinhalte in einem Feld zusammen fassen Separierung Attributwerte Zerlegen eines Feldinhaltes in mehrer Felder 8

Modellierung der Dimensionen und Faktentabellen Feldgruppen... Gliederung der transformierten Felder in Feldgruppen Schlüsselfeld z.b. Produkt-Nr., Kunden-Nr. (Key s) Wertefeld z.b. Menge, Beträge Informationsfeld z.b. Produktbeschreibung, Informationen sonstige Felder alles anderen Informationen, die nicht in Schlüsselfeld, Informationsfeld und Wertefeld stehen 9

Modellierung der Dimensionen und Faktentabellen Modellierung der Dimensionen und Faktentabellen anhand des DWH/Mart. DWH / Mart ERwin 10

Integration Dimensionen/Faktentabellen in den Cubebereich Die Dimensionen und Faktentabellen werden mit anderen Quellsystemen abgeglichen und integriert. Von Quellsystemen unabhängig modellierte Dimensionen und Fakten ERwin Im Cubebereich vorhandene Dimensionen und Fakten Cubebereich 11

Modellierung des DWH mit nach gelagerten Systemen Übergeordnet zu allen Quellsystemen wird ein DWH mit abhängigen Marts, Cubes und Partitionen für Cubes modelliert. Mart Cube DWH Cubepartitionen 12

Modellierung von Marts und Cubes Für fachlich abgegrenzte Quellsysteme können unabhängige Marts, Cubes und Partitionen für Cubes modelliert werden. Cubes Mart Cubepartitionen 13

Entwicklung von Design Guides für einzelne Aufgabenblöcke Für die einzelnen Aufgabenbereiche der Modellierung und Integration werden spezifische Design Guides entwickelt. Zum Beispiel: Analyse Quellsystem Modellierung DWH Marts Modellierung Cubes 14

Konkretisierung der Vorgehensweise Ziele der Vorgehensweise Revisionsfähigkeit Wartungsfreundlichkeit Einfache Erweiterbarkeit Einfache Migration auf die nächste SQL-Server Version oder auf ein anderes DWH-System 15

Konkretisierung der Vorgehensweise Teil 1 Extraktion Definition der Extraktionsregeln Erstellen des Datenmodells für die Extraktions - DB DB2 Extraktions - DB 16

Konkretisierung der Vorgehensweise Teil 2 Deltabildung Durch Abgleich der beiden Datenbestände wird der Deltabestand ermittelt. 17 DB 2 Die extrahierten Daten werden alternierend in den Datenbestand 1 bzw. Datenbestand 2 geschrieben. Extraktion Datenbestand 1 Extraktion Datenbestand 2 Delta DB

Konkretisierung der Vorgehensweise Teil 3 Transformation Definition der Transformationsregeln Definition des Datenmodells der transformierten Daten Hilfstabellen - DB Delta DB Transformierte DB 18 Fehler - DB

Konkretisierung der Vorgehensweise Teil 4 Laden der Deltadaten in das DWH Definition Datenmodell (Dimensionen und Fakten) des DWH anhand der Transformations - DB 19 Transformiertes Delta DWH Aufbau und Ergänzung der Dimensionen und Faktentabellen

Konkretisierung der Vorgehensweise Teil 5 Erstellen der Cubes Definition Datenmodell des Cube Definition berechneter Felder (Berechnungsregeln) Definition berechneter Zellen (Teilbereiche des Cubes) Cubebereich Cube 20

Business Intelligence Business Intelligence heißt, eine globale Sicht auf die Transaktionen zu gewinnen, um daraus bessere und schnellere Entscheidungen für das Geschäft abzuleiten.

Business Intelligence Was ist Business Intelligence? Physische Basis für BI Möglichkeit 1: keine aggregierten Daten Möglichkeit 2: keine atomaren Daten Möglichkeit 3: bereinigte, aggregierte und historische Daten 22

Business Intelligence Verläßliche, flexible und übergreifende Reports Nur eine Interpretation der Kennzahlen Schnelle Lieferung Ihres Wunschreports "Alle" Zahlen sind verfügbar Benchmarking mit Konkurrenz (externe Daten) Komplexe Analysen und Darstellungen Multidimensionale Analysen, z.b. was, wann, wo Planungen, was-wäre-wenn Analysen Unterschiedliche Abstraktionsstufen mit Möglichkeiten zum Nachbohren im Detail Geographische Darstellungen, Managementcockpits Aufdeckung vorher unentdeckter Zusammenhänge Segmentierung Verhaltensmusteranalyse Optimierung von Wegen, Plazierungen, etc. 23

Aus technischer Sicht sorgt Business Intelligence für eine konsolidierte Datensicht auf Automationsinseln bessere Datenkonsistenz bessere Datenqualität Historie übergreifender Zugriff Auswertung mit modernen Werkzeugen vereinfachte Systemverwaltung weniger Last auf OLTP Systemen Decision Support Systems Marts Warehouses Multi-Dimensional Analysis Exec Info Systems Mining Sales Distribution Business Operations Marketing Financial Customer & Call Center New Products & Services Campaign 24

Enterprise Warehouse Modell Source Model Source Model Provisioning Logischesl Modell Enterprise Warehouse Logisches Modell Meta-Daten Mart Logisches Modell Mart Logisches Modell Mart Logisches Modell Source Interne Sources Input Layer Unternehmensweites, auf analytische Anforderungen ausgerichtetes Modell Granulare und aggregierte Information Denormalisierte und dimensionale Strukturen Staging Services Enterprise Warehouse Externe Sources Classified Sources Informat'l Feedback Verteil Services Marts 25

Bereinigung / Transformation / Laden Selektion / Aggregation / Propagation Generell gibt es zwei Möglichkeiten zur Implementierung von Marts External External External Operational Operational Operational Enterprise Warehouse Atomar Aggregate Historisch Konsistent Virtuelle Marts Physische Marts 26

Bereinigung / Transformation / Laden Selektion / Aggregation / Propagation... doch nur eine hat sich in der Praxis bewährt External External External Operational Operational Operational Enterprise Warehouse Atomar Aggregate Historisch Konsistent Virtuelle Marts Physische Marts 27

Reconciliation / Cleansing / Transformation Selection / Aggregation / Propagation Physische Implementierung: 1. Möglichkeit Die BDW Schicht enthält bereinigte, atomare und historische Daten, keine aggregierten Daten. b Cleansed Atomic External External External Operational Operational Operational a b Enterprise Warehouse Cleansed Atomic Historical data marts 28 Population Pipe Source layer BDW layer BIW layer Client layer layer layer

Physische Implementierung: 1. Möglichkeit Vorteile Spart Plattenplatz, da keine aggregierten Daten im Enterprise Warehouse gehalten werden. Empfehlenswert, solange nur wenige Marts. Einfache Erweiterungen. Auswirkungen Gefahr von Inkonsistenzen bei der Ableitung und Aggregation, falls es für einzelne Marts Gemeinsamkeiten gibt. Möglicherweise eine Übergangslösung, bis mehrere Marts entwickelt werden. Auf Ebene des Enterprise Warehouse sind keine Abfragen möglich. 29

Reconciliation / Cleansing / Transformation / Derivation Selection / Aggregation / Propagation Physische Implementierung: 2. Möglichkeit Das Warehouse enthält aggregierte und historische Daten, keine atomaren Daten. b External External External Operational Operational Operational a Cleansed Atomic b Enterprise Warehouse Aggregated Historical data marts 30 Population Pipe Source layer BDW layer BIW layer Client layer layer layer

Physische Implementierung: 2. Möglichkeit Vorteile Spart Plattenplatz, da nur die aggregierten Daten gespeichert werden. Empfehlenswert, wenn die operationalen Daten "sauber" sind Auswirkungen Die Ableitung aus den operationalen Daten ist komplexer. Kein Zugriff auf atomare Daten im Enterprise Warehouse möglich. 31

Reconciliation / Cleansing / Transformation / Derivation Selection / Aggregation / Propagation Physische Implementierung: 3. Möglichkeit Die BDW Schicht enthält bereinigte, atomare, aggregierte und historische Daten. 32 External External External Operational Operational Operational b a Cleansed Atomic b Enterprise Warehouse Atomic Aggregated Historical Cleansed data marts Population Pipe Source layer BDW layer BIW layer Client layer layer layer

Physische Implementierung: 3. Möglichkeit Vorteile Die "sauberste" Lösung. Klare Trennung zwischen cleansing Schicht transformation Schicht propagation Schicht. Auswirkungen Viel Plattenplatz. Aufwendiger zu entwickeln und zu pflegen. Für einfache Probleme zu komplex. 33

Danke für Ihre Aufmerksamkeit 34