Hamburg, im August 2016

Ähnliche Dokumente
Otto Group als data driven company Clickstream als Herzstück der neuen BI Plattform

TDWI Konferenz DWH Architektur Agilität durch Data Vault Modeling. Twitter: @TDWI_EU

Technologischen Rahmenbedingungen und Werkzeuge für eine wertschöpfende Controller-Rolle

Modellierung agiler Data Warehouses mit Data Vault Dani Schnider, Trivadis AG DOAG Konferenz 2015

Vom Single Point of Truth zur Single Version of the Facts. Data Warehousing zu Beginn des BigData-Zeitalters. inspire IT - Frankfurt

Data Vault. Modellierungsmethode für agile Data Warehouse Systeme. Dr. Bodo Hüsemann Informationsfabrik GmbH. DOAG BI, München,

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004

Agile Analytics Neue Anforderungen an die Systemarchitektur

In-Memory Datenbanken im Kontext komplexer Analytics Pojekte am Beispiel der Otto Group BI

Datawarehouse Architekturen. Einheitliche Unternehmenssicht

BIG DATA STRATEGIE FÜR DEN ONLINE-HANDEL

Lars Priebe Senior Systemberater. ORACLE Deutschland GmbH

Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH

Intelligence (BI): Von der. Nürnberg, 29. November 2011

Data-Vault-Automation aus dem Datenmodellierungstool. 1. Tagung der DDVUG am 24.Juni2014

Was ist Analyse? Hannover, CeBIT 2014 Patrick Keller

TRACK II Datenmanagement Strategien & Big Data Speicherkonzepte. TRACK I Big Data Analytics & Self Service BI

Deutsch, Englisch (gut) Fachinformatiker für Anwendungsentwicklung

Raus aus der Bl-Falle

Vorteile einer standardisierten DV-orientierten BI-Architektur hinsichtlich Modellierung, Bewirtschaftung und Betrieb. Thomas Mattick, BBF GmbH

BI Organisation und Governance. Patrick Keller, Senior Analyst und Prokurist CeBIT 2016

RE.one. Self Service Information Management für die Fachabteilung

Studierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen

MARKETING TRANSFORMATION UND MULTI-CHANNEL MANAGEMENT. Alexander Voges Düsseldorf, 24. Februar 2016

Herausforderungen der Digitalisierung

Oracle SQL Developer Data Modeling

Business Intelligence Architektur im Umfeld von Big Data (IDAREF) [D2] Bernd Meister Uetliberg,

Seminar C02 - Praxisvergleich OLAP Tools

good. better. outperform.

1Ralph Schock RM NEO REPORTING

Oracle OLAP 11g: Performance für das Oracle Data Warehouse

Near Realtime ETL mit Oracle Golden Gate und ODI. Lutz Bauer

PROZESSCONTROLLING MIT MICROSOFT TOOLS

AKWI-Fachtagung SAP HANA Live als Basis für operatives Reporting in Echtzeit. Customizing und Anwendung

Hohe Anpassungsfähigkeit der Entscheidungsunterstützung in Versicherungen trotz regulatorischer Anforderungen

Data Vault. Data Warehouse Agilität nicht nur durch Vorgehensweisen, sondern mit Methode. Dr. Bodo Hüsemann Informationsfabrik GmbH

Zukunftsträchtige Potentiale: Predictive Analysis mit SAP HANA & SAP BO

Die perfekte Kombination im Agilen Data Warehouse Oracle Engineered Systems mit Data Vault

Data Vault Ein Leben zwischen 3NF und Star. Michael Klose, CGI Deutschland Oracle DWH Community,

Vollständig generisches DWH für kleine und mittelständische Unternehmen

Business Intelligence Center of Excellence

Andreas Emhart Geschäftsführer Alegri International Group

Oracle BI&W Referenz Architektur Big Data und High Performance Analytics

Modellbasierte Business Intelligence in der Praxis. Nürnberg,

BICC, Organisation und Kompetenz Das Raiffeisen Solution SAS Competence Center

SimProgno Studie Ergebnisse einer empirischen Studie zur Thematik der Entscheidungsunterstützung im Online-Shop-Management Juli 2011

EXASolution als Bestandteil einer BI / DWH- und Kampagnenmanagementlandschaft Ein Erfahrungsbericht aus der Praxis

Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing

Herzlich willkommen. zum Vortrag: Die otto group in Österreich. E-Commerce als Arbeitsplatz der Zukunft. 22. Januar 2014

Die Bedeutung der Prozessmodellierung bei der Weiterentwicklung des DWHs der DAK Der Innovator als Missing Link

Smart Customer MDM im Verlagswesen. Springer Science + Business Media & Uniserv GmbH Martin Faber, Christian Holtz

Solution for Business Intelligence. MID Insight 2013

Behandlungsunterstützung mittels App. Lars Erdmann, Partner, Q_PERIOR AG SAP Mobile Forum, 17. April 2013

Business Intelligence Praktikum 1

DIE DATEN IM ZENTRUM: SAS DATA MANAGEMENT

BI WIKI START-UP YOUR DWH PARTIZIPATIVE BI IM ZEITALTER VON BIG DATA

Die Realtime Big Data OTTO im Kontext von Process Excellence

Windows Azure für Java Architekten. Holger Sirtl Microsoft Deutschland GmbH

Profil Andy Sydow. Persönliche Daten. Profil. Profil Andy Sydow. Deutsch, Englisch (gut) Fachinformatiker für Anwendungsentwicklung

Agile DWH Modellierung mit Data Vault. Alexander Blech Matthias Wendt

Erfahrungsbericht Agile Entwicklung einer BI Anwendung für das Meldewesen

Projekt Weblog :: Integration

Model Driven SOA Modellgetriebene Entwicklung von SOA Anwendungen. OOP München,

Inspiration und Bedarfsweckung: Die Rolle von Papier in der E-Commerce- Welt bei Otto. Alexander Voges

Von Big Data zu Executive Decision BI für den Fachanwender bis hin zu Advanced Analytics

Business Intelligence Praktikum 1

ETL in den Zeiten von Big Data

Strategie und Self Service BI im Unternehmen. Gegensätze miteinander kombinieren

DATA WAREHOUSE. Big Data Alfred Schlaucher, Oracle

TRACK II Datenmanagement Strategien & Big Data Speicherkonzepte BI Operations Erfolgsfaktoren für einen effizienten Data Warehouse Betrieb

Über uns Everywhere commerce everywhere delivery

Präsentation der Bachelorarbeit

Der sd&m-ansatz für serviceorientierte Architektur Quasar Enterprise

Data Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML

Adlerblick So gewinnen Sie einen Überblick über ein DWH Dr. Andrea Kennel InfoPunkt Kennel GmbH CH-8600 Dübendorf Schlüsselworte Einleitung

Die Rolle von Print im OTTO Media-Mix

Data Integration and ETL with Oracle Warehouse Builder

Marketing Intelligence Architektur und Konzepte. Josef Kolbitsch Manuela Reinisch

Strategisches Informationsmanagement auf Basis von Data Warehouse-Systemen

Das generierte Data Warehouse

Unsere LEistungen auf einen Blick

Maximieren Sie Ihr Informations-Kapital

good. better. outperform.

Leistungssteuerung beim BASPO

Automatisierungsarchitekturen für das Smart Grid Am Beispiel der OPC UA und der IEC Dr.-Ing. Mathias Uslar, Sebastian Rohjans

Archivieren im heterogenen Umfeld

Skills. Inhalt: 1. Toolübersicht S.1 2. Technologien und Sprachen S.1 3. Projekte S.2 4. Diplom, Zertifikate und Teilnahmebestätigungen S.

Agile BI mit Agile BI Modeler & Agile Scorecard

Big-Data-Technologien - Überblick - Prof. Dr. Jens Albrecht

Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick.

Open Source BI 2009 Flexibilität und volle Excel-Integration von Palo machen OLAP für Endanwender beherrschbar. 24. September 2009

O-BIEE Einführung mit Beispielen aus der Praxis

Prozessunterstützung durch BPR-, BPM- und Workflow-Systeme

Strategische Begleitung komplexer Multi-Channel Projekte in der Praxis

Die Realtime Big Data OTTO

Mobile Backend in der

2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung

BI around the world - Globale Reporting Lösungen bei Continental Automotive

BI vision 2015 Customer Experience Management Reporting mit SAP BusinessObjects / Rainer Dewes / Vodafone GmbH

Unsere LEistungen auf einen Blick

Transkript:

Hamburg, im August 2016

AGILE DATA-VAULT- ENTWICKLUNG IM ONLINE- VERSANDHANDEL. Eine Fallstudie bei Otto

INHALT 1. Zahlen & Fakten: Vorhang auf für OTTO 2. Architektur: Das BRAIN 3. Data Vault I: Der Weg rein 4. Data Vault II: Der Weg raus 3

1. ZAHLEN UND FAKTEN Vorhang auf für OTTO 4

Zahlen & Fakten Firmensitz: Hamburg (Hauptsitz) Mitarbeiter: 4.350 (standortunabhängig) Umsatz 2015/2016: 2,561 Milliarden Euro Der OTTO-Campus in Hamburg 5

Über 65 Jahre OTTO: Vom Schuhversand zum Pionier im E-Commerce 1949: Gründung 1950: Der erste, handgebundene OTTO-Katalog wird verschickt: Er präsentiert auf 14 Seiten 28 Paar Schuhe Ab 1960: Aufbau zum führenden Versandhändler für Mode und Einrichten Der Hauptkatalog wird zum Markenzeichen Ab 1995: Verstärkter Ausbau zum Multichannel-Händler otto.de geht online Heute: OTTO ist Treiber im Onlinehandel, das Unternehmen nutzt neueste Technologien und gestaltet den Markt aktiv mit 6

20 Jahre Erfahrung im E-Commerce 2000: Bestellung per Handy wird erstmals möglich über mobil.otto.de 1995: OTTO präsentiert sein Angebot erstmals im Internet unter www.otto.de Heute: Über 2,1 Millionen Artikelpositionen und rund 5.200 Marken auf otto.de. Komfortables Shopping über alle Endgeräte. 7

Vom Katalogversender zum E-Commerce-Profi Schuhe Multimedia Bademoden Haushalt Herrenmode Küche Möbel Damenmode Heimtextilien Baumarkt Sport Spielzeug Wäsche Große Bandbreite an Produkten und Marken 8

Großer und treuer Kundenbestand 20 Millionen Bestellungen pro Jahr rund 6 Millionen aktive Kunden über 1 Million Visits pro Tag 9

Rund 90% Onlineanteil am Gesamtumsatz Unternehmenspräsentation 16.09.2016 10

International erfolgreich Die Otto Group ist eine weltweit agierende Handels- und Dienstleistungsgruppe mit 123 wesentlichen Unternehmen in mehr als 20 Ländern. 11

Geschäftsfeld Multichannel-Einzelhandel der Otto Group Nordamerika Deutschland Russland Südamerika Europa Asien Mehrheitsbeteiligungen der Otto Group Minderheitsbeteiligungen der Otto Group 12

2. ARCHITEKTUR Das BRAIN 13

Positionierung der BI-Plattform in die Gesamt-IT Customer Touchpoints Closed Loop Onlineshop Real-time BI BI Middleware / EAI Interne Systeme NOA Mercado SEO Tool Externe Quellen Google Adwords Load Once BRIN (BI Plattform) 14

COMMON Zusammensetzung von BRAIN aus vertikalen Stacks und horizontalen Layern REAL-TIME STACK SPEED ANALYTIC STACK SERVING REPORTING STACK STANDARD PREPARATION MODEL SCORING BIG DATA STACK INFORM. STACK LOAD BASE HUB 1 CLASSIC STACK HUB LOAD BASE HUB n OLAP DASH- BOARDS AD HOC 15

Strukturierung über Daten Domänen 16

QUELLEN STAGING ( LOAD ) DATA VAULT ( BASE ) INFORMATION MARTS ( BUSINESS ) Strukturierung über Daten Domänen 17

Zentrales DM Tool

Zentrales DI Tool

3. DATA VAULT I Der Weg rein 20

Data Vault 2.0 Modell Das (relationale) Datenmodell steht im Vordergrund MD5 Hashes Hashing auf dem Weg nach Staging CSV 1 : 1 Staging Hard Rules Data Vault XML 21

Abweichungen vom Standard Keine explizite RecordSource Kein expliziter LDTS Abgedeckt über techn. Felder die auch den Talend Job identifizieren 22

Bewirtschaftung Data Vault CLASSIC STACK CSV XML Generisches Job parsen CSV Code Generator für Load Statements SQL Code Generator für DV spezifische Load Statements LOAD Layer (Staging Area) BASE Layer (Core Warehouse)

Metadaten Model enthält Struktur und Beladelogik der Modelle Data Definition Data Logistics Model Relationship Entity Entity Mapping Entity Key Relationship Attribute Entity Key Attribute Attribute Entity Attribute Mapping

Quelle nach Staging XML Preload Job CSV Load Job Xpath parsing SK erzeugen Staging CSV Load Job 25

Quelle nach Staging Im 2 Wochen Sprint bei neuer Quelle machbar Automatisierung recht einfach SKs auf den Weg in die Staging sehr vorteilhaft Generik auf den Weg in den DV nicht immer deterministisch / abbildbar Von Anfang an Geschäftsanforderung betrachten Datenbeschaffung ist essentiell XML ohne XSD schwer zu modellieren Großes Testdatenset ist wertvoll Schnittstelle selber definieren, wenn möglich Daten direkt von RDMS abziehen Früh auf den Weg bringen 26

Staging nach Base optional Staging gen. Job Mappings aus PD Data Vault 27

Physikalische Modellierung und Datenfluss 28

PowerDesigner als fundamentales Tool für die Modellierung SAP PowerDesigner DDL Metadaten Bewirtschaftung (ETL) 29

Daten Domäne BaseDelivery 30

Lessons Learned Im 2 Wochen Sprint bei neuem Modell machbar Scope gut definieren (agil) Klein anfangen, man kommt iterativ zur allumfänglichen Lösung Nicht zu viel (allein) vorausdenken, es ist kein Reengineering nötig Kenne deinen Fachbereich und das Geschäft Konkret nachfragen nicht versuchen selber zu interpretieren Timestamps: an fachliches Datum gehalten (letzte Änderung in Quelle) Probleme durch Nachläufer-Problematik KISS (vor allem die Beladelogik) 31

4. DATA VAULT II Der Weg raus 32

Base nach Business (End-) User greifen nur auf die Marts zu (über ded. Access-Schicht) Analytic User dürfen auf alle Ebenen Data Vault Soft Rules Common Mart Soft Rules Trafo Mart n Mart Bus. Rules Mart 1 33

Pains Nichts generisches / automatisiertes Kein BusinessVault Common Mart soll kompletter DV in 3NF persistiert sein Marts sollen auf Exasol, aber Architektur soll so bleiben 34

Lessons Learned Geschäftslogik bleibt trotzdem bestehen und komplex View-Schicht ohne BusinessVault (Stern aus DV direkt ) kann inperformant werden Kenne Dein DMBS Investitionen sind zu schützen, keine Grüne Wiese 35

VIELEN DANK FRAGEN? 36

Jan Sandte Information Architect IT-BI-CA Otto (GmbH & Co. KG) jan.sandte@otto.de 37