BIG DATA IM RETAIL-SEKTOR AM BEISPIEL KASSENBONDATEN BUSINESS ANALYTICS DAY

Ähnliche Dokumente
Big Data im Retail-Sektor am Beispiel Kassenbondaten

Datenprodukte für Deutschlands größten Fahrzeugmarkt. Vortrag beim BITKOM Big Data Summit am 16. Februar 2017 in Hanau

Big Data Informationen neu gelebt

inovex Case Study C. H. Beck Verlag Implementierung eines flexiblen Image Service auf Basis von Microsoft Azure

Office 365 Dynamics 365 Azure Cortana Intelligence. Enterprise Mobility + Security Operations Mgmt. + Security

SQL on Hadoop für praktikables BI auf Big Data.! Hans-Peter Zorn und Dr. Dominik Benz, Inovex Gmbh

BI-Kongress 2016 COMBINED THINKING FOR SUCCESS - BI & S/4HANA

Big Data im Call Center: Kundenbindung verbessern, Antwortzeiten verkürzen, Kosten reduzieren! Sascha Bäcker Dr.

vinsight BIG DATA Solution

Copyr i g ht 2014, SAS Ins titut e Inc. All rights res er ve d. HERZLICH WILLKOMMEN ZUR VERANSTALTUNG VISUAL ANALYTICS

Big-Data-Technologien - Überblick - Prof. Dr. Jens Albrecht

Hans-Peter Zorn Inovex GmbH. Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke?

Einführung in Big Data und Hadoop (mit verschiedenen Live Demos) Eintägiges Intensivseminar

Echtzeiterkennung von Cyber-Angriffen auf IT-Infrastrukturen. Frank Irnich SAP Deutschland

Die wichtigsten Hadoop-Komponenten für Big Data mit SAS

ETL in den Zeiten von Big Data

Überraschend mehr Möglichkeiten. Lambda-Architektur in der Praxis. Das wichtigste Architektur-Konzept für Big Data am konkreten Beispiel.

Paradise Found Roadshow 2017

Trends in der BI. Hannover, 20. März 2017 Patrick Keller, Senior Analyst und Prokurist

June Automic Hadoop Agent. Data Automation - Hadoop Integration

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004

A Big Data Change Detection System. Carsten Lanquillon und Sigurd Schacht

ERFOLGSFAKTOREN EINER DATENGETRIEBENEN CUSTOMER-CARE-OPTIMIERUNG

Copyr i g ht 2014, SAS Ins titut e Inc. All rights res er ve d. HERZLICH WILLKOMMEN ZUR VERANSTALTUNG HADOOP

Sonderdruck. In der digitalen Welt bestehen mit der Digital Business Platform der Software AG

Copyr i g ht 2014, SAS Ins titut e Inc. All rights res er ve d. HERZLICH WILLKOMMEN ZUR VERANSTALTUNG DATA MANAGEMENT

Skalierbare Webanwendungen

MOBILE ON POWER MACHEN SIE IHRE ANWENDUNGEN MOBIL?!

Big Data in Marketing und IT

Die Bausteine der AWS Web Services

Microsoft Azure: Ein Überblick für Entwickler. Malte Lantin Technical Evangelist, Developer Experience & Evangelism (DX) Microsoft Deutschland GmbH

Symbiose hybrider Architekturen im Zeitalter digitaler Transformation. Hannover,

Die Cloud, die alles anders macht. Die 6 Grundzüge der Swisscom Cloud

Data und Big Data in der Cloud

Raber+Märcker Techno Summit 2014 Microsoft Dynamics NAV 2013 R2 Überblick und Hintergründe zu aktuellen Version.

PRODATIS CONSULTING AG. Folie 1

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria

BDCA Kick-Off München,

Trends im Markt für Business Intelligence. Patrick Keller, Senior Analyst & Prokurist CeBIT 2016

Technologie und Marketing für digitales Business

SODA. Die Datenbank als Document Store. Rainer Willems. Master Principal Sales Consultant Oracle Deutschland B.V. & Co. KG

Oracle Data Integrator Ein Überblick

DWH Best Practices das QUNIS Framework 80 Jahre Erfahrung bei der Modellierung & dem Betrieb von DWH. Referent: Ilona Tag

Copyright 2014, Oracle and/or its affiliates. All rights reserved.

Mission. TARGIT macht es einfach und bezahlbar für Organisationen datengetrieben zu werden

Big Data & Advanced Analytics Anwendungsfälle Beispiele für Analysen auf Basis strukturierter & unstrukturierter Daten

Technologischen Rahmenbedingungen und Werkzeuge für eine wertschöpfende Controller-Rolle

SQL Server 2008 R2 Überblick. Steffen Krause Technical Evangelist

Cloud und Big Data als Sprungbrett in die vernetzte Zukunft am Beispiel Viessmann

Big Data Hype und Wirklichkeit Bringtmehrauchmehr?

Erfahrungsbericht: Umstieg von RDBMS auf Big Data-Technologien

Oracle BI&W Referenz Architektur Big Data und High Performance Analytics

Self-Service und Data Storytelling mit Qlik Sense und Qlikview. Referenten: Oliver Zemljak, Konstantin Wächter Session 2

Bedeutung von Integrationsarchitekturen im Zeitalter von Mobile, IoT und Cloud

BI und Data Warehouse im Zeitalter der Digitalisierung

Mit In-Memory Technologie zu neuen Business Innovationen. Stephan Brand, VP HANA P&D, SAP AG May, 2014

Agenda. Ausgangssituation (Beispiel) PaaS oder IaaS? Migrationspfade Deep Dives. IaaS via Azure Site Recovery PaaS via SQL Deployment Wizard

Mobile Backend in der

Unternehmen und IT im Wandel: Mit datengetriebenen Innovationen zum Digital Enterprise

Open Source als de-facto Standard bei Swisscom Cloud Services

Agile Methoden als Erfolgsfaktor für BI und Big Data Projekte. Best Practices aus unseren Projekten. Dr. Stefan Igel Karlsruhe,

SOA im Zeitalter von Industrie 4.0

SharePoint, Liferay & Co.: Social Business Integration in der Praxis. Dr. Christoph Tempich Webinar,

Wie Amazon mit Hilfe von Technologie und Daten erfolgreich ist Startup Firmen in Deutschland und weltweit haben Agilität, Innovation und globale

DATA WAREHOUSE. Big Data Alfred Schlaucher, Oracle

Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick.

Wide column-stores für Architekten

SAP Analytics in der Praxis Einfach und verständlich erklärt. UnitCon/ARITHNEA Kundentag, Benedikt Bonnmann

Step 0: Bestehende Analyse-Plattform

MHP Real-Time Business Solution Ihre Lösung zur Harmonisierung und Analyse polytechnischer Messdaten

Big Data Anwendungen Chancen und Risiken

ODI und Big Data Möglichkeiten und ein Erfahrungsbericht Dr. Holger Dresing Oracle Deutschland B.V. & Co. KG Hannover

Peter Dikant mgm technology partners GmbH. Echtzeitsuche mit Hadoop und Solr

Review Freelancer-Workshop: Fit für Big Data. Mittwoch, in Hamburg

Studierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen

15 Jahre SharePoint-Technologie

NoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE

Big Data Plattformen für polystrukturierte Daten neue Chancen und Herausforderungen

Innovation gestalten - von ABAP zur SAP HANA Cloud Platform

Was ist Analyse? Hannover, CeBIT 2014 Patrick Keller

Simulationen und Mathematische Programmierung mit SAS Dr. Mihai Paunescu

Köln, 27. September 2017

<Insert Picture Here> 8. Business Intelligence & Data Warehouse Konferenz

Operational Intelligence

R im Enterprise-Modus

B1 - Big Data Science: Tornado oder laues Lüftchen? Uetliberg,

Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien. Berlin, Mai 2013


Hadoop Eine Erweiterung für die Oracle DB?

T-SYSTEMS MMS. OTRS Mandantenfähig das geht? Das Geht!

Intelligentes Datenmanagement und Architekturen für flexibles Reporting und Analytik

Beratung. Results, no Excuses. Consulting. Lösungen. Grown from Experience. Ventum Consulting. SQL auf Hadoop Oliver Gehlert Ventum Consulting

DevOps. Alexander Pacnik, Head of DevOps Engineering

Big Data, small Data und alles dazwischen!

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik

BIG UNIVERSITÄTSRECHENZENTRUM

Enterprise NoSQL mit der MarkLogic-Datenbank

einfach. gut. beraten. Oracle Big Data Konnektoren: Hadoop und die Oracle DB DOAG Konferenz + Ausstellung 2016 Nürnberg Philipp Loer

Living Lab Big Data Konzeption einer Experimentierplattform

THEMA: SAS DATA INTEGRATION STUDIO FÜR MEHR TRANSPARENZ IM DATENMANAGEMENT EVA-MARIA KEGELMANN

Transkript:

BIG DATA IM RETAIL-SEKTOR AM BEISPIEL KASSENBONDATEN BUSINESS ANALYTICS DAY 08.03.2017 REWE Systems GmbH Jonas Freiknecht inovex GmbH Bernhard Schäfer

AGENDA 1 / Vorstellung REWE Systems GmbH und inovex GmbH 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 2

KENNZAHLEN DER REWE SYSTEMS 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 3

VORSTELLUNG INOVEX GMBH inovex ist ein IT-Projekthaus für die Digitale Transformation: Agile Development & Management Web UI/UX Replatforming Microservices Mobile Apps Smart Devices Robotics Big Data & Business Intelligence Platforms Data Science Data Products Search Deep Learning Data Center Automation DevOps Cloud Hosting Trainings & Coachings inovex gibt es in Karlsruhe Pforzheim München Köln Hamburg. Und natürlich unter www.inovex.de Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 4

AGENDA 2 / Big Data @ REWE 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 5

IT-EINSATZ IM MARKT 2010 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 6

IT-EINSATZ IM MARKT VON HEUTE 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 7

BIG DATA @ REWE SYSTEMS DAS WARUM Entlastung des Mainframes Auslagerung rechenintensiver Jobs nach Hadoop (ETL Offloading) Vorverarbeitung der Daten in Hadoop Vermeidung teurer explorativer Datenanalysen auf dem Mainframe Konsolidierung der Daten und Werkzeuge Zusammenführen der Vielzahl an Datenquellen (Data Lake) Längere Vorhaltezeit der Rohdaten und Aggregate Abteilungsübergreifende Standard Tools Erschließung neuer Use Cases Analysen über eine Vielzahl von Datenquellen (Apache Drill) Skalierbares Machine Learning (Apache Spark) Vorgefertigte Analyse-Templates für Fachanwender (Apache Zeppelin) 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 8

BIG DATA @ REWE SYSTEMS HISTORIE Aufbau der Staging- Cluster Umsetzung erster Spark- Anwendung (Spark 1.1) Einführung interner Hadoop- Schulungen Stretch-Cluster über zwei RZs Schulungen für Fachabteilungen MapReduceJobs in Produktion für (E)TL von Versorgerdaten Produktivierun g erster Spark- Anwendung (Spark 1.3) 12 produktive Anwendungen Juni 2014 Dez. 2014 Okt. 2014 Okt. 2015 Dez. 2015 Heute 2017 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 9

AGENDA 3 / Bondatenverarbeitung auf Hadoop 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 10

BONDATENVERARBEITUNG AUF HADOOP HINTERGRUND Anforderung: REWE Group-weite, qualitätsgesicherte Landing-Zone für Bondaten Märkte Kassensysteme Landingzone Qualitätssicherung / Duplikatsprüfung Weiterverarbeitung H 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 11

BONDATENVERARBEITUNG AUF HADOOP ARCHITEKTUR DATA HUB Data Sources Collection Ingestion Storage Application Spark Executor Aggregate Analytics Frontend Batch Processing MQ Transaktionen Index Adhoc Analysen Aggregation Weiterverarbeitung External Sinks MQ Zeppelin Warenwirtschaft Anwendungen Stammdaten Master Data Import 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 12

BONDATENVERARBEITUNG AUF HADOOP SPARK STREAMING UI Pro Event ~ 200 Transaktionen ~ 2400 Transaktionen pro Sekunde ~ 70 Mio. Transaktionen täglich ~ 180 GB Rohdaten täglich 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 13

AGENDA 4 / Beispiel Anwendung: Analytics Frontend 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 14

[ Folie entfernt ] 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 15

[ Folie entfernt ] 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 16

[ Folie entfernt ] 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 17

[ Folie entfernt ] 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 18

AGENDA 5 / Lessons Learned 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 19

LESSONS LEARNED HADOOP TECHNOLOGIEN Spark Big Data Swiss Army Knife Datenquellen: JDBC: DB2, Strukturierte Dateien in HDFS: CSV, JSON, Parquet, NoSQL Datenbanken: HBase Spark Streaming Flexible, robuste und skalierbare Streaming Engine Für kritische 24/7 Applikationen sehr viel Detailwissen erforderlich 1 1 https://www.inovex.de/blog/247-spark-streaming-on-yarn-in-production/ 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 20

LESSONS LEARNED HADOOP TECHNOLOGIEN (2) HBase Skaliert für sehr große Datenmengen Höherer Entwicklungssaufwand im Vergleich relationalen DBs SQL-Zugriff über Apache Drill möglich Continuous Integration Integrationstests mit Spark Local Mode & HBase Mini Cluster Einfache Integration in bestehendes Buildsystem(Quickbuild) 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 21

LESSONSLEARNED BIG DATA SERVICE @ REWE Start Simple Fokus auf wenige Kernkomponenten aus Hadoop Ökosystem: Spark, HBase, Oozie, (Hive) Agile Entwicklung Java anstatt Scala/Python Vereinfacht die Ausbildung von Big Data Entwicklern Standardisierung Bereitstellung von Java Libraries für etablierte Patterns Namenskonventionen für HDFS und HBase Training Schulungsprogramm Java Entwickler Big Data Entwickler Vermittlung Konzepte über verteilte Systeme Java 8 Lambda Streams ähnlich zu Spark RDD API Wir haben einen Hadoop-Cluster? Ja, seit 3 Jahren. Tue Gutes und sprich darüber. 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 22

Vielen Dank für Ihre Aufmerksamkeit! https://www.rewe-systems.com/ihre-karrierechancen/jobangebote/ 8. März 2017 Big Data im Retail-Sektor am Beispiel Kassenbondaten 23