Hadoop und SAS Status und Ausblick WIEN, JUNI 2015 GERNOT ENGEL, CLIENT SERVICE MANAGER SAS AUSTRIA

Ähnliche Dokumente
Copyr i g ht 2014, SAS Ins titut e Inc. All rights res er ve d. HERZLICH WILLKOMMEN ZUR VERANSTALTUNG VISUAL ANALYTICS

Copyr i g ht 2014, SAS Ins titut e Inc. All rights res er ve d. HERZLICH WILLKOMMEN ZUR VERANSTALTUNG HADOOP

THEMA: SAS TOOLS FÜR DIE DATENVERARBEITUNG IN HADOOP ODER WIE REITET MAN ELEFANTEN?" HANS-JOACHIM EDERT

ETL in den Zeiten von Big Data

DIE DATEN IM ZENTRUM: SAS DATA MANAGEMENT

Data. Guido Oswald Solution Switzerland. make connections share ideas be inspired

Big Data Informationen neu gelebt

Beratung. Results, no Excuses. Consulting. Lösungen. Grown from Experience. Ventum Consulting. SQL auf Hadoop Oliver Gehlert Ventum Consulting

Komponenten des Big Data Lab Konzepte und Technologien zum Bearbeiten von Big Data Use Cases

Copyr i g ht 2014, SAS Ins titut e Inc. All rights res er ve d. HERZLICH WILLKOMMEN ZUR VERANSTALTUNG DATA MANAGEMENT

June Automic Hadoop Agent. Data Automation - Hadoop Integration

SAS Education. Grow with us. Anmeldung bei SAS Education. Kurstermine Juli Dezember 2015 für Deutschland, Österreich und die Schweiz

Big-Data-Technologien - Überblick - Prof. Dr. Jens Albrecht

SQL on Hadoop für praktikables BI auf Big Data.! Hans-Peter Zorn und Dr. Dominik Benz, Inovex Gmbh

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004

Industrie 4.0 Predictive Maintenance. Kay Jeschke SAP Deutschland AG & Co. KG., Februar, 2014

Simulationen und Mathematische Programmierung mit SAS Dr. Mihai Paunescu

Die wichtigsten Hadoop-Komponenten für Big Data mit SAS

SAS Predictive Analytics Factory The SAS approach for the production and maintenance of analytical models

Cross-Channel-Marketing und Customer Journey

LOG AND SECURITY INTELLIGENCE PLATFORM

Hadoop Demo HDFS, Pig & Hive in Action. Oracle DWH Konferenz 2014 Carsten Herbe

Problemstellung. Keine Chance! Ich brauche eine genaue Spezifikation und dann vielleicht in 3-4 Wochen können Sie einen erstes Beispiel haben!

SAP HANA Einsatzmöglichkeiten und Potenziale

Big Data Mythen und Fakten

Was ist Analyse? Hannover, CeBIT 2014 Patrick Keller

NoSQL-Datenbanken und Hadoop im Zusammenspiel mit dem Data Warehouse

Zend PHP Cloud Application Platform

Big Data in der Praxis

Werkzeuge für Datenbank Handwerker: IBM Data Studio und IBM Optim QWT

Software EMEA Performance Tour Juni, Berlin

Aufbau eines IT-Servicekataloges am Fallbeispiel einer Schweizer Bank

MOBILE ON POWER MACHEN SIE IHRE ANWENDUNGEN MOBIL?!

OERA OpenEdge Reference Architecture. Mike Fechner PUG Infotag 19. Mai 05 Frankfurt

Hadoop Eine Erweiterung für die Oracle DB?

Was ist Windows Azure? (Stand Juni 2012)

EMC. Data Lake Foundation

Das Beste aus zwei Welten

Microsoft Azure Fundamentals MOC 10979

THEMA: GUT VORBEREITET IST HALB ZERTIFIZIERT ANTWORTEN ZUR SAS VISUAL ANALYTICS-ZERTIFIZIERUNG" THOMAS WENDE

IBM Netezza Data Warehouse Appliances - schnelle Analysen mit hohen Datenmengen

Mit In-Memory Technologie zu neuen Business Innovationen. Stephan Brand, VP HANA P&D, SAP AG May, 2014

MEHR ANALYTICS FÜR MEHR ANWENDER DR. GERHARD SVOLBA COE ANALYTICS DACH WIEN, 11. JUNI 2015

Technologietag SharePoint 2010

tdwi E U R D P E OPEN SOURCE BUSINESS INTELLIGENCE HANSER MÖGLICHKEITEN, CHANCEN UND RISIKEN QUELLOFFENER BI-LÖSUNGEN

Daten haben wir reichlich! The unbelievable Machine Company 1

Die Renaissance von Unified Communication in der Cloud. Daniel Jonathan Valik UC, Cloud and Collaboration

Nico Orschel AIT GmbH & Co KG Marc Müller 4tecture GmbH. 95 Prozent brauchen es, 5 Prozent machen es: Load Testing mit VS leicht gemacht

Microsoft Office SharePoint Server 2007 Überblick. Gernot Kühn Partner Technical Specialist Microsoft Deutschland Gmbh

Analyse leicht gemacht - SAS Enterprise Guide. Gerd Hoffmann Technical Competence Center SAS Deutschland

Software Defined Storage Storage Transformation in der Praxis. April

Der SAS DataStep und die Prozedur SQL Cellent Finance Solutions GmbH Seite: 1

Archive / Backup System für OpenVMS

Mission. TARGIT macht es einfach und bezahlbar für Organisationen datengetrieben zu werden

POWER BI DAS neue BI Tool von Microsoft!? Wolfgang Strasser twitter.com/wstrasser

Spring Dynamic Modules for OSGi Service Platforms

LOAD TESTING 95% BRAUCHEN ES, 5 % MACHEN ES: LOAD TESTING MIT VS LEICHTGEMACHT NICO ORSCHEL MVP VS ALM, CONSULTANT

Business Intelligence. Bereit für bessere Entscheidungen

Big Data: Apache Hadoop Grundlagen

Leistungssteuerung beim BASPO

ORM & OLAP. Object-oriented Enterprise Application Programming Model for In-Memory Databases. Sebastian Oergel

Citrix Dazzle. Die Zukunft der XenApp Bereitstellung? Thomas Kötzing - Freiberufler, Analyst Microsoft MVP, Citrix CTP / ThomasKoetzing.

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria

CAS coole Arbeitsumgebung für SAS Programme

OWB 10.2 Experts im Einsatz: Automatisierung von Designschritten bei der Bayer Healthcare AG. Referent: Lutz Bauer, Senior Systemberater, MT AG

IT SECURITY MANAGEMENT MIT ARIS CLOUD ENTERPRISE

Zeitlich abhängig von OWB?

p^db=`oj===pìééçêíáåñçêã~íáçå=

Trends im Markt für Business Intelligence. Patrick Keller, Senior Analyst & Prokurist CeBIT 2016

Möglichkeiten für bestehende Systeme

MetaNavigation der effizienteste Weg maximalen Mehrwert aus BI Metadaten zu ziehen

Infor PM 10 auf SAP. Bernhard Rummich Presales Manager PM Uhr

Data Governance Informationen kontrolliert managen

IT-Services. Business und IT. Ein Team. Aus Sicht eines Retailers.

Der Cloud Point of Purchase. EuroCloud Conference, 18. Mai 2011 (Christoph Streit, CTO & Co-Founder ScaleUp)"

Windows Azure für Java Architekten. Holger Sirtl Microsoft Deutschland GmbH

Review Freelancer-Workshop: Fit für Big Data. Mittwoch, in Hamburg

Uwe Baumann artiso Solutions

Folgende Voraussetzungen für die Konfiguration müssen erfüllt sein:

Markus BöhmB Account Technology Architect Microsoft Schweiz GmbH

IT-Symposium. 2E04 Synchronisation Active Directory und AD/AM. Heino Ruddat

OPEN GOVERNMENT: MEHR TRANSPARENZ UND PARTIZIPATION DURCH ANALYTICS ANDREAS NOLD STATEGISCHE GESCHÄFTSENTWICKLUNG SAS D-A-CH

ALM As-A-Service TFS zur hausinternen Cloud ausbauen

Albert HAYR Linux, IT and Open Source Expert and Solution Architect. Open Source professionell einsetzen

Mobile Apps: Von der Entwicklung bis zum Test mit HP Software

Administering Microsoft SQL Server Databases

DB2 for VM / VSE 7.5. News & Experiences. Torsten Röber. GSE Frühjahrstagung April 2008, Bonn. IBM Software Group

Next Generation Cloud

Mit dem 6. Rundbrief gelange ich mit einem Update des Zeitservers an Alle.

Cloud und Big Data als Sprungbrett in die vernetzte Zukunft am Beispiel Viessmann

Copyright 2014, Oracle and/or its affiliates. All rights reserved.

DATA WAREHOUSE. Big Data Alfred Schlaucher, Oracle

Big Data im Call Center: Kundenbindung verbessern, Antwortzeiten verkürzen, Kosten reduzieren! Sascha Bäcker Dr.

Oracle OLAP 11g: Performance für das Oracle Data Warehouse

Wie profitiert SAP MaxDB von SSD Technologie?

SMART Newsletter Education Solutions April 2015

Einreichung zum Call for Papers

THEMA: "SAS STORED PROCESSES - SCHNELL GEZAUBERT" HELENE SCHMITZ

Hadoop. High Performance Batches in der Cloud. Hadoop. Folie Januar 2011

Transkript:

Copyright o p y r i g h t 2012, 2 0 1 2, SAS S A S Institute s t i t u tinc e In. c All. Arights l l r i g hreserved. t s r e s e r ve d. Hadoop und SAS Status und Ausblick WIEN, JUNI 2015 GERNOT ENGEL, CLIENT SERVICE MANAGER SAS AUSTRIA

Copyright o p y r i g h t 2012, 2 0 1 2, SAS S A S Institute s t i t u tinc e In. c All. Arights l l r i g hreserved. t s r e s e r ve d. AGENDA 1 SAS & Hadoop Technologien, Lösungen 2 Demo SAS access to hadoop, SAS Dataloader for hadoop 3 SAS Hadoop Anwendungsszenarien & Ausblick

Copyright o p y r i g h t 2012, 2 0 1 2, SAS S A S Institute s t i t u tinc e In. c All. Arights l l r i g hreserved. t s r e s e r ve d. SAS FOR HADOOP VISION To be the Analytic and Data Management solution of choice for Hadoop.

C o p y r i g h t 2 0 1 2, S A S In s t i t u t e In c. A l l r i g h t s r e s e r ve d. HADOOP GRUNDLAGEN KEINE GEGENSÄTZE ABER OFT NICHT GEMEINSAM BETRACHTET! Wdh. Hadoop als Data Integration Platform Hadoop als Kernkomponente einer next gen BI- und Analytics-Strategie EVALUATE / MONITOR RESULTS IDENTIFY / FORMULATE PROBLEM DATA PREPARATION DEPLOY MODEL DATA EXPLORATION ETL Process VALIDATE MODEL TRANSFORM & SELECT BUILD MODEL ist Baustein einer Transformation der IT Landschaft dient zur Unterstützung neuer Fragestellungen in den Fachbereichen

SAS & HADOOP BASIS TECHNOLOGIEN & PRODUKTE SAS/Access to Hadoop Push some SAS processing from Hadoop into SAS Embedded Process - Push SAS data processing to Hadoop with Map Reduce In-Memory Analytics - Use Hadoop for Storage persistence and commodity computing. SAS SAS SAS Hive Impala Score A Code A HPA LASR SAS/Access to Hadoop - Demo SAS/Access to Cloudera Impala SAS DI Server SAS/Scoring Accelerator for Hadoop SAS Code Accelerator for Hadoop * SAS Data Quality Accelerator for Hadoop* SAS Data Loader for Hadoop (*inkludiert) - Demo SAS Visual Analytics SAS Visual Statistics SAS in memory Statistics SAS HPA Produkt bundles Copyr i g ht 2014, SAS Ins titut e Inc. All rights res er ve d.

SAS & HADOOP DATENMANAGEMENT FÜR HADOOP MIT SAS Datenmanagement mit SAS PROC HADOOP (Map Reduce + Pig Scripting + HDFS Kommandos) SAS Access to Hadoop Hive, Hive2, Impala Proc Pushdown: FREQ, RANK, REPORT, SORT, SUMMARY/MEANS & TABULATE Hadoop Plugins für SAS Data Integration Studio SAS Data Loader Point & Click Datenmanagement für Hadoop: Einlesen, Transformieren und Bereinigen von Daten in Hadoop Highlights: SQOOP Integration, SAS Profiling und Data Quality Engines, Transfer der Daten zu SAS In- Memory Analytics Cluster HTML-basierendes Interface Copyr i g ht 2014, SAS Ins titut e Inc. All rights res er ve d.

C o p y r i g h t 2 0 1 2, S A S In s t i t u t e In c. A l l r i g h t s r e s e r ve d. KURZDEMO SAS ACCESS TO HADOOP ENGINE SAS access to Hadoop Zugriffe - > 3 Möglichkeiten Sas access engine -> Hive library SAS Application Server Access to Hadoop Hadoop Cluster HiveServer2 XML Files JAR Files JDBC Hive Metastore MapReduce (Compute Framework) HDFS File access -> hdfs Fileref Data Files Data Files HDFS Proc hadoop -> pass through proc Hadoop -> passthrough hdfs commands eingebettet in sas code

C o p y r i g h t 2 0 1 2, S A S In s t i t u t e In c. A l l r i g h t s r e s e r ve d. SAS DATA INTEGRATION SERVER GUI SUPPORTED HADOOP TRANSFORMATIONEN FROM Hadoop IN Hadoop EP WITH Hadoop EP EP

SAS DATA LOADER FOR HADOOP STECKBRIEF Führt SAS DS2 Code, HiveQL und DQ Code auf einem Hadoop Cluster aus Kann Hadoop-Daten in einen vorhandenen LASR Server laden (für weitere Analysen in VA / VS) Zugriff auf externe Datenbanken (2.2) RDBMS SAS Data Loader Hadoop Cluster SAS LASR (VA / VS) Copyr i g ht 2014, SAS Ins titut e Inc. All rights res er ve d.

C o p y r i g h t 2 0 1 2, S A S In s t i t u t e In c. A l l r i g h t s r e s e r ve d. KURZDEMO SAS DATALOADER FOR HADOOP 2.2 CONFIG TRIAL EDITION Client PC 1 ACQUIRE DATA DISCOVER DATA 2 TRANSFORM DATA 3 CLEANSE DATA 4 INTEGRATE DATA 5 DELIVER DATA EP SAS Embedded Process + QKB Virt. SAS Data Loader vapp Hadoop Config Hadoop Sandbox EP HDFS Virt. Hadoop Config SAS Embedded Process + QKB Copy Data to Hadoop Profile Data Identification Analysis Query Query Select Columns Apply Filters Map Columns Sort / Order Calculate Columns Transpose data Aggregate Validate Parse Standardize Join Create Match codes Sort & Deduplicate Aggregate Run a SAS program Load SAS LASR Create tables Create views Copy from Hadoop Configuration Directory Hadoop Data Transform data Access data, move it into Hadoop, and assess the data structure and content Select data of interest, manipulate it, and structure it into the data format desired Put data into a consistent format Combine datasets, including data that has no common key, remove duplicate data, and create new data points thru aggregation Load datasets into SAS LASR inmemory analytic server, Create new Hadoop tables, and deliver data to other databases and apps

C o p y r i g h t 2 0 1 2, S A S In s t i t u t e In c. A l l r i g h t s r e s e r ve d. SAS DATA LOADER FOR HADOOP EXAMPLE PREPARE AND LOAD CUSTOMER DATA Business Analyst Action Business Analyst Action Use Copy Data to Hadoop Use Transform data in Hadoop I need my Customer data in Hadoop I need to subset and summarize the data Use Cleanse Data in Hadoop Use Load Data to LASR I can see, but I can also fix, the data quality issue I need to Load the data to LASR for visualization

C o p y r i g h t 2 0 1 2, S A S In s t i t u t e In c. A l l r i g h t s r e s e r ve d. HADOOP PRAXIS ZUSAMMENFASSUNG Hadoop unterscheidet sich von traditionellen DBMS Systemen Umdenken bei der Datenverarbeitung notwendig Hive & SQL bedarfsgetrieben verwenden Datenhaltung eröffnet neue Möglichkeiten Ordner von Flatfiles werden als Tabelle verwaltet (vergleichbar SPD Server/SPD Engine) Arbeiten mit den Partitionen Nutzen der Transfer-Transformationen Hadoop ist optimiert auf große Tabellen Datenqualitätsfunktionen mit DQ Accelerator optimal für Big Data Dataloader for Hadoop Fachbereichstaugliches point & click Werkzeug für hadoop ( Datentransfer rdms hdfs, LASR Server, DQ, ETL..)

SAS DATA LOADER FOR HADOOP WHATS NEW ROADMAP Version 2.3 (9.4M3) Enhancements Profile Threading & Performance Enhancements SAS User Defined Formats Hive 14 Enhancements Distribution Support MapR / PHD (stretch) New Directives: Hive Node, Delete Node LDAP Authentication Future (2.4+) * New Directives : Merge, Score Unstructured Text Processing Major Features Spark Integration Chained Directives Execute in Jobs Parallel Federation Server Integration Automated & Smart Profiling * features are subject to change Copyr i g ht 2013, SAS Ins titut e Inc. All rights res er ve d.

SAS 9.4M3 WHAT S NEW MapR Support für alle SAS Bausteine PROC SQOOP SAS/Access to Hadoop Verbessert: Performance, Durchreichen von Fehlerbeschreibungen, implicit passthrough (where exists, between) SAS/ACCESS to HAWQ SAS/ACCESS to Impala BASE Proc Pushdown Embedded Process (Accelerators) Zugriff auf Daten über HCatalog (Hive SerDes) Dateiformate verwendbar: Parquet, ORC, Avro, Sequence, RCFILE Code Accelerator: erlaubt multiple Input Data Sources, unterstützt Merge Statement Copyr i g ht 2012, SAS Ins titut e Inc. All rights res er ve d.

Copyright o p y r i g h t 2012, 2 0 1 2, SAS S A S Institute s t i t u tinc e In. c All. Arights l l r i g hreserved. t s r e s e r ve d. SAS & HADOOP IN-MEMORY TECHNOLOGIE BI & ANALYTIC LASR-based In-Memory Technology SAS Visual Analytics / Visual Statistics Business Analysten und Data Scientists Fokus auf interaktive Analysen SAS In-Memory Statistics Fokus auf Programmierung SAS High-Performance Analytics SAS Prozeduren aus den Bereichen Statistics, Data Mining, Text Analytics, Optimization übertragen auf verteilte In-Memory Technologie Frontend: Enterprise Miner Fokus auf Batch-Processing und Produktiv-Betrieb

C o p y r i g h t 2 0 1 2, S A S In s t i t u t e In c. A l l r i g h t s r e s e r ve d. SAS & HADOOP ANWENDUNGS SZENARIEN HADOOP ANALYTICS FÜR SPEZIALTHEMEN UND INPUT / ANREICHERUNG EDW BI and Analytics Operational Data Sources Data Mart Data Mart EDW Analytic Mart Analytic Mart Analytic Mart Data Mart

C o p y r i g h t 2 0 1 2, S A S In s t i t u t e In c. A l l r i g h t s r e s e r ve d. SAS & HADOOP ANWENDUNGS SZENARIEN Operational Data Sources HADOOP DATA PLATFORM ALS STAGING LAYER DATA LAKE Beladung HDFS, Auswertestrukturen in Hadoop, data appliances oder RDBMS EDW BI and Analytics Data Mart Data Mart Analytic Mart Analytic Mart

C o p y r i g h t 2 0 1 2, S A S In s t i t u t e In c. A l l r i g h t s r e s e r ve d. HADOOP IM EINSATZ ERGEBNISSE EINER UMFRAGE UNTER SAS KUNDEN, DIE BEREITS HADOOP EINSETZEN (EMEA/AP, 02.2015) Kunden nach Branchen Eingesetzte Hadoop Distributionen Produkte im Einsatz Einsatzszenarien Fraud 13% "Analytics" 42% Offload EDWH / Cost Reduction 32% "Data Lake" 13%

C o p y r i g h t 2 0 1 2, S A S In s t i t u t e In c. A l l r i g h t s r e s e r ve d. SAS ANGEBOT BIG DATA LAB Einsatzfertiges Komplettpaket für die selbständige Entwicklung von Big Data Use Cases zum Fixpreis Software- Lösungen TECHNOLOGIE Bereitstellung On- Premise Cloud Größenskalierung S M L Datenmanagement Data Loader for Hadoop Access to Hadoop Metadatenmanagement Analytics Visual Analytics Visual Statistics In-Memory Statistics Installation Konfiguration Training SERVICE Umsetzung eines beispielhaften Use Cases Zusätzlich buchbare Dienstleistungen: Coaching und Bereitstellung von Experten (Data Scientist, Daten- Management-Experte) Consulting

BIG DATA LAB IHRE VORTEILE Sie starten schneller. Sie minimieren das Risiko falscher Investments. Sie sparen Doppelarbeit und Doppelinvestitionen. Sie bezahlen genau das, was Sie brauchen. Copyr i g ht 2014, SAS Ins titut e Inc. All rights res er ve d.

C o p y r i g h t 2 0 1 2, S A S In s t i t u t e In c. A l l r i g h t s r e s e r ve d. SUMMARY SAS & HADOOP VIELFÄLTIGE UNTERSTÜTZUNG, MORE TO COME! 1. Data Management: SAS optimiert und erleichtert den Zugriff auf Daten in Hadoop 2. In-Memory Analytics: SAS erweitert und beschleunigt Analytik auf Hadoop-Daten. 3. In-Database Processing: SAS verlagert (analytische) SAS Funktionalität in das Hadoop Cluster.

Copyright o p y r i g h t 2012, 2 0 1 2, SAS S A S Institute s t i t u tinc e In. c All. Arights l l r i g hreserved. t s r e s e r ve d. UNSER ANGEBOT THINK BIG, START NOW! BIG DATA LAB Auf www.sas.de/bigdatalab alle Infos zum Nachlesen Kommen Sie ins Gespräch mit uns! PRODUKTE TESTEN SAS Data Loader for Hadoop kostenlos herunterladen und 90 Tage testen: www.sas.de/dataloader SAS Visual Analytics (Demo) kostenlos ausprobieren: www.sas.de/visualanalytics

INFORMATIONEN - KONTAKT SAS UND HADOOP INFORMATIONEN: http://www.sas.com/de_de/software/sas-hadoop.html - http://www.sas.com/en_us/software/sas-hadoop.html Interessante White papers: http://www.sas.com/en_us/whitepapers/big-data-analytics-hadoop-107049.html http://www.sas.com/en_us/whitepapers/bringing-power-of-sas-to-hadoop-105776.html BARC: Big data analytics in der DACH region: http://www.sas.com/de_de/whitepapers/ba-wp-barc-big-data-analytics-2014-2298353.html Webinare: http://www.sas.com/de_at/webinars.html Big Data Analytics mit SAS & Hadoop Big data lab Code Beispiele:http://support.sas.com/resources/papers/proceedings14/SAS033-2014.pdf Copyr i g ht 2014, SAS Ins titut e Inc. All rights res er ve d.

THANKS A LOT!! FRAGEN - next steps?? rainer.sternecker@sas.com, gerhard.svolba@sas.com, gernot.engel@sas.com DANKE! Copyr i g ht 2014, SAS Ins titut e Inc. All rights res er ve d.