Hadoop-as-a-Service (HDaaS)



Ähnliche Dokumente
Test zur Bereitschaft für die Cloud

Wege in die private Cloud: Die Lösung von INNEO auf Basis von FlexPod Datacenter

EMC. Data Lake Foundation

Next Generation Datacenter Automation und Modularisierung sind die Zukunft des Datacenters

Der Weg in das dynamische Rechenzentrum. Jürgen Bilowsky Bonn

PROFI UND NUTANIX. Portfolioerweiterung im Software Defined Data Center

Dateisysteme und Datenverwaltung in der Cloud

IT-Lösungsplattformen

Infrastruktur als Basis für die private Cloud

Zend PHP Cloud Application Platform

Integration von Mechatronik- und Softwaresystemen durch Virtualisierung von PLM-System-Komponenten

Vorstellung SimpliVity. Tristan P. Andres Senior IT Consultant

WIE ERHÖHT MAN DIE EFFIZIENZ DES BESTEHENDEN RECHENZENTRUMS UM 75% AK Data Center - eco e.v. 1. Dezember 2009

Time To Market. Eine Plattform für alle Anforderungen. Lokale Betreuung (existierende Verträge und Vertragspartner, ) Kosten

Hyper-Converged - Weniger ist mehr!

HP STOREVIRTUAL STORAGE. Erweiterbarer Speicher für virtualisierte Umgebungen

Der Desktop der Zukunft ist virtuell

Big Data Informationen neu gelebt

Die Plattform für Ihre Datenfabrik unabhängig von Ort und Zeit

Peter Garlock Manager Cloud Computing Austria. Cloud Computing. Heiter statt wolkig IBM Corporation

Track 4. Anwendungsbeispiel. Automatisierte Bereitstellung eines Test- & Entwicklungssystems

Virtualisierung im Rechenzentrum

Virtualisierung im IT-Betrieb der BA

Simplify Business continuity & DR

Klicken. Microsoft. Ganz einfach.

Complex Hosting. Whitepaper. Autor.: Monika Olschewski. Version: 1.0 Erstellt am: ADACOR Hosting GmbH

Das perfekte Rechenzentrum mit PernixData Architect & FVP

Serverkonsolidierung durch Einsatz von VMware Virtual Infrastructure 3 (VI3)

Data Center Automa-on for the Cloud. Pascal Petsch

09:45 10:45 Keynote - Ein Blick in die Zukunft: Wie künftige Anforderungen die IT-Infrastruktur beeinflussen

Dynamische Änderung von Ressourcen in OpenStack

Hybride Cloud-Infrastrukturen Bereitstellung & Verwaltung mit System Center 2012

"Es werde Cloud" - sprach Microsoft

VMware Software -Defined Data Center

Jung Dynamisch Virtualisiert? Risiken der Realisierung

Virtualisierung und Management am Desktop mit Citrix

virtualization and clustering made simple OSL AKTUELL 2015

Data Protection von Microsoft Applikationen mit Tivoli Storage Manager

IT-Dienstleistungszentrum Berlin

Herausforderungen des Enterprise Endpoint Managements

June Automic Hadoop Agent. Data Automation - Hadoop Integration

synergetic AG Open House 2012 Ihr Unternehmen in der Wolke - Cloud Lösungen von synergetic

Februar Newsletter der all4it AG

Hochverfügbarkeit mit Windows Server vnext. Carsten Rachfahl Microsoft Hyper-V MVP

» Hyper-V Best Practice Microsofts Virtualisierung professionell einsetzen

Produkte und Systeme der Informationstechnologie ENERGIE- MANAGEMENT

Szenarien zu Hochverfügbarkeit und Skalierung mit und ohne Oracle RAC. Alexander Scholz

Dell Data Protection Solutions Datensicherungslösungen von Dell

VMware View: Design-Konzepte, Virenschutz und Storage. SHE Informationstechnologie AG. Thorsten Schabacker, Senior System Engineer

Cloud? Vertrauen kann sich nur entwickeln. Genau wie Ihr Business.

DDC. Dynamic Data Center. Hendrik Leitner München, 29. November 2004

Agenda. TERRA CLOUD GmbH Zahlen, Daten, Fakten Private & Hybrid Cloud Szenarien Public Cloud Szenarien Lessons Learned

Cloud Computing mit der Windows Azure Platform

Acceleris Data Center Consulting IT auf dem Weg zur Industrialisierung

Seminar im Wintersemester 2008/2009. Complex and Distributed IT-Systems TU Berlin

MANAGED BUSINESS CLOUD. Individuell. Flexibel. Sicher.

SQL Azure Technischer Überblick. Steffen Krause Technical Evangelist Microsoft Deutschland GmbH

Sicher, schnell, hochverfügbar : Interxion und cloudgermany.de. Interxion Cloud Hubs als Bodenstation für die Cloud Germany

MATCHING VON PRODUKTDATEN IN DER CLOUD

OSL Storage Cluster und RSIO unter Linux Storage-Attachment und Hochverfügbarkeit in 5 Minuten

vsphere vs. HyperV ein Vergleich aus Sicht eines VMware Partners interface:systems

Keep your SAN simple Spiegeln stag Replizieren

Cloud Zertifizierung und Kompetenz. Hendrik A. Reese, Principal Consultant, TÜV Rheinland

OS-Virtualisierung mit Solaris Zonen in der Praxis

Customer Reference Case: Microsoft System Center in the real world

IT-Effizienzworkshop bei New Vision GmbH Entry und Midrange Disksysteme

Ein Hypervisor alleine macht nicht glücklich Interessante Add-Ons zu VMware vsphere

best Systeme GmbH Michael Beeck Geschäftsführer, CTO best Systeme GmbH

Was ist Windows Azure? (Stand Juni 2012)

Streamworks IT Prozess Automation

Neues in Hyper-V Version 2

Themen des Kapitels. 2 Übersicht XenDesktop

Reche. jede Art von Daten Mitarbeiterorientierte IT

ETL in den Zeiten von Big Data

CLOUDLÖSUNGEN FÜR DEN MITTELSTAND BUILD YOUR OWN CLOUD

Selectron Fleet Diagnosis

Einführung in Hadoop

KONICA MINOLTA IT SOLUTIONS GMBH IT-INFRASTRUKTUR

Zend Server Cluster Manager

expect more Verfügbarkeit.

Persönliche Einladung. Zur IT Managers Lounge am 4. November 2009 in Köln, Hotel im Wasserturm.

IT im Wandel Kommunale Anforderungen - zentrales Clientmanagement versus Standardtechnologie!?

Open Source als de-facto Standard bei Swisscom Cloud Services

Dialogik Cloud. Die Arbeitsumgebung in der Cloud

AEQUO Adaptive und energieeffiziente Verteilung von virtuellen Maschinen in OpenStack-Umgebungen

Systeme 1. Kapitel 10. Virtualisierung

4 Planung von Anwendungsund

herzlich vsankameleon Anwendungsbeispiel Titelmasterformat durch Klicken bearbeiten willkommen Titelmasterformat durch Klicken bearbeiten

Enterprise Program Management Service

Cloud Kongress Umfrage. Reinhard Travnicek / X-tech

Vision: ICT Services aus der Fabrik

Das Citrix Delivery Center

Lösungen rund um das Zentrum der Virtualisierung

Bewertung der Methoden zur Sicherung von virtuellen Maschinen (VMware, Hyper-V) Ein Erfahrungsbericht

WISSENSWERTES ÜBER WINDOWS SCALE-OUT FILE SERVER

Immer noch wolkig - aktuelle Trends bei Cloud Services

Hitachi File & Content Services: Hitachi NAS Plattform. Uwe Angst NAS Business Manager

Cloud Ecosystem Autumn Meeting Cloud Plattformen in der Praxis. 3. November 2015 examio GmbH

Transkript:

Hadoop-as-a-Service (HDaaS) Flexible und skalierbare Referenzarchitektur Arnold Müller freier IT Mitarbeiter und Geschäftsführer Lena Frank Systems Engineer @ EMC Marius Lohr Systems Engineer @ EMC

Fallbeispiel: CIO eines DAX Unternehmens klassische IT Dienste: neue IT Dienste:

Die Möglichkeiten neue Geschäftsfelder Umsatzsteigerung Risikominimierung hjdfhjdsfh Verbesserung operatives Geschäft

Die Herausforderungen Kostendruck ggü. Cloud Anbietern Fehlendes Wissen über Hadoop Infrastrukturen Schnelles Deployment Anforderungen und Workloads mehrere Mandanten Hochverfügbarkeit und Datensicherheit

Klassische Hadoop Architektur Sqoop PIG Mahout Hive HBase NameNode Job Tracker Task Tracker DataNode 2 nd NameNode Data Node + Compute Node Data Node + Compute Node Data Node + Compute Node Ethernet NameNode Data Node + Compute Node Data Node + Compute Node Data Node + Compute Node

Klassische Hadoop Architektur dedizierte Serverumgebung mit lokalemstorage Hardware und Kapazität nur für Hadoop Daten gedacht Effizienz schlechte CPU Auslastung da auf Lastspitzen zugeschnitten 3-fach Spiegelung(300% Brutto) durch Hadoop Architektur Skalierungsmöglichkeiten starresverhältnisvon Compute Node zudata Node Fehlertoleranz bei Namenode NameNode ist nicht geschützt Enterprise Class Dienste Fehlende Datensicherungskonzepte wie Snapshots, Replikation, Backup Keine logische Trennung von Mandanten

Hadoop Architektur mit konsolidiertem HDFS Storage Sqoop Mahout Hive HBase NameNode PIG Job Tracker Task Tracker DataNode Compute Node Compute Node Compute Node Ethernet H D F S name node data node Compute Node Compute Node Compute Node

Project Serengeti Open-Source Projekt Schnelles Deploymentvon HadoopClustern in virtuellen Umgebungen VM VM vcenter Management Server Templates Hadoop Node Hadoop Node vsphere + Serengeti Host Host Host Host

Hadoop-as-a-Service Referenzarchitektur SelfService Portal Serengeti Orchestration & Chargeback User Management Hadoop virtuell Compute Node Compute Node Compute Node vcenter physikalisch H D F S Name node data node Infrastructure Mgmnt

HDaaS Workflow Data Scientist 7: Access and Analyze 1: Request SELF SERVICE PORTAL 3: Invoke 6: Notify ORCHES TRATOR 6: Notify 4b: Provision Compute SERENG ETI Hadoop Cluster 5: Instantiate PIVO- TAL HD PIVO-HD WORKER TAL HD MASTER HD WORKER MASTER 2: Validate 4a: Provision Storage USER/ TENANT MGMT AD HDFS/ REST API Shared HDFS Storage

Vorteile einer entkoppelten und virtualisierten Hadoop Infrastruktur unabhängige Skalierung der Infrastruktur Compute und Data Nodes voneinander unabhängig erweiterbar Data Scientist bessere Ausnutzung der IT Infrastruktur >80% Storage Utilization, verbesserte CPU Utilization parallele Workloads von non-hadoop Applikationen auf gleicher Hardware Virtualisierte Hadoop Cluster automatisierte Bereitstellung und einfaches Management konsolidierter HDFS Speicher Compute Templates als Basis für schnelles Deployment SharedHDFS Storage Hadoop-as-a-Service Referenzarchitektur Mandantentrennung Logische Trennung der Datenzugriffe Logische Trennung der Compute Nodes Fehlertoleranzen für Name Nodes Name Node ist Bestandteil des HDFS zusätzlicher Schutz der Daten Snapshots, Replikation, Backup

Haben Sie noch Fragen?