Cloud-Infrastrukturen Seminar Cloud Data Management WS09/10



Ähnliche Dokumente
Was ist Amazon RDS? Datenbank Typen DB Instanzen Features. Live Demo Fazit. Amazon RDS - Till Ganzert

MATCHING VON PRODUKTDATEN IN DER CLOUD

Cloud-Infrastrukturen

Cloud Computing mit mathematischen Anwendungen

SKILLCLUSTER Schwalbenrainweg 30a Aschaffenburg Tel.: +49 (0)700-SCLUSTER Fax: +49 (0)700-SKILLS4U Mail:

Aufbau eigener Cloud-Infrastrukturen mit Eucalyptus Hochschule Mannheim

Prof. Dr.-Ing. Rainer Schmidt 1

Dateisysteme und Datenverwaltung in der Cloud

FlexiScale - Web Hosting mit Cloud-Computing Hochschule Mannheim

Seminar Cloud Data Management WS09/10. Tabelle1 Tabelle2

Was ist Windows Azure? (Stand Juni 2012)

Gliederung. Was ist Cloud Computing Charakteristiken Virtualisierung Cloud Service Modelle Sicherheit Amazon EC2 OnLive Vorteile und Kritik

MapReduce. Johann Volz. IPD Snelting, Lehrstuhl Programmierparadigmen

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

MICROSOFT WINDOWS AZURE

Unternehmen-IT sicher in der Public Cloud

Preise und Leistungen Dynamic Computing Services

Räumliche Verteilung der HFT-Studierenden analysiert in der Cloud

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse?

Apache Lucene. Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org

Virtual Elastic Services

Next Generation IaaS von ProfitBricks

Der Nutzen und die Entscheidung für die private Cloud. Martin Constam Rechenpower in der Private Cloud 12. Mai 2014

Auto-Provisionierung tiptel 30x0 mit Yeastar MyPBX

Citrix Provisioning Server Marcel Berquez. System Engineer

Ruben Deyhle Proseminar Konzepte für Daten- und Prozess-Management. Cloud Computing mit Windows Azure

Lokale Installation von DotNetNuke 4 ohne IIS

Preisvergleich ProfitBricks - Amazon Web Services M3 Instanz

I N F O R M A T I O N V I R T U A L I S I E R U N G. Wir schützen Ihre Unternehmenswerte

Amazon Relational Database Service

HANDBUCH LSM GRUNDLAGEN LSM

Projektgruppe Algorithmen für die Cloud-unterstützte 3-D-Darstellung auf mobilen Endgeräten

Hochverfügbare Virtualisierung mit Open Source

Next Generation Cloud

Projektarbeit/SHK-Tätigkeit: Entwicklung graphischer Visualisierungskomponenten

June Automic Hadoop Agent. Data Automation - Hadoop Integration

AEQUO Adaptive und energieeffiziente Verteilung von virtuellen Maschinen in OpenStack-Umgebungen

Vorwort Azure Cloud Computing mit Microsoft Danksagungen Kontakt zum Autor... 13

Konzeption und Entwicklung einer an YouTube orientierten Lösung für Video-Streaming auf Basis von Cloud Computing-Diensten

Big Data in der Forschung

WELCOME. Nutzen der Cloud für eine optimale Performance. Patrick Schwanke Quest Software GmbH. Martin Schmitter Trivadis GmbH. 10.

HERZLICH WILLKOMMEN SHAREPOINT DEEP DIVE FOR ADMINS IOZ AG 2

Enterprise Applikation Integration und Service-orientierte Architekturen. 09 Simple Object Access Protocol (SOAP)

Prozessarchitektur einer Oracle-Instanz

Definition Informationssystem

2. ERSTELLEN VON APPS MIT DEM ADT PLUGIN VON ECLIPSE

Installationsanleitung. ipoint - Server

GoGrid Hochschule Mannheim

EMC. Data Lake Foundation

System Center Essentials 2010

Private Cloud mit Eucalyptus am SCC

GIS in der Cloud: Beispiele von ESRI und con terra

Dynamische Änderung von Ressourcen in OpenStack

Online Data Protection

Vorstellung SimpliVity. Tristan P. Andres Senior IT Consultant

KURZANLEITUNG CYBERDUCK MIT CLOUD OBJECT STORAGE

Cloud-Computing. 1. Definition 2. Was bietet Cloud-Computing. 3. Technische Lösungen. 4. Kritik an der Cloud. 2.1 Industrie 2.

Cloud-Architekturen auf verschiedenen Ebenen Seminar: Datenbankanwendungen im Cloud Computing

Was darf das Grid kosten?

Apache HBase. A BigTable Column Store on top of Hadoop

IntelliRestore Seedload und Notfallwiederherstellung

Die Bausteine der AWS Web Services

Win-Digipet V 9.2 Premium Edition Wie bastele ich mir steuerbare Kontakte. Wie bastele ich mir steuerbare Kontakte? -Quick-And-Dirty-Lösung-

Projektpraktikum: Verteilte Datenverarbeitung mit MapReduce

Physiotherapeutisches Expertentool im cloudbasierten. AW1 Nicolas With Betreuer: Olaf Zukunft

WIE ERHÖHT MAN DIE EFFIZIENZ DES BESTEHENDEN RECHENZENTRUMS UM 75% AK Data Center - eco e.v. 1. Dezember 2009

Mikrocontroller Grundlagen. Markus Koch April 2011

Anleitung zum Intel Matrix Storage Manager

Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen

Die technischen Aspekte von Mapping-Lösungen

PERFORMANCE TESTS AVALON ODS-SERVER DR. REINHARD HALLERMAYER, BMW GROUP

Neues in Hyper-V Version 2

Workshop: Eigenes Image ohne VMware-Programme erstellen

Data. Guido Oswald Solution Switzerland. make connections share ideas be inspired

Big Data Mythen und Fakten

peer-to-peer Dateisystem Synchronisation

EXCHANGE Neuerungen und Praxis

Kopplung von Datenbanken

Konfiguration Firewall (Zyxel Zywall 10) (von Gruppe Schraubenmeier)

SEMT. Prof. G. Bengel. Searching as a Service (Programming Model: MapReduce)

Einrichtung des Cisco VPN Clients (IPSEC) in Windows7

WINDOWS 10 Upgrade. Beispiel: Desktop-Ausschnitt von vorhandenem WIN 8.1 (rechte Ecke der Taskleiste)

Kommunikation, Information und mobile verteilte Systeme (KIS)

Ressourcenmanagement in Forschung und Entwicklung Grünenthal integriert SAS in sein Berechtigungs- und Mandantenkonzept 7.

Online-Werbung. Welche Möglichkeiten der Online-Annoncen gibt es? Google AdWords und Co.

Kurzanleitung ejax Online-Demo

WINDOWS 8 WINDOWS SERVER 2012

4D Server v12 64-bit Version BETA VERSION

Carl-Engler-Schule Karlsruhe Datenbank 1 (5)

LOAD BALANCING LASTVERTEILUNG BEI INTERNETANWENDUNGEN

Gewährleistung und SoftwaremieteVortrag im Rahmen der Veranstaltung IT-Recht - Grundlagen für Informatiker

WINDOWS AZURE IM ÜBERBLICK GANZ NEUE MÖGLICHKEITEN

Installation von NetBeans inkl. Glassfish Anwendungs-Server

KVM Performance Optimierungen auf Hypervisor / Linux Eben

Losfahrertreffen 2015

Paravirtualisierung (2)

MULTINETWORKING MEHR ALS NUR EIN NETZWERK. Oktober 2010

Anleitung zur Software-Installation. ENDEAVOUR 1001 Version Deutsch

datenfabrik. Validieren von -Adressen 1

Transkript:

Cloud-Infrastrukturen Seminar Cloud Data Management WS09/10 Richard Beyer 1

Inhalt 1. Allgemeines 2. Amazon EC2 3. Yahoo Cloud 4. Vergleich 5. Fazit 6. Literatur Richard Beyer 2

Definition Cloud computing is using the internet to access someone else's software running on someone else's hardware in someone else's data center - Lewis Cunningham on-demand computing instances (z.b. Amazon AWS) on-demand computing capacity (z.b. Yahoo) Richard Beyer 3

Allgemeiner Aufbau Beide Architekturen bestehen aus lose gekoppelten Rechnern, ABER 1. On-Demand Computing Instances liefert miet- oder kaufbare Instanzen an Rechnerkapazität 2. On-Demand Computing Capacity bietet reine Daten- oder Rechenleistung zur Unterstützung rechenintensiver Algorithmen oder sehr großer Datenmengen Richard Beyer 4

Amazon Webservices und mehr. Richard Beyer 5

Reserved / on-demand instances mietbar Über webinterface sog. AMIs konfigurierbar (Amazon machine image) AMI erstellen AMI in S3 laden Netzwerk / Sicherheit konfigurieren AMI starten Richard Beyer 6

Instanz Typen Standard Instances Small (Default) 1.7 GB of memory, 1 EC2 CU 160 GB of instance storage, 32-bit platform Large 7.5 GB of memory, 4 EC2 CU 850 GB of instance storage, 64-bit platform Extra Large 15 GB of memory, 8 EC2 CU 1690 GB of instance storage, 64-bit platform High-Memory Instances High-Memory Double Extra Large Instance 34.2 GB of memory, 13 EC2 CU, 850 GB of instance storage, 64-bit High-Memory Quadruple Extra Large Instance 68.4 GB of memory, 26 EC2 CU, 1690 GB of instance storage, 64-bit High-CPU Instances High-CPU Medium Instance 1.7 GB of memory, 5 EC2 CU, 350 GB of instance storage, 32-bit High-CPU Extra Large Instance 7 GB of memory, 20 EC2 CU, 1690 GB of instance storage, 64-bit EC2 Compute Unit => 1.0-1.2 GHz 2007 Opteron or 2007 Xeon processor Richard Beyer 7

Preise Amazon EC2 Zuzügl. Transferkosten + Extra-Services Richard Beyer 8

Key/Value basierter Filehost-Service Daten werden in amazonweit eindeutigen Buckets zusammengefasst Pro Bucket beliebig viele Dateien zw. 1B-5GB Host-Auswahl USA oder Europa möglich Zugriff über SOAP oder BitTorrent z.b. Beispiel: http://db1.s3.amazonaws.com/db1.mdb Kosten: $0.170 per GB next 50 TB / month of storage used $0.10 In / $0.17-$0.10 Out Transferkosten $0.12/1000 Transactions oder 10000 GET Richard Beyer 9

Einfaches verteiltes Datenbankmanagementsystem Einfachste Datenbankfunktionen Verzicht auf Schema, keine Joins, keine semantischen Integritätsbedingungen Dafür automatische Indizierung aller Daten Keine Administration & Wartung notwendig Kosten: $0.154 pro Amazon SimpleDB Machine Hour 0.10$ In / 0.17$ - 0.10$ Out Transferkosten Richard Beyer 10

Content Distribution Service Baut auf Amazon S3 auf und kopiert in S3 gespeicherte Daten zu geografisch unterschiedlichen Speicherknoten Ermöglicht niedrigere Latenzzeiten und höhere Datenübertragungsraten Kosten: Ähnlich wie bei S3 Zuzüglich Kosten für die Verteilung der Originaldateien von Amazon S3 Richard Beyer 11

Messaging-Service Erstellung eigener Message-Queues möglich Datenvolumen bis zu 8KB pro Message Messages werden 4 Tage gespeichert Können simultan abgerufen und gespeichert werden Einfaches Sperren beim Verarbeiten möglich Kosten: $0.01 pro 10000 Requests $0.10 In / $0.17-$0.10 Out Transferkosten Zw. EC2 & SQS kostenlos Richard Beyer 12

MapReduce-Service mit Hilfe vom Hadoop- Framework Kombiniert Amazon EC2 und Amazon S3 Teilt rechen- oder datenintensive Aufgaben in Teilaufgaben und fasst deren Ergebnisse dann wieder zusammen Kosten Small EC2 Unit $0.095/h + $0.015/h MapReduce Richard Beyer 13

Überblick Gesamtpreis Small System Webserver Richard Beyer 14

Richard Beyer 15

Allgemeiner Aufbau der Yahoo Cloud Richard Beyer 16

Edge Services Routing & Caching Vergleichbar mit Amazons CloudFront Geografisch orientierte Zwischenspeicherung von Inhalten Routing-Optimierung Richard Beyer 17

Messaging Nachrichtensystem für Kommunikation zwischen Cloudkomponenten Beispiel: Updatebenachrichtigung für Edge Services (Update oder Fehlerfall) Richard Beyer 18

Hadoop System für Parallelverarbeitung großer Datenmengen oder komplexer Algorithmen Hat bei Yahoo! Zugriff auf Sherpa und MObStor Eingesetzt für semantisch optimierte Werbung, Spamreduzierung oder allgemeine Suchalgorithmen bei Yahoo! Search Yahoo! WebMap Hadoop auf 10.000 Core- Linux-System mit 300TB komp. Daten Ergebnis: 33% Leistungssteigerung Richard Beyer 19

MObStor Virtualisierung der Hardware von SAN Systemen Bereitsstellung von Datenspeicher mit einfacher Zugriffsschnittstelle Zugriff auf Daten via URL Unterstützt Streaming und Caching von Daten Eingesetzt bei Yahoo! Mail, Bilder, Maps, Werbung Richard Beyer 20

Sherpa (PNUTS) Einfaches relationales Datenbanksystem Reguläre Tabellen, Datensätze und Attribute Auch blobs möglich, kann beliebige Inhalte und Strukturen beinhalten Einfache Anfrageoperationen Komplexere Anfragen, JOINS aus Performancegründen nicht unterstützt Zugriff via Hadoop möglich Richard Beyer 21

Vergleich Amazon AWS Yahoo! Cloud Funktion Amazon EC2 VMs (Provisioning Service) Bereitstellen einzelner virtueller Rechner Amazon S3 MObStor Simpler Filehosting-Service, mit Vorteil des schnellen Zugriffs und großer Dateien Amazon RDS / Simple DB Sherpa Datenbanksystem Amazon Elastic Map Reduce Hadoop + HDFS Parallelverarbeitung komplexer Prozesse Amazon SQS Message Broker Simpler Nachrichtenaustausch zwischen Instanzen Amazon Cloud Front Edge Caching / Edge Routing Geografisch orientiertes Cachen von Daten zur Optimierung von Zugriffszeiten Richard Beyer 22

Fazit Ähnlichkeiten Infrastrukturebene Modulare Architektur Unterschiede On Demand Instances / Capacity Betriebszweck Richard Beyer 23

Literatur [AWS EC2]: http://aws.amazon.com/ec2/, aufgerufen 27.12.2009. [AWS SEC]: http://aws.amazon.com/security, aufgerufen 27.12.2009. [BRANTNER 2008]: M. Brantner, D. Florescu et al., Building a database on S3., SIGMOD 2008. [Cooper 2008]: B. F. Cooper, R. Ramakrishnan, U. Srivastava, et al., PNUTS: Yahoo! s hosted data serving platform. VLDB, 1(2):1277 1288, 2008. [COOPER 2009]: B. Cooper, E. Baldeschwieler et al., Building a Cloud for Yahoo!, IEEE DE Bulletin, 2009. [GROSSMAN, GU 2009]: Robert L. Grossman, Yunhong Gu, On the Varieties of Clouds for Data Intensive Computing, http://sites.computer.org/debull/a09mar/grossman.pdf, aufgerufen 27.12.2009. [HADOOP]: http://hadoop.apache.org/, aufgerufen 27.12.2009. [YAHOO DEV]: http://developer.yahoo.net/blog/archives/2009/07/mobstor.html, aufgerufen 27.12.2009. Richard Beyer 24

Vielen Dank für ihre Aufmerksamkeit! Fragen? Richard Beyer 25