PVFS (Parallel Virtual File System)

Ähnliche Dokumente

PVFS - Parallel Virtual File System Clusterseminar

OSL Storage Cluster und RSIO unter Linux Storage-Attachment und Hochverfügbarkeit in 5 Minuten

peer-to-peer Dateisystem Synchronisation

OFS: Ein allgemeines Offline-Dateisystem auf Basis von FUSE

XEN Performance. Projektpraktikum Informatik. Arne Klein Arne Klein () XEN Performance / 25

Storage Area Networks im Enterprise Bereich

LVM und ZFS reloaded

Lehrveranstaltung Speichersysteme Sommersemester Kapitel 13: Parallele Dateisysteme. André Brinkmann

Entwicklungen bei der Linux Clustersoftware

Oracle Real Application Clusters: Requirements

Filesystem in Userspace. Jens Spiekermann

Laufwerke unter Linux - Festplatten - - USB Sticks - September 2010 Oliver Werner Linuxgrundlagen 1

HBF IT-Systeme. BBU-BSK Übung 2 Stand:

Wie können Sie eine Client Lizenz wieder freigeben?

Verteiltes Persistenz-System. Mykhaylo Kabalkin

Linux-HA-Cluster Heartbeat mit DRBD

Lexware professional und premium setzen bis einschließlich Version 2012 den Sybase SQL-Datenbankserver

Persona-SVS e-sync GUI/Client Installation

ProSeminar Speicher- und Dateisysteme

Michael Flachsel. Das SAN an der TUB. Aufbau und Funktion. 15. November 2007

Speichernetze (Storage Area Networks, SANs)

Wo finde ich die Software? - Jedem ProLiant Server liegt eine Management CD bei. - Über die Internetseite

User Mode Linux. Sven Wölfel 15. April 2005

Freiberuflicher IT-Berater Schwerpunkte: Unix, Oracle, Netzwerk. Dipl.-Inform. Joachim Jäckel

Ceph. Distributed Storage Julian mino Klinck GPN

Client-Server mit Socket und API von Berkeley

4D Server v12 64-bit Version BETA VERSION

Neues in Hyper-V Version 2

Clustering mit Shared Storage. Ing. Peter-Paul Witta

Storage Management und Archivierung

Umbenennen eines NetWorker 7.x Servers (UNIX/ Linux)

Anleitung zur Nutzung des SharePort Utility

Konfiguration von Igel ThinClients fu r den Zugriff via Netscaler Gateway auf eine Storefront/ XenDesktop 7 Umgebung

Windows Integration. von Tino Truppel

Hochverfügbarkeit mit Windows Server vnext. Carsten Rachfahl Microsoft Hyper-V MVP

JEAF Cloud Plattform Der Workspace aus der Cloud

1 Voraussetzungen für Einsatz des FRITZ! LAN Assistenten

zur WinIBW Version 2.3

2. Braunschweiger Linux-Tage. Vortrag über RAID. von. Thomas King Braunschweiger Linux-Tage Seite 1/16

Wine - Windows unter Linux

MailUtilities: Remote Deployment - Einführung

Multimedia und Datenkommunikation

Aufbau einer Testumgebung mit VMware Server

LabView7Express Gerätesteuerung über LAN in einer Client-Serverkonfiguration. 1. Steuerung eines VI über LAN

OPERATIONEN AUF EINER DATENBANK

2 Die Terminaldienste Prüfungsanforderungen von Microsoft: Lernziele:

Folgende Einstellungen sind notwendig, damit die Kommunikation zwischen Server und Client funktioniert:

Einrichtung des Cisco VPN Clients (IPSEC) in Windows7

PoINT Storage Manager Installation

storage management (c) Till Hänisch 2003, BA Heidenheim

Nutzung von GiS BasePac 8 im Netzwerk

Oracle Automatic Storage Management (ASM) Best Practices

Verteilte Dateisysteme

msm net ingenieurbüro meissner kompetent - kreativ - innovativ

VMware als virtuelle Plattform

4. Network Interfaces Welches verwenden? 5. Anwendung : Laden einer einfachen Internetseite 6. Kapselung von Paketen

Hochverfügbare Virtualisierung mit Open Source

Fluent auf Windows HPC Server ict ag - Mit uns können Sie rechnen

Tips, Tricks und HOWTOs Virtualisierung für Profis und Einsteiger Serverkonsolidierung, Testumgebung, mobile Demo

Frederik Wagner Leibniz-Rechenzentrum der Bayerischen Akademie der Wissenschaften

Agenda. Einleitung Produkte vom VMware VMware Player VMware Server VMware ESX VMware Infrastrukture. Virtuelle Netzwerke

FileLock FLEXIBLE SKALIERBARE KOSTENEFFIZIENTE HARDWARE- UNABHÄNGIGE LÖSUNGEN ZUR LANG-ZEIT DATENARCHIVIERUNG YOUR DATA.

> Soft.ZIV. Maple Mathematisches Software System

Test mit lokaler XAMPP Oxid Installation

GPFS im Medienumfeld. Anwendungsbeispiel On-Demand Videoproduktion. Andreas Musch - ZDF

ein verteiltes und repliziertes Dateisystem XtreemOS IP project is funded by the European Commission under contract IST-FP

Hardware- und Softwareanforderungen für die Installation von California.pro

Allgemeine Anforderungen zum Einsatz von (gültig ab Version 45.xx.xx)

WINDOWS 8 WINDOWS SERVER 2012

Was ist PDF? Portable Document Format, von Adobe Systems entwickelt Multiplattformfähigkeit,

Praktische Anleitung zu Konfiguration von PPTP Verbindungen

Securepoint Security Systems

Print2CAD 2017, 8th Generation. Netzwerkversionen

Installationsanleitung für pcvisit Server (pcvisit 12.0)

Verteilte Systeme. Verteilte Systeme. 9 Verteilte Dateisysteme SS 2015

Virtual Channel installieren

DNS-325/-320 und FXP

Kooperativer Speicher: Schwächen und Gegenmaßnahmen

Trackaufzeichnungen können als Active-Logs oder mit eigenen Namen versehene und auf max. 500 Punkte begrenzte Saved-Tracks gespeichert werden.

Citrix Provisioning Server Marcel Berquez. System Engineer

INSTALLATIONSANLEITUNG der Version 2.1 (Jänner 2014)

Lizenzen auschecken. Was ist zu tun?

Fragen und Antworten. Kabel Internet

2. Installation unter Windows 8.1 mit Internetexplorer 11.0

mywms Vorlage Seite 1/5 mywms Datenhaltung von Haug Bürger

Verwendung von SD-Speicherkarten über den SPI-Bus

Anleitung zur Installation des Printservers

Workshop: Eigenes Image ohne VMware-Programme erstellen

Datensicherheit und Hochverfügbarkeit

HMK Open Day 28. Januar 2009 Kronberg. Hierarchisches Storage Management mit SUN SAM-FS

Firewalls für Lexware Info Service konfigurieren

HA Linux Cluster in der Praxis

Lehrveranstaltung Grundlagen von Datenbanken

Transkript:

Management grosser Datenmengen PVFS (Parallel Virtual File System) Thorsten Schütt thorsten.schuett@zib.de Management grosser Datenmengen p.1/??

Inhalt Einführung in verteilte Dateisysteme Architektur von PVFS Komponenten Installation Benchmarks Management grosser Datenmengen p.2/??

Anforderungen an verteilte Dateisysteme globaler Namensraum hohe Geschwindigkeit Robustheit, Redundanz Backups Locking grosse Dateien Management grosser Datenmengen p.3/??

Globale Dateisysteme / Single-Server Beispiel: NFS-Server Probleme: langsam, Bandbreite durch Netzwerkkarte am Server begrenzt High Speed Disk Vorteil: keine Redundanz simple Architektur Management grosser Datenmengen p.4/??

Globales/verteiltes Dateisystem Beispiel: PVFS,... Probleme: Namensraum High Speed Disk High Speed Disk High Speed Disk High Speed Disk Konsistenz, es soll von jeder Datei eine Version geben Vorteil: eventuell Redundanz schneller? Management grosser Datenmengen p.5/??

PVFS Clemson University (http://parlweb.parl.clemson.edu/pvfs/) Geschichte: älter als 1996 Lizenz: GNU unterstützte Architekturen: x86/linux:2.2er und 2.4er Kernel Alpha/Linux:2.2er und 2.4er Kernel Ziele: Forschungsplattform Geschwindigkeit Management grosser Datenmengen p.6/??

Was heisst Parallel Virtual File System File System ermöglicht dem Benutzer das Speichern und Laden von Dateien mit den üblichen Funktionen(open, read, write, close) Parallel speichert die Daten auf mehreren Rechnern Virtual Das File System besteht eigentlich aus mehreren User-Space Deamons, die auf das lokale File System zugreifen Management grosser Datenmengen p.7/??

Architektur von PVFS verschiedene Aufgaben/Rollen im Cluster file manager: Meta-Daten I/O server: Daten client Kommunikation über TCP Es wird das vorhandene Filesystem benutzt und auch das Authenitfizierungssystem. Management grosser Datenmengen p.8/??

Installation/Administration (I) Server: pvfs-1.5.2-pre4.tgz:./configure && make && make install iod, mgr.iodconf,.pvfsdir, /etc/iod.conf /usr/local/sbin/mgr /usr/local/sbin/iod Management grosser Datenmengen p.9/??

Installation/Administration (II) Client: pvfs-kernel-0.9.2-pre5.tgz:./configure && make && make install pvfs.o, pvfsd, mount.pvfs /dev/pvfsd insmod pvfs pvfsd mount.pvfs node001:/pvfs... Management grosser Datenmengen p.10/??

File striping (I) Metadata, die auf mgr gespeichert werden Zugriffsrechte Besitzer, Gruppe physical distribution of the file data Basis-Knoten Anzahl der IO Knoten Stripe-Grösse /pvfs/foo Management grosser Datenmengen p.11/??

File striping (II) Global wird eine Ordnung der IO-Knoten gespeichert. file manager muss während read/write nicht kontaktiert werden. Die Metadaten werden zwischen open und close lokal zwischengespeichert. Management grosser Datenmengen p.12/??

Der endlose Weg der Daten durch das FS(I) Host 1 Host 2 User Space Kernel Space App open /mnt/pvfs/foo Glibc pvfsd Systemcall VFS Treiber /dev/pvfsd INode Mapping req: pvfs/foo TCP/IP Network device Netz ack TCP/IP Network device mgr /pvfs_meta/foo VFS ext2 Blockdevice Harddisk normaler Kommunikationsweg Shortcut mit pvfs lib Management grosser Datenmengen p.13/??

Der endlose Weg der Daten durch das FS (II) Host 1 Host 2 User Space Kernel Space App Glibc VFS read: /mnt/pvfs/foo pvfsd Systemcall req:read Block Treiber /dev/pvfsd INode Mapping TCP/IP Network device Netz TCP/IP Network device iod /pvfs_data/001/f1092157504 VFS ext2 Blockdevice Harddisk normaler Kommunikationsweg Shortcut mit pvfs lib Management grosser Datenmengen p.14/??

Schnittstellen zum System Man kann normale UNIX Dateioperationen benutzen. Kernel-Modul (transparent) glibc-wrapper (deprecated) erweiterte Schnittstelle:strided Zugriffe native PVFS-Bibliothek MPI-IO Management grosser Datenmengen p.15/??

Einschränkungen Filegröße:, wobei (bedingt durch Linux) die Anzahl der I/O-Server ist Links nach pvfs funktionieren aber nicht von pvfs. Zum Caching wird das Betriebssystem benutzt(vfs) kein Netzwerkcache Management grosser Datenmengen p.16/??

Fehlende Features Hinzufügen und löschen von IO-Knoten funktiert nicht online! keine Redundanz keine Rekonstruierung von Daten single points of failure Manager-Deamon IO-Deamon Aber man kann auf den IO-Knoten RAID etc benutzen. Management grosser Datenmengen p.17/??

Datentransfer-Benchmark Benutzte Konfiguration: Fast-Ethernet/Myrinet (10.2/37.7MB/s ttcp Messung) PVFS Bibiliothek, nicht Kernel-Modul! 500MHz PIII mit 512MB RAM stripe size: 16KB gesamt 60 Knoten-Cluster Netzwerk-Topologie Management grosser Datenmengen p.18/??

Ethernet/Lesen Management grosser Datenmengen p.19/??

Ethernet/Schreiben Management grosser Datenmengen p.20/??

Myrinet/Lesen Management grosser Datenmengen p.21/??

Myrinet/Schreiben Management grosser Datenmengen p.22/??

Resultate Skalierbarkeit von Fast-Ethernet erreicht Myrinet verhält sich unter hoher Last besser war nur synthetischer Test(peak performance) - 50-60% in echten Anwendung (flow solver) beobachtet Management grosser Datenmengen p.23/??

Eigene Erfahrungen die Blockgröße ist wichtig! dd am besten bei 32KB/Block Installation Management grosser Datenmengen p.24/??

geplante weitere Entwicklung abstrakte Kommunikationsschicht: ST,... strided Zugriffe verbessern Performance Tuning Entwickler vernachlässigen Redundanz siehe weitere Features Management grosser Datenmengen p.25/??