Große Dateisysteme effizient verwalten

Ähnliche Dokumente
AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

SEMINAR Modifikation für die Nutzung des Community Builders

Upgrade auf die Standalone Editionen von Acronis Backup & Recovery 10. Technische Informationen (White Paper)

Übung - Datensicherung und Wiederherstellung in Windows Vista

SharePoint Demonstration

Handbuch ECDL 2003 Modul 2: Computermanagement und Dateiverwaltung Dateien löschen und wiederherstellen

SAP Memory Tuning. Erfahrungsbericht Fritz Egger GmbH & Co OG. Datenbanken sind unsere Welt

1 Was ist das Mediencenter?

Anwendungsbeispiele. Neuerungen in den s. Webling ist ein Produkt der Firma:

Bilder zum Upload verkleinern

KURZANLEITUNG CLOUD OBJECT STORAGE

mysql - Clients MySQL - Abfragen eine serverbasierenden Datenbank

Übung - Datensicherung und Wiederherstellung in Windows 7

ISA Server 2004 Protokollierung - Von Marc Grote. Die Informationen in diesem Artikel beziehen sich auf:

Alle alltäglichen Aufgaben können auch über das Frontend durchgeführt werden, das in den anderen Anleitungen erläutert wird.

BERECHTIGUNGEN IM ÜBERBLICK. protecting companies from the inside out

BitDefender Client Security Kurzanleitung

Updatehinweise für die Version forma 5.5.5

esearch one-single-point-of-information Federated Search Modul

Daten Sichern mit dem QNAP NetBak Replicator 4.0

MARCANT - File Delivery System

Handbuch ECDL 2003 Basic Modul 2: Computermanagement und Dateiverwaltung Dateien löschen und wiederherstellen

Berechtigungen im Kalender Anleitung für die Rechtevergabe im Outlook Kalender FHNW, Services, ICT

Test zur Bereitschaft für die Cloud

IAWWeb PDFManager. - Kurzanleitung -

RT Request Tracker. Benutzerhandbuch V2.0. Inhalte

So funktioniert die NetWorker 7.5 Eigenschaft zum Sichern umbenannter Verzeichnisse ( Backup renamed Directories )

Anleitung zum Extranet-Portal des BBZ Solothurn-Grenchen

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

SJ OFFICE - Update 3.0

OLXTeamOutlook 1.5 für Outlook 2003, 2002/XP, 2000 und 97/98

Proton Tankmesssystem per SMS und Webserver Dokumentation V1.4

Hilfe zur Dokumentenverwaltung

BI in der Cloud eine valide Alternative Überblick zum Leistungsspektrum und erste Erfahrungen

Treffpunkt Internet Reutlingen, B.Schüle 1

KURZANLEITUNG CYBERDUCK MIT CLOUD OBJECT STORAGE

Anti-Botnet-Beratungszentrum. Windows XP in fünf Schritten absichern

Tevalo Handbuch v 1.1 vom

Stellvertretenden Genehmiger verwalten. Tipps & Tricks

Online bezahlen mit e-rechnung

Ordner Berechtigung vergeben Zugriffsrechte unter Windows einrichten

Datenübernahme von HKO 5.9 zur. Advolux Kanzleisoftware

SOL-IT insurancecube. Verwalten. Verbinden. Überblicken.

Stundenerfassung Version 1.8 Anleitung Arbeiten mit Replikaten

Ihre Lizenz ändern. Stand 01/2015

INDEX. Öffentliche Ordner erstellen Seite 2. Offline verfügbar einrichten Seite 3. Berechtigungen setzen Seite 7. Öffentliche Ordner Offline

Kostenstellen verwalten. Tipps & Tricks

Memeo Instant Backup Kurzleitfaden. Schritt 1: Richten Sie Ihr kostenloses Memeo-Konto ein

Updatebeschreibung JAVA Version 3.8 und Internet Version 1.4

BEO-SANKTIONSPRÜFUNG Eine Einführung zum Thema Sanktionsprüfung und eine Übersicht zur BEO-Lösung.

Wiederkehrende Bestellungen. Tipps & Tricks

Die Dateiablage Der Weg zur Dateiablage

Ontrack EasyRecovery 11 Neue Funktionen. S.M.A.R.T.-Analysefunktion Wiederherstellung von VMware VMDK-Images Datenlöschfunktion

Auto-Provisionierung tiptel 30x0 mit Yeastar MyPBX

Es sollte die MS-DOS Eingabeaufforderung starten. Geben Sie nun den Befehl javac ein.

1 Einleitung. Lernziele. Symbolleiste für den Schnellzugriff anpassen. Notizenseiten drucken. eine Präsentation abwärtskompatibel speichern

Benutzerverwaltung Business- & Company-Paket

TREND SEARCH VISUALISIERUNG. von Ricardo Gantschew btk Berlin Dozent / Till Nagel

Dokumentation PuSCH App. windows-phone

Web Interface für Anwender

Zur Bestätigung wird je nach Anmeldung (Benutzer oder Administrator) eine Meldung angezeigt:

Partitionieren in Vista und Windows 7/8

Senden von strukturierten Berichten über das SFTP Häufig gestellte Fragen

L10N-Manager 3. Netzwerktreffen der Hochschulübersetzer/i nnen Mannheim 10. Mai 2016

SFTP SCP - Synology Wiki

Software zum Registrieren und Auswerten von Projektzeiten im Netzwerk

Medienkompass1, Lehrmittelverlag des Kantons Zürich, 1. Ausgabe 2008, Thema 13 Sicher ist sicher, S.58-61

LCM-6 Digital Signage Software

Fragen zur GridVis MSSQL-Server

Dokumentenmanagement mit active.pdm

Was ist PDF? Portable Document Format, von Adobe Systems entwickelt Multiplattformfähigkeit,

Forschungsprojekt: IT und Data Governance in KMU

Installationshinweise und Systemvoraussetzungen

Anleitung zum Login. über die Mediteam- Homepage und zur Pflege von Praxisnachrichten

Anleitung servicedirekt. Anmeldung. Das einfache Überlauf Routing

Welchen Weg nimmt Ihr Vermögen. Unsere Leistung zu Ihrer Privaten Vermögensplanung. Wir machen aus Zahlen Werte

BERECHTIGUNGEN IM ÜBERBLICK. protecting companies from the inside out

Online-Zugang zum EOM. Anleitung

BusinessMail X.400 Webinterface Gruppenadministrator V2.6

NetStream Helpdesk-Online. Verwalten und erstellen Sie Ihre eigenen Tickets

Lehrer: Kurs wiederherstellen

ERPaaS TM. In nur drei Minuten zur individuellen Lösung und maximaler Flexibilität.

transfer.net Erste Schritte mit transfer.net

Windows 7: Neue Funktionen im praktischen Einsatz - Die neue Taskleiste nutzen

Um dies zu tun, öffnen Sie in den Systemeinstellungen das Kontrollfeld "Sharing". Auf dem Bildschirm sollte folgendes Fenster erscheinen:

(im Rahmen der Exchange-Server-Umstellung am )

Benachrichtigungsmöglichkeiten in SMC 2.6

Anleitung für die Teilnahme an den Platzvergaben "Studio II, Studio IV und Studio VI" im Studiengang Bachelor Architektur SS15

Arbeiten mit den Mastercam Werkzeug-Managern

Kurzanleitung. Einstieg in die TripleCard Profi-Software. Zeiterfassungs- Software für. TripleCard Terminal

End User Manual EveryWare SPAM Firewall

S Sparkasse Hattingen

Mobile Dokumente. Vertreterarchiv mit LDOX.Share. Digitaler Rechnungsversand mit LDOX.DocumentManager

Handbuch ECDL 2003 Modul 2: Computermanagement und Dateiverwaltung Grundbegriffe: Speichereinheiten, Ordnerstruktur und Dateitypen

Arbeiten mit dem neuen WU Fileshare unter Windows 7

Anleitung. Update/Aktualisierung EBV Einzelplatz Homepage. und Mängelkatalog

Windows Domäne MSAD. (in Windows 7) Felizitas Heinebrodt. Technische Hochschule Nürnberg Rechenzentrum Kesslerplatz 12, Nürnberg

Externe Authentifizierung. Externe Authentifizierung IACBOX.COM. Version Deutsch

Starten der Software unter Windows 7

Transkript:

RobinHood Große Dateisysteme effizient verwalten Daniel Kobras science + computing ag IT-Dienstleistungen und Software für anspruchsvolle Rechnernetze Tübingen München Berlin Düsseldorf

science+computing ag Gegründet 1989 Standorte Tübingen München Berlin Düsseldorf Mitarbeiter 258 Anteilseigner Bull S.A. (100%) Umsatz 10/11 26,66 Mio. Euro Portfolio IT Service für komplexe Berechnungsumgebungen Umfassende Lösungen für Linux- und Windows-basiertes HPC scvenus Systemmanagement-Software zur effizienten Administration homogener und heterogener Netze Seite 2

Übersicht Warum sollte ich mich für RobinHood interessieren? Wie kann ich RobinHood missbrauchen? Wie kann ich RobinHood gebrauchen? Was kann ich künftig von RobinHood erwarten? Seite 3

Administration großer Dateisysteme Seite 4

Dateisystem-Performance Optimiert für schnellen Datenzugriff open() read()/write() Metadaten-Suche ineffizient readdir() stat() Seite 5

Dateisystem-Performance Optimiert für schnellen Datenzugriff open() read()/write() Anwender Metadaten-Suche ineffizient readdir() stat() z.b. find, du -s, ls -lr über weite Teile eines Dateisystems Administrator Seite 6

Durchsatz vs. Latenz Metadaten-intensive Zugriffe führen zu Random I/O-Operationen Beschränkt durch Latenz des Speichersystems (IOPS) Ungleichgewicht Durchsatz vs. IOPS auf HDDs typische SATA-Disk: 100MB/s, 100 IOPS bei 4k-I/O-Größe: Random I/O ca. 250mal langsamer als Streaming I/O In großen Datenspeichern HDD nach wie vor Standard (Preis/Kapazität) Metadaten-Operationen dauern auf großen Dateisystemen im Verhältnis zur Gesamtgröße eines HDD-Datenträgers sehr lange Seite 7

Schere im Kopf # find # du -s # ls -lr Seite 8

Schere im Kopf # find # du -s # ls -lr Großes Dateisystem! Seite 9

Schere im Kopf Administratoren haben es schwer, den Überblick über große Dateisysteme zu behalten Wo liegen die größten Dateien? Wie viele Einträge umfassen die größten Verzeichnisse? Was ist durchschnittliche Dateigröße? Welche Dateitypen werden am häufigsten verwendet? Wie wird das Dateisystem genutzt? Informationen sind essentiell für Dateisystem-Anpassungen, Kapazitätsplanung, Accounting, Backup Informationsbeschaffung dauert zu lange wird in nächtliche Skripte ausgelagert wird unterlassen Seite 10

SELECT statt find Idee: Stelle Metadaten eines Dateisystems als Datenbank zur Verfügung, die sich für beliebige Suchen optimieren lässt Ersetze Metadaten-Suchen im Dateisystem durch Datenbank- Abfragen Seite 11

Datenbank-Betankung Wunschtraum: Datenbank ins Dateisystem integriert schöne Idee, aber nicht der Status Quo Auch gut: Dateisystem bietet Schnittstelle, um alle Informationen über Änderungen an externe Programme weiterzureichen ChangeLog-Feature in Lustre 2.x Holzhammer: Dateisystem regelmäßig scannen und dazwischen mit Inkonsistenzen leben aufwändig, aber klappt immer Seite 12

Kernfunktionalität von RobinHood Wunschtraum: Datenbank ins Dateisystem integriert schöne Idee, aber nicht der Status Quo Auch gut: Dateisystem bietet Schnittstelle, um alle Informationen über Änderungen an externe Programme weiterzureichen ChangeLog-Feature in Lustre 2.x Holzhammer: Dateisystem regelmäßig scannen und dazwischen mit Inkonsistenzen leben aufwändig, aber klappt immer RobinHood beschafft über eine der beiden Methoden den Metadaten-Inhalt eines Dateisystems und repliziert ihn in eine Datenbank (derzeit: MySQL) Seite 13

Vorteile Suche in Dateisystem-Metadaten dauert nur wenige Sekunden statt Stunden und Tagen Administrator kann Aufgaben interaktiv bearbeiten Datenbank-Abfragen befreien Dateisystem von Metadaten-Last durch Scan-Läufe (oder verlagern Scan-Läufe auf Bereiche außerhalb von Stoßzeiten) Seite 14

RobinHood-Missbrauch Seite 15

Arbeiten mit der RobinHood-DB Alle Dateien eines Nutzers anzeigen # find -uid <name> wird zu sql> SELECT fullpath FROM ENTRIES WHERE owner = <name>; Seite 16

Arbeiten mit der RobinHood-DB Alle Dateien anzeigen, die keinem aktuellen vorhandenen User- Account zugeordnet sind sql> SELECT owner AS 'Owner',fullpath AS 'Path' FROM ENTRIES WHERE CONV(owner, 10, 10) = owner ORDER BY owner; Seite 17

Arbeiten mit der RobinHood-DB Schätze ab, wie viele Dateien im System bereits in einem komprimierten Format gespeichert sind sql> SELECT COUNT(*) AS '#files', ROUND(SUM(size)/(1024*1024*1024),2) AS 'Size (GB)' FROM ENTRIES WHERE fullpath LIKE '%.gz' OR fullpath LIKE '%.bz2' OR fullpath LIKE '%.7z' OR fullpath LIKE '%.xz' OR fullpath LIKE '%.zip' OR fullpath LIKE '%.tgz'; Seite 18

Sonstige Ideen Projekt-Quotas light Nächtliche Anpassung von Dateisystem-Berechtigungen (Datenmanagement light ) Überwachung der Dateisystembelegung (Kapazitätsmanagement light ) Automatisches Komprimieren inaktiver Dateien Ersatz für beliebige Skripte vom Typ find dosomething ) Einsatz dann sogar zum Nulltarif (das heißt kein zusätzlicher Scan über das Dateisystem, sondern nur Ersatz eines bestehenden Scan-Skripts) Seite 19

RobinHood-Gebrauch Seite 20

RobinHood im Überblick Ursprünglich Software-Paket zur Verwaltung von temporären Daten in Dateisystemen (Tmpfs-Manager) Weitere Komponenten in Entwicklung: effizientes Backup für Lustre 2.x HSM-Policy-Engine für Lustre 2.y Entwicklung primär durch CEA Open-Source-Projekt (CeCILL-C-Lizenz, LGPL-Pendant) Projektseite: http://robinhood.sf.net/ Binärpakete für RHEL5, RHEL6 Git-Tree öffentlich zugänglich Seite 21

Features Tmpfs-Manager Fokus: Verwaltung temporärer Daten auf großen Dateisystemen Policy-Engine zum automatisierten, regelbasierten Löschen von Daten Einfaches Klassifizieren von Daten E-Mail-Alerts Feste Kommandos für häufige Abfragen Web-GUI mit Dateisystem-Übersicht Effiziente Scan-Läufe auf Posix-Dateisystemen Nutzt ChangeLog-Feature auf Lustre-2.x-Dateisystemen Implementierung in C Keine Skripting-Möglichkeit für einfache Funktionserweiterungen Seite 22

Web-Oberfläche Quelle: Thomas Leibovici/CEA Seite 23

Kommando-Beispiele # rbh-report --top-users Rank: 1 User: userx Space used: 27.66 TB (59400014112 blks) Nb entries: 1382550 Size avg: 20.98 MB (21996622bytes) Rank: 2 User: usery Space used: 16.34 TB (35089882808 blks) Nb entries: 1673391 Size avg: 10.24 MB (10736295bytes) ( ) Seite 24

Kommando-Beispiele # rbh-report --user-info User: kobras Type: directory Count: 53 Space used: 236.00 KB (472 blks) Type: file Count: 833 Space used: 398.54 MB (816200 blks) Size avg: 517.10 KB (529512 bytes) Seite 25 Type: symlink Count: 10 Space used: 0 (0 blks) Size avg: 14 (14 bytes)

Kommando-Beispiele # rbh-report --top-size Rank: 1 Path: /scr/foo/bar/xxx.big Size: 476.11 GB (511223230464 bytes) Last access: 2012/02/26 05:32:43 Last modification: 2010/11/09 09:18:43 Owner/Group: myuser/mygroup Purge class: back_server2 Stripe count: 1 Stripe size: 1.00 MB (1048576 bytes) Pool: production Storage units: OST #21 ( ) Seite 26

Kommando-Beispiele Seite 27 # rbh-report --class-info Class: back_server1 Nb entries: 1063201 Space used: 21.82 TB (46863965240 blks) Size min: 0 (0 bytes) Size max: 327.25 GB (351382807603 bytes) Size avg: 21.52 MB (22566027 bytes) Class: back_server2 Nb entries: 2039364 Space used: 25.71 TB (55219685744 blks) Size min: 0 (0 bytes) Size max: 476.11 GB (511223230464 bytes) Size avg: 13.22 MB (13864848 bytes)

Beispiele für E-Mail-Alerts Warnung (an Admins) bei neuen Dateien >100GByte /etc/robinhood.d/tmpfs/myfs.conf: (...) Alert recent_large_file { type == file and size > 100GB and last_mod < 1d } (...) Seite 28

Beispiele für E-Mail-Alerts Warnung (an Admins), falls eine Gruppe gr_diskhog zuviel Platz belegt ( Quota light ) /etc/robinhood.d/tmpfs/myfs.conf: (...) trigger_on = group_usage(gr_diskhog); high_threshold_vol = 15TB; notify = TRUE; (...) Auch möglich: Hardcore-Quota : Lösche Daten der Gruppe, falls sie zuviel Platz belegt (gemäß vorgegebener Purge-Policy) Seite 29

RobinHood in Zukunft Seite 30

Geplante Weiterentwicklungen Kommandos rbh-find, rbh-du als effizienter Ersatz für find und du E-Mail-Warnungen direkt zum Anwender verschicken Automatisches Ausbalancieren von Lustre-OSTs Ausführen beliebiger, benutzerdefinierter Aktionen anhand von Policies (Komprimieren, Verschieben,...) Höhere Skalierbarkeit durch NOSQL-Datenbank Seite 31

Zusammenfassung RobinHood spiegelt Metadaten eines Dateisystems in SQL- Datenbank Ersetzt langwierige Kommandos durch effiziente Datenbank- Abfragen Entlastet Dateisysteme Ermöglicht schnelleres Arbeiten für Administratoren Simple Idee bringt spürbare Erleichterungen im Administrationsalltag Seite 32

Vielen Dank für Ihre Aufmerksamkeit. Daniel Kobras science + computing ag www.science-computing.de Telefon 07071 9457-0 info@science-computing.de