Betrieb eines heterogenen Clusters



Ähnliche Dokumente
Agenda. HPC-Benutzerkolloquium. EM64T-Clustererweiterung. EM64T-Clustererweiterung am RRZE

Anleitung zur Nutzung des SharePort Plus

Anleitung zur Nutzung des SharePort Utility

A1 Desktop Security Installationshilfe. Symantec Endpoint Protection 12.1 für Windows/Mac

Oracle VirtualBox. Zum Herunterladen für alle Betriebssysteme gibt s die VirtualBox auf:

Reporting Services und SharePoint 2010 Teil 1

CADEMIA: Einrichtung Ihres Computers unter Windows

Installationsanleitung. Lohn Manager 9.5

Konventionen. Danksagung

Windows Server 2008 (R2): Anwendungsplattform

Installationshinweise für OpenOffice Portable auf einem Wechseldatenträger Stand: 27. März 2003 LS Stuttgart, Kaufmännische ZPG

Verschlüsselung mit PGP. Teil 1: Installation

Benutzerhandbuch für Debian Server mit SAMBA. Rolf Stettler Daniel Tejido Manuel Lässer

Formular»Fragenkatalog BIM-Server«

Installieren Sie den Janaserver auf dem Schulserver oder dem Lehrerrechner.

C++ mit Eclipse & GCC unter Windows

disk2vhd Wie sichere ich meine Daten von Windows XP? Vorwort 1 Sichern der Festplatte 2

Fragen und Antworten. Kabel Internet

Datenübernahme von HKO 5.9 zur. Advolux Kanzleisoftware

Upgrade von Windows Vista auf Windows 7

Diese Anleitung erläutert die Einrichtung des Active Directory Modus im DNS-343.

Hochleistungsrechnen mit Windows Interaktive Benutzung und das Batchsystem Christian Terboven Rechen- und Kommunikationszentrum RWTH Aachen

MORE Profile. Pass- und Lizenzverwaltungssystem. Stand: MORE Projects GmbH

TYPO3 CMS 6.2 LTS. Die neue TYPO3- Version mit Langzeit- Support

Mediumwechsel - VR-NetWorld Software

Installation OMNIKEY 3121 USB

Printserver und die Einrichtung von TCP/IP oder LPR Ports

Änderungsbeschreibung HWS32 SEPA Überweisungen

IBM SPSS Statistics für Windows-Installationsanweisungen (Netzwerklizenz)

Version 0.3. Installation von MinGW und Eclipse CDT

INDEX. Öffentliche Ordner erstellen Seite 2. Offline verfügbar einrichten Seite 3. Berechtigungen setzen Seite 7. Öffentliche Ordner Offline

C++11 C++14 Kapitel Doppelseite Übungen Musterlösungen Anhang

SANDBOXIE konfigurieren

Guide DynDNS und Portforwarding

Print2CAD 2017, 8th Generation. Netzwerkversionen

WEKA Handwerksbüro PS Mehrplatzinstallation

SYSTEM REQUIREMENTS. 8MAN v4.5.x

Online bezahlen mit e-rechnung

COSYNUS iphone/ipad Connector für Tobit David Integriert und offline mit Tobit David arbeiten

MSDE 2000 mit Service Pack 3a

Galaxy V7 in Deutsch ist ab sofort frei gegeben. Die Versionen Französisch, Italienisch und Englisch folgen spätestens Ende Oktober 2012.

Wie räume ich mein Profil unter Windows 7 auf?

Systemvoraussetzungen

Page Hotelsoftware. Merkblatt für Mehrwertsteuer-Umstellung für Beherbergungsleistungen zum

Anleitung Captain Logfex 2013

Beruflichen Schule in Nidda

Installationsanleitung. Ab Version

Anleitung zum Extranet-Portal des BBZ Solothurn-Grenchen

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

EASYINSTALLER Ⅲ SuSE Linux Installation

Paragon WinPE Recovery Media Builder

Installationshinweise für OpenOffice 2.3 auf dem PC daheim Stand: 26. März 2003 LS Stuttgart, Kaufmännische ZPG

Mediumwechsel - VR-NetWorld Software

NbI-HS. NbIServ Bethenhausen Bethenhausen

Catherina Lange, Heimbeiräte und Werkstatträte-Tagung, November

Anleitung über den Umgang mit Schildern

Updatehinweise für die Version forma 5.5.5

Karten-Freischaltung mit dem UNLOCK MANAGER

Stecken Sie Ihren USB Stick oder Ihre externe USB Festplatte in den USB Steckplatz des Sinus 154 DSL SE.

Anleitung Grundsetup C3 Mail & SMS Gateway V

Datenbank-Verschlüsselung mit DbDefence und Webanwendungen.

Tapps mit XP-Mode unter Windows 7 64 bit (V2.0)

WOT Skinsetter. Nun, erstens, was brauchen Sie für dieses Tool zu arbeiten:

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

So funktioniert die NetWorker 7.5 Eigenschaft zum Sichern umbenannter Verzeichnisse ( Backup renamed Directories )

Sie müssen sich für diesen Fall mit IHREM Rechner (also zeitgut jk o.ä.) verbinden, nicht mit dem Terminalserver.

Installationsanleitung WibuKey Treiber

Handbuch PCI Treiber-Installation

Die YouTube-Anmeldung

Fragen zur GridVis MSSQL-Server

Netzwerk einrichten unter Windows

Jahresabschluss Finanzbuchhaltung INGARA. Provisorisch und Definitiv. INGARA Version

Quickstep Server Update

Download unter:

HAFTUNGSAUSSCHLUSS URHEBERRECHT

SFKV MAP Offline-Erfassungstool. Installationsanleitung

Domain Registration & Transfer. Version: 1.3 Datum: Alexander Pascual

.htaccess HOWTO. zum Schutz von Dateien und Verzeichnissen mittels Passwortabfrage

Systemvoraussetzungen winvs office winvs advisor

Ablauf. Festigung des Gelernten Login und Struktur. Umgang mit Plugins: Ändern persönl. Einstellungen. Fachgebietslogo einfügen Anlegen neuer Seiten

REGIONALES RECHENZENTRUM ERLANGEN [ RRZE] Datenbanken. RRZE-Campustreffen, Stefan Roas und Ali Güclü Ercin, RRZE

Excel beschleunigen mit dem mit Windows HPC Server 2008 R2

Kleines Handbuch zur Fotogalerie der Pixel AG

Installationsanleitung dateiagent Pro

FastViewer Remote Edition 2.X

Leichte-Sprache-Bilder

-Konten für Studierende und Zugriffswege auf die Mail-Systeme der Hochschule Rhein-Waal

GDI - Lohn & Gehalt Umstieg auf Firebird 2.5

Paket 1 (Reportage - Standesamt) Paket 2 (Reportage - Kirche) Paket 3 (Reportage - Trauung + Sektempfang)

1 Was ist das Mediencenter?

SharePoint Workspace 2010 Installieren & Konfigurieren

Unterrichtsformalitäten für Mathematik, 3. Klasse

Nach der Installation des FolderShare-Satellits wird Ihr persönliches FolderShare -Konto erstellt.

PM/HV - SAP. Installationsanleitungen. Seite 1 von 12

Rillsoft Project - Installation der Software

EchoLink und Windows XP SP2

Hinweise zur Installation der USB Treiber für Windows XP 32bit

Oracle APEX Installer

"Ich habe als Vereinsverantwortlicher eine erhalten - was mache ich, um Torwurf.de für meinen Verein einzusetzen?"

Transkript:

Betrieb eines heterogenen Clusters Georg Hager Regionales Rechenzentrum Erlangen (RRZE) ZKI AK Supercomputing Karlsruhe, 22./23.09.2005 Transtec GBit/IB-Cluster am RRZE IA32-Cluster 04/2003 86+2 Knoten Dual Xeon (Prestonia) EM64T- Cluster 12/2004 IB-Interconnect 64+1 Knoten Dual Xeon (Nocona) 2

EM64T-Clustererweiterung SFB 473 der DFG: Mechanisms of Transcriptional Regulation HBFG-Antrag gestellt am 21.06.2004 Volumen: 240000 (davon 20000 von FH Nürnberg) DFG Eingang am 09.07.2004 positiv begutachtet am 13.10.2004 SFB beauftragt RRZE mit Vertragsverhandlungen, Beschaffung und Betrieb der Clustererweiterung Vertragsunterzeichnung mit Transtec am 15.11.2004 Erweiterung wurde ausdrücklich mit dem Ziel beantragt und beschafft, eng in das bestehende IA32-Cluster integriert zu werden 3 EM64T-Clustererweiterung Anlieferung und Aufbau der Knoten am 14.12.2004 64 Rechenknoten + 1 Frontend + 1 Fileserver Knoten: Dual Intel Xeon "Nocona" (EM64T), 3.2 GHz, 1 MB L3, 2 GB RAM, GBit Interconnect 16 (jetzt 24) Knoten zusätzlich ausgestattet mit PCI-X Infiniband-Karten plus 24-Port Switch Fileserver: 3,2 TByte brutto, 2,4 Tbyte netto-kapazität Beginn der Abnahmephase am 15.12.2004 12:00 Während der Abnahme Integration in RRZE-Umgebung Ausräumen von 32-/64-Bit-Problemen Einrichten des Batch-Systems 4

EM64T-Clustererweiterung Was ist neu bei Nocona/EM64T? 64-Bit Linux-Betriebssystem (analog Opteron) Fähigkeit, 32-Bit und 64-Bit Programme nativ auszuführen Im 32-Bit-Modus: Vorteile durch verdoppelten Cache höhere Taktfrequenz SSE3 und weitere Architekturverbesserungen Im 64-Bit-Modus: Weitere Vorteile durch breitere Integer-Register (64 statt 32 Bit) doppelte Anzahl SSE2-Register 32-Bit-Compiler funktionieren weiterhin wie gewohnt -xp Flag nutzt SSE3-Erweiterung Native 64-Bit-Compiler verfügbar damit auch neue MPI-Bibliotheken 5 Clustererweiterung: Vorgaben Gemeinsames Batchsystem (OpenPBS+Maui) neue Knoten werden bevorzugt an SFB vergeben hohe Auslastung wird sichergestellt bei Leerständen dürfen "normale" User die neuen Knoten benutzen Generell kann ein bestimmter Knotentyp angefordert werden (IA32, EM64T, Infiniband) Entwicklungsumgebung Konsistente Compilerinstallation auf beiden Clusterteilen IA32-Binaries laufen ohne Änderung auf den EM64T-Knoten (incl. MPI) EM64T-Binaries können nur auf EM64T-Frontend erzeugt werden TotalView (leider) nur für IA32 ($) 6

Clustererweiterung: Partitionen normal (150) ia32 (86) em64t (64) gbit (126) mnox (24) "node properties" "normal": "gbit": "ia32": "em64t": "mnox": Knoten Knoten, die nur GE-Interconnect haben "alten" Knoten "neuen" Knoten Knoten mit IB-Interconnect 7 Cluster: Batchbetrieb Queue-Konfiguration Queue Laufzeit [HH:MM:SS] min-max. CPUs/Job wer darf? express 01:00:00 iexpress 01:00:00 s1 01:00:01 T 06:00:00 1-64 s2 06:00:01 T 48:00:00 1-64 s3 48:00:01 T 168:00:00 auf Antrag ls_normal T 24:00:00 1-64 SFB ls_long 24:00:01 T 240:00:00 SFB iband T 64:00:00 4-32 auf Antrag Weitere Queues (special, fhg, lstm) sind für Spezialzwecke vorgesehen 8

Cluster: Batchbetrieb Aufteilung der Queues auf die Knoten, weitere Beschränkungen Queue express iexpress s1 s2 s3 ls_normal ls_long iband Knoten ia32 (werktags 8-21h sind 4 Knoten reserviert) mnox (werktags 10-16h sind 4 Knoten reserviert) normal ia32 ia32 gbit gbit mnox max. RUNNING CPUs (172) (48) (300) (172) 8 (96) 80 (48) 9 Cluster: Batchbetrieb Wer merkt sich das s? Niemand! Einsortierung in die Standard-Queues erfolgt automatisch anhand Laufzeit Knotenzahl Zugriffsbeschränkungen Normalbenutzer muss keine Queue mehr angeben, Default-Queue ist "route" "route" verteilt Jobs anhand der Ressourcen etc. auf andere Queues Ausnahme: Queue "iband" und andere Spezialqueues 10

Cluster: Batchbetrieb route ls_normal ls_long express SFB Alle User dir. submit erlaubt s1 s2 dir. submit verboten REJECT s3 Spezialuser 11 Integration der neuen Knoten Betriebssystem: Debian 3.0 Hauptproblem: Integration der Intel-Compiler in die Debian 3.0 Entwicklungsumgebung im 64-Bit-Betrieb Intel-Compiler benutzt Header und Bibliotheken der GNU Compiler Collection Parle Installation mehrerer GNU-Compiler plus Intel- Compiler ist problematisch "Hacks" (Wrapperskripte um GNU-Compileraufrufe, Patches in Intel-Compiler-Konfigurationsfiles, GXX_INCLUDE) machen beide Welten kompatibel Aktuelle GNU-Compiler werden vom RRZE unter separaten Pfaden zur Verfügung gestellt Bereitstellung geeigneter MPI-Bibliotheken erforderlich (32/64 Bit, compilerabhängig) 12

Fazit: Wie läuft es nach 9 Monaten? Häufigste Userbeschwerden "Mein Job läuft nicht los" Maui gibt darauf üblicherweise eine erschöpfende Auskunft statistisch bekommen SFB-User genau "ihren" Share an Zyklen (ca. 35-40%) "Da sind Physiker auf unseren Knoten" Kurzläufer sind überall erlaubt gcc funktioniert nicht Problem mit den gcc-wrappern "Ich brauche Paket X in Version 3.14, aber es ist nur in Version 2.72 vorhanden"/"ich brauche eine 64-Bit-Version von Bibliothek Y" Bereitstellung von (Back)ports, meist seitens Transtec Ansonsten: 90% durchschnittliche Auslastung! 13