Monitoring der GEO600-Jobs Beispiel für Applikations- Monitoring



Ähnliche Dokumente
mobilepoi 0.91 Demo Version Anleitung Das Software Studio Christian Efinger Erstellt am 21. Oktober 2005

Zend PHP Cloud Application Platform

Benutzerhandbuch. Leitfaden zur Benutzung der Anwendung für sicheren Dateitransfer.

Lizenz Verwaltung. Adami Vista CRM

Administrator-Anleitung

Lokale Installation von DotNetNuke 4 ohne IIS

Kurzanleitung AVAST 5 FREE ANTIVIRUS

Wie mache ich eine Datensicherung vom SQL Server Express

Für eine längere Laufzeit oder zusätzlichen Optionen sowie Jobarten, Regionen und Tätigkeitsbereiche werden immer Credits berechnet.

Wo finde ich die Software? - Jedem ProLiant Server liegt eine Management CD bei. - Über die Internetseite

Release Automation für Siebel

Diese Anleitung enthält Anweisungen, die nur durch erfahrene Anwender durchgeführt werden sollten!

Einreichung zum Call for Papers

CMS.R. Bedienungsanleitung. Modul Cron. Copyright CMS.R Revision 1

Der Product Activation Manager (PAM) dient dazu Software-Lizenzen anzuzeigen, zu verwalten und abzurufen.

ITT WEB-Service DEMO. Kurzbedienungsanleitung

An integrated total solution for automatic job scheduling without user interaction

Installation von horizont 4 bei Verwendung mehrerer Datenbanken

Einsatzbearbeitung im Sanitätsdienst

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

Multiplayer Anweisungen

Matrix42. Use Case - Sicherung und Rücksicherung persönlicher Einstellungen über Personal Backup. Version September

WindowLogger für MS-Terminalserver

Kurzanleitung OOVS. Reseller Interface. Allgemein

1 Installation QTrans V2.0 unter Windows NT4

Verschlüsselung mit PGP. Teil 1: Installation

Installation SQL- Server 2012 Single Node

Formular»Fragenkatalog BIM-Server«

Lizenzierung von System Center 2012

Use AMW to deploy to OpenShift

Anleitung zur Nutzung des SharePort Utility

Installation/Einrichtung einer Datenbank für smalldms

Xylem WebService Demo Kurzbedienungsanleitung

SharePoint Demonstration

THEMA: "SAS STORED PROCESSES - SCHNELL GEZAUBERT" HELENE SCHMITZ

Moodle aktuell halten mit Git

ecaros2 Installer procar informatik AG 1 Stand: FS 09/2012 Eschenweg Weiterstadt

Advoware mit VPN Zugriff lokaler Server / PC auf externe Datenbank

CRIBMASTER TECH DOC. Störbehebung bei Ausführung des Connectivity Checkers

How-to: Webserver NAT. Securepoint Security System Version 2007nx

Web Interface für Anwender

Benachrichtigungsmöglichkeiten in SMC 2.6

Update und Konfiguraton mit dem ANTLOG Konfigurations-Assistenten

Anleitung für Kunden zum Umgang mit verschlüsselten s von der LASA Brandenburg GmbH

BAPS Basel Psychologie Studien

Single User 8.6. Installationshandbuch

Was ist LDAP. Aufbau einer LDAP-Injection. Sicherheitsmaßnahmen. Agenda. LDAP-Injection. ITSB2006 WS 09/10 Netzwerkkonfiguration und Security

Schritt-für-Schritt-Anleitung So verschlüsseln Sie Ihr -Konto in der Software 6.0

Powermanager Server- Client- Installation

Windows Server 2008 (R2): Anwendungsplattform

Installation EPLAN Electric P8 Version Bit Stand: 07/2014

desk.modul : ABX-Lokalisierung

e-serve UPSM Version 7.1

Prozessbewertung und -verbesserung nach ITIL im Kontext des betrieblichen Informationsmanagements. von Stephanie Wilke am

Lizenzen auschecken. Was ist zu tun?

LabTech RMM. Integration von Teamviewer. Vertraulich nur für den internen Gebrauch

Prüfen Sie, ob Sie über Administratorrechte (Server und Client) verfügen.

Grundlagen des Grid Computing

Handbuch. timecard Connector Version: REINER SCT Kartengeräte GmbH & Co. KG Goethestr Furtwangen

ecaros2 - Accountmanager

SolarWinds Engineer s Toolset

Installationsanleitung Home & Office-Banking Plattform

easysolution GmbH easynet Bessere Kommunikation durch die Weiterleitung von easynet-nachrichten per nach Hause

Stundenerfassung Version 1.8 Anleitung Arbeiten mit Replikaten

FrontDoor/Monitor mehr sehen von FrontDoor

Windows 2008R2 Server im Datennetz der LUH

IBM Software Demos Tivoli Composite Application Manager for SOA

united hoster GmbH Preis- und Leistungsverzeichnis Support

CTX 609 Daten Fax Modem. Installation Creatix V92 Data Fax Modem (CTX 609) unter Windows XP/ Windows Installation unter Windows XP:

Kurzanweisung für Google Analytics

iphone app - Anwesenheit

Silca Software ERKLÄRUNG. February 2013 Copyright Silca S.p.A. V.2.0

2 Die Terminaldienste Prüfungsanforderungen von Microsoft: Lernziele:

Tutorial Einrichtung eines lokalen MySQL-Servers für den Offline-Betrieb unter LiveView

Fotogalerie mit PWGallery in Joomla (3.4.0) erstellen

MJD baut Brunnen. Pfandflaschenprojekt mit Tuisa e.v. Leitfaden

Reborn Card Ultimate 8 Kurzanleitung Installation

Backup der Progress Datenbank

2. Die eigenen Benutzerdaten aus orgamax müssen bekannt sein

v2.2 Die innovative Softwarelösung für kundenspezifisches Anrufmanagement Administrator-Handbuch

Beschreibung Regeln z.b. Abwesenheitsmeldung und Weiterleitung

Version smarter mobile(zu finden unter Einstellungen, Siehe Bild) : Gerät/Typ(z.B. Panasonic Toughbook, Ipad Air, Handy Samsung S1):

Zur Bestätigung wird je nach Anmeldung (Benutzer oder Administrator) eine Meldung angezeigt:

Freigabemitteilung Nr. 39. Neue Funktionen adresse zurücksetzen / ändern Kennung ändern Anlegen von OCS (elektr. Postfach) Mailbenutzern

WINDOWS 8 WINDOWS SERVER 2012

Anwenderleitfaden Citrix. Stand Februar 2008

Anleitung zur Updateinstallation von ElsaWin 4.00

Ablauf Vorstellungsgespräch

Widerrufsbelehrung der Free-Linked GmbH. Stand: Juni 2014

Im vorliegenden Tutorial erfahren Sie, wie Sie in myfactory Postfächer für den Posteingang und den Postausgang anlegen.

Second Steps in eport 2.0 So ordern Sie Credits und Berichte

Professionelle Seminare im Bereich MS-Office

Das Roaming Cockpit. Inhalt. 1 Das Roaming Cockpit Aufrufen des Roaming Cockpit über den Browser... 3

Installation der 4Dv12sql Software für Verbindungen zum T.Base Server

SMS-Tool. Seite 1 von 8

[DvBROWSER] Offline-Viewer für [DvARCHIV] und [DvARCHIVpersonal] Version 2.2

FuxMedia Programm im Netzwerk einrichten am Beispiel von Windows 7

Die richtigen Partner finden, Ressourcen finden und zusammenführen

Transkript:

Monitoring der GEO600-Jobs Beispiel für Applikations- Monitoring Alexander Beck-Ratzka Monitoring-WS, 28.11.2008 Alexander Beck-Ratzka Monitoring GEO600 Monitoring Workshop

Agenda Was ist GEO600 und einstein@home? einstein@home aufs Grid. Automatisierung der job submission und Fehlerbehandlung. Online Demo GEO600-Portal

GEO600 Interferometer zur Messung von Gravitationswellen. Standort: südlich von Hannover Problem: Rauschen noch über der Nachweisgrenze. Analyse der Daten mit unterschiedlichsten Parametern erforderlich -> einstein@home

einstein@home Applikation zur Analyse der Messdaten der Inferometer. Basiert auf BOINC Framework. Entwickelt am Max-Planck- Institut für Gravitationsphysik.

einstein@home Applikation zur Analyse der Berkley Open Infrastructure for Distributed Computing Messdaten der Inferometer. Basiert auf BOINC Framework. Entwickelt am Max-Planck- Institut für Gravitationsphysik.

einstein@home Executables für nahezu alle Architekturen verfügbar. Roh-Daten werden vom einstein@home-server runtergeladen; analysierte Daten zurückgespielt. Ein einstein@home-job läuft nur, wenn Prozessor idelt (BOINC). Jeder kann sich beteiligen; für abgeschlossene Läufe werden Credits vergeben

einstein@home aufs Grid 1 Ideal für das Grid: Für viele Plattformen verfügbar Gut getestete Software Einfache Requirements auf den Ressourcen Eingebaute checkpoint- und Recovery-Methoden Laufzeit kann auf die Minute genau angegeben werden Lineare Skalierung mit Anzahl der Knoten (Task Farming)

einstein@home aufs Grid 2 Automatisches Deployment Deployed wird auf Globus-Ressourcen mit einem wsgram-job Erforderliche Software (GEO600 und third party products) wird aus svn Repositories ausgecheckt, und ggf. compiliert

einstein@home aufs Grid 3 Ablauf eines einstein@home Grid-Jobs einstein@home client wird mit vorgegebenen Walltime Limit auf Workernode gestartet einstein@home client holt sich zu Beginn (falls erforderlich) Datenpaket von Server Meldet seinen Start bei zentraler mysql- Datenbank auf buran.aei.mpg.de an Nach Ablauf der Walltime werden checkpoints für Neustart geschrieben einstein@home meldet sich bei Datenbank als fertig ab Jeder einstein@home job wird mit einer eindeutigen Task-Nummer versehen

einstein@home Ablauf Execution Host Checkpoint data on localhost e@h Client einstein@home Server inspect.pl mysql-server buran.aei.mpg.de

einstein@home Ablauf Execution Host Checkpoint data on localhost einstein@home Server inspect.pl mysql-server buran.aei.mpg.de

Automatisierung Automatisierte Job-Submission mittels cron-jobs Ablaufsteuerung über config-file run gt4-fzk.gridka.de { GEO600_HOME = GEO600-1.1 FT = PBS FT_FORK = YES TIMEOUT = 1.00:00:00 JOBS_RUNNING_MAX = 2600 JOBS_QUEUE_MAX = 80 JOBS_QUEUE_MIN = 50 FLOPS = 1709 CHECK_ARCHIVE = NO USE_TMP = /tmp PREFIX = build/boinc_5.4.11_i686-pc-linux-gnu GSISSH = dgrid-fzk.gridka.de POSTSTAGE = no LOCATION = file://~/geo600-1.1/tasks ACCESS = gt4-fzk.gridka.de GT4 = gt4-fzk.gridka.de }

Automatisierung Überprüfung der Status der Tasks in mysql-datenbank Auslösen von fehlerbehenden Aktionen, wenn diese behebbar sind. Jeder Inspektionslauf schickt eine Email an den Jobadmin (cron-feature), so dass dieser bei nicht behebbaren Fehlern sofort informiert wird, und aktiv werden kann.

Automatisierung Automatische Reaktion auf Fehler in config-file einstellbar ERROR P-Done-rc127 { APPLICATION_STATE = P GLOBUS_STATE = Done GLOBUS_RC = 32512 MESSAGE = "application returned error code 127" ACTION = RESET } ERROR E-Failed-rc1 { APPLICATION_STATE = E GLOBUS_STATE = Failed GLOBUS_RC = 256 MESSAGE = "application returned errorcode 1" ACTION = RMDIR,STAGEOUT,DEANNOUNCE }

e@h Grid-Bilanz Obwohl erst seit März diesen Jahres richtig produktiv, sind wir schon auf Platz 1 aller Beitragenden escience-gruppe des AEI hat die meisten Credits gesammelt Täglich um oder etwas über 100000 CPU-Stunden auf D-Grid Ressourcen

Online Demo GEO600 Portal... Alexander Beck-Ratzka Monitoring GEO600 Monitoring Workshop

GEO600-Portal

GEO600-Portal

GEO600-Portal