Grid-Computing. Übersicht: Ingo Strauch. Mottenlinux-Treffen 10.05.2005. Was versteht man unter dem Grid. Das LHC Computing Grid (LCG)



Ähnliche Dokumente
Einiges zur Grid Infrastruktur bei DESY

Grundlagen des Grid Computing

Grid-Systeme. Betrachtung verschiedener Softwareplattformen zur Realisierung von Grids und Vorstellung des Globus Toolkit Grid Systeme 1

Abschlussvortrag zur Bachelorarbeit. Konzeption und Aufbau eines Grid Testlabors am Beispiel des Globus Toolkit 4

Grundlagen des Grid Computing

LCG2-basierte MonteCarlo Produktion bei H1

GRID-Computing vom lokalen zum globalen Ressourcenmanagement

Grid-Computing in der Hochenergiephysik

Forschungszentrum Karlsruhe in der Helmholtz-Gemeinschaft. Torsten Antoni Rüdiger Berlich

Die Tier2-Site DESY-ZN. die langweiligen technischen Details. Andreas Haupt

Abschlussvortrag zur Diplomarbeit Aufbau und Analyse einer Shibboleth/GridShib-Infrastruktur

Um dies zu tun, öffnen Sie in den Systemeinstellungen das Kontrollfeld "Sharing". Auf dem Bildschirm sollte folgendes Fenster erscheinen:

glite eine Grid Distribution der EGEE GRID Seminar am Fakultät für Physik Steen Klemer (Fakultät für Physik) glite 1 / 22

glite Testbed am RRZN und Workload Management Grid Seminar 2005 Stefan Piger, Jan Wiebelitz

Das LHC-Computing-Grid

HowTo: Einrichtung & Management von APs mittels des DWC-1000

Grid Aktivitäten bei DESY

Hochleistungsrechnen in Grids. Seminar: Grid-Middleware. Mirko Dietrich 4. Dezember 2006

SFTP SCP - Synology Wiki

mysql - Clients MySQL - Abfragen eine serverbasierenden Datenbank

Leichte-Sprache-Bilder

:: Anleitung Hosting Server 1cloud.ch ::

SSH Authentifizierung über Public Key

LCG. LHC Computing Grid. Rolf Reinthaler. Universität Würzburg. 17. Juli 2009

Andy s Hybrides Netzwerk

Grid-Aktivitäten an der RWTH-Aachen

Installation der SAS Foundation Software auf Windows

a.sign Client Lotus Notes Konfiguration

Übung: Netzwerkmanagement mit SNMP

Scheduling Mechanisms for the Grid

1. License Borrowing Verfahren

ACHTUNG: Es können gpx-dateien und mit dem GP7 aufgezeichnete trc-dateien umgewandelt werden.

Grid-Computing am LRZ 1. Schritt: GSI-SSH

Cloud-Computing Seminar - Vergleichende Technologien: Grid-Computing Hochschule Mannheim

Autorisierung. Sicherheit und Zugriffskontrolle & Erstellen einer Berechtigungskomponente

Umbenennen eines NetWorker 7.x Servers (UNIX/ Linux)

Installation Hardlockserver-Dongle

Konfiguration IKMZ / Universitätsrechenzentrum des Cisco VPN-Clients v3.6 Netze und Datenkommunikation

glite Data Management Grid Seminar 2005 Julia Coester, Thomas Warntjen

mysoftfolio360 Handbuch

Leitfaden zur ersten Nutzung der R FOM Portable-Version für Windows (Version 1.0)

Comtarsia SignOn Familie

-Verschlüsselung mit Geschäftspartnern

Grid-Computing bei CDFII

Websites mit Dreamweaver MX und SSH ins Internet bringen

Migration Howto. Inhaltsverzeichnis

OP-LOG

Lokale Installation von DotNetNuke 4 ohne IIS

Ebenenmasken Grundlagen

Netzsicherheit I, WS 2008/2009 Übung 12. Prof. Dr. Jörg Schwenk

Konfiguration von Igel ThinClients fu r den Zugriff via Netscaler Gateway auf eine Storefront/ XenDesktop 7 Umgebung

COMPUTER MULTIMEDIA SERVICE

Er musste so eingerichtet werden, dass das D-Laufwerk auf das E-Laufwerk gespiegelt

Support-Tipp Mai Release Management in Altium Designer

Einrichtung des Cisco VPN Clients (IPSEC) in Windows7

Die Projek*ools. Files, Git, Tickets & Time

Erste Schritte mit TeamSpeak 3

SAS Metadatenmanagement Reporting und Analyse

POP3-Protokoll Eine kurze Erklärung. Johannes Mayer SAI, Universität Ulm Juni 2001

How-to: HTTP Proxy mit Radius Authentifizierung an einem Windows 2003 Server. Securepoint Security System Version 2007nx

Web-Kürzel. Krishna Tateneni Yves Arrouye Deutsche Übersetzung: Stefan Winter

Windows 10 > Fragen über Fragen

Vodafone Conferencing Meeting erstellen

Architektur Verteilter Systeme Teil 2: Prozesse und Threads

Einbindung des Web Map Service für Gemeinden Anleitung

Die Captimizer BTZ-Datei 2015

Step by Step Webserver unter Windows Server von Christian Bartl

Virtual Private Network

Seminar. Grid-Computing. Wintersemester 2005/2006

Was ist PDF? Portable Document Format, von Adobe Systems entwickelt Multiplattformfähigkeit,

Oracle Database Backup Service - DR mit der Cloud

Handbuch xgdm-was Extension Version 1.0

SAMMEL DEINE IDENTITÄTEN::: NINA FRANK :: :: WINTERSEMESTER 08 09

Summer Workshop Mehr Innovationskraft mit Change Management

Installation SQL- Server 2012 Single Node

Senden von strukturierten Berichten über das SFTP Häufig gestellte Fragen

Upgrade auf die Standalone Editionen von Acronis Backup & Recovery 10. Technische Informationen (White Paper)

Administrator Handbuch

e-books aus der EBL-Datenbank

VIDA ADMIN KURZANLEITUNG

Geschrieben von Administrator Montag, den 15. November 2010 um 22:09 Uhr - Last revised Donnerstag, 16. Dezember 2010

Bilder im Drachenforum per Klicklösung veröffentlichen

oder ein Account einer teilnehmenden Einrichtung also

Eine Anleitung, wie Sie Mozilla Thunderbird 2 installieren und konfigurieren können. Installation Erstkonfiguration... 4

Facebook I-Frame Tabs mit Papoo Plugin erstellen und verwalten

Update / Inbetriebnahme domovea Server. Update/Inbetriebnahme domovea Server Technische Änderungen vorbehalten

BitDefender Client Security Kurzanleitung

Seminar Grid-Computing. Oktay Tugan, WS 2006/07 SICHERHEIT

HTBVIEWER INBETRIEBNAHME

2. Einrichtung der ODBC-Schnittstelle aus orgamax (für 32-bit-Anwendungen)

Verwendung des IDS Backup Systems unter Windows 2000

So funktioniert die NetWorker 7.5 Eigenschaft zum Sichern umbenannter Verzeichnisse ( Backup renamed Directories )

Übung - Konfigurieren einer Windows-XP-Firewall

ANYWHERE Zugriff von externen Arbeitsplätzen

MailUtilities: Remote Deployment - Einführung

LDAP. Universität zu Köln IT-Zertifikat Allgemeine Technologien 1 Dozentin: Susanne Kurz M.A Referent: Branko Dragoljic

WinCVS Version 1.3. Voraussetzung. Frank Grimm Mario Rasser

SharePoint Demonstration

Ihr habt Probleme auf die Closed Public Beta zuzugreifen? Dieses Dokument hilft Euch Antworten auf häufig gestellte Fragen zu erhalten.

SolarWinds Engineer s Toolset

Transkript:

Grid-Computing Ingo Strauch Mottenlinux-Treffen 10.05.2005 Übersicht: Was versteht man unter dem Grid Anwendungsgebiete Middleware Das LHC Computing Grid (LCG) Beispiele Referenzen Ingo Strauch, Mottenlinux-Treffen, 10.05.2005

Was versteht man unter dem Grid Begriff angelehnt an Power-Grid (d.h. Stromnetz) Der Verbraucher von Rechenleistung stellt eine Verbindung zum Rechennetz her, so wie der Stromverbraucher zum Stromversorgungsnetz. Alles was hinter der Steckdose passiert ist für den Konsumenten verborgen, er verbraucht einfach Leistung. (http://de.wikipedia.org/wiki/grid-computing) Aber... es gibt nicht das Grid Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 1/23

Unterschiedliche Auffassung von Grid Grid ist Modewort mit z.t. sehr unterschiedlicher Bedeutung Generelle Typen Computational-Grids: Zusammenfassung verteilter Rechenkapazitäten Data-Grids: transparenter Zugriff auf Daten an verschiedenen Standorten Kombination aus beidem Beispiele in der Industrie IBM: Rechenleistung on demand Oracle: haupts. hochverfügbarer Cluster Sun Grid Engine: lokale Rechner als Farm Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 2/23

Wer braucht Grid-Technologie? Physik Elementarteilchenphysik (Large Hadron Collider Experimente,... ) Astronomie (Radioteleskope 1,... ) andere Felder Medizin (Visualisierung, Therapie,... ) Bio-Informatik (Genom-Analyse,... ) Ingenieurswesen (Automobil- u. Flugzeugbau, Simulationen,... ) Klimaforschung (Wettervorhersage, Hochwasser-Simulation,... ) Heute: Beschränkung auf Elementarteilchenphysik; dort wichtigste Grids 1 Artikel in ix 11/04 LCG, NorduGrid, Grid 3, SAM Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 3/23

Grids in der Elementarteilchenphysik Beispiel: das CMS-Experiment am CERN eines von 4 Experimenten am Large Hadron Collider Messung von Proton-Proton Kollisionen bei Energie von 14TeV alle 4 Experimente zusammen weltweit 470 Institute 6200 Wissenschaftler erwartete Datenrate: 15 PetaByte/Jahr Daten und Rechenkapazität verteilt vorhalten LHC-Computing-Grid (LCG) Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 4/23

Schalenstruktur hierarchische Datenverteilung ( Tiers ) Tier-0: Rekonstruktion, Rohdaten Tier-1: rekonstr. Daten, Reprocessing zentrale Analysen Tier-2: Ereignis-Simulation, Nutzer-Analysen Tier-3: optional, kleine Gruppen/Unis deutsches Tier-1 Zentrum: GridKa 500 Rechenknoten mit je 2 CPUs 200TB Plattenplatz, 400TB Tape Ende April: 10 Tage Dauertransfer von Tier-0 zu sieben Tier-1 Zentren @ 600 MB/s http://www.heise.de/newsticker/meldung/59027 Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 5/23

Grid-Middleware Benötige Software-Komponenten, die Komplexität verstecken Middleware Verschiedene Projekte, hier Beschränkung auf Globus grundlegendes Toolkit wird von vielen Middlewares benutzt EDG (EU DataGrid) EU-gefördertes Projekt (04/2001-03/2004) LCG (LHC Computing Grid) produktionsreife Infrastruktur für die LHC Experimente (und andere) basiert auf stabilen EDG-Releases EGEE (Enabling Grids for E-Science in Europe) EU-gefördertes Projekt (04/2004-03/2006, geplant bis 2008) Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 6/23

Momentan 110 Sites im LCG-2 Grid Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 7/23

Acronym-Overkill BDII: Berkeley Database Information Index CE: Computing Element ClassAd: Classified advertisement CLI: Command Line Interface DIT: Directory Information Tree DN: Distinguished Name (LDAP) EDG: European DataGrid EDT: European DataTag EGEE: Enabling Grids for E-sciencE ESM: Experiment Software Manager GFAL: Grid File Access Library GGUS: Global Grid User Support GIIS: Grid Index Information Server GSI: Grid Security Infrastructure GUID: Grid Unique ID ID: Identifier IS: Information Service JDL: Job Description Language LB: Logging and Bookkeeping Service LDAP: Lightweight Directory Access Protocol LFC: LCG File Catalog LFN: Local File Name LRC: Local Replica Catalog LRMS: Local Resource Management System LSF: Load Sharing Facility MDS: Monitoring and Discovery Service RLS: Replica Location Service RM: Replica Manager RMC: Replica Metadata Catalog RMS: Replica Management System ROS: Replica Optimization Service SE: Storage Element SRM: Storage Resource Manager SURL: Storage URL TURL: Transport URL UI: User Interface VDT: Virtual Data Toolkit VO: Virtual Organization WMS: Workload Management System GLUE: Grid Laboratory for a Uniform EnvironmentMPI: Message Passing Interface WN: Worker Node GOC: Grid Operations Centre GRAM: Globus Resource Allocation Manager GRIS: Grid Resource Information Service PFN: Physical File name RB: Resource Broker RLI: Replica Location Index (aus LCG-2 User Guide) Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 8/23

Zugang zum Grid erfordert Public Key Infrastructure (PKI) GSI: Grid Security Infrastructure Authentifizierung: wer bin ich? Authorisierung: was darf ich? basiert auf X509 Zertifikaten ausgestellt von Certificate Authorities (CAs), für Deutschland: GridKa gesamte Authentifizierung kommt aus dem Globus Toolkit wer ich bin Virtual Organizations Zusammenschluß von z.b. Mitarbeitern des gleichen Experimentes Zugriff auf gemeinsame Ressourcen was ich darf Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 9/23

Was kann ich jetzt tun? Aufteilung in zwei Schwerpunkte Job/Workload Management Jobs starten/abbrechen Programme/Parameter spezifizieren einem Job Dateien mitgeben/output abholen Job Description Language (JDL) Data Management Dateien dem Grid bekannt machen Dateien im Grid von einer Site zu anderen replizieren Dateien ins Grid/aus dem Grid kopieren Datenkataloge Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 10/23

Wichtige Komponenten (Rechner/Dienste) User Interface (UI) Benutzerinteraktion Computing Element (CE) Zielsystem, an dem gerechnet wird i.a. ganze Rechnerfarm Worker Node (WN) eigentliche Rechenknoten viele WNs zu einem CE zusammengefaßt Storage Element (SE) wo die Daten liegen Replica Location Server (RLS) verwaltet Replicas und deren Speicherorte Grid Resource Information Service (local GRIS) Infodienst auf CEs & SEs welche Info durch sog. GLUE Schema definiert Grid Index Information Server (site GIIS) sammelt Informationen aller lokalen GRISes wie GRISes per LDAP abfragbar Berkeley Database Information Index (BDII) zentr. Anlaufstelle für Information System (IS) sammelt Informationen aller site GIISes Resource Broker (RB) entscheidet, wo gerechnet wird Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 11/23

Übersicht Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 12/23

Vorbereitung für Arbeiten im Grid Zum Arbeiten mit dem Grid ist Proxy-Zertifikat nötig, d.h. als erstes immer $ grid-proxy-init Enter GRID pass phrase for this identity: Creating proxy... Your proxy is valid until: Wed May 11 03:23:42 2005 Done Passwort wurde beim Certificate-Request gewählt Test ob Proxy vorhanden $ grid-proxy-info [...] type : full legacy globus proxy strength : 512 bits timeleft : 11:14:10 Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 13/23

Job/Workload Management Beispiel: Hello World erstelle JDL-Datei (hello world.jdl) mit folgendem Inhalt Executable = "/bin/echo"; Arguments = "Hello World"; StdOutput= "stdout"; StdError = "stderr"; OutputSandbox = {"stdout","stderr"}; ermittle verfügbare Ressourcen edg-job-list-match --vo <vo_name> hello_world.jdl Job abschicken edg-job-submit --vo <vo_name> hello_world.jdl dabei: OutputSandbox wird am Job-Ende aus dem Grid zurückkopiert Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 14/23

Job/Workload Management (Fortsetzung) Jeder Job über eindeutige Job ID gekennzeichnet, Form: https://grid-rb.desy.de:9000/wlb3aggdsnufhgceibcjhg Job Status abfragen edg-job-status https://grid-rb.desy.de:9000/wlb3aggdsnufhgceibcjhg mom. Status (z.b. SCHEDULED, RUNNING, DONE) bei welchem Computing Element gelandet Job Output abholen edg-job-get-output https://grid-rb.desy.de:9000/wlb3aggdsnufhgceibcjhg holt OutputSandbox vom Resource Broker ab Job abbrechen edg-job-cancel https://grid-rb.desy.de:9000/wlb3aggdsnufhgceibcjhg Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 15/23

Job/Workload Management Komplexere Beispiele weitere JDL Attribute InputSandbox: Dateien dem Job mitgeben (wenige MB) Requirements: z.b. installierte s/w, CPU-Zeit,... (Attribute aus GLUE Schema) Rank: wie CEs bevorzugen, die Requirements erfüllen InputData: welche Daten auf nahem SE liegen sollen nicht-standard-software benutzen offizielle s/w der VO auf WNs installieren per InputSandbox mitschicken wie Datenfile betrachten und am Jobanfang vom SE kopieren Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 16/23

Ablaufschema Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 17/23

Data Management Begriffe Jede Datei auf einem Storage Element hat einen Globally Unique Identifier (GUID) kennzeichnet Datei im Grid eindeutig z.b.: guid:8fa51ad0-f973-4afa-9607-905f6ee6761b ein oder mehrere Logical Filenames (LFNs) menschenlesbares Alias, mehrere für das gleiche File möglich z.b.: lfn:mcevents_pythia_ztautau.ntpl.cmkin_4_3_1.5000events ein oder mehrere Physical Filenames (PFNs) ein PFN pro Replica z.b.: sfn://accip41.physik.rwth-aachen.de/storage/dcms/generated/\ 2005-03-11/file92679a17-5773-4b6e-9d7b-19312fcc02e4 Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 18/23

Datei auf SE kopieren und im RLS registrieren Data Management Kommandos $ lcg-cr -d grid-se.desy.de --vo dcms \ -l lfn:hello_world.jdl \ file:$pwd/hello_world.jdl guid:\ cf03754d-d092-497e-8ecc-a6213b758384 $ lcg-rep --vo dcms \ -d ekp-lcg-se.physik.uni-karlsruhe.de \ lfn:hello_world.jdl Neuen LFN hinzufügen $ lcg-aa --vo dcms \ guid:cf03754d-d092-497e-8ecc-a6213b758384 \ lfn:doofer_name LNFs zur GUID finden Name der Replica $ lcg-la --vo dcms \ $ lcg-lr --vo dcms lfn:hello_world.jdl guid:cf03754d-d092-497e-8ecc-a6213b758384 srm://grid-se.desy.de/pnfs/desy.de/data/\ lfn:doofer_name dcms/generated/2005-05-10/\ lfn:hello_world.jdl file5d75ec1c-d5dc-4536-848d-20aec5399899 Alle Replicas finden Auf anderes SE replizieren Am Ende alle Test-Dateien löschen: $ lcg-del -a --vo dcms lfn:doofer_name $ lcg-lr --vo dcms lfn:doofer_name sfn://ekp-lcg-se.physik.uni-karlsruhe.de/... srm://grid-se.desy.de/... Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 19/23

Wo/wie kann ich das alles tun? User Interface (UI) Zentraler Punkt: das User Interface Einstiegspunkt ins Grid Nutzer loggen sich per ssh ein alle wichtigen Grid-Kommandos vorhanden prinzipiell jeder Rechner kann UI sein nötige Software globus, edg, lcg,... 400MB als RPMs für RedHat und ScientificLinux verfügbar muß anschließend an Site angepasst werden Informationen über CAs müssen ständig aktualisiert werden nicht vergessen: brauche Grid-Zertifikat und Mitgliedschaft in einer VO! Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 20/23

Probleme/Limitationen VO Mitgliedschaft derzeit nur Mitgliedschaft in einer VO möglich wird in Zukunft gelöst durch Virtual Organization Membership Service (VOMS) alle Mitglieder einer VO werden auf WNs/SEs auf dieselbe Unix ID abgebildet Information System Resource Broker starker Belastung ausgesetzt Information System propagiert Änderungen erst nach 2 Minuten verfügbare Tools teilweise sehr low-level viel per Hand Diagnosemöglichkeiten teilweise beschränkt/fehlermeldungen nichtssagend Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 21/23

Nachtrag für Hacker Zertifikat mit OpenSSL betrachten openssl x509 -text -in ~/.globus/usercert.pem LDAP Abfragen Mitglieder einer VO ldapsearch -x -H ldap://<vo-server> -b ou=<vo>,ou=vo,o=<org>,c=de local GRIS auf SE oder CE ldapsearch -x -H ldap://<ce/se-host>:2135 -b Mds-Vo-name=local,o=grid ldapsearch -x -H ldap://<ce-host>:2135 -b Mds-Vo-name=local,o=grid \ objectclass=gluecluster ldapsearch -x -H ldap://<ce-host>:2135 -b Mds-Vo-name=local,o=grid \ objectclass=gluece site GIIS (typisch auf CE) ldapsearch -x -H ldap://<ce/se-host>:2135 -b Mds-Vo-name=<Site>,o=grid Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 22/23

Weitere Informationsquellen I. Foster, C. Kesselman (1999): The Grid: Blueprint for a New Computing Infrastructure, Morgan Kaufmann Publisher Inc. I. Foster, C. Kesselman, S. Tuecke (2000): The Anatomy of the Grid: Enabling Scalable Virtual Organizations I. Foster, C. Kesselman, J. Nick, S. Tuecke (2002): The Physiology of the Grid: An Open Grid Services Architecture for Distributed Systems Integration H. Kornmayer im Linux-Magazin 06/2004: Vernetzte Welten - Das Globus-Toolkit, Version 2 A. Meyer in c t 22/2004: Nützliche Abfälle - Vom WWW zum Grid EGEE: Introduction to Grid Computing with the LCG-2 middleware, Grid-Kurs am DESY LCG-2 User Guide, sehr empfehlenswertes Handbuch Global Grid User Support, zentrale Anlaufstelle für Probleme LCG-2 Monitoring Map, Karte der Sites in LCG-2 Ingo Strauch, Mottenlinux-Treffen, 10.05.2005 23/23