Linux Cluster in Theorie und Praxis



Ähnliche Dokumente
Icinga Teil 2. Andreas Teuchert. 25. Juli 2014

Aktuelle Themen der Informatik

Verteiltes Monitoring. 23. Oktober 2014

Webbasierte Installation des Cisco AnyConnect VPN-Client 3.1 unter Linux

SolarWinds Engineer s Toolset

Nagios System Monitoring

Step by Step Remotedesktopfreigabe unter Windows Server von Christian Bartl

OX Updater: als frei zu betrachten sind. Bitte senden Sie Verbesserungshinweise zu dieser Dokumentation an

Kurzanleitung zur Softwareverteilung von BitDefender Produkten...2

Nagios. Jens Link September Jens Link () Nagios September / 1

Lokale Installation von DotNetNuke 4 ohne IIS

Lizenzierung von Windows Server 2012

Monitoring - Vorher Wissen was passieren wird

Agenda - 1/26 - Agenda

Wo finde ich die Software? - Jedem ProLiant Server liegt eine Management CD bei. - Über die Internetseite

Check_MK. 11. Juni 2013

Titel. App-V 5 Single Server Anleitung zur Installation

Parallels Mac Management 3.5

MailUtilities: Remote Deployment - Einführung

ecaros-update 8.2 Update 8.2 procar informatik AG 1 Stand: DP 02/2014 Eschenweg Weiterstadt

Howto. Einrichten des TREX Monitoring mit SAP Solution Manager Diagnostics

Windows Server 2008 für die RADIUS-Authentisierung einrichten

Man liest sich: POP3/IMAP

Upgrade auf die Standalone Editionen von Acronis Backup & Recovery 10. Technische Informationen (White Paper)

Xerox Device Agent, XDA-Lite. Kurzanleitung zur Installation

DOKUMENTATION PASY. Patientendaten verwalten

2 Die Terminaldienste Prüfungsanforderungen von Microsoft: Lernziele:

Anwenderdokumentation AccountPlus GWUPSTAT.EXE

Installation der SAS Foundation Software auf Windows

Die DeskCenter Management Suite veröffentlicht neue Version 8.1

Eigenen WSUS Server mit dem UNI WSUS Server Synchronisieren

Einspielanleitung für das Update DdD Cowis backoffice DdD Cowis pos

Einbindung des Web Map Service für Gemeinden Anleitung

Projektmanagement in Outlook integriert

Benachrichtigungsmöglichkeiten in SMC 2.6

Powermanager Server- Client- Installation

LabTech RMM. Monitoring von MDaemon. Vertraulich nur für den internen Gebrauch

Matrix42. Use Case - Inventory. Version Februar

Select & Preprocessing Cluster. SPP Server #1. SPP Server #2. Cluster InterConnection. SPP Server #n

2. Installation unter Windows 8.1 mit Internetexplorer 11.0

Überwachung des Nagios-Servers. Stephan Schmidt 31. August 2007

Erfassung von Umgebungskontext und Kontextmanagement

Datenbanküberwachung mit Nagios Ein Praxisbeispiel

TELEMETRIE EINER ANWENDUNG

Installation von horizont 4 bei Verwendung mehrerer Datenbanken

Referenz-Konfiguration für IP Office Server. IP Office 8.1

LabTech RMM. Integration von Teamviewer. Vertraulich nur für den internen Gebrauch

desk.modul : ABX-Lokalisierung

Lizenzierung von Windows Server 2012 R2. Lizenzierung von Windows Server 2012 R2

generic.de QDBAddOn Produktinformationsblatt Automatisierung der NetIQ AppManager -Überwachung und Vereinfachung von bestehenden Funktionalitäten.

Print2CAD 2017, 8th Generation. Netzwerkversionen

Leitfaden zur Nutzung von binder CryptShare

SZENARIO BEISPIEL. Implementation von Swiss SafeLab M.ID mit Citrix. Redundanz und Skalierbarkeit

Konfiguration von Igel ThinClients fu r den Zugriff via Netscaler Gateway auf eine Storefront/ XenDesktop 7 Umgebung

Lokaler KMS Server im Schulnetzwerk (Kurzanleitung)

Anleitung Captain Logfex 2013

Windows 8 Lizenzierung in Szenarien

Der Check_MK Micro Core. 22. Oktober 2014

Qualitätsmanagement im Projekt

Sybase Central Dokumentation Aktivierung der Monitoringfunktion

collectd the statistics collection & monitoring daemon

Anbindung LMS an Siemens S7. Information

Entwicklungen bei der Linux Clustersoftware

Einsatzbedingungen FAMOS 3.10

Kern Concept AG Software Entwicklung HMO und BlueEvidence

Netzwerkversion PVG.view

Installation von Microsoft SQL Server 2012 RTM

Nagios Erweiterungen Der Rest. Nagios / Icinga. OpenSource Network-Monitoring im großen Stil. Manuel Landesfeind

ein Versandsystem das immer passt Systemvoraussetzungen für den Einsatz des HVS32

Teamschool Installation/ Konvertierungsanleitung

msm net ingenieurbüro meissner kompetent - kreativ - innovativ

Installationsbeschreibung Flottenmanager 7.1

MULTI-TIER RECHENZENTRUM - EIN DESIGN DER ZUKUNFT? Patrick Pulvermüller

Lizenz-Server überwachen

7HVWHQYRQ6$3$QZHQGXQJHQPLWGHP([WHQGHG &RPSXWHU$LGHG7HVW7RROH&$77

Qt-Projekte mit Visual Studio 2005

ESB - Elektronischer Service Bericht

Modul 129: LAN-Komponenten in Betrieb nehmen Thema: Fehlersuche. Netzwerk Fehlersuche. Technische Berufschule Zürich IT Seite 1

Verfügbarkeit von Applikationen und Failover Szenarien. Winfried Wojtenek.

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

PQ Explorer. Netzübergreifende Power Quality Analyse. Copyright by Enetech Alle Rechte vorbehalten.

Benutzerhandbuch. Leitfaden zur Benutzung der Anwendung für sicheren Dateitransfer.

SAP-Monitoring mit SNAG-View

USU Smart Link Ausblick & Roadmap

Configuration Management mit Verbosy OSDC Eric Lippmann

Vorschlag einer integrierten Monitoringlösung

InfoPoint vom 9. November 2011

Projektmanagement in Outlook integriert InLoox 5.x Installationshilfe für Windows Terminalserver

Erfassen von Service-Meldungen über das Web-Interface auf

Verwendung des Terminalservers der MUG

LabView7Express Gerätesteuerung über LAN in einer Client-Serverkonfiguration. 1. Steuerung eines VI über LAN

Zuverlässiger IT-Service und Support Wir haben Ihr EDV-System im Griff.

System Center Essentials 2010

init.at informationstechnologie GmbH Tannhäuserplatz 2/5.OG 1150 Wien Austria

Systemvoraussetzungen winvs office winvs advisor

Benutzer und Rechte Teil 1

peer-to-peer Dateisystem Synchronisation

Anleitung. Update/Aktualisierung EBV Einzelplatz Homepage. und Mängelkatalog

SharePoint Workspace 2010 Installieren & Konfigurieren

Transkript:

Foliensatz Center for Information Services and High Performance Computing (ZIH) Linux Cluster in Theorie und Praxis Monitoring 30. November 2009 Verfügbarkeit der Folien Vorlesungswebseite: http://tu-dresden.de/die_tu_dresden/zentrale_einrichtungen/ zih/lehre/ws0910/lctp INF 1046 Nöthnitzer Straße 46 01187 Dresden 0351-463 38783 Andy Georgi 2/22 Inhalt Monitoring 1 Monitoring 2 Ganglia m 3 Nagios Screenshots Definition Monitoring bezeichnet die systematische Erfassung oder Beobachtung von Vorgängen oder Prozessen mittels technischer Hilfsmittel. Das Ziel dieser Überwachung ist der steuernde Eingriff insofern definierte Schwellwerte über- bzw. unterschritten werden. Auf Mehrprozessorsysteme bezogen lassen sich dementsprechend folgende Mindestanforderungen an ein Monitoring-Tool stellen: Zentralisierte Messwerterfassung Skalierbarkeit Minimaler Overhead Definition von Grenzwerten und Benachrichtigung sobald diese unterbzw. überschritten werden 3/22 4/22

Inhalt 1 Monitoring 2 Ganglia 3 Nagios Screenshots Veröffentlichung von Version 1.0.0 erfolgte 2000 durch Matthew L. Massie Weiterentwicklung in Zusammenarbeit mit der Universität Berkeley (Matthew L. Massie, David E. Culler) und dem San Diego Supercomputer Center (SDSC) Aktuelle Version: 3.1.2 Designkriterien: Skalierbarkeit Fehlertoleranz Erweiterbarkeit Portierbarkeit Minimaler Overhead Wartungsaufwand unabhängig von der Anzahl der Knoten 5/22 6/22 I Das Ganglia-Monitoring-System setzt sich aus drei Komponenten zusammen: 1 Clientapplikation gmond (Ganglia Monitoring Daemon) 2 Serverapplikation gmetad (Ganglia Meta Daemon) 3 PHP-basiertes Webinterface II Ganglia Monitoring Daemon Installation auf jedem zu überwachenden Knoten Erfüllt vier Funktionen: Aufnahme lokaler Messwerte Verteilung der lokalen Messwerte an andere Clients Entgegennahme von Messwerten anderer Clients Senden des gesamten Bestands an Messwerten auf Anfrage an einen Server Übertragung der Statusinformationen mittels Multi- oder Unicast Repräsentation der Daten durch XDR Implementiert eine Vielzahl von Prozeduren zum Aufnehmen von Messwerten (siehe gmond -m) Schnittstelle für das Einbinden eigener Metriken wird bereitgestellt Abbildung: Ganglia überblick [GANG04] 7/22 8/22

III IV Ganglia Meta Daemon Webinterface Abfrage der Daten von einem Meta Daemon bei jedem Aufruf der Seite Knoten mit kritischen Werten werden hervorgehoben und an den Anfang der Graphenliste gesetzt Installation auf einem oder wenigen Servern Periodische Abfrage einer oder mehrerer Monitoring Daemons oder untergeordneter Meta Daemons Aggregation und Speicherung der Statusinformationen in einer Datenbank Aufgrund der hierarchischen Struktur ko nnen mehrere Cluster von einer zentralen Stelle u berwacht werden Abbildung: Screenschot Ganglia Webinterface 9/22 10/22 Inhalt [GANG03] University of California, Berkeley Ganglia Installation and Configuration, 2003 http://sourceforge.net/apps/trac/ganglia/wiki/ganglia%203. 1.x%20Installation%20and%20Configuration [GANG04] M. L. Massie, B.N. Chun, D. E. Culler The ganglia distributed monitoring system: design, implementation, and experience, Apr 2004 http://ganglia.info/papers/science.pdf 11/22 1 Monitoring 2 Ganglia U berblick 3 Nagios U berblick Screenshots 12/22

Entwicklungsbeginn März 1999 unter dem Namen NetSaint Autor: Ethan Galstad Umbenennung in Nagios im Jahr 2002 aufgrund einer Namensähnlickeit mit einer eingetragenen Marke Designziele: Modularer Aufbau Eskalationsmanagement Portier- und Skalierbarkeit Selbstständige Problemlösung Hochverfügbarkeit/Redundanz Open Source (GPLv2) I Nagios besteht im Wesentlichen aus vier Komponenten: 1 Nagios-Plugins 2 Clientapplikation (NRPE/NSCA) 3 Serverapplikation (Nagios) 4 CGI-basiertes Webinterface Abbildung: Nagios überblick 13/22 14/22 II Nagios-Plugins Verantwortlich für die Bereitstellung der Statusinformationen Werden entweder auf dem Server (wie z.b. check ping) oder auf dem Knoten selbst (wie bspw. check load) ausgeführt Das Plugin Paket von Nagios stellt grundlegende Funktionalitäten bereit Erweiterungen in Form von Binaries oder Skripten (Bash, Perl, Python... etc.) mit folgenden Eigenschaften möglich: Rückgabewert darf max. eine Zeile umfassen Endet mit einem der folgenden Return Codes: 0 = OK 1 = WARNING 2 = CRITICAL 3 = UNKNOWN Return Code abhängig von definierten Schwellwerten (Angabe mit -w für den Warnschwellwert und -c für den kritischen Schwellwert) III Clientapplikation Nagios stellt zwei Applikationen für die zu überwachenden Knoten bereit Die Wahl entscheidet gleichzeitig über die Art und Weise der Überwachung (aktiv oder passiv) Nagios Remote Plugin Executor (NRPE): Ausführung der Instruktionen vom Server und Rückgabe der Ausgaben Initiierung erfolgt durch den Server, daher spricht man hier von active checks oder active monitoring Nagios Service Check Agent (NSCA): Initiierung der Überwachung durch den Client und selbstständiges Senden der erfassten Daten an den Server Aufgrund der passiven Rolle des Servers wird diese Methode auch als passive checks oder passive monitoring bezeichnet 15/22 16/22

IV Screenshots I Serverapplikation Die Serverapplikation wird, in Abhängigkeit der zu überwachenden Nodes, auf einem oder mehreren Knoten installiert Sammlung der Statusinformationen kann aktiv oder passiv erfolgen Zentralisierte Aggregation und Speicherung der gesammelten Informationen Erweiterung der Funktionalität durch Plugins möglich Webinterface Bereitstellung einer Laufzeitumgebung über CGI Für den Betrieb von Nagios nicht zwingend erforderlich, bietet sich aber als sinnvolle Erweiterung für die Auswertung der Monitoringdaten an Filter sollen bei der Lokalisierung von Fehlern helfen Abbildung: Nagios Tactical Monitoring Overview [NAGSCR] 17/22 18/22 Screenshots II Screenshots III Abbildung: Service Status Details für alle Hosts [NAGSCR] Abbildung: Tree Status Map [NAGSCR] 19/22 20/22

Screenshots IV [NAGDOC] Nagios Core Development Team and Community Contributors Nagios Core Version 3.x Documentation, Jun 2009 http://nagios.sourceforge.net/docs/nagios-3.pdf [NAGSCR] Nagios Enterprises Nagios Screenshots, 2009 http://ganglia.info/papers/science.pdf Abbildung: Host State Trends [NAGSCR] 21/22 22/22