Nagios Netzwerke effektiv überwachen Christoph Stöttner christoph.stoettner@edcom.de Edcom Software & Consulting GmbH Leopoldstraße 29 80802 München +49 89 3840850 info@edcom.de www.edcom.de
Nagios Netzwerke effektiv überwachen Inhaltsverzeichnis 1 Einleitung 2 Monitoring - Prophylaxe und Zeitgewinn 3 Nagios 4 Nagios Addons 5 Angebot 6 Epilog
Nagios Netzwerke effektiv überwachen Einleitung Vorstellung Christoph Stöttner Linux seit 1993 IBM Lotus Domino seit 2000 Nagios seit 2004 Edcom Software & Consulting GmbH IBM Premier Partner 20 MA
Nagios Netzwerke effektiv überwachen Einleitung Monitoring ist effektiver Stressabbau Was möchte man als Admin vermeiden? Ausfälle und nicht verfügbare Dienste zur Hauptgeschäftszeit Mitarbeiter melden Ausfall dem Support, bevor man selbst den Ausfall bemerkt Blackberry-Dienst läuft nicht und das Management meldet sich bei der IT Leitung Verschenkte Zeit bei der Ersatzteilbeschaffung
Nagios Netzwerke effektiv überwachen Einleitung Warum? Arbeitsbelastung der Admins steigt Keine Zeit für regelmäßige Log-Analysen, Monitoring Ausfälle immer zur ungünstigsten Zeit Lieber in Ruhe reagieren, ohne Telefon- Terror und Zeitdruck
Nagios Netzwerke effektiv überwachen Einleitung Probleme lösen, bevor die Anwender sie bemerken!
Nagios Netzwerke effektiv überwachen Einleitung Warum monitoren? Unterschiedliche Admins bzw. Einstellungen Install and forget Log-Analyse im Fehlerfall mehr oder weniger regelmäßiges Monitoring je nach Arbeitsbelastung automatisierte Meldungen über verschiedene Tools Monitoring ist langweilig, also wie automatisieren? Wichtige Informationen sind verteilt im Netz Windows Eventlog Linux Syslog Datenbank- oder Anwendungsprotokolle
Nagios Netzwerke effektiv überwachen Monitoring - Prophylaxe und Zeitgewinn Monitoring Gesamtüberblick über das Netzwerk Sammlung im Netzwerk verteilter Daten Windows Events Linux Syslog Auslastung von CPU, Memory und HD Viele tägliche Arbeiten lassen sich automatisieren Log Analyse Füllgrad von Festplatten Trendanalysen für Haushaltsmittelanträge Steigerungen und Auslastung von Hardware aufzeichnen Beleg von Hardwarebedarf (Entwicklung Speicherbedarf der letzten Jahre) Report und Beleg für SLA Zeitnahe Benachrichtigung
Nagios Netzwerke effektiv überwachen Monitoring - Prophylaxe und Zeitgewinn Beispiele - DB Backup falsch konfiguriert Backupskript der Datenbanksicherung läuft Amok MSDE auf c: Backup und Log auf c: 10:15 Uhr Warning Message Disk 80% Full 10:20 Uhr Critical Message Disk 95% Full Plattenplatz konnte freigegeben werden, bevor der Server stehen blieb
Nagios Netzwerke effektiv überwachen Monitoring - Prophylaxe und Zeitgewinn Beispiele - DB Backup falsch konfiguriert Backupskript der Datenbanksicherung läuft Amok MSDE auf c: Backup und Log auf c: 10:15 Uhr Warning Message Disk 80% Full 10:20 Uhr Critical Message Disk 95% Full Plattenplatz konnte freigegeben werden, bevor der Server stehen blieb Ausfall zuvorgekommen - keine aufwändige Fehlerbehebung
Nagios Netzwerke effektiv überwachen Monitoring - Prophylaxe und Zeitgewinn Beispiele - iseries Netzteil iseries (AS/400) Netzteil defekt Ausfall einer Netzwerkkarte IST 17:00 Uhr Ausfall des Netzteils 8:00 Uhr Anruf eines Anwenders beim Support 8:15-8:30 Uhr Ersatzteilbestellung Ersatz nicht vor 12 Uhr im Haus Soll 17:00 Uhr Ausfall des Netzteils 17:15 Uhr Mailalarmierung des Admins 17:30 Uhr Fehler gefunden - Ersatzteilbestellung läuft 7:35 Uhr Netzteil geliefert - Einbau - Anwendung läuft
Nagios Netzwerke effektiv überwachen Nagios Nagios ehemals NetSaint Open Source Software unter GPL Framework zum Monitoring von verschiedensten Hosts und Services Modular erweiterbar zusätzliche Prüfprogramme (Checks) viele Plugins / Addons Erkennen von Trends Dokumentation für SLA große Verbreitung aktive deutsche Community einfach erweiterbar Flexibles Benachrichtigungssystem
Nagios Netzwerke effektiv überwachen Nagios Voraussetzungen Physikalischer Server oder virtuelle Maschine Standard-PC evtl. GB LAN Linux (oder Unix-Derivat) Debian Red Hat Ubuntu SuSE C-Compiler (mit Linux geliefert) TCP/IP (Standard Netzwerkkonfiguration) Webserver (Apache) GD Library (mit Linux geliefert)
Nagios Netzwerke effektiv überwachen Nagios Was kann man monitoren? Alles was ein Skript ausführen oder beantworten kann!
Nagios Netzwerke effektiv überwachen Nagios Mögliche Überwachungen Hardware Netzwerkgeräte Serverhardware Drucker Betriebssysteme CPU, Speicher, Festplatten Prozesse und Dienste Performance Logdateien Anwendungen Datenbanken Web- und Applicationserver (Apache, IIS, JBOSS) SAP Netzwerkdienste DNS, HTTP(s), FTP(s) LDAP(s), SMTP Netzwerkports (TCP, UDP)
Nagios Netzwerke effektiv überwachen Nagios Alarmierungsmethode E-Mail Jabber / Google Talk SMS Mail2SMS GSM Modem Twitter Eskalation Meldung an zusätzliche Kontaktgruppen möglich alternative Kontaktmethoden möglich Erkennen von Abhängigkeiten Vermeidung von Fehlalarmen
Nagios Netzwerke effektiv überwachen Nagios Notifications - Benachrichtigungen Config: normal check interval 5 retry check interval 2 max check attempts 4 Prüfung des Dienstes alle 5 Minuten bei Ereigniswechsel -Prüfung alle 2 Minuten Fehlerzustand nach 4 Tests, die das gleiche Ergebnis führen - Eventhandler wird ausgeführt - Prüfinterval wieder 5 Minuten Reagieren auf Ereignisse Bei OK - nicht OK Bei nicht OK - OK Ausführen von externen Skripten, SNMP Traps
Nagios Netzwerke effektiv überwachen Nagios Browser- und Clientunabhängig Schneller Überblick Dokumentation über Kommentare Downtime Arbeitsschritte Anzeige von Ausfällen über Themes anpaßbar Web Interface
Nagios Netzwerke effektiv überwachen Nagios Browser- und Clientunabhängig Schneller Überblick Dokumentation über Kommentare Downtime Arbeitsschritte Anzeige von Ausfällen über Themes anpaßbar Web Interface
Nagios Netzwerke effektiv überwachen Nagios Browser- und Clientunabhängig Schneller Überblick Dokumentation über Kommentare Downtime Arbeitsschritte Anzeige von Ausfällen über Themes anpaßbar Web Interface
Nagios Netzwerke effektiv überwachen Nagios Browser- und Clientunabhängig Schneller Überblick Dokumentation über Kommentare Downtime Arbeitsschritte Anzeige von Ausfällen über Themes anpaßbar Web Interface
Nagios Netzwerke effektiv überwachen Nagios WAP Interface http://nagiosserver/nagios/cgi-bin/statuswml.cgi
Nagios Netzwerke effektiv überwachen Nagios Host - Overview
Nagios Netzwerke effektiv überwachen Nagios Host - Detail
Nagios Netzwerke effektiv überwachen Nagios Service - Overview
Nagios Netzwerke effektiv überwachen Nagios Service - Detail
Nagios Netzwerke effektiv überwachen Nagios Netzwerkübersicht - Map Konfiguration über Element parents in Hosts Definition
Nagios Netzwerke effektiv überwachen Nagios Addons Nagvis Visualisierung von Prüfergebnissen auf Grafiken, Karten oder Fotos physikalisch (z.b. alle Hosts in einem Rack/Raum/Bereich) logisch (z.b. alle Applikations-Server) geographisch (z.b. alle Hosts in einem Land) Geschäftsprozesse (z.b. alle Hosts/Services, die in einen Prozess involviert sind) seit Version 1.4: Gadgets
Nagios Netzwerke effektiv überwachen Nagios Addons Nagvis Visualisierung von Prüfergebnissen auf Grafiken, Karten oder Fotos physikalisch (z.b. alle Hosts in einem Rack/Raum/Bereich) logisch (z.b. alle Applikations-Server) geographisch (z.b. alle Hosts in einem Land) Geschäftsprozesse (z.b. alle Hosts/Services, die in einen Prozess involviert sind) seit Version 1.4: Gadgets
Nagios Netzwerke effektiv überwachen Nagios Addons Beispiele für Nagvis Quelle: http://www.nagvis.org
Nagios Netzwerke effektiv überwachen Nagios Addons Beispiele für Nagvis
Nagios Netzwerke effektiv überwachen Nagios Addons Beispiele für Nagvis
Nagios Netzwerke effektiv überwachen Nagios Addons Beispiele für Nagvis Quelle: http://www.nagvis.org
Nagios Netzwerke effektiv überwachen Nagios Addons Beispiele für Nagvis Quelle: http://www.nagvis.org
Nagios Netzwerke effektiv überwachen Nagios Addons pnp4nagios Performancedaten darstellen und speichern Export in PDF und XML möglich
Nagios Netzwerke effektiv überwachen Nagios Addons pnp4nagios Performancedaten darstellen und speichern Export in PDF und XML möglich
Nagios Netzwerke effektiv überwachen Nagios Addons Grafische Konfiguration Nagconf NagiosQL Fruity Nconf
Nagios Netzwerke effektiv überwachen Nagios Addons Grafische Konfiguration Nagconf NagiosQL Fruity Nconf
Nagios Netzwerke effektiv überwachen Angebot Nagios Das eintägige get started-paket enthält: Fertig installiertes Vmware-Image mit Ubuntu Server 8.10 LTS Nagios 3 pnp4nagios, NagiosQL 3, NagVis 1.4 snmptt lauffähig unter ESX(i)3 oder Vmware Server 2 Einrichtung des Images in Ihrem Netzwerk Konfiguration einiger Hosts und Services Systemeinführung
Nagios Netzwerke effektiv überwachen Epilog Zusammenfassung Nagios übernimmt viele Routine-Aufgaben Einarbeitung und Einsatz lohnt sich in vielerlei Hinsicht Schrittweise implementierbar Erfassung Hosts (Server, Geräte) Erfassung Services Abhängigkeiten Erweiterungen Mehrwert durch: Aufzeichnung der Daten Antwortzeit Speicherplatzentwicklung Beleg für Verfügbarkeit Verlässliche Alarmierung Mail IM SMS
Nagios Netzwerke effektiv überwachen Epilog Fragen?
Nagios Netzwerke effektiv überwachen Epilog Vielen Dank für die Aufmerksamkeit! Einen ruhigen Feierabend mit Nagios