Peter Geigle Essential Bytes GmbH & Co. KG 65203 Wiesbaden
Monitoring Open Source Nagios
GroundWork OpenNMS Zenoss Nagios
GroundWork Überwachungssystem aus vielen OpenSource Programmen wie z.b. Nagios Stack Installer(Linux,VMware.zip) Basic auto discovery and configuration Reporting auch über charts Notification email+ custom script-
OpenNMS Enterprise Network Management System auf Basis von Open- Source RPM Installation Autodiscovery Reporting auch über charts Notification email+ custom script+
Zenoss kommerzielles OpenSource-Projekt mit freiem Kern Stack Installer(Linux,VMware.zip) Autodiscovery Reporting auch über charts Notification email+ custom script+
Einsatzbereich: Hardware und Betriebssystem Detaillierte Überwachung von Applikationen u. Datenbanken Oracle: Monitoring zur Überwachung diverser Betriebsparameter
Neuinstallation: Standardmäßig einige, wenige Scripte Durchführung grundlegender Überwachungs-Checks Nicht Ausreichend! Ziel: Überwachung der gesamten Datenbank in unterschiedlichen Zeitabständen mit unterschiedlichem Detaillierungsgrad
1. Aktueller Zustand der Datenbank Verfügbarkeit Auslastung Antwortzeiten 2. Abgriff von Datenbankwerten in längeren Zeitabständen Füllgrad bzw. Wachstum von Tablespaces Größe bzw. Wachstum von Datafiles 3. Healthchecks in größeren Zeitabständen Konformität mit Firmenrichtlinien Trends bei Speichermengen und Last
Vergleich der gesammelten Performance und Abgleich mit Baseline neben Datenbank muss auch der Application Server und die Anwendungen mit einbezogen werden Performancedaten aus : Hardware Datenbank Applicationserver Anwendung Gesamtüberblick über komplette Infrastruktur Benachrichtigung und zeitnahe Reaktion (möglich)
Überwachungslösung für komplexe IT-Infrastrukturen zur Überwachung und Erhöhung deren Verfügbarkeit Aufbau auf kleinen Modulen in C, C++, C#, Java, Perl, PHP oder Phyton diese müssen einen Statuswert an Nagios senden und Ausgaben tätigen können
5 unterschiedliche Statusmeldungen 0 = Okay 1 = Warning 2 = Critical 3 = Unknown 4 = Pending
Beispiel für Festplattenkapazitätscheck Modul überprüft Speicherplatz mit 3 Parametern Der Check c:\ Drive ist Gelb hinterlegt und mit einer Warnmeldung versehen Bei Überschreitung des Warning-Schwellwertes Anzeige auf der Oberfläche
Alarmierung durch Nagios d.h. Meldung an Verantwortlichen per E-Mail, SMS, Pager, IM-Message oder Anruf Beispielhafte Meldung von Nagios per email (hier bei einem Server Absturz)
Das Modulkonzept ermöglicht eigene Module schnell und einfach zu erstellen Serverseitig werden UNIX-Varianten sowie C-Compiler benötigt Clientseitig werden alle gängigen Systeme unterstützt Microsoft Windows, Mac OS X, Linux, Unix Zusätzlich: Freie Clientumgebung NSClient++ oder nrpe
Erweiterbar durch sogenannte Addons wie z.b. Visualisierungs-Addon NagVis oder grafisches Konfigurationssystem NagiosQL Das Addon NagVis
Abgrenzung von Nagios! bietet keine vordefinierten Überwachungen, Module sind zwar verfügbar, müssen jedoch eingerichtet werden keine Server- oder Clientsteuerung möglich kann jedoch durch eigene Scripte nachgebildet werden
Oracle Checks in 3 Unterkategorien 1. Unterkategorie 2. Unterkategorie 3. Unterkategorie kurze Intervalle derzeitiger Stand der Datenbank größere Abstände Trends erkennbar, interpretierbar keine Interpretation zeigen nur Trend an oder müssen interpretiert werden
Checks der 1. Unterkategorie 1. Listener Verfügbarkeit, Dauer des Connectversuches, Dauer TNS-Ping 2. Antwortzeit des Servers 3. laufen alle wichtigen Oracle Prozesse 4. Last auf Datenbank (Vergleich aktueller Last mit erstellter Baseline) 5. Alert-Log Prüfung auf neue kritische Einträge 6. Meldung von Deadlogs 7. Meldung blockierter und blockierender Sessions 8. Meldung fehlgeschlagenes Backup Diese Checks sorgen für Überblick über derzeitigen Zustand der Datenbank
Checks der 2. Unterkategorie 1. Füllgrad und Wachstum des Filesystems 2. Füllgrade von Tablespaces 3. Größe der Datafiles 4. Größe und Wachstum der Archivelogs 5. Plattenzugriffe, Durchsatz und Peaks 6. Prozessornutzung Diese Checks zeigen einen Trend über die Entwicklung des Füllgrades des Tablespace users an Diese Checks werden interpretiert und als Performancedaten gespeichert zeigen hierdurch den Trend an
Checks der 3. Unterkategorie 1. Nicht indizierte Foreign-Key-Spalten 2. Ungültige Objekte 3. Offline Tablespaces 4. Anzeige von Dateien, die nicht wieder hergestellt werden können 5. Prüfen des Backups auf Integrität 6. Rollen und Benutzerrechte 7. Systemprivilegien 8. Anmeldung als privilegierter Benutzer 9. OFA-Standards eingehalten 10. Firmenstandards eingehalten Die Checks decken einen großen Informationsumfang ab. Der Administrator muss nur an einer Stelle analysieren um Probleme und Schwächen der Datenbank zu finden.
OracleModul dient als Framework und zentrale Anlaufstelle für Verwaltung der einzelnen Oracle Checks Es ruft Scripte auf, die die Datenbank abfragen Zurückgegebene Werte der Abfragen gehen an das Modul zurück, das die Werte interpretieren kann und an Nagios weitergibt Zusätzlich zu den abgerufenen Infos aus gesamter IT-Umgebung erhält man jederzeit einen Gesamtüberblick über komplette Infrastruktur
Vergleich ist nur beschränkt möglich, da der OEM neben Überwachung zur Datenbankverwaltung genutzt werden kann. Beschränkung auf Überwachungs- und Auswertungsfunktion des OEM Gesamtübersicht des Oracle Enterprise Manager
Nagios OEM Einrichtung und Aufwand einer Installation Benötigt Oracle Application Server Patchmanagement nicht eingebaut Integriertes Patchmanagement Abbildung von Performancedaten mit grafischer Aufbereitung Automatische Auswertungen und Grafiken Aktueller Zustand und Historie Einbindung von Fremdsystemen und/oder Hardware
Peter Geigle Essential Bytes GmbH & Co. KG Hagenauer Straße 44 D-65203 Wiesbaden Telefon +49(0)611-2207079 Fax +49(0)7808-933633 E-Mail pgeigle@essential-bytes.de Internet http://www.essential-bytes.de