Verfügbarkeit und Monitoring

Ähnliche Dokumente
Monitoring REGIONALES RECHENZENTRUM ERLANGEN [RRZE]

Systemüberwachung / Monitoring

Wissensmanagement. Thema: ITIL

Oracle Cloud Control. Seminarunterlage. Version vom

Wissensmanagement. Thema: ITIL

NetEye Release Notes Version 3.9

Gunter Geib. Seite. DATEV eg, alle Rechte vorbehalten

Systemüberwachung / Monitoring

Service Monitoring Marktpartnerkommunikation

IT-SERVICEQUALITÄT AUS ANWENDERSICHT VERSTEHEN UND OPTIMIEREN USER EXPERIENCE UND CLIENTS BOSCH

Monitoring einer OpenShift Umgebung. DB Systel GmbH Holger Koch D.IDP 62 Frankfurt am Main

Automatisiertes Monitoring mit Icinga 2 und dem Director. Nicolai Buchwitz #Proxtalks 2018, 24. Oktober 2018

Systems Management bei ZFLS

Monitoring - Vorher Wissen was passieren wird

Copyright 2012, Oracle and/or its affiliates. All rights reserved.

DevOps und Red Hat Openshift Eine Traumkombination SEVEN PRINCIPLES AG

Textmasterformat bearbeiten

Domino Monitoring. 11:00 Uhr Mittwoch, Track 4 Session 8

Big Brother is watching

Service Level Management mit dem Oracle Enterprise Manager 10g DOAG SIG Fusion Middleware

Zielgruppenorientiertes IT Servicemonitoring. OSMC2013 Oliver Tatzmann

RealStuff Informatik AG

End-to-End Monitoring und Tracing

ITIL. Incident- und Problem- Management in der Anwendung. Uli Manschke Technical Consultant HP OpenView

DIGITALES INNOVATIONS-MANAGEMENT IM ÖFFENTLICHEN SEKTOR

<Insert Picture Here> Einhaltung von Service Level Agreements

Modernes IT Monitoring/Management

Ist Ihre Mainframe Anwendungs- Umgebung wirklich so effizient, wie Sie denken?

Oracle SOA Suite: Total Quality T-Systems

ITIL: Configuration, Change & Release Management

Was zeichnet eine gute Dokumentation im RZ-Umfeld aus? Dirk Peifer, Systemberater Datacenter

Ticketing mit ServiceNow Kurzanleitung

System i Monitoring & Automation

200 Millionen Messwerte pro Tag. App-Monitoring bei RTLs wer-kennt-wen.de

Foglight Performance Analysis for Oracle

DE-CIX GLOBEPEER SPECIAL SERVICE LEVEL AGREEMENT

Rolle eines Threat Management Centers im Rahmen des Risikomanagements nach ISO 27001

Managed Infrastructure Service (MIS) Schweiz

Migration in die Cloud

A1 Cloud Storage. Servicebeschreibung und Servicebedingungen. Version: 1.0 Datum:

Oracle System Application Management in a Nutshell

INFRA-XS, die E2E-Monitoring-Lösung für ITIL Implementierungen

Corporate IT Monitoring

Schulung advertzoom. advertzoom Release 2.1 Stand Januar advertzoom GmbH

Modul 3: Ankopplung des ITIL- Servicemanagements an das klassische Netzmanagement

Oracle Fusion Middleware Überwachung mit Oracle BAM

OPNET s Application Response Expert (ARX)

Echtzeitanalysen aus Perspektive der Endanwender

Übersicht Monitoring/Alerting Prometheus. Licht ins Dunkel. Monitoring mit Prometheus und Grafana. Alexander Schreiber

Gnädinger & Jörder Consulting Assuring Project Success

OXO³ technische Aspekte der Oracle EMEA internen BI Implementierung

IT-INFRASTRUKTUR SYSTEM- INTEGRATION ANALYSE KONZEPTION LÖSUNG

Cloud Computing in SAP Umgebungen

Integriertes IT-Infrastruktur-Monitoring bei der Österreichischen Flugsicherung

Anwendungsmetriken sammeln und auswerten mit Micrometer

Inhalt. 1 Einleitung (Introduction) 3 2 Voraussetzungen für diesen Service 3 3 Leistungsbeschreibung (Service Description) 4 4 Service Transition 5

Datenbanküberwachung mit Open Source-Mitteln. Markus Schmidt

Webcast: Java Nagios Monitoring in der Praxis

SLA- und Performance-Management mit Oracle GridControl

PRODUCTION INTELLIGENCE OUT OF THE CLOUD

hochverfügbare Oracle DB Anwendungen

»Selbst denkende«management-werkzeuge für die virtuelle Welt

EXXETA Insights. Aktuelle Themen und Trends. Susanne Neumann. Leipzig,

mit Nagios Regionaltreffen Osnabrück / Bielefeld / Paderborn Dr. Ulrich Reus

ITIL Prozese in APEX am Beispiel des Vodafone FCH

Cybersicherheit in der Smart Factory

Oracle Enterprise Manager 10g Grid Control Release 2

PROFI MANAGED SERVICES

Monitoring. Vertrauen ist gut, Kontrolle ist... Mathias Brandstetter Trend Micro Deutschland GmbH

Monitoring von Oracle-Datenbanken mit Nagios

Hand in Hand, um Ihren IT-Betrieb zu sichern. freicon.de monitos.de

Managed Plesk. 1. Produktdefinition. 2. Begriffsdefinitionen. Service Level Agreement. 2.1 Werktag. 2.2 Reaktionszeiten. 2.3 Systemkritische Anfragen

Application Performance Management. Auch eine Frage des Netzwerkes?

Hochverfügbarkeit mit Data Guard Möglichkeiten und Grenzen

Monitoring IBM Maximo. Siemens CORMAP. Hans-Rudolf Hornivius & Dirk Huppertz. Maximo Anwenderkonferenz

Herausforderungen von ITSM Lösungen mit JIRA Service Desk meistern.

Bedarfsgerechte Prozesse erstellen mit. ProcessManager

Open Source SLA Reporting mit Nagios

Icinga Einführung Thomas-Krenn.AG. Philipp Deneu

ConSol* Monitoring-Tools Ein Überblick - Mit Praxisbeispielen zum Einsatz bei Lidl -

Enterprise Service Management in einer internationalen Multiprovider Umgebung

Server-Überwachung mit Icinga 2

Ressourcen und Kapazitätsanalysen im Oracle-Umfeld

Oracle Cloud Control. Seminarunterlage. Version vom

AddOn Managed Services Die neue EinfachheIT

Verfügbarkeit aus Unternehmenssicht

Service Level Agreement

Checkliste ISO/IEC 27001:2013 Dokumente und Aufzeichnungen

Absicherung der IT-Infrastruktur: einheitliche Zugangskontrolle für LAN, WLAN und VPN. Volker Kull

Feedback aus der Produktion Ein Blick in den DevOps-Baukasten

Service Portal Die komplette IT auf einen Blick an jedem Ort, auf jedem Device, in Echtzeit. Network Visibility

PROFI MANAGED SERVICES

Energiemanagement nach ISO mit Envis Web.

Unsere Remote Solutions bringen Sie weiter. Viel weiter!

Strukturierte Verbesserung der IT-Sicherheit durch den Aufbau eines ISMS nach ISO 27001

System Monitoring. OMD // Check_MK // Nagios

Lösungen für ein sicheres System Management

»Anforderungen an ein modernes Prozessdaten-Informationssystem in der rohstoffverarbeitenden Industrie«Martin Gamperl MGS Software GmbH, Graz

<Insert Picture Here> Oracle Business Transaction Management (OBTM) in der Praxis

Transkript:

talk@ Verfügbarkeit und Monitoring von Websystemen und Umgebungen Armin Pech Dirk Röder Babiel GmbH check_http!talk.babiel.com!/3?d=20160901

Agenda Verfügbarkeit Pause Monitoring Q&A, Diskussion 2

Verfügbarkeit Hallo, ist da wer? 3

Agenda Verfügbarkeit Definitionen Messen und Bewerten Service Level Agreement Erreichbarkeit sicherstellen 4

Unser Service Mehrwert für Kunde Ohne Verantwortung für Kosten und Risiken Beispiel: Webseite Zuverlässigkeit + Stabilität Verfügbarkeit 5

Unser Service Architektur bestimmt Komponenten Service Komponente Sub-Komponente 6

Was ist Verfügbarkeit? % = Erwartung Ausfall Erwartung Welche Einheit? Zeit: Uptime, Response Time Anzahl: Systeme, Sessions / Hits Welcher Zeitraum? 24x7, 12x5 7

Verfügbarkeit in Zahlen 8

Messen: Planung Was: Antwort Wie: Protokoll Wo: Stationen Wann: Intervall, Zeitraum Intern: Komponenten / Systeme Extern: Service / Umgebung 9

Messen: Sichtweise User Kunde Webseite Webserver Applikation Dev/Admin Betreiber 10

Messen: Sichtweise externes Monitoring internes Monitoring 11

Messen: Beispiel Webseite Messung von Webseiten: Intern + Extern (3 Standorte) Verbindung (Layer 3 + 4) HTTP Status Inhaltsprüfung Antwortzeit Connections / Sessions 12

Messen: Beispiel Webseite Überwachung wird komplex! DNS-Auflösung integrieren Anwendungsverhalten (Redirects, Cookies) HTTP und HTTPS Inhalte aus Caches Services mit vielen Endpunkten (CDNs) 13

Messen und Bewerten Wie die Verfügbarkeit überwachen? 1. Normalzustand ermitteln 2. Schwellwerte definieren 3. Aufzeichnungen erstellen 4. Ereignisse und Entwicklung bewerten 5. Reports generieren 6. Trends vorhersagen 14

Messen und Bewerten Response Time einer Webseite intern Loadbalancer 15

Messen und Bewerten intern Loadbalancer extern FRA extern DUS#1 extern DUS#2 16

Messen und Bewerten intern Loadbalancer extern FRA extern DUS#1 extern DUS#2 17

Messen und Bewerten 18

SLA: Service Level Agreement Vereinbarung zwischen Kunde und Betreiber Anforderungen und Ziele Richtlinien zur Bewertung & Korrektur Geplante Wartung / ungeplanter Ausfall Kommunikation und Reporting Beeinflusst Systemumgebung 19

SLA Organisation ITIL definiert unsere Prozesse Monitoring Reporting Dispatching & Escalation Incident Management Problem Management 20

SLA Organisation ITIL definiert unsere Prozesse Monitoring Reporting Dispatching & Escalation Incident Management Problem Management Nachvollziehbarer Informationsfluss Probleme schnell korrigieren Nachhaltige Lösung suchen Dokumentation (Knowledge Base) 21

SLA Reaktionen Escalation: Alarmierungen Zeit bis Bearbeitung Kommunikation: Anbieter & Kunde Incident: Wiederherstellung des Service Zeit bis Reparatur Mean Time To Recover Problem: Anpassung der Umgebung Zeit bis Korrektur Mean Time Between Failure 22

Erreichbarkeit sicherstellen Gesamte Infrastruktur betrachten Abhängigkeiten prüfen Verfügbarkeit von Drittanbietern https://talk.babiel.com/2/lb-ddos Dokumentation / Notfallplan Schulung / Testing Backup? 23

Erreichbarkeit sicherstellen User Internet / Autonome Systeme Router Firewalls Loadbalancer / Caches Webserver Backends Applikationen Datenbanken / Storage 24

Pause Gleich geht's weiter 25

Monitoring Was tun unsere Systeme eigentlich den ganzen Tag so? 26

Agenda Definition von Monitoring Anforderungen im Monitoring Entwicklung der Plattformen Stand Heute Anregungen 27

Definition von Monitoring Kein Monitoring Überzeugung in Stabilität User basiertes Monitoring Benutzer sind schneller 28

Definition von Monitoring Manuelles Monitoring Skript basiert Zeitgesteuerte Skripte die Emails versenden 29

Definition von Monitoring Reaktives Monitoring Störung tritt ein (bemerkt durch User/Skript) Entstörung erfolgt durch Personal Merkmal der Störung wird überwacht 30

Definition von Monitoring Proaktives Monitoring (Alle) Kennzahlen eines Systems erheben Durch (zentrales) System ausgewertet Via Datenbank/Log langfristig nachgehalten 31

Schlagworte TSDB Time Series Database Datenbank für Messwerte Metrik / Performance Data 10 packets transmitted, 10 received, 0% packet loss, time 9013ms rtt min/avg/max/mdev = 8.334/8.716/10.168/0.534 ms Dashboard Grafische Darstellung von Metriken 32

Anforderungen Was will ich erreichen? Sicherstellung meines Dienstes Benachrichtigung bei Störungen Datenhistorie Automatische Problembehebung 33

Entwicklung der Plattformen 1988 SNMP 1995 MRTG 34

Entwicklung der Plattformen 1988 SNMP 1995 MRTG 1999 Nagios / OpenNMS / RRD Tool 35

Entwicklung der Plattformen 36

Entwicklung der Plattformen 1988 SNMP 1995 MRTG 1999 Nagios / OpenNMS / RRD Tool 2000 Ganglia 2001 Cacti / Zabbix 37

Entwicklung der Plattformen 38

Entwicklung der Plattformen 1988 SNMP 1995 MRTG 1999 Nagios / OpenNMS / RRD Tool 2000 Ganglia 2001 Cacti / Zabbix 2003 Munin 2006 Observium (LibreNMS) / HP OpenView / (IBM) Tivoli 39

Entwicklung der Plattformen 40

Entwicklung der Plattformen 1988 SNMP 1995 MRTG 1999 Nagios / OpenNMS / RRD Tool 2000 Ganglia 2001 Cacti / Zabbix 2003 Munin 2006 Observium (LibreNMS) / HP OpenView / (IBM) Tivoli 2011 #monitoringsucks 41

Entwicklung der Plattformen 1988 SNMP 1995 MRTG 1999 Nagios / OpenNMS / RRD Tool 2000 Ganglia 2001 Cacti / Zabbix 2003 Munin 2006 Observium (LibreNMS) / HP OpenView / (IBM) Tivoli 2011 #monitoringsucks 2012 Sensu / Riemann / Prometheus 2014 Grafana / Icinga2 42

Die Rolle von Nagios 1999 Nagios Daraus resultierte Entwicklungen 2004 OpsView mit Nagios Core 2008 CheckMK 2009 Icinga Fork 2009 Shinken als Python Implementation 2012 Op5 Monitor mit Nagios Core 2013 Naemon als Fork 43

Stand Heute Einige neue Möglichkeiten im Angebot All in One Lösungen Baukasten-Prinzip 44

All in One Lösungen Icinga2 45

All in One Lösungen Prometheus 46

All in One Lösungen TICK Stack 47

Baukasten-Prinzip Erhebung Auswertung Speicherung Darstellung collectd sysdb Diamond ffwd-java 48

Baukasten-Prinzip Erhebung Auswertung Speicherung Darstellung Riemann Sensu Prometheus 49

Baukasten-Prinzip Erhebung Auswertung Speicherung Darstellung Graphite InfluxDB OpenTSDB RRD 50

Baukasten-Prinzip Erhebung Auswertung Speicherung Darstellung Grafana Dashing 51

Anregungen Automatisierung Überwacht alles! Abhängigkeiten! Wer überwacht euer Monitoring? 52

Q & A Fragen? Anregungen? 53

Vielen Dank für euer Interesse! talk.babiel.com/3 (Folien) Verbunden bleiben: talk@babiel.com twitter.com/babiel facebook.com/babiel.gmbh 54