OPNET s Application Response Expert (ARX) Root Cause Analyse und End2End Monitoring Summary Werden im IT Betrieb Probleme durch dei Anwender gemeldet, müssen schnell Informationen aus unterschiedlichen Bereichen der Service-Delivery bereit gestellt werden, um die problematischen Komponenten zu isolieren ist es der Server? oder das Netzwerk? Häufig könne jedoch mit den normalen Mitteln keine Fehler festgestellt werden, weil eine übergreifende Performance-Sicht fehlt. Diese Sicht kann mit der einer End2End-Lösung erstellt werden, die den komplexen Job der Errechnung von Antwortzeiten sowie deren Komponenten (Netzwer, Server, Applikation) übernimmt. Die OPNET ARX Appliance erfasst die Antwortzeit für alle Anwender, Server, und Applikationen. Die Performance einer Anwendung wird über den gesamten Weg erfasst, vom Client über das Netz zu den unterschiedlichen Server-Tiers, die eine Anwendung umfassen. Workflows erlauben Drilldowns von Rot/Grün Dashboards über aussagefähige Statistiken bis hin zu Traces. Damit ist die Lösung für IT Abteilungen von der Entwicklung- Rollout Planung, Ressource& Kapazitätsmanagement bis hin zum First Level / Second Level Support die primäre Plattform. Architektur OPNETs ARX System sind Probesysteme, die über SpanPorts oder Taps IP Daten erfassen, diese realtime analysieren und die Informationen in Statistiken oder Packet-Traces bereits stellen. Die Statistiken werden in Dashboards, Tabellen oder Reports dargestellt und bis zu 3 Jahren kontinuierlich abgespeichert. 1
Unterschiedliche Software Module können die Daten aus unterschiedlichen Perspektiven analysieren, wie Web Performance, SQL-Transaktionen, Voip oder generische Applikationen. IP Address-Bereiche werden in Business-Gruppen organisiert, so dass in den Charts oft Abteilungen oder Lokationen dargestellt werden anstatt IP Adressen. Ziel ist es, mit geringstem Aufwand oft nur einer zentralen Probe eine vollständige Ende-zu-Ende-Performance Sicht zu erzeugen, Schwachstellen oder Ursachen für Performanceverluste darzustellen und in quasi Realtime Anwender bei Troubleshooting- und Planungsprozessen zu unterstützen. Die System - Setup-Time ist extrem gering nach einer Stunde steht die Appliance und sammelt wertvolle Daten - größere Projekte werden innerhalb von wenigen Tagen abgeschlossen. Versionen ARX wird in unterschiedlichen Versionen geliefert beginnend mit einem Low-Cost Software-Only System bis zu der Datacenter Version mit mehreren zig Terrabyte Capture Speicher. Die Appliances können in großen Data-Centern als auch in Standorten kleiner oder mittlerer Größe eingesetzt werden. End User experience reale Antwortzeit Enduser Experience ist die real erlebte Antwortzeit, die beim Benutzer wahrgenommen wird. Die delay-relevanten Daten, die Einfluß auf die Enduser-Experience haben, wie zb. Network- oder Server-Delays - werden in der Appliance als Zeitwerte ermittelt. In der Grafik unten wird die gesamte, beim Benutzer erfasste Antwortzeit für eine generische Anwendung dargestellt und die einzelnen Bestandteile Server (rot), Netz (violett, gelb) und das Volumen der Anwendung (grün). 2
MultiTier-Environments Moderne Anwendungen sind i.d.r. über mehrere Tiers ausgelegt. Ein ARX System kann erkennen, wann ein Tier als Client und wann als Server fungiert und weist für beide Seiten die funktionstypischen Metriken auf. Damit können vollständige Tier-Beziehungen implementiert werden. Performance Statistiken Performance Statistiken beschreiben die User Response Time - die real erlebte Zeit, die für eine gesamte Transaktion durch den Anwender wahrgenommen wird, sowie deren ursächliche Komponenten. Dazu gehören entsprechend Die Server Response Time die Zeit, die ein Server benötigt, die Daten bereit zu stellen Die Netzwerk Zeit mit den Metriken von Latenz, Retranmission Delay Applikations Zeit als und Data Transfer Delay verursacht durch Volumen oder Message-Aufkommen Damit kann eine Antwortzeit und deren Ursachen sofort erkannt werden. Für spezifische Anwendungen wie Web Anwendungen, SQL etc. werden die Performancewerte in applikationsspezifischen Metriken angegeben wie zb. Pagetime die Zeit, die das Laden einer Webseite für den Anwender dauert. Utilization Statistiken ARX erfasst für die Top-5000 Kommunikationspartner den vollständigen Metriksatz, wie Anwendungen, Bytes, Packets, Connections, etc. und errechnet jedoch zusätzlich die Timing Effekte wie Server Responsezeit, User Experience, etc. Damit kann schnell der Einfluß von hoher Netzlast auf die Antwortzeit geprüft werden, ob zu viele Verbindungen die Server belasten oder wie sich ein WAN Upgrade auf die User-Experience auswirkt. Snapshot Buffer Ein ARX System kann auf IP Pakete in Rohformat auf eine halbes hundert Terrabyte Data Capture speichern, und diese Daten für einen Wireshark Export zv. Stellenn aber grundsätzlich sind auch diese Capturespeicher endlich und können in Hochlast- Zeiten in wenigen Tagen überschrieben werden und damit wichtigen Informationen löschen. Opnets ARX verwendet das Konzept der Snpashot-Buffer, bei der wichtigen Informationen 10 Mal länger im Speicher verbleiben als normale Daten. 3
Werden Alarm-Konditionen festgestellt, kann automatisch ein Trace-Ausschnitt erzeugt werden, der einen definierbaren Zeitraum vor und nach dem Eintreten der Alarmbedingungen umfasst. Diese Snapshots werden in einen getrennten Speicherbereich abgelegt, der ausschließlich diese Alarm-Traces beinhaltet und wird damit deutlich langsamer gefüllt und dementsprechend langsamer überschrieben. So können im Durchschnitt monatelang Alarme mit den zugehörigen Paket-Daten weg geschrieben werden. Web Anwendungen Webseiten werden automatisch erfasst und Performancebewertungen vorgenommen. In der Performancebewertung für die Webseiten wird die Ladezeit für die vollständige Webseite erfasst, anstatt die der einzelnen Web- Elemente, wie Grafiken, Text etc. Werden quasi- identische Webseiten vom System erkannt, werden diese in Web- - Page- Families automatisch organisiert. Unterschiedliche Webseiten können zu gescha fts- kritischen Web- Anwendungen organisiert werden und diese in Dashboards dargestellt werden. Sollen die einzelnen Web- Elemente bewertet werden, kann mit einer One- Click- Option die ausgewählte Webseite in Wireshark oder Ace- Analyst zur Detail- Analyse exportiert werden. Netflow Ein ARX System kann als Netflow Collector für Netflow Version 5,7 und 9 fungieren. Die erfassten Netflow Daten werden vollständig in das Datenmodell von ARX integriert und u.u. dedupliziert. 4
Damit können über Span-Ports erfasste Daten mit den Daten, die das System selbst nicht sehen kann, aber in Routern erfasst werden, korreliert werden. Data Representation ARX verwendet ein System grafischer Dashboards, um die vielfältigen Informationen anwendungs-spezifisch aufzubereiten und darzustellen. Die Dashboards sind workflow-orientiert und ermöglichen komplexe Analyse Joibs durch wenige Drill-Down Funktionen abzubilden. Citrix Tracer Citrix User können i.d.r. im Datacenter nicht identifiziert werden, da aus Sicht aller Tools der XenApp Server als verursachender Client fungiert. Citrix Analyse ist fast unmöglich, User Daten werden in Citrix verschlüsselt, das Protokollverhalten ist nicht context-basiert eine Mausbewegung erzeugt genauso viel Daten wie ein Kopie-Job, und wie schon geschrieben ist immer der XenApps-Server der Client für die Anwendung. 5
Mit der Opnet-Citrix-Tracer Lösung ist es möglich, Citrix-User Transaktionen durch den Xenapp Server zu verfolgen. Implementierung Erfahrungen in allen Projekten zeigen, dass ARX Systeme in Stunden implementiert werden und sofort relevante Daten aufweisen. Die Applikationen werden i.d.r. automatisch erfasst, die Kommunikations-Beziehungen gelernt und die Antwortzeiten und andere Statistiken für alle festgestellten Kommunikation festgeschrieben. Das System erlernt das Normalverhalten und erzeugt für Abweichungen automatisch Alarme. Wichtigste Aufgaben für den Kunden bestehen in der Definition der Business- Organisation und dem Mappping von IP Adressen zu den festgelegten Strukturen sowie der evtl. Anpassung von Alarmbedingungen. 6