Vorhersagemodell für die Verfügbarkeit von IT-Services

Vorhersagemodell für die Verfügbarkeit von IT-Services Magdeburg Research and Competence Cluster Very Large Business Applications Lab Fakultät für Informatik Institut für Technische und Betriebliche Informationssysteme Otto-von-Guericke-Universität Magdeburg Sascha Bosse sbosse@ovgu.de http://mrcc.ovgu.de/cvlba-lab/home/

1 Motivation: Service Level Agreements IT-Outsourcing wird durch Service-Orientierung und Cloud Computing weiter vorangetrieben Zwischen Anbieter und Kunde werden Service Level Agreements (SLAs) geschlossen o Rechtliche Rahmenbedingungen o Funktionale Beschreibung des Services o Nicht-funktionale Qualitätsmetriken (Quality of Service - QoS) Herausforderung für IT-Service-Provider: Erfüllen der SLAs bei minimalem Ressourceneinsatz Eine der wichtigsten QoS-Metriken ist die Verfügbarkeit

2 Motivation: Verfügbarkeit von IT-Services Garantierte Werte für Verfügbarkeit oft jenseits der 99 % Google Search hatte zwischen 1.9.2006 und 1.9.2007 eine Verfügbarkeit in Deutschland von 99,994 %, das entspricht 29 Minuten Downtime Aberdeen Group: Im Jahr 2012 erlitten die untersuchten 134 Unternehmen im Schnitt über 1 mio. $ an Umsatzeinbußen durch IT-Ausfälle Auch spezialisierte IT-Dienstleister wie Microsoft und Amazon haben mit Rechenzentrumsausfällen zu kämpfen Vorhersagemodelle können Management unterstützen

3 Methodologie Design Science Ansatz (vgl. Hevner et al. 2004, Pfeffers et al. 2008, Österle et al. 2011) Artefakt ist ein quantitatives Vorhersagemodell Evaluierung des Designs in zwei Schritten 1. Verifikation durch Vergleich mit etabliertem Ansatz 2. Argumentativ Design Analyse Evaluierung

4 Stand der Technik Verfügbarkeitsvorhersage recht reifes Feld Nach dem Divide-et-Impera-Prinzip wird ein System in seine Komponenten zerlegt Verschiedene Ansätze aus der Literatur o Qualitativ: keine quantitativen Ergebnisse o Quantitativ-Messbasierend: wenig Rückschlüsse für Systemverbesserungen, keine hypothetischen Szenarien o Analytisch-Kombinatorisch: Nehmen unabhängige Komponenten an o Analytisch-Zustandsbasiert: Leiden unter Zustandsraumexplosion

5 Stand der Technik: Abhängigkeiten Analytisch-Zustandsbasierte Verfahren sind in der Lage, Abhängigkeiten zwischen den Komponenten zu definieren, z.b.: o Fällt Komponente 1 aus, fällt auch Komponente 2 aus o Wird Komponente 1 wiederhergestellt, erhöht sich die Fehlerrate von Komponente 2 o Fällt Komponente 1 aus, kann Komponente 2 nicht gleichzeitig ausfallen Zustandsraumexplosion führt zu hohem Zeitverbrauch und numerischer Ungenauigkeit Kodierung in einem Petri-Netz erhöht Handhabbarkeit, aber Probleme bleiben bestehen bei analytischer Auswertung Alternative: Simulation der Petri-Netze

6 Modell Hierarchisches Modell aus drei Teilen o Servicemodell o Systemmodell o Komponentenmodell Komponentenmodell definiert Zustandswechsel zwischen ok und defect

7 Systemmodell Systemmodell beschreibt die Kombination der Komponenten Reliability Block Diagram ermöglicht serielle und parallele Verknüpfungen Kann um Abhängigkeitsbeziehungen erweitert werden

8 Beispiel: Ausfallabhängigkeit

9 Servicemodell Beschreibt Nutzung und Ausführung der Serviceoperationen Verfügbarkeit o Zeitbasiert Zeit in SystemUp o Request-basiert Anteil der Request Served

10 Verifikation: Szenario Beispielszenario eines internationalen ASPs

11 Verifikation: Ergebnisse Konfidenzintervalle der Verfügbarkeit in Abhängigkeit zur Iterationenanzahl Analytischer Wert gestrichelt

12 Fazit und Ausblick Verfügbarkeitsvorhersage wichtig für IT-Service-Provider Analytische Ansätze können Dynamik und Abhängigkeiten nur unzureichend abbilden Petri-Netz-Ansatz ermöglicht hohe Flexibilität Simulation zeitaufwändig, aber stabil Für Abhängigkeiten keine Referenzwerte => Validierung an realen Daten notwendig Menschliche Fehler sind nicht berücksichtigt => aber großer Anteil an Serviceausfällen

Vielen Dank für Ihre Aufmerksamkeit! Fragen? Anmerkungen? Kritik? Magdeburg Research and Competence Cluster Very Large Business Applications Lab Fakultät für Informatik Institut für Technische und Betriebliche Informationssysteme Otto-von-Guericke-Universität Magdeburg Sascha Bosse sbosse@ovgu.de http://mrcc.ovgu.de/cvlba-lab/home/

14 Beispiel: Standby -Redundanz