Synchroner Spiegel & Applikationsverfügbarkeit Johan van den Boogaart
Definitionenvon DR/ BC HA-Cluster Ausfallsicherheit bei einem Fehler auf einem Knoten Backup Kopieren von Daten im Fall eines Datenverlustes 2
Definitionenvon DR/ BC Distaster/Recovery (K-Wiederherstellung) Alle Maßnahmen in der IT, die nach einem K-Fall eingeleitet werden Datenwiederherstellung Ersetzen nicht mehr benutzbarer Infrastruktur/ Hardware/ Organisation Business Continuity Nicht nur Wiederherstellung der IT-Dienste Unterbrechungsfreie Geschäftsabläufe 3
DR/BC Kriterien Recovery Point Objective (RPO) Wieviel Datenverlust kann in Kauf genommen werden? Recovery Time Objective (RTO) Die Zeit, die vom Zeitpunkt des Schadens bis zur vollständigen Wiederherstellung der Geschäftsprozesse benötigt wird Wiederherstellung der Infrastruktur + Daten Nacharbeitung von verlorenen Daten, wenn möglich Wiederaufnahme der Produktion Recovery Time and Point Objective RTPO TM 4
Synchroner Spiegel 5
SynchronerSpiegel Kein Single Point of Failure (SPOF) Verfügbarkeit 99,999% Null RPO Brandabschnitt bis 100 km 6
Ursachen eines Ausfalls kein K-Fall Mai 2014 The State Of Business Technology Resiliency, Q2 2014 7
Logische Fehler Fehlgeschlagene Wartungsarbeiten Unbeabsichtigtes Löschen Bedienungsfehler Datenkorruption durch Software-/ Hardware Fehler Beschädigte Datenimporte Sabotage durch Dritte 8
DR/BC bei logischen Fehlern Production Site Recovery Automation BC/DR Site Continuous Data Protection Offsite Backup Replication 9
Konfiguration einer Replikation Virtualization Team Storage Team Local vcenter Storage Locate all s affecting CRM Locate all Datastores Move all other app s to other LUNs Replication Management Remote Storage Map & Document Zza All LUNs Consolidate CRM s on separate LUN Consolidate all CRM s to same LUN Ensure sufficient space for replica Configure all replication pairs and entities Create and document recovery plan Document all LUN properties Allocate LUNs in replica with same properties Remote vcenter Verify replication Test recovery plan On going monitoring 10
Folgen eines Ausfalls "80% of unplanned outages are due to ill-planned changes made by administrators ("operations staff") or developers. The IT Process Institute's Visible Ops Handbook 11
Durchschnittliche Kosten eines RZ-Ausfalls Source: Understanding the Cost of Data Center Downtime: An Analysis of the Financial Impact of Infrastructure Vulnerability http://www.evolven.com/blog/downtime-outages-and-failures-understanding-their-true- 12
DR Test Heutige DR Tests sind komplex und teuer Intensive Koordination zwischen Storage/ Virtualization/ Infrastruktur Team DR Test nur am Wochenende Kosten Unzufriedene Mitarbeiter Wochenende meistenszu kurz für alle Tests DR Test nicht vollständig durchgeführt Source: Research in Action The Hidden Costs of Managing Applications in the Cloud July, 2013 13
Synchroner Spiegel Teuer & Komplex Latenzzeiten à Entfernung Failover per LUN Schützt nicht gegen >70% der Ursachen für Ausfälle 14
Applikationsverfügbarkeit Production Site BC/DR Site Recovery Automation Recovery Automation Continuous Data Protection Offsite Backup Replication 15
Applikation RTO & RPO Production Site Enterprise Applications CRM, ERP, SQL, Oracle, SharePoint, Exchange CRM VPG RPO 4 seconds ERP VPG RPO 6 seconds SQL VPG RPO 9 seconds 16
Automatisierter Replikationsprozess Example - Current replication configuration process for virtualized CRM Virtualization Team Storage Team Local vcenter Locate all Locate s all s affecting affecting CRM CRM Storage Locate all Datastores Move all other app s to other LUNs Replication Management Remote Storage Configure Map & Document verify Zza replication All and LUNs policies Consolidate CRM s on separate LUN Consolidate all CRM s to same LUN Ensure Ensure sufficient space space for for replica replica Configure all replication pairs and entities Create and document recovery plan Document all LUN properties Allocate Allocate space LUNs for in all replica replicated with same s properties Remote vcenter Verify replication Test recovery plan On going replication monitoring On going monitoring 17
DR Test Report 18
Fragen? 19
Danke schön!!! 20