Bochum, 09.02.2010 Notfallplanung in der Praxis Stadtwerke Düsseldorf AG Uwe Bergfeld - Leiter Systemmanagement / Rechenzentrumsbetrieb
Agenda Vorstellung Stadtwerke Düsseldorf (EnBW) Das Rechenzentrum Die Notfallplanung in der Praxis Folie Nr.2
Agenda Vorstellung Stadtwerke Düsseldorf (EnBW) Das Rechenzentrum Die Notfallplanung in der Praxis Folie Nr.3
SWD im EnBW Konzern Kernaufgaben der Stadtwerke Düsseldorf Energieversorgung (Strom, Erdgas, Fernwärme) Trinkwasserversorgung Consulting Contracting Entsorgung Folie Nr.4
SWD Beteiligungen Folie Nr.5
SWD Kennzahlen 2008 Umsatz Bilanzgewinn 1.882 Mio. Euro 72 Mio. Euro Mitarbeiter gesamt 2611 Mitarbeiter IS 152 Folie Nr.6
Agenda Vorstellung Stadtwerke Düsseldorf (EnBW) Das Rechenzentrum Die Notfallplanung in der Praxis Folie Nr.7
RS6000 SD POWE R SUPPLY 2 PROLIANT POWE R SUPPLY 1 6400R SD POWE R SUPPLY 2 PROLIANT POWE R SUPPLY 1 6400R SD RS6000 SD Rechenzentren Folie Nr.8
Aufgaben Anwendungssysteme Lotus Notes SAP R/3 SAP IS-U GIS HR-Access File Server ORACLE Datenbanken 350 diverse Anwendungen hochverfügbar Folie Nr.9
Agenda Vorstellung Stadtwerke Düsseldorf (EnBW) Das Rechenzentrum Die Notfallplanung in der Praxis Folie Nr.10
Ausgangssituation IT-Notfallplanung Dauer bis Wiederanlauf der Systeme unbekannt Kosten für Wiederanlauf nicht verifizierbar Abwicklung für Wiederherstellung nach Ausfall nicht vorherseh- und planbar Kosten für Pflege Katastrophenfall-Dokumentation sehr hoch Aktives Katastrophenfall-Management nicht nachweisbar Folie Nr.11
Ziele einer IT Notfallplanung bei den SWD Einführung einer toolgestützten Notfallplanung mit der Software Alive-IT Absicherung des RZ- Betriebs nach einem K-Fall Erstellen von Notfallhandbüchern Schnittstellen zur Katastrophenvorsorge der Stadtwerke Düsseldorf AG Durchführung von Notfallübungen Folie Nr.12
Ermittlung der Anforderungen an den Wiederanlauf kritischer IT Systeme Vorhandene Priorisierungstabellen der Anwendungen sichten Erstellen einer neuen Priorisierungstabelle Überarbeiten der Priorisierung durch die Fachabteilungen Folie Nr.13
Priorisierte Wiederanlaufklassen Klasse / Priorität Max. Ausfallzeit Soll Ersatzbetrieb 0 6 Stunden Normal 1 6 Stunden Eingeschränkt 2 48 Stunden Eingeschränkt 3 >1 Woche Eingeschränkt Folie Nr.14
Notfallkonzept - Phasenmodell Phasenmodell zur Abwicklung von Notfällen und Tests für BCM und ITSCM: normaler Betrieb Phase 0 Erkennen, Alarmierung Eskalation Phase 1 Retten Phase 2 Sofortmassnahmen Phase 3 Vorbereitung Phase 4 Erstellen Testszenario Phase 5 Entscheiden Phase 6 Alarmierung Notfallteams Phase 7 Wiederanlauf Priorität 0/1 1 Phase 8 Wiederanlauf Priorität 2 Phase 9 Prüfung Phase 10 Rückbau Phase 11 Auswertung Phase 12 Notbetrieb Konsolidierung Phase 13 Rückverlagerung normaler Betrieb Notfall Notfall u. Test Test Folie Nr.15
Notfall Konzept Alarmierung (Bruno) Automatische Melder Feuer Wasser Einbruch Manuelle Melder Filialen Aussenstellen Feuerwehr Polizei Störung Sicherheitszentrale Tel.: xxxx Alarmierung nach nach vorliegender Liste Liste Expertenteams: Systembetreuer, Systemexperte,... gravierende Störung Escalation Eskalation Management Notfall nach Szenario nein Alarmierung nach vorliegender Liste ja Krisenstab ITSCM Notfallstab / Notfallteams Andere Notfallstäbe / Notfallteams Notfall Folie Nr.16
Notfallübung Vorgehen Notfalltest Krisenmanagement / Krisenkommunikation Angekündigter Termin Im Krisenraum der OE322-Systemmanagement Zeitlich begrenzt Ausgangpunkt: Realistisches Szenario Aufgabenstellung: Abarbeitung des Notfallplans Kontinuierlich werden 2 Notfallübungen pro Jahr durchgeführt ( > 2004) Folie Nr.17
Notfallübung Szenario: Ausfall eines SAP/R3 Produktionsservers Simuliert den Ausfall einer Zentralinstanz AIX V6,1; Oracle 10g; 830 Dialog Benutzer; 2,9 TByte Datenbank Dieses Szenario wird in drei Stufen durchgeführt 1. Stufe: Tabelle wird mit Daten befüllt 2. Stufe: Kommunikation zwischen Storageeinheit gestört (SRDF) 3. Stufe: IBM p6 Server wird hart ausgeschaltet Der Test wurde an einem Samstag durchgeführt um SWD Mitarbeiter möglichst nicht in ihrer Arbeit zu beeinträchtigen Folie Nr.18
POWER SUPPLY 2 PROLIANT POWER SUPPLY 1 6400R SD POWER SUPPLY 2 PROLIANT POWER SUPPLY 1 6400R SD Notfallszenario: Ausfall SAP Cluster Rechenzentrum Backup Rechenzentrum ATM Backbone IBM p6 Heartbeat IBM p6 SRDF Verbindung DMX 3 DMX 3 Folie Nr.19
ITSCM Testklassen Geschäftsprozesstest: 1/2 Unternehmen Geschäftsprozesse: Abrechnung, Stromerzeugung, Entsorgung Testtiefe Anwendungs- Test: 1/2 Anwendungen SAP Operational CRM Kraftwerk Personal OE 321 Anwendungsdienste test: 1/2 Anwendungsdienste SAP Produktion Abrechnungs system Zählerwesen HR- Access OE 322 Basistest: 1/2 Systeme UNIX Netz W2K Datenbank OE 322 323 Testkomponenten Folie Nr.20
Katastrophen- und Krisenstabübung bung Strategisch Katastrophen- Stab Krisenstab GB 1 Krisenstab GB 2 Krisenstab GB 3 Taktisch Personalmanagement und Soziales Stab (OE310) Informationsservice Stab (OE320) ITSCM Immobilien,Objektservice Und Logistik Stab (OE330) Wasserwerk Stab (OE340) Anwendungsentwicklung Notfallstab Produktions- Systeme Kommunikations- Technik Notfallstab Operational System Management Client Management Team Datenbank Folie Nr.21 Team AIX
Zeitplanung der Notfallübung 15.08.09 Folie Nr.22
Ergebnis der Notfallübung Umschalten auf den zweiten Standort hat ohne Probleme funktioniert SAP Produktion wurde 10 Tage aus dem zweitem Standort zur Verfügung gestellt FTP User: Passwörter mussten neu vergeben werden Oracle Datenbank Sicherung musste angepasst werden Abrechnung und Mahnlauf haben länger gedauert Folie Nr.23
Was ist der Nutzen der Stadtwerke Düsseldorf? Hoch aktuelle, aktive Notfalldokumentation beim schnellen Wiederanlauf nach Störungen/Ausfällen Ressourcen-Einsparungen für die Pflege der Notfalldokumentation Als Online-System für den täglichen Betrieb nutzbar (auch für Betriebsdokumentationen) Flexibel in die vorhandene Umgebung zu integrieren Standortübergreifend einsetzbar Folie Nr.24
Vielen Dank