Oracle HA-Technologien im Überlick Björn Bröhl OPITZ CONSULTING Gummersbach GmbH Seite 1
Übersicht Was bedeutet Hochverfügbarkeit? Oracle HA-Technologien Standby Dataguard Failover-Cluster / Failsafe Seite 2
Was bedeutet Hochverfügbarkeit? Seite 3
Motivation Was kostet Sie eine Stunde Ausfallzeit? Branche Energie 2.800.000 Telekommunikation 2.000.000 Verarbeitende Industrie 1.600.000 Finanzinstitute 1.400.000 IT 1.300.000 Versicherungen 1.200.000 Handel 1.100.000 Pharmaindustrie 1.000.000 Bankwesen 900.000 Kosten in USD/ Stunde Quelle: IT Performance Engineering & Measurements Strategies: Quantifying Performance Loss, Meta Group, Oktober 2000 Seite 4
Was bedeutet Hochverfügbarkeit? In der Regel wird Verfügbarkeit in ihrer Bedeutung auf eine Prozentzahl reduziert: Uptime Downtime pro Jahr* Downtime pro Woche* 95 % 18,25 Tage 4 h 12 min 98 % 3,65 Tage 1 h 41 min 99,8 % 17 h 30 min 20 min 10 sec 99,9 % 8 h 45 min 10 min 5 sec 99,99 % 52 min 30 sec 1 min 99,999 % 5 min 25 sec 6 sec 99,9999 % 31,5 sec 0,6 sec * bezieht sich auf 24x365 Seite 5
Was bedeutet Hochverfügbarkeit? Die Verfügbarkeit eines Systems oder einer Systemkomponente ist definiert als prozentualer Zeitanteil, in dem dieses System bzw. die Komponente ohne Einschränkung funktioniert. Seite 6
Was bedeutet Hochverfügbarkeit? Ohne Einschränkung hat viele Implikationen. Die Verfügbarkeit ist daher anhand mehrerer Kriterien zu messen: Mean Time to Repair (MTTR, mittlere Dauer der Wiederherstellung nach einem Ausfall) Mean Time between Failure (MTBF, mittlere Zeit zwischen zwei Ausfällen) maximale Dauer eines Ausfalls Zuverlässigkeit Fehlersicherheit (Robustheit bei Fehlbedienung, Sabotage) System- und Datenintegrität Wartbarkeit Reaktionszeit / Antwortzeit Seite 7
Was bedeutet Hochverfügbarkeit? neue Herausforderungen durch Mehrschichtarchitekturen Seite 8
Gründe für Ausfallzeiten Nicht geplanter Aufall System Fehler Daten Fehler & Disaster menschlicher Fehler Stromausfall / System-Ausfall Festplatten-Fehler Fehler Wasser, Feuer,, Etc. gelöschte Tabellen Admin-Fehler geplanter Ausfall Routine Arbeiten Routine Arbeiten Backups Hardware & O/S Erweiterungen Seite 9
Was bietet Oracle? Archive Log Cold Standby Hot Standby Failsafe Flashback Real Application Cluster Und was das alles ist, erfahren Sie im Laufe dieser Veranstaltung Seite 10
Was bietet Oracle? Ungeplante Ausfallzeit Systemfehler Datenfehler & Desaster Menschliche Fehler Real Application Cluster Fast Restart, Data Guard Recovery Manager ASM, Data Guard Flashback DB, - Query Log Miner, Data Guard Geplante Ausfallzeit Routine Operationen System Wartung Partitioning, Data Guard Dynamic Reconfiguration Online Redefinition Data Guard Seite 11
Maximum Availability Architektur Seite 12
Oracle HA-Technologien Standby Seite 13
Cold -Standby-Datenbank Cold Standby Datenbank Produktiv-System Cold Standby-System Daten-Dateien Back-Up Restore Anwenden Online-Redo-Log-Dateien 1 2 n Archivierte Redo-Log-Dateien Seite 14
Bewertung der Cold Standby Datenbank Cold Standby: Vorteil: Kein Datenverlust: alle abgeschlossenen Transaktionen bleiben erhalten Nachteil: Aufwand im Normalbetrieb (Archivierung) Zusätzliche Hardware Zeitbedarf im Schadensfall: Restore: Bandsicherung einspielen (Archive) Recovery: Nachfahren aller Transaktionen seit der Zeit der Sicherung bis zum aktuellen Zeitpunkt Seite 15
Hot -Standby-Datenbank Hot Standby Datenbank Produktiv-System Hot Standby-System Daten-Dateien Daten-Dateien Übertragen Anwenden Online-Redo-Log-Dateien Online-Redo-Log-Dateien Seite 16
Bewertung Standby-Datenbank Hot Standby: Vorteil: Nachteil: Kein zeitaufwändiges Zurückschreiben der Datenbank-Dateien Minimales Recovery (lediglich die letzten Änderungsvektoren) Erhöhter technischer Aufwand Zusätzliche Lizenzen Seite 17
Arten der Standby-Datenbank Weitere Unterscheidungen bei Standby-Datenbanken: Physisch (seit Oracle 6): Logisch (seit Oracle 9i): Strukturidentisch Ist nur als Schatten- Datenbank brauchbar Änderungen am Produktiv- System werden über Recovery-Mechanismen nachgezogen Kann Read-Only geöffnet werden Enthält alle Informationen der Produktion, ist aber nicht strukturidentisch Kann zusätzliche Objekte enthalten Änderungen am Produktiv- System werden über SQL- Statements nachgezogen Kann Read-Write geöffnet werden Seite 18
Standby-Datenbank: Standby-Datenbank: Erhebliche Zeitersparnis im Schadensfall Minimierte Downtime Kann bei Lesezugriffen zum Load-Balancing eingesetzt werden (dies erhöht aber den Gap zwischen der Produktion und der Standby-Datenbank, verlangsamt also den Failover ) Erhöhter technischer Aufwand Ggf. zusätzliche Lizenzen nötig Seite 19
Oracle HA-Technologien Dataguard Seite 20
Data Guard Data Guard: Seite 21
Data Guard Data Guard: Zentrale Verwaltung von Produktion und Standby- Systemen (logisch & physisch) über Oracle Net GUI (Data Guard Manager) Anlegen, Verwalten, Überwachen von Standby- Datenbanken Seite 22
Data Guard Data Guard (Fortsetzung): Hoher Schutz der Produktionsdaten ( Zero Data Loss ) selbst bei physischer Korruption Flexible Schutz-Modi zur Balanzierung von Performanceund Sicherheits- Ansprüchen Failover (Produktionsausfall) Switchover (Server-Wartung) Load-Balancing zwischen Produktion und Standby- Systemen Seite 23
Oracle HA-Technologien Failover-Cluster / Failsafe Seite 24
Fail Safe Komponenten: Hard- und Software 3rd Party Cluster-Filesystem shared Disk für: Datafiles, Redologfiles Oracle Cluster-Filesystem (OCFS) RAW-Devices Server 1 Server 2 MSCS Interconnect, Heartbeat Seite 25
Wie funktioniert Fail Safe? aktiv passiv aktiv Server 1 Server 2 Seite 26
Vorteile von Fail Safe Fail Safe reduziert die Ausfallzeit sehr einfache Installation und Konfiguration Software Option für Microsoft Cluster Server (MSCS) Zusammenarbeit mit dem MSCS Automatische Starten des 2 Knoten Seite 27
Der Fail Safe Manager ermöglicht das Administrieren Administration durch den Fail Safe Manager Verwaltung der Knoten Gruppen und Resourcen Seite 28
Fragen und Antworten Kontakt: Björn Bröhl bjoern.broehl@opitz-consulting.de Seite 29