Hochverfügbarkeit für die Datenbank

Ähnliche Dokumente
Hochverfügbarkeit für die Datenbank was ist zu beachten

Hochverfügbarkeit von TransConnect 2.2

Oracle DataGuard 10g im WAN

Hochverfügbarkeit mit Data Guard Möglichkeiten und Grenzen

APEX (Hoch) Verfügbar? Ernst Leber

Oracle Datenbanken Clonen. aber richtig. Wir kümmern uns!

Hochverfügbarkeit mit Data Guard Möglichkeiten und Grenzen

Oracle Grid Infrastructure 11gR2 im praktischen Einsatz

Harald Armin Massa. Hochverfügbarkeit mit PostgreSQL - ein Überblick. Swiss PG Day Rapperswil

<Insert Picture Here> Überblick Oracle Recovery Manager

Jochen Kutscheruk merlin.zwo InfoDesign GmbH & Co. KG. Wir kümmern uns!

Performance (und Probleme?) Oracle 10g mit ASM und SAN

Hochverfügbarkeit - wie geht das?

Datenbank als RAC oder in einer virtualisierten Umgebung?

Oracle VM Server (x86) im praktischen Einsatz

Oracle Backup und Recovery mit RMAN

2010 DataCore Software Corp. All rights reserved

Oracle VM Server (x86) im praktischen Einsatz

<Insert Picture Here> RAC Architektur und Installation

Erfahrungsbericht, Konsolidierung und Administration Real Application Cluster

Verfügbarkeit von Applikationen und Failover Szenarien. Winfried Wojtenek.

Oracle Automatic Storage Management (ASM) Best Practices

Oracle Flashback. in der Praxis Dr. Frank Haney 1

The Unbreakable Database System

Oracle Backup und Recovery

und DRBD und Gluster FrosCon 2017 Daniel Menzel

IT-Symposium /20/2004. Ralf Durben. Business Unit Datenbank. ORACLE Deutschland GmbH. 1

Agenda. FRA Was ist das? Warum sollte die FRA genutzt werden? FRA INIT Paramter Verzeichnisstruktur (Beispiel) Überwachung der Flash Recovery Area

Sichere Daten mit OSL Storage Cluster


Oracle und Hochverfügbarkeit Verschiedene Ansätze im Vergleich. Dierk Lenz Herrmann & Lenz Services GmbH DOAG Regio München/Südbayern 14.

Datensicherheit und Hochverfügbarkeit

Oracle Database 12c: RAC Administration

Oracle Grid Infrastructure 11gR2 im Einsatz

HOCHVERFÜGBARKEIT SICHERE VERFÜGBARKEIT FÜR IHRE DATEN

Daten: Gründungsjahr 1995 Schwerpunkte Oracle, VMware, Microsoft, Linux und Novell Ausschließlich zertifizierte Techniker:

!1 Copyright 2012, Oracle and/or its affiliates. All rights reserved.

Redundanzen. Verfügbarkeit = MTBF / (MTBF + MTTR)

18. Juni 2008, Berlin. Erfahrungsbericht üb das Backup und Recovery von ORAC Datenbanken mit Commvault QNetix. Dagmar Förster

Oracle Data Guard und RMAN das perfekte Team

Werner Rudolf Seite 1. Hochverfügbarkeitstechnologien in der IT

Backup & Recovery in Oracle 11g Funktionen und Features

56 Maßnahmen zur Sicherung der Verfügbarkeit in Oracle-Umgebungen. Client Client Client Client Client. Public Network. aktiv. Private Network.

Oracle 12c Real Application Cluster (RAC) und Grid Infrastructure

Datenbanken und Oracle, Teil 2

Backups im HA Umfeld, nur für Ewiggestrige? am Bsp. Exadata MAA Setup

Überblick über Oracle Technologie im Bereich Hochverfügbarkeit. Tage der Datenbanken FH Köln Campus Gummersbach 20. Juni 2013 Dierk Lenz

Aspekte der Hochverfügbarkeit in Servern für Telekommunikationsdienste

Oracle 9i Real Application Clusters

Dbvisit Oder doch lieber Data Guard?

Hochverfügbare Lösungen für Windows Serversysteme

Zuverlässigkeit und Sicherheit

Die Idee der Recovery Area: Sie enthält bei Beschädiging der Database Area alles, was für ein erfolgreiches Recovery gebraucht wird

Verfügbarkeit von RZ-Infrastrukturen Wie viel benötigt die Mittelgroß GmbH?

Hochverfügbarkeits-Szenarien

Datenbankreplikation in der Standard Edition. Markus Jendrossek

Virtualisierung und Hochverfügbarkeit

Minimal Downtime Oracle 11g Upgrade. DOAG Konferenz 2010 Martin Decker

Fehlertoleranzmechanismen in hochverfügbaren Clustersystemen

GSCC General Storage Cluster Controller. TSM Verfügbarkeit

ORACLE Database Migration

Application Business Continuity

Zuverlässigkeit und Verfügbarkeit

Backup/Recovery. Tobias Weidt,

Erhöhung der Verfügbarkeit der Stromversorgung - Probleme, Fehler und Ursachen

Lutz Fröhlich. Oracle ng. mitp

Backup und Recovery mit VSS Virtualisierte Oracle Datenbanken Manfred Wisotzky Peter Jensch DOAG Regionaltreffen 28. Januar 2016

Innova&ve IT Solu&ons. Oracle ACFS / Cloud File System. En?esselung Ihrer Business- kridschen ApplikaDonen. Ma#hias Pölzinger Senior Consultant

Eine TEAM-Präsentation

Verfügbarkeit aus Unternehmenssicht

<Insert Picture Here> RMAN Full Backups zum Preis von inkrementellen Backups

NECDIS GmbH. Technical Whitepaper. NEC Fault Tolerant Server Der 99,999 % Ausfallsichere

Lösen Sie (fast) alle ihre Probleme mit Oracle Advanced Queuing. Performance Lastverteilung

Oracle Hot Standby. XE, SEOne, SE. Maximum Performance Mode. WIN, Linux, Unix Einfache Lösung. bis zu 10 Standby DB

Möglichkeiten der - Archivierung für Exchange Server im Vergleich

Verfügbarkeit von Applikationen in Failover Szenarien

Oracle VM im praktischen Einsatz

Oracle Database Appliance X6-2 Familie. Bernd Löschner

HERZLICH WILLKOMMEN. Oracle Enterprise Manager Grid Control- Hochverfügbarkeit für den OMS. Markus Flechtner DOAG-Regionaltreffen 3.


ONLINE BACKUP STORAGE REGIONALES DATENBACKUP MIT BIS ZU 100 TB SPEICHERPLATZ. Irgendwo Speicherplatz mieten ist kein Problem.

Schlüsselworte Data Guard, Standby Datenbank, RMAN, Backup, Restore, Recovery

The Unbreakable Database System

HA Storage Cluster Lösung

Konsolidierungsplattform Exadata Betriebliche Erfahrungen. Gregor Büchner (Deutsche Telekom IT GmbH) Mai 2017

Flash Recovery Area in der Praxis

PoINT Storage Manager Installation

Jung Dynamisch Virtualisiert? Risiken der Realisierung

IBM DB2 UNIX/Linux/Windows Backup und Hochverfügbarkeit mit HADR

<Insert Picture Here> Die RZ-Zentrale - Grid Control hochverfügbar

OSL Storage Cluster - Produktübersicht Storage Networking & Virtualization Volume Management Clustering High Availability Disaster Protection

Szenarien zu Hochverfügbarkeit und Skalierung mit und ohne Oracle RAC. Alexander Scholz

Backup und Recovery mit Oracle-Bordmitteln

IBM Tivoli Storage Manager K-Fall Konzept

DOAG 2013 HOCHVERFÜGBARKEIT EINER SINGLE-INSTANZ (AKTIV/PASSIV-FAILOVER) OHNE RAC

Produkte und Systeme der Informationstechnologie ENERGIE- MANAGEMENT

Risikomanagement für den Mittelstand. Stefan Ehmann

ODA Erfahrungen und Neuigkeiten

Data Guard. Deutsche Oracle Anwendergruppe Regionalgruppe BI / MS / OS. Funktionsweise und Einsatzmöglichkeiten. Klaus Garstecki

Marathon everrun TM Was kommt nach den Clustern? Abschätzung geschäftlicher Auswirkungen Die wahren Ausfallkosten

Transkript:

Hochverfügbarkeit für die Datenbank Was ist zu beachten? Jochen Kutscheruk merlin.zwo InfoDesign GmbH & Co. KG

Die merlin.zwo-gruppe Bad Liebenzell Karlsruhe Neustadt / W. Eningen Seite 2

Warum Hochverfügbarkeit für die Datenbank? Seite 3

Überlegungen zur Wahrscheinlichkeit Seite 4

Ein kleines Beispiel USV1 Storage1 Server1 Switch1 Server USV Storage Switch USV2 Storage2 Server2 Switch2 Seite 5

Ein kleines Beispiel RAC Dataguard RAC RZ1 USV Storage Server Switch RZ3 Switch Server Storage USV RZ2 RZ4 Wahrscheinlichkeit eines Totalausfalls: 100%????!! Seite 6

Wahrscheinlich? Wie wahrscheinlich ist denn eigentlich ein Erdbeben der Stärke 9 in Nürnberg? Seite 7

Der Teufel steckt in der Zeitachse Nur wann? Heute Morgen 3 Mrd. Jahre (Deshalb kamen uns die 30.000 Jahre zwischen Tschernobyl und Fukushima so kurz vor) Seite 8

Definition der Verfügbarkeit Seite 9

Definition der Verfügbarkeit Ein System wird als verfügbar bezeichnet, wenn es in der Lage ist, die Aufgaben zu erfüllen, für die es vorgesehen ist. Als Verfügbarkeit wird die Wahrscheinlichkeit bezeichnet, dass ein System innerhalb eines spezifizierten Zeitraums funktionstüchtig (verfügbar) ist. Die Verfügbarkeit wird als Verhältnis aus fehlerbedingter Stillstandszeit (= Ausfallzeit) und Gesamtzeit eines Systems bemessen. Quelle: Wikipedia Seite 10

Verfügbarkeitsklassen Klasse Verfügbarkeit Ausfall pro Jahr 2 99% 3T 15:39:36 h 3 99,9% 0T 08:45:58 h 4 99,99% 0T 00:52:36 h 5 99,999% 0T 00:05:16 h 6 99,9999% 0T 00:00:32 h Dabei unbedingt zusätzlich zu beachten: MTBF: Mean Time Between Failure MTTR: Mean Time To Recover Seite 11

Alternative Klassifizierung Availability Environment Classification (AEC) (Harvard Research Group) Klasse Typ Beschreibung AEC-0 Conventional Funktion kann unterbrochen werden, Datenintegrität ist nicht essentiell AEC-1 Highly Reliable Funktion kann unterbrochen werden, Datenintegrität gewährleistet AEC-2 High Availability Funktion darf nur innerhalb festgelegter Zeiten oder zur Hauptbetriebszeit minimal unterbrochen werden AEC-3 Fault Resilient Funktion muss innerhalb festgelegter Zeiten oder während der Hauptbetriebszeit ununterbrochen aufrecht erhalten werden AEC-4 Fault Tolerant Funktion muss ununterbrochen aufrechterhalten werden, 24/7 Betrieb muss gewährleistet sein AEC-5 Disaster Tolerant Funktion muss unter allen Umständen verfügbar sein Seite 12

Arten der Datenbank-Verfügbarkeit Die Definition Hochverfügbarkeit ist abhängig von den Anforderungen! Verfügbarkeit der Daten Ein Datenverlust ist nicht akzeptabel Ein kurzzeitiger Ausfall der Anwendung ist akzeptabel Beispiel: Hochregallager Verfügbarkeit der Anwendung 24 x 7 x 365 notwendig Ein (kleiner) Datenverlust ist akzeptabel Beispiel: Tourismus-Webseite Seite 13

Wunsch und Wirklichkeit Der Wunsch (des Managements?): Verfügbarkeitsklasse 6 bzw. AEC-5 Minimale Anschaffungskosten Minimale laufende Kosten Die Wirklichkeit: Entweder Verfügbarkeitsklasse 6 Aber: Maximale Anschaffungs- und laufende Kosten Oder Minimale Anschaffungs- und laufende Kosten Aber: Verfügbarkeitsklasse 2 Seite 14

Die Wirklichkeit Begrenztes Budget Begrenzte Zeit Daher muss gegenüber dem Management klar kommuniziert werden, was mit dem gegebenen Budget in der gegebenen Zeit erreicht werden KANN! Aber: was kann denn erreicht werden? Seite 15

Berechnung der Verfügbarkeit Seite 16

Serienschaltung Serienschaltung abhängiger Komponenten Der Einfachheit halber: Verfügbarkeitsklasse 3 (99,9%) für jede Komponente USV Storage Server Switch 0,999 x 0,999 x 0,999 x 0,999 = 0,996 Gesamt! Jährliche Ausfallzeit: 34,99 Stunden statt 8,76 Stunden! Seite 17

Parallelschaltung Parallelschaltung von Komponenten RAC-Server Berechnet als Produkt der Ausfallzeiten: 0,001 4 x = 0,001 8,76 1x10Stunden -12 = x 0,001 0,000001 = 0,00003 / = Jahr 0,000000001 = Sekunden 31,5 Sekunden = / Jahr 0,03 / Sekunden Jahr / Jahr Jährliche Ausfallzeit: 30 µsekunden statt 8,76 Stunden! Seite 18

Parallel/Seriell-Schaltung RAC-Server Parallelschaltung von Komponentengruppen USV Storage Switch Berechnet als Produkt der Verfügbarkeiten: 0,999 x 0,999 x 0,999999999999 x 0,999 = 0,997 Jährliche Ausfallzeit: 26,3 Stunden statt 30 µs! Seite 19

Serienschaltung redundant Serienschaltung abhängiger redundanter Komponenten USV1 Storage1 Server1 Switch1 USV1 Storage1 Server1 Switch1 USV2 Storage2 Server2 Switch2 USV2 Storage2 Server2 Switch2 (1-(1-0,999) 2 ) 4 = 0,999999999984 = 0,5 ms / Jahr 1 - (1-0,999 4 ) x (1-0,999 4 ) = 0,99998405 = 8,4 Minuten / Jahr Seite 20

Weitere Überlegungen Die Eliminierung des SPOF (Single Point Of Failure) wäre notwendig, um die Verfügbarkeit wirklich steigern zu können. Der SPOF lässt sich jedoch nur verschieben, niemals eliminieren! Je weiter der SPOF verschoben wird, desto teurer wird das Gesamtsystem die Kosten steigen dabei nicht linear, sondern exponentiell. Seite 21

Weitere Überlegungen Zusätzliche Ausfallzeiten durch die gestiegene Komplexität des Gesamtsystems. Höhere Anforderungen an das Personal Höhere laufende Kosten! Kleines Beispiel: redundante Internetleitung im zweiten Brandabschnitt vorhanden? Wie lange wird benötigt, um das alternative Routing Intern/Extern korrekt lauffähig zu haben? Seite 22

Alternative / Ergänzende Ansätze Seite 23

Vorbemerkung Können einfache Lösungen auch funktionieren? Abhängig von den konkreten Anforderungen Wird nur Verfügbarkeit gefordert? Wird nur Datensicherheit gefordert? Welche Ausfallzeiten werden toleriert? Die Kombination Real Application Cluster / DataGuard auf entsprechender Hardware ist Unschlagbar im Bereich Ausfallsicherheit (Muss jedoch korrekt aufgesetzt worden sein!) Unschlagbar im Bereich Kosten Seite 24

Vorbemerkungen Ab wann ist ein System denn nicht mehr verfügbar? Hardwareausfall Dienste werden nicht gestartet (nach reboot) Antwortzeit: z.b. 30 Minuten statt 30ms Logisch (inhaltlich) korrupte Daten Physisch korrupte Datenblöcke Seite 25

Alternative Datensicherheit RMAN Image Copy auf zweite, unabhängige Storage Storage1 USV (Controlfile, Onlinelog, Datafiles) Server Switch Storage2 (Controlfile, Onlinelog, Archivelogs, Image Copy) Ersatzserver Vorteil: Keinerlei Datenverlust bei Ausfall einer Storage Nachteil: Zusätzliche, nicht unabhängige Storage-Komponente Notwendiges KnowHow im Fehlerfall verfügbar? Doppelter Festplattenplatz benötigt Seite 26

Alternative Verfügbarkeit Standby-Datenbank zu Fuß Server Kopie der Datenbank Ersatzserver Archivelogs regelmäßig kopieren Permanentes, skriptgesteuertes Recovery Vorteil: Günstig zu implementieren, wenig zusätzliches KnowHow notwendig Nachteil: Datenverlust garantiert Seite 27

Alternative Datensicherheit Ungewöhnliche Variante: Transportable Disk Server Ersatzserver Control, Redo, Data Nächtliche Kopie Umbau Control, Redo, Archive Vorteil: Keinerlei Datenverlust Nachteil: Notwendiges KnowHow im Fehlerfall verfügbar? Seite 28

Oftmals ungenutzte Möglichkeiten Flashback Database / Table Flashback Query RMAN Image Copy Allgemein: Strategien zur Vermeidung eines Datenbank Restores Notfallkonzept unabhängig überprüfen lassen! Ganz wichtig: Regelmäßige Notfallübungen! Seite 29

Die tatsächliche Implementierung Die tatsächliche Implementierung ist abhängig von vielerlei Faktoren: der geforderten Verfügbarkeit der benötigten Verfügbarkeit dem verfügbaren Budget der verfügbaren Zeit dem verfügbaren KnowHow des Fachpersonals Das in Abhängigkeit von diesen Faktoren erreichbare Ziel muss unbedingt klar kommuniziert werden! Seite 30

Fragen und Antworten????? Haben Sie noch Fragen? merlin.zwo InfoDesign GmbH & Co. KG Jochen Kutscheruk Telefon: 07052 50898 40 EMail: Web:? jochen.kutscheruk@merlin-zwo.de http://www.merlin-zwo.de Seite

Kontakt merlin.zwo Versprochen. merlin.zwo InfoDesign GmbH & Co. KG Jochen Kutscheruk Taglöhnergärten 43 76228 Karlsruhe Tel. 07052 508 98 40 jochen.kutscheruk@merlin-zwo.de http://www.merlin-zwo.de