FEHLERTOLERANZ EINE SEHR GROBE ÜBERSICHT BETRIEBSSYSTEME UND SICHERHEIT, WS 2016/17 HERMANN HÄRTIG

Ähnliche Dokumente
Hardware, Fehlertoleranz, Am Beispiel Dateisysteme

Wegweiser. Gegenstand und Begriffe. Dateien und Verzeichnisse. Implementationsaspekte. Ablauf eines Dateizugriffs. Plattenspeicher

Hardware & Fehlertoleranz, Beispiel: Dateisysteme

Die allerwichtigsten Raid Systeme

RAID. Name: Artur Neumann

Zuverlässige Systeme Fehlertoleranz

Hard & Software Raid

Redundant Array of Inexpensive Disks

Verlässliche Systeme

RAID Redundant Array of Independent [Inexpensive] Disks

Betriebssysteme K_Kap11C: Diskquota, Raid

R.A.I.D. Redundant Array of Inexpensive ( oder Independent ) Disks Redundante Reihe billiger (oder unabhängiger ) Laufwerke

STORAGE. Martin Schmidt Berufsschule Obernburg

Kapitel 6 Anfragebearbeitung

Was machen wir heute? Betriebssysteme Tutorium 12. Organisatorisches. Frage 12.1.a. Programmieraufgaben Vorstellung. Antwort

Moderne RAID Technologie

Formale Grundlagen der Fehlertoleranz in verteilten Systemen

Lehrveranstaltung Speichersysteme Sommersemester 2009

Fakten statt Bauchgefühl: RAID Mathematik für Admins

Fehlertoleranzmechanismen in hochverfügbaren Clustersystemen

4 LCN VCN LCN Extents werden außerhalb der MFT gespeichert

Seminar "Pleiten, Pech und Pannen der Informatik" (SoSe 2002) Betriebsfehler: Fehlertoleranz und Redundanz

Verlässliche Systeme

Felix Großkreuz Philipps-Universität Marburg Fachbereich 12 Seminar IT-Administration SS2011

Software-RAID unter Linux

10 Datenträgerverwaltung, RAID

Angewandte Informationstechnik

9. Verwaltung von Ein- und Ausgabegeräten

Bedeutung der Metadateien. Alle Metadaten werden in Dateien gehalten. NTFS ist ein Journal-File-System

2. Braunschweiger Linux-Tage. Vortrag über RAID. von. Thomas King Braunschweiger Linux-Tage Seite 1/16

Die Sicht eines Sysadmins auf DB systeme

RAID Systeme. Redundant Array of Independent Disks. Stefan Berntheisel. Stand: Dezember 2003

RAID-Systeme. Proseminar Speicher- und Dateisysteme SoSem 2012 Kai Frederking

Grundlagen der Rechnerarchitektur

6.2 Master-File-Table (3)

Von Bits, Bytes und Raid

Motivation für Fehlertoleranz in VS Fehlermodelle Erreichen von Fehlertoleranz. Verteilte Systeme. 7. Fehlertoleranz

Alle Metadaten werden in Dateien gehalten

Moderne RAID Technologie. Grundlagen technisches Wissen, verständlich erklärt

1.1 Disk-Arrays und RAID für eine hohe Datenverfügbarkeit

Entwurfsmuster und Softwarearchitekturen für sicherheitskritische Systeme

Fantec SQ-35RU3e. 4x 3,5" SATA HDD, RAID, USB3.0, esata. Bedienungsanleitung

Automatisierung Rationalisierung

Netzwerkspeicherlösungen (NAS) mit Hardware-RAID. Hohe Datensicherheit und Zuverlässigkeit ohne Performance-Verlust.

Modellbasierte Software- Entwicklung eingebetteter Systeme

Oracle Automatic Storage Management (ASM) Best Practices

Systemanforderungen für MSI-Reifen Release 7

Eigene Dokumente, Fotos, Bilder etc. sichern

Redundanz und Replikation

15 Implementierung von Dateien 15.5 Beispiel: Windows NT (NTFS)

Vorlesung "Verteilte Systeme" Sommersemester Verteilte Systeme. 13. Fehlertoleranz. Verteilte Systeme, Sommersemester 1999 Folie 13.

2010 DataCore Software Corp. All rights reserved

Musterlösung. für Schulen in Baden-Württemberg. Windows Datensicherung. Musterlösung. Windows 2000 / Autor: Detlef Schreiber

Stellar Datenrettung Data Recovery Data Erasure Data Migration.

Kapitel 7 Beispiele für konkrete Techniken: Festplatten

Anleitung zur Installation von SATA- Festplatten und zur RAID-Konfiguration

Basiseinheit Cluster. Rückgrat des gesamten Systems. Basiseinheit Strom. entsprechender Eintrag für

Unterrichtseinheit 13

Blue Screen. Blaues Bild mit sehr vielen Informationen Tobias C. Sutor-EDV.de

Wiederholung: Realisierung von Dateien

Lokales Storage Teil 1

Verfügbarkeit von Applikationen und Failover Szenarien. Winfried Wojtenek.

Jetz' red' I SSD... NAS... RAID... An diese Folien wird gearbeitet. Hinweise sind willkommen.

0RGHUQH5$,'7HFKQRORJLH *UXQGODJHQ. 7HFKQLVFKHV:LVVHQYHUVWlQGOLFKHUNOlUW &RS\ULJKW ,&3YRUWH[&RPSXWHUV\VWHPH*PE+ )DOWHUVWUDVVH )OHLQ*HUPDQ\

Die neuen 3PAR StoreServ Systeme

Verteilte Systeme F. Fehlertoleranz

Die Einführung kann auch Nachteile mit sich ziehen:

Physische Datenorganisation

Betriebssysteme WS 2012/13 Peter Klingebiel, DVZ. Zusammenfassung Kapitel 4 - Datenträger/Dateiverwaltung

Grundlagen: Überblick

Wartung und Pflege von Adaptec RAID Lösungen

Alles Spricht von RAID-Verband

Desaster Recovery und mehr. Philip Rankers Product Manager

Verteiltes Backup. Einleitung Grundlegende Backup Techniken Backup in Netzwerken. Client/Server Peer-to-Peer

Software-RAID mit Linux. Sven Velt

Lokales Storage Teil 1

RAID-Konfigurations-Tool

Ontrack EasyRecovery 11 Produktvergleich

Grundlagen der Technischen Informatik. Hamming-Codes. Kapitel 4.3

Datensicherung. Wer was wie wo warum? Brauche ich das??

12 Fehlertoleranz. Begriffe

Safety und Fehlertoleranz

SSDs als Cache für HDDs

Rheinisch-Westfälische Technische Hochschule Aachen Lehrstuhl für Informatik 2 Prof. Dr. Ir. Joost-Pieter Katoen

Safety und Fehlertoleranz. Backup RAID Fehlertoleranz

PC-Komponenten. Die Bestandteile eines Computers

Grundlagen der Rechnerarchitektur. Ein und Ausgabe

Die Digitalisierung von Musik

PCI-EXPRESS-KARTE FÜR 2 SATA-II-KANÄLE. Bedienungsanleitung

Netzwerksicherheit. Teil 5: Virtualisierung und Ausfallsicherheit. Martin Mauve, Björn Scheuermann und Philipp Hagemeister

Datenbanksysteme II: Storage, Discs, and Raid. Ulf Leser

MAXDATA RAID-Controller

Verteiltes Persistenz-System. Mykhaylo Kabalkin

XIII. Inhaltsverzeichnis

Betriebssysteme. FU Berlin SS 2003 Klaus-Peter Löhr

OSL Unified Virtualization Server

XEN Virtualisierung und mehr

Grundlagen Technisches Wissen, verständlich erklärt

Transkript:

Faculty of Computer Science Institute of Systems Architecture, Operating Systems Group FEHLERTOLERANZ EINE SEHR GROBE ÜBERSICHT BETRIEBSSYSTEME UND SICHERHEIT, WS 2016/17 HERMANN HÄRTIG

BEGRIFFE Sicherheit/Security/Safety Fehlertoleranz Konstruktion zuverlässigerer Systeme aus weniger zuverlässigen Komponenten! 2

PLAN FÜR DIESE DS Fehler 5 Grundaufgaben Fallbeispiel: RAID Hardware Fehlermodell von Platten Anwendung 5 Grundaufgaben Bezug zur Systemarchitektur Weitere wichtige Fragen 3

FEHLER, FEHLER UND FEHLER Ursprüngliche Wirkung z.b. durch kosmische Strahlung verursachte Bit-Flips Sichtbarwerdung/Manifestation z.b. pointer kracht Wirkung z.b. falsche Daten werden gespeichert, Rechner stürzt ab englische Fachliteratur: Fault, Error, Failure 4

FEHLERTYPEN Entwurfsfehler Anforderungsanalyse Programmier- Fehler Ausfälle Äußere Effekte z.b. durch kosmische Strahlung verursachte Bit flips Alterung (Badewanne) 5

5 GRUNDAUFGABEN DER FT Entdeckung - Detection Isolation - Containment Behebung - Recovery Reparatur - Repair Redundanz 6

REDUNDANZ Zusätzliche Mittel für die Grundaufgaben: Zeit: Information: Struktur: Funktion: zusätzlich benötigte Zeit Kodierungen, Replikation gleichartiger Elemente für die Grundaufgaben benötigte zusätzliche Funktionalität 7

ENTDECKUNG Kodierungen Adressraumverletzung ( Segmentaton Fault ) Plausibilitätskontrollen viele, auch anwendungsspezifische Methoden/Wissen 8

ISOLATION Verhinderung der Ausbreiten von Fehlern direkte Erkennung und Abbrechen direkte Korrektur Adressräume 9

BEHEBUNG./. RECOVERY Herstellung eines korrekten oder konsistenten Zustandes forward backward (z.b. Checkpoints) 10

REPARATUR Wiederherstellen oder Austausch defekter Komponenten deren Eingliederung in System 11

RAID PLATTEN ALS BSP. Fehler Verfälschung magnetisch gespeicherter Informationen mechanische Beeinträchtigung (Crash) Ausfall der Plattenelektronik 12

PLATTENFEHLER Entwurfs-/Produktionsfehler Laufzeitfehler Beschädigung von Daten bspw. durch Magnetismus Reparatur: neu schreiben transiente Fehler Alterungsfehler, bspw. Ausfall einzelner Blöcke oder des ganzen Laufwerks Reparatur: Austausch permanenter Fehler 13

TRANSIENTE LESEFEHLER Jeder Block auf Platte hat Head/Tail mit redundanter Codierung Error Correcting Codes (ECC) Fehlererkennung und -korrektur durch Auswertungdieses Codes Buchführung zu Wartungszwecken Statistik: Festplatten mit höheren (transienten) Fehlerraten fallen auch bald komplett aus 14

PERMANENTE FEHLER: DEFEKTE Erkennung durch redundante Codes häufig schon bei Herstellung Vermeidung statt Entdeckung,Behebung, : Plattenspuren haben Bad Sector -Markierungen In Software: Datei mit Liste aller defekten Blöcke (Vorsicht bei Backup!), Blöcke als allokiert markiert Heute eher schon im Festplatten-Controller 15

AUSFALL VON LAUFWERKEN Entdeckung: Timeout sich häufende Lesefehler Recovery: Redundanz durch RAID Reparatur: Plattentausch 16

RAID PLATTEN ALS BSP. 17

PLATTEN Eigenschaften Persistente Speicherung Lesen/Schreiben in Einheiten von Blöcken (Sektoren) an beliebiger Stelle der Platte Beliebig häufiges Lesen und Schreiben Mechanik:Kopf verschieben / Scheiben rotieren 18

RAID - REDUNDANT ARRAY OF INDEPENDENT DISKS Ziel Bessere Leistung durch parallele ZugriffeAusgleich der Lücke zwischen immer schnelleren Prozessoren/ Speichern und nach wie vor langsamen Platte Nachteil: Mittlere Zeit bis zum Ausfall des Feldes ist kleiner Maßnahmen zur Fehlertoleranz! 19

OHNE REDUNDANZ (RAID 0) Disk Array aus n PlatteN Keine Kosten für Redundanz (trivial) Keine Fehlertoleranz 20

SPIEGELPLATTEN (RAID 1) Disk Array aus 2n Platten Jede Platte gespiegelt (identische Kopien) Schreiben: alle Daten zweimal Lesen: einmal, von schnellerer Platte Fehlertolerant (ein beliebiger Ausfall) Hohe Speicherkosten 21

EINZELNE PARITÄTSPLATTE (RAID 4) Nutzerdaten werden blockweise auf n Platten verteilt (striping)dateiblock 1 auf Disk 1, 2 auf 2,... Blockweise Paritätsbildung(Disk 1, Block 1) XOR (Disk 2, Block 1)... (Disk P, Block 1) Fehlererkennung durch jede Platte separat Rekonstruktion durch Paritätsbildung 22

RAID LEVEL 5 Probleme mit RAID 4: bei hohem Leseanteil: Paritäts-Platte nicht richtig ausgelastet bei vielen kleinen Dateien und Schreiboperationen: Engpass an Paritätsplatte Block Interleaved Distributed Parity Paritätsblöcke über gesamtes Array verteilt 23

WEITERE BEISPIELE Double modular redundancy (Stratus, ) TMR (TT-Ethernet) Replikation und Konsens Encoded processing 24

MITNEHMEN Grundelemente RAID als Beispiel 25