Hardware & Fehlertoleranz

Ähnliche Dokumente
Hardware & Fehlertoleranz, Beispiel: Dateisysteme

Wegweiser. Gegenstand und Begriffe. Dateien und Verzeichnisse. Implementationsaspekte. Ablauf eines Dateizugriffs. Plattenspeicher

Die allerwichtigsten Raid Systeme

RAID. Name: Artur Neumann

Hard & Software Raid

STORAGE. Martin Schmidt Berufsschule Obernburg

Redundant Array of Inexpensive Disks

Kapitel 6 Anfragebearbeitung

SSDs und Flash Memory. Matthias Müller 16.Juni 2010 Institut für Verteilte Systeme

Betriebssysteme K_Kap11C: Diskquota, Raid

Grundlagen der Rechnerarchitektur

Fakten statt Bauchgefühl: RAID Mathematik für Admins

Was machen wir heute? Betriebssysteme Tutorium 12. Organisatorisches. Frage 12.1.a. Programmieraufgaben Vorstellung. Antwort

RAID Redundant Array of Independent [Inexpensive] Disks

RAID Systeme. Redundant Array of Independent Disks. Stefan Berntheisel. Stand: Dezember 2003

Felix Großkreuz Philipps-Universität Marburg Fachbereich 12 Seminar IT-Administration SS2011

Moderne RAID Technologie. Grundlagen technisches Wissen, verständlich erklärt

Betriebssysteme WS 2012/13 Peter Klingebiel, DVZ. Zusammenfassung Kapitel 4 - Datenträger/Dateiverwaltung

Alle Metadaten werden in Dateien gehalten

2. Braunschweiger Linux-Tage. Vortrag über RAID. von. Thomas King Braunschweiger Linux-Tage Seite 1/16

Bedeutung der Metadateien. Alle Metadaten werden in Dateien gehalten. NTFS ist ein Journal-File-System

SSDs als Cache für HDDs

Wiederholung: Realisierung von Dateien

Physische Datenorganisation

Hybride Cloud Datacenters

Using Remote Memory on Heterogeneous NOWs von Svetoslav Vasilev

Lokales Storage Teil 1

Verteiltes Backup. Einleitung Grundlegende Backup Techniken Backup in Netzwerken. Client/Server Peer-to-Peer

Dateisysteme und Datenverwaltung in der Cloud

Effizienter Einsatz von Flash-Technologien im Data Center

4.3 Hintergrundspeicher

0RGHUQH5$,'7HFKQRORJLH *UXQGODJHQ. 7HFKQLVFKHV:LVVHQYHUVWlQGOLFKHUNOlUW &RS\ULJKW ,&3YRUWH[&RPSXWHUV\VWHPH*PE+ )DOWHUVWUDVVH )OHLQ*HUPDQ\

PVFS (Parallel Virtual File System)

Überblick. Multi-Cloud Computing Motivation Redundant Array of Cloud Storage (RACS) Zusammenfassung. c td MWCC (WS14/15) Multi-Cloud Computing 13 1

4 LCN VCN LCN Extents werden außerhalb der MFT gespeichert

PROFI UND NUTANIX. Portfolioerweiterung im Software Defined Data Center

RAID-Systeme. Proseminar Speicher- und Dateisysteme SoSem 2012 Kai Frederking

Jetz' red' I SSD... NAS... RAID... An diese Folien wird gearbeitet. Hinweise sind willkommen.

Kapitel 7 Beispiele für konkrete Techniken: Festplatten

10 Datenträgerverwaltung, RAID

Implementierung von Dateisystemen

Massenspeichersysteme im Einsatz bei TIER 2/3 Grid-Zentren

Simplivity Rechenzentrum in a Box

Verteilte Systeme. Einführung. Prof. Dr. Oliver Haase

Lokales Storage Teil 1

Speichermanagement auf Basis von Festplatten und optischer Jukebox

Einsatz Flashspeicher Vorteil oder Risiko

PRÄSENTATION MAGNETISCHE FESTPLATTEN. Proseminar Speicher- und Dateisysteme. Björn Fries 10. /

4. Vorlesung Betriebssysteme

Verteilte Dateisysteme in der Cloud

Lehrveranstaltung Speichersysteme Sommersemester 2009

B-Bäume I. Algorithmen und Datenstrukturen 220 DATABASE SYSTEMS GROUP

Betriebssystemschichten ( )

Die klassische HDD & Das Mysterium SSD. Ernst Fankhauser

Prototypvortrag. Exploiting Cloud and Infrastructure as a Service (IaaS) Solutions for Online Game Service Provisioning. Projektseminar WS 2009/10

Zuverlässige Systeme Fehlertoleranz

MICROSOFT WINDOWS AZURE

Software-RAID unter Linux

Gliederung. Was ist Cloud Computing Charakteristiken Virtualisierung Cloud Service Modelle Sicherheit Amazon EC2 OnLive Vorteile und Kritik

Was darf das Grid kosten?

Flash-Technologie und RAID

Open Source für (Münchner) Unternehmer. Donatus Schmid Sprecher der Geschäftsleitung Marketing Direktor Sun Microsystems GmbH

Protected User-Level DMA in SCI Shared Memory Umgebungen

Vision: ICT Services aus der Fabrik

Virtueller Speicher. SS 2012 Grundlagen der Rechnerarchitektur Speicher 44

Netzwerksicherheit. Teil 5: Virtualisierung und Ausfallsicherheit. Martin Mauve, Björn Scheuermann und Philipp Hagemeister

Storage News wie viele IOPS sind zeitgemäß? Mathias Riediger & Sven Willholz Systems Engineering

Angewandte Informationstechnik

Cloud Computing mit mathematischen Anwendungen

DRAM Speicherfehler im Betriebssystem Problem und Gegenmaßnahmen

Seminar Cloud Data Management WS09/10. Tabelle1 Tabelle2

9. Verwaltung von Ein- und Ausgabegeräten

Leistungsanalyse von Rechnersystemen

Theorie und Einsatz von Verbindungseinrichtungen in parallelen Rechnersystemen

1.1 Disk-Arrays und RAID für eine hohe Datenverfügbarkeit

Informatikdienste Virtualisierung im Datacenter mit VMware vsphere

Anfragebearbeitung. Vorlesung: Dr. Matthias Schubert

ROSIK Mittelstandsforum

Technische Informatik II

Fantec SQ-35RU3e. 4x 3,5" SATA HDD, RAID, USB3.0, esata. Bedienungsanleitung

LVM AUSARBEITUNGEN ZUM THEMA A6: TIMO BÖLLINGER DOMINIC ECKART DOZENT: PROF. TISCHHHAUSER MANNHEIM 2004 VON UND

Cloud Computing. Betriebssicherheit von Cloud Umgebungen C O N N E C T I N G B U S I N E S S & T E C H N O L O G Y

Hybride Cloud Datacenter

Übersicht. 1. Was ist Flash Memory? 2. Wie funktioniert Flash Memory? Einordnung Vorteile, Nachteile. Spezielle Technologie Schreiben Lesen.

Musterlösung. für Schulen in Baden-Württemberg. Windows Datensicherung. Musterlösung. Windows 2000 / Autor: Detlef Schreiber

ZFS Filesystem und KVM-Virtualisierung

PostgreSQL Hardware und RAM Tuning

Prüfung VO Betriebssysteme SS2008 / 7. Juli 2008

Übersicht über Technologie und Nutzung von Solid State Drives

1C02. RAID Performance Grundlagen. Wozu überhaupt über I/O Performance nachdenken?

I/O Performance optimieren

Virtualisierung in der Automatisierungstechnik

Azure und die Cloud. Proseminar Objektorientiertes Programmieren mit.net und C# Simon Pigat. Institut für Informatik Software & Systems Engineering

Die Technologie von Solid State Disks

IO Performance in virtualisierten Umgebungen

MAXDATA RAID-Controller

Einfach erklärt: RAC Grundlagen für Dummies

Anleitung zur Installation von SATA- Festplatten und zur RAID-Konfiguration

Von Bits, Bytes und Raid

Transkript:

Hardware & Fehlertoleranz Betriebssysteme Hermann Härtig TU Dresden Hermann Bjoern Doebel Härtig TU Dresden Amazon Web Services

Wegweiser Platten- und Flash-Speicher Prinzipien der Fehlertoleranz RAID als ein Beispiel BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 2

Funktionsweise von Platten Arm Kopf Spindel Zylinder, Spur (track) BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 3

Funktionsweise von Platten Eigenschaften Persistente Speicherung Lesen/Schreiben in Einheiten von Blöcken (Sektoren) an beliebiger Stelle der Platte Beliebig häufiges Lesen und Schreiben Mechanik: Kopf verschieben / Scheiben rotieren Block: Header Daten Tail: error correction codes BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 4

Eigenschaften von Platten Entwicklung der Plattentechnik Latenz: verbessert sich nur sehr allmählich Kapazität: wächst sehr schnell Optimierung: Flash-memory in Plattenlaufwerken Im Vergleich zu anderen Komponenten CPU-Leistung wächst sehr schnell Netzleistung wächst sehr schnell Dateisystem: außerordentlich kritisch für die Leistungsfähigkeit von Rechnern BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 5

Kenngrößen von Platten Größe, Kapazität und Zugriffsgeschwindigkeit sind bestimmt durch: Drehgeschwindigkeit Spurdichte (Zoning) Schreibdichte Beschleunigungs- und Bewegungszeiten Settle-Time (Kopfberuhigung, Kalibrierung) Caching Bus BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 6

Ablauf eines Plattenzugriffs (SCSI) Rechner - Gerätesteuerung (1):Kommando, Adresse Gerätesteuerung (2): Kommando, Adresse Umrechnung der Adresse in plattengeometrische Größen Seek : Start-Zeit, Bewegung, Stop-Zeit Abwarten Rotation Datentransfer Gerätesteuerung 1 z.b. PCI Controller CPU Peripherie-Bus (z.b. PCI) MEM Gerätesteuerung 2 (Platten-Controller) Bus BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 7

... setzt sich zusammen aus: Zugriffszeit Kommandogenerierung und -transfer seek(positionieren): Beschleunigung Bewegung Abbremsen Kopfberuhigung Spur-Identifikation Rotations-Latenz Daten-Transfer BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 8

Bandbreite... ist die übertragene Informationsmenge pro Zeiteinheit (MByte/s) (Drehgeschwindigkeit konstant) Laufwerk: Zoning niedriger höher Beispiel Abstand von Spindel: 1 cm / 2 cm Spurumfang: 6 cm / 12 cm BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 9

Allokation: Block Dateien Blöcke einer Datei in der Nähe zueinander Dateien mit großer Anforderung an Bandbreite nach außen Ziel: möglichst große Lese-/Schreiboperationen Vorauslesen ( read ahead ) Plattenaufträge sortieren Nicht mehr FIFO Konsequenzen Minimiere mechanische Bewegungen (seek, rotate) Auf Hardware- und Betriebssystem-Ebene BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 10

Caches Caches Virtueller Speicher Buffer-Cache Gerätesteuerung 1 CPU Peripherie-Bus MEM Caches Bus Gerätesteuerung 2 BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 11

Entwickelt aus EEPROM Flash-Speicher EEPROM: einmal schreibbar, danach teurer Lösch-Zyklus vor Wiederbeschreiben Lese-Geschwindigkeiten ähnlich zu DRAM Im Gegensatz zu Festplatten weniger anfällig für Magnetismus Stöße Herstellungskosten höher als bei Festplatten Basis für moderne SSDs u.ä. BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 13

Flash-Speicher: Performance Medium Lesen Schreiben Löschen DRAM 13.9 ns / 1 B 7.1 µs / 512 B NOR Flash 45.0 ns / 1 B 23.0 µs / 512 B NAND Flash 15.0 µs / 1 B 35.0 µs / 8 kb 13.9 ns / 1 B 7.1 µs / 512 B 14.0 µs / 1 B 7.2 ms / 512 B 300 µs / 1 B AVG: 350 µs / 8 kb MAX: 500 µs / 8 kb Festplatte AVG: 8.2 ms / 512 B AVG: 9.2 ms / 512 B - - 18.0 ms / 128 kb 1.5 3 ms / 1 MB T. Kuo: Challenges and Solutions for Consumer Flash-Memory Devices, National Taiwan University, CODES 2011, Taipeh 2011 BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 14

Flash-Speicher: Aufbau Schreiben: seitenweise (1 page = 512 B) Überschreiben erst nach vorherigem Löschvorgang möglich (analog zu EEPROM) Granularität: 1 Block = 32 Seiten = 16 kb 512 B Lesen / Schreiben Block 1 Block 2 16 kb Löschen Block 3 Block 4...... T. Kuo: Challenges and Solutions for Consumer Flash-Memory Devices, National Taiwan University, CODES 2011, Taipeh 2011 BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 15

Flash-Speicher: Anbindung Standard-Dateisystem (ext4...) auf Flash-Gerät: Optimiert für Festplatten mit hohen Seek-Zeiten Flash-Seek-Zeit quasi 0 Löschen durch Überschreiben nicht möglich wegen blockweisem Löschen bei Flash Spezielles Flash-Dateisystem (im BS) oder Flash Translation Layer in Hardware: Fehlerkorrektur, Garbage Collection Begrenzte Anzahl von Schreiboperationen pro Flash- Zelle möglich (10.000 100.000) Wear Leveling: gleichmässige Verteilung von Schreiboperationen über alle Blöcke BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 16

Flash-Speicher: Aktualisierung Aktualisierung durch Schreiben in freie Seite kein Löschaufwand Live Pages Free Pages A B C D Block Aktualisierung: A A', B B' A B C D A' B' Dead Pages T. Kuo: Challenges and Solutions for Consumer Flash-Memory Devices, National Taiwan University, CODES 2011, Taipeh 2011 BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 17

Flash-Speicher: Verwaltung L D D L D D L D L L D L L L D Schreiben des Blockes nicht mehr möglich Garbage Collection L D L L L D D L L L D L Live Free D Dead T. Kuo: Challenges and Solutions for Consumer Flash-Memory Devices, National Taiwan University, CODES 2011, Taipeh 2011 BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 18

Flash-Speicher: Verwaltung L D D L D D L D L L D L L L D Garbage Collection: (1) Kopieren der lebendigen Seiten in freie Seiten L D L L L D D L L L D L Live Free D Dead T. Kuo: Challenges and Solutions for Consumer Flash-Memory Devices, National Taiwan University, CODES 2011, Taipeh 2011 BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 19

Flash-Speicher: Verwaltung D D D D D D D D L L D L L L D Garbage Collection: (1) Kopieren der lebendigen Seiten in freie Seiten L L D L L L D L (2) Löschen des Original- Blocks L D L L L D L Live Free D Dead T. Kuo: Challenges and Solutions for Consumer Flash-Memory Devices, National Taiwan University, CODES 2011, Taipeh 2011 BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 20

Flash-Speicher: Verwaltung Garbage Collection: L L D L L L D (1) Kopieren der lebendigen Seiten in freie Seiten L L D L L L D L (2) Löschen des Original- Blocks L D L L L D (3) Wiederverwendung der freigegebenen Seiten L Live Free D Dead T. Kuo: Challenges and Solutions for Consumer Flash-Memory Devices, National Taiwan University, CODES 2011, Taipeh 2011 BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 21

Wegweiser Platten- und Flash-Speicher Prinzipien der Fehlertoleranz RAID als ein Beispiel BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 22

Fehlertoleranz: Aufgaben Fehlermodell festlegen Was kann schief gehen? Mechanismen zur Fehlertoleranz Fehlererkennung Fehler-Isolation Fehler-Behebung Häufiger Ansatz: Redundanz als Mittel zur Fehlertoleranz BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 23

Fehlermodell (Beispiel Festplatte) Entwurfs-/Produktionsfehler Laufzeitfehler Beschädigung von Daten bspw. durch Magnetismus Reparatur: neu schreiben transiente Fehler Alterungsfehler, bspw. Ausfall einzelner Blöcke oder des ganzen Laufwerks Reparatur: Austausch permanenter Fehler BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 24

Fehlermodell (Beispiel DRAM) Entwurfs-/Produktionsfehler Kleinere Strukturgrößen Laufzeitfehler Beschädigung von Daten bspw. durch Strahlungsfehler Reparatur: neu schreiben transiente Fehler Alterungsfehler, bspw. Ausfall einzelner Worte oder eines ganzen DIMMs Reparatur: Austausch permanenter Fehler BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 25

Formen der Redundanz Zeit Mehrfache Ausführung von Operationen, Vergleich der Ergebnisse Struktur Nutzung mehrfach ausgelegter Funktionseinheiten (z.b. Speicherung von Daten auf 2 Festplatten) Information Fehler-korrigierende Codes als Bestandteil der gespeicherten Daten Zusätzliche Funktionalität fügt auch zusätzliche Fehlerquellen hinzu! BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 26

Transiente Lesefehler Jeder Block auf Platte hat Head/Tail mit redundanter Codierung Error Correcting Codes (ECC) Fehlererkennung und -korrektur durch Auswertung dieses Codes Buchführung zu Wartungszwecken Statistik: Festplatten mit höheren (transienten) Fehlerraten fallen auch bald komplett aus BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 27

Permanente Lesefehler: Defekte Blöcke Erkennung durch redundante Codes häufig schon bei Herstellung Vermeidung statt Behebung: Plattenspuren haben Bad Sector -Markierungen In Software: Datei mit Liste aller defekten Blöcke (Vorsicht bei Backup!) Blöcke als allokiert markiert Heute eher schon im Festplatten-Controller BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 28

Ausfall von Laufwerken Entdeckung: Timeout sich häufende Lesefehler Recovery: Redundanz durch RAID Reparatur: Plattentausch BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 29

RAID - Redundant Array of Independent Disks Zusammenbau mehrere unabhängig ansteuerbarer Platten zu einem Array Ziel Bessere Leistung durch parallele Zugriffe Ausgleich der Lücke zwischen immer schnelleren Prozessoren/Speichern und nach wie vor langsamen Platten Client Client Client Client Disk Array based Server Nachteil Mittlere Zeit bis zum Ausfall des Feldes ist kleiner Maßnahmen zur Fehlertoleranz! BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 30

Ohne Redundanz (RAID 0) Disk Array aus n Platten Keine Kosten für Redundanz (trivial) Keine Fehlertoleranz Disk 1... Disk n BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 31

Spiegelplatten (RAID 1) Disk Array aus 2n Platten Jede Platte gespiegelt (identische Kopien) Schreiben: alle Daten zweimal Lesen: einmal, von schnellerer Platte Fehlertolerant (ein beliebiger Ausfall) Hohe Speicherkosten Disk 1... Disk n Disk 1'... Disk n' BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 32

Einzelne Paritätsplatte (RAID 4) Nutzerdaten werden blockweise auf n Platten verteilt (striping) Dateiblock 1 auf Disk 1, 2 auf 2,... Blockweise Paritätsbildung (Disk 1, Block 1) XOR (Disk 2, Block 1)... (Disk P, Block 1) Fehlererkennung durch jede Platte separat Rekonstruktion durch Paritätsbildung Disk 1... Disk n Parity BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 33

Probleme mit RAID 4: RAID Level 5 bei hohem Leseanteil: Paritäts-Platte nicht richtig ausgelastet bei vielen kleinen Dateien und Schreiboperationen: Engpass an Paritätsplatte Block Interleaved Distributed Parity Paritätsblöcke über gesamtes Array verteilt beste Leistung bei kleinen und großen Leseanforderungen sowie bei großem Anteil Schreiboperationen kleine Schreibanforderungen immer noch ineffizienter, da Paritätsblock jedesmal lokalisiert und geschrieben werden muss BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 34

Fehlertoleranz auf allen Ebenen Moderne Anwendungen: Cloud Computing Hier: Infrastructure as a Service (IaaS), z.b. Amazon Web Services, Google Compute Engine, Microsoft Azure Vorteile Reduzierter Aufwand fuer Hardware-Wartung Bezahlmodell: Pay-as-you-go Nachteile Weniger Kontrolle ueber Hardware und Daten (wer hat Zugriff?) Flexibilitaet (HW-Plattform) Skalierbarkeit BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 35

Fehlertoleranz auf allen Ebenen Fehlertoleranz in der Cloud? - Mach es selbst! IaaS stellt lediglich Infrastruktur bereit, Nutzer macht damit, was er will Beispiel: Amazon Web Services [Barr 2011] - Festplatten-Fehler verbergen: Netzwerk-Dateisysteme (EBS), redundanter Objekt-Speicher (S3) - Redundante Server-Infrastruktur (Verfuegbarkeits-Zonen) - Geografische Verteilung (Regionen) - Bausteine fuer fehlertolerante Anwendungen - Verteilter Nachrichten-Service (SQS) - Fehlertoleranter Datenspeicher (SimpleDB, RDBS) [Bar 2011]: J.Barr et al. Building Fault-Tolerant Applications on AWS, 2011, http://media.amazonwebservices.com/aws_building_fault_tolerant_applications.pdf BS WS 2015, HW, Fehlertoleranz, Bsp: Dateien 36