Fehlertolerante Systeme

Ähnliche Dokumente
Fehler und Fehlertoleranz

Seminar: Fehlertolerante und Selbstheilende Systeme

Zuverlässige Systeme Fehlertoleranz

Verteilte Systeme F. Fehlertoleranz

Strukturelle Redundanz

Universität Paderborn Die Universität der Informationsgesellschaft. Validierung und Verifikation (inkl. Testen, Model-Checking, Theorem Proving)

Motivation für Fehlertoleranz in VS Fehlermodelle Erreichen von Fehlertoleranz. Verteilte Systeme. 7. Fehlertoleranz

Fehlertolerante und Selbstheilende Systeme.

Modellbasierte Software- Entwicklung eingebetteter Systeme

11 Zuverlässigkeit und Sicherheit

Qualität, Fehler un Testvorgehen

Entwurfsmuster und Softwarearchitekturen für sicherheitskritische Systeme

Seminar "Pleiten, Pech und Pannen der Informatik" (SoSe 2002) Betriebsfehler: Fehlertoleranz und Redundanz

Redundanztechniken. Seminararbeit für den Masterstudiengang. Informatik. von. Kamo Azad. Vogeliusweg , Paderborn

Formale Grundlagen der Fehlertoleranz in verteilten Systemen

Validierung und Verifikation!

Vorlesung Projektmanagement und Teamorganisation. Dr. Bernhard Schätz Leopold-Franzens Universität Innsbruck Sommersemester 2003

Validierung und Verifikation

2.7! Überwachung und Diagnose

Modellbasierte Software- Entwicklung eingebetteter Systeme

(Miss-) Konzeptionen von Sicherheitsprinzipien

Verlässliche Systeme

Sicherheit & Zuverlässigkeit

Zuverlässigkeit und Sicherheit

Grundbegriffe der Fehlertoleranz Seminar: Softwarebasierte Fehlertoleranz

Vorlesung "Verteilte Systeme" Sommersemester Verteilte Systeme. 13. Fehlertoleranz. Verteilte Systeme, Sommersemester 1999 Folie 13.

Monitoring mit Solar-Log - Fehler schnell erkennen und Ertragsverluste vermeiden

Mean Time Between Failures (MTBF)

Fault-Konzepte Fehlermana Fehl gement in ermana Rechnernetzen Rechne Christian Stroh

Zeitgesteuerte Kommunikationssysteme für Hard-Real-Time Anwendungen. Jörn Sellentin

Modellbasierende Fehlerdiagnose für Automobile und Flugzeuge

Zuverlässigkeitstechnik. Grundlagen. VL PLT-2 Professur für Prozessleittechnik

Datenträgerverwaltung

Methoden der Werkstoffprüfung Kapitel I Grundlagen. WS 2009/2010 Kapitel 1.0

Modellierung und Analyse eingebetteter und verteilter Systeme

Die Transportprotokolle UDP und TCP

Unterrichtseinheit 12

Vorlesung Fehlertolerante Systeme / Fehlertoleranz in Datenbanksystemen

Sonstiges Fehlercodes im Gerätemanager

Verwaltung von Signaturen für Malware-Gruppen

ReCoNets Entwurfsmethodik für eingebettete Systeme bestehend aus kleinen Netzwerken hardwarerekonfigurierbarer Knoten und -verbindungen

Funktionale Sicherheit IEC SIL 2

Einleitung Definitionen FlexRay TTA Vergleich Fazit Literatur. Verteilte Echtzeit

Fehlertoleranzmechanismen in hochverfügbaren Clustersystemen

Trouble-Shooting Soforthilfe Mithilfe des SMART Board 600er Serie Interactive Whiteboard Bereitschaftsanzeigelämpchen

Grundlagen des Datenschutzes

Qualitätsmanagement-Richtlinie für Lieferanten. ANHANG - Anleitung zur Bearbeitung von 8D-Reporten. Ausgabe A Seite 2 von 9

Redundanz und Replikation

Eine Workflow-Applikation mit InterSystems Ensemble im Rahmen einer DICOM-Modality Worklist. M. Sc. Sebastian Thiele NestorIT GmbH

Band G, Kapitel 7: Prinzipien. Prinzipien der Verfügbarkeit

Energieeffizienz und Lichtqualität in der Straßenbeleuchtung

Bibliotheks-basierte Virtualisierung

Detaillierte NIVPOOL Beschreibung

SYSTEM- UND SOFTWARE-ENGINEERING

Fehlertolerante Hardware Systeme

Projektmanagement. Vorlesung von Thomas Patzelt 9. Vorlesung

VS2 Slide 1. Verteilte Systeme. Vorlesung 2 vom Dr. Sebastian Iwanowski FH Wedel

Der Backoff-Algorithmus

8 Kenngrößen eines Sicherheitssystems

DRAM Speicherfehler im Betriebssystem Problem und Gegenmaßnahmen

zu konzipieren und umzusetzen. Gerne unterstützen wir Sie auch persönlich sprechen Sie uns an.

Georgi Dimitrov. IT Administrator

CAN - BUS. Inhaltsverzeichnis

Vortrag zum Hauptseminar Hardware/Software Co-Design

Überblick zu den Sicherheitsnormen

Military Air Systems

Seminar zur Energiewirtschaft:

Virtualisierung in der Automatisierungstechnik

Herausforderung Onboard-Diagnose

Einbezug von Nutzungsversprechen und Requirements Engineering in die Entwicklung von AAL-Systemen

Redundant Array of Inexpensive Disks

1.4! Einführung. Systemmodellierung. Methoden und Werkzeuge

FUNKTIONALE SICHERHEIT VON ELEKTRISCHEN ANLAGEN IN INDUSTRIELLEN BETRIEBSSTÄTTEN VON OTTO WALCH

Armaturen in der Anlagensicherheit. Funktionale Sicherheit Safety Integrity Level SIL

Die Zertifizierungsstelle der TÜV Informationstechnik GmbH bescheinigt hiermit dem Unternehmen

Typische Speicherfehler in C

Validierung von Software-Werkzeugen. Matthias Hölzer-Klüpfel

Modellierung und Analyse eingebetteter und verteilter Systeme

Konzept Orchestra Alerting

OSL Unified Virtualization Server

Technische Spezifikation Interoperabilität

Unterrichtseinheit 13

Gezielte Wartung von automatisierten Systemen mit Hilfe von Fehlerprävention

handlungsfehler in der präklinischen Versorgung f. Dr. A. Ferbert Jahrestagung der ANB

Controller-Area-Network

Ablaufsimulation. Digitale Systemoptimierung. Dipl.-Inf. Alexander Ulbrich Dipl.-Ing. Jürgen Wagner Garching, 17. November 2006

Transkript:

Wissenschaftliche Vertiefung Studiengang Technische Informatik Fehlertolerante Systeme Philipp Dürnay 22.01.2016

Agenda Fehlertoleranz Fehlerdiagnose Fehlerbehandlung Beispielsystem Ausblick Philipp Dürnay 2

Fehlertoleranz Der Fehlerbegriff Äußere Fehlhandlung Komponente Wie können Fehlerwirkungen verhindert werden? Fehlerursache (engl. fault) Fehlzustand (engl. error) Fehlerwirkung (engl. failure) Die verschiedenen Aspekte des Fehlers können weit entfernt voneinander auftreten Philipp Dürnay 3

Fehlertoleranz Fehlertoleranz beschreibt die Fähigkeit eines Systems, trotz einer begrenzten Anzahl fehlerhafter Subsysteme seine spezifizierte Funktion weitestgehend zu erfüllen Funktionen: 1) Fehlerdiagnose 2) Fehlerbehandlung Redundanzarten: Strukturelle Redundanz Zusätzliche Betriebsmittel Funktionale Redundanz Informationsredundanz Fehlertoleranz erfordert Redundanz Zeitredundanz Philipp Dürnay 4

Fehlerdiagnose Codierungstest Übertragungs / Speicherfehler Umkehrungstest Effektiv bei Berechnungsfehlern Teils aufwendig oder gar nicht durchführbar Strukturelle Überwachung Wie können Fehler erkannt werden? Zeitüberprüfung Effektive Erkennung von Ausfällen Konsistenztest Abhängig vom Plausibilitätsbereich Replikationstest Erkennung von Entwurfsfehlern erfordert Diversität Ein Ausfall ist leichter zu erkennen als eine Fehlfunktion Philipp Dürnay 5

Fehlerdiagnose Modellbasierte Verfahren Basiert auf Modell des Zielsystems Präzises Modell ermöglicht detaillierte Diagnose Diagnose stark abhängig vom Modell Beobachtungsbasierte Verfahren Basiert auf Beobachtung des Zielsystems Kann universeller und dynamischer entwickelt werden Benötigt viele Daten zur effektiven Diagnose Diagnoseverfahren können in zwei Gruppen unterschieden werden Philipp Dürnay 6

Fehlerbehandlung Wie kann auf ein Fehler reagiert werden? Fehlerbehebung Rekonfiguration Fehlerkompensation Entfernen des Fehlzustandes Ersetzen des fehlerhaften Subsystems Ausgleichen der Fehlerwirkung Behandlungsmethoden unterscheiden sich in drei Gruppen Philipp Dürnay 7

Fehlerbehandlung Beispiel für Fehlerbehebung: Checkpoint and Restart Fehlzustand soll durch Neustart des (Sub ) Systems behoben werden Philipp Dürnay 8

Fehlerbehandlung Beispiel für Rekonfiguration: Graceful Degradation R1 R2 R3 F1, F2, F3 F4, F5, F6 F7, F8, F9 a) Normalfall R1 R2 R3 F1, F2, F3 F4, F5, F6 b) R2 sei ausgefallen R1 R2 R3 F1, F2, F3 c) R1 und R2 seien ausgefallen Wichtige Prozesse werden auf verbleibende Ressourcen verteilt Philipp Dürnay 9

Fehlerbehandlung Beispiel für Fehlerkompensation: N aus M Systeme A B C M Ergebnis Fehleranzeige Mehrheitselement Fehler wird nicht entfernt sondern ausgeglichen Philipp Dürnay 10

Beispielsystem Flugcomputer B777 Standby System innerhalb der Kanäle Ergebnis ist Mittelwert aller Kanäle Hardwarediversität durch verschiedene Prozessoren Softwarediversität durch verschiedene Compiler Philipp Dürnay 11

Ausblick Fehlerursachen können nicht entfernt werden Systeme, die hohe Zuverlässigkeit benötigen, erfordern viele zusätzliche Ressourcen Je mehr Toleranz, desto mehr Redundanz erforderlich Philipp Dürnay 12

Zusammenfassung Fehlhandlung Fehlererkennung Fehlerbehandlung Fehlerursache (engl. fault) Fehlzustand (engl. error) Replikationstest Konsistenztest Umkehrungstest Strukturelle Überwachung Codierungstest Zeitüberprüfung Fehlwirkung (engl. error) Fehlerbehebung Rekonfiguration Fehlerkompensation Kompensierte Wirkung Fehlerfreier Zustand Philipp Dürnay 13

Ende Fragen? Quellen: [1] DIN 400041 [2] [3] [4] Danke für die Aufmerksamkeit Philipp Dürnay 14