Proseminar Technische Informatik WS08/09 bei Georg Wittenburg, M.Sc. Zuverlässigkeit und Fehlertoleranz in der Technik

Ähnliche Dokumente
Freie Universität Berlin Proseminar Technische Informatik Georg Wittenburg, M.Sc. Seminararbeit Fehlertoleranz und Zuverlässigkeit in der Technik

Fehlertolerante Systeme

Fehlertolerante und Selbstheilende Systeme. Redundanztechniken

Fehlertoleranz in eingebetteten Systemen

Betrieb und Instandhaltung von Energieanlagen

Zuverlässige Systeme Fehlertoleranz

2. Übung zur Vorlesung Statistik 2

Vor- und Nachteile der Fehlermaskierung

Warum ist Ariane 5 beim Erstflug explodiert?

FEHLERTOLERANZ EINE SEHR GROBE ÜBERSICHT BETRIEBSSYSTEME UND SICHERHEIT, WS 2016/17 HERMANN HÄRTIG

Software Engineering I Prof. Dr. Martin Glinz. Fallstudie: Ariane Flug 501. Universität Zürich Institut für Informatik

Fakultät für Informatik der Technischen Universität München. Fehlertoleranz. Redundanz

Software Engineering. Ariane Flug 501! Fallstudie

Gefahrenanalyse mittels Fehlerbaumanalyse

Redundanzen. Verfügbarkeit = MTBF / (MTBF + MTTR)

2. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17

Das System funktioniert, wenn A UND B gleichzeitig funktionieren. A: Komponente A funktioniert. A : B :

Hochverfügbarkeits-Szenarien

Dipl.-Inf. (FH) Thomas Noone

Übungsscheinklausur,

Berechnung von Abständen

- Fehlertoleranz - Ausarbeitung im Rahmen des Seminars Pleiten, Pech und Pannen der Informatik von Herrn Jürgen Ruf und Herrn Thomas Kropf im WS01/02

Hochverfügbarkeit für die Datenbank

Entwurfsmuster und Softwarearchitekturen für sicherheitskritische Systeme

Software Engineering. Validierung und Verifikation. Martin Glinz Harald Gall. Kapitel 7. Universität Zürich Institut für Informatik

WS 2009/10. Diskrete Strukturen

Prof. Dr. Bernhard Arnold, Institut für Statistik und Ökonometrie der Universität Hamburg. Lebensdaueranalyse und Zuverlässigkeit von Systemen

Grundlagen: Überblick

Fault Trees. Überblick. Synonyme für Fehlerbäume. Geschichte Friederike Adler CV 03

WS 2016/17 Diskrete Strukturen Kapitel 3: Kombinatorik (1)

Sind die nachfolgenden Aussagen richtig oder falsch? (0,5 Punkte pro korrekter Beantwortung)

13. Algorithmus der Woche Fehlererkennende Codes Was ist eigentlich ISBN?

Redundanz als Grundlage von Fehlertoleranz/Fehlerkorrektur

Entwicklung sicherheitskritischer Systeme

7 Fehlertoleranz. vs7 1

Proseminar Fehlertoleranzverfahren WS 06/07

Verteilte Systeme F. Fehlertoleranz

3. Musterlösung. Problem 1: Boruvka MST

Datenblatt. Funktionale Sicherheit Sicherheitskennwerte für Bremse BE..(FS) * _0715*

1 Zuverlässigkeit von Netzwerken


Verlässliche Systeme

Motivation für Fehlertoleranz in VS Fehlermodelle Erreichen von Fehlertoleranz. Verteilte Systeme. 7. Fehlertoleranz

17. Oktober 2006 (überarbeitete Version)

GPS System. NAVSTAR-System besteht aus 3 Komponenten. Geschichte Grundfunktion Wie funktioniert GPS?

Ü B U N G E N Z U V E R L Ä S S L I C H E E Z S A U F G A B E 4 : E RW E I T E RT E A R I T H M E T I S C H E C O D I E R U N G

Folie 1: Fehlerbaumanalyse (FTA) Kurzbeschreibung und Ziel Die Fehlerbaumanalyse im Englischen als Fault Tree Analysis bezeichnet und mit FTA

2.7! Überwachung und Diagnose

Algorithmus von Berkeley (1989)

Seminar: Fehlertolerante und Selbstheilende Systeme

Sommersemester Jewgeni Rose. Technische Universität Braunschweig

! Die Noten von 10 Bachlor- 30 Master- und 10 PhD-Studenten (Doktoranden) eines Informatikkurses waren wie folgt.

Korrelation, Regression und Signifikanz

Qualität, Fehler un Testvorgehen

Marathon everrun TM Was kommt nach den Clustern? Abschätzung geschäftlicher Auswirkungen Die wahren Ausfallkosten

Grundkurs Mathematik I

RAID Redundant Array of Independent [Inexpensive] Disks

2. Übung zur Vorlesung Statistik 2

Abiturtraining Physik

Dokument Klassifikation. Thomas Uhrig: Data-Mining SS10

Validierung und Verifikation!

WAHRSCHEINLICHKEITSTHEORIE A N W E N D U N G Terminologie

Zeitgesteuerte Kommunikationssysteme für Hard-Real-Time Anwendungen. Jörn Sellentin

Dynamisches Huffman-Verfahren

SIMATIC PCS 7 V6.1 SP1. Redundanz und Hochverfügbarkeit in PCS 7. Redundanz und Hochverfügbarkeit in PCS 7. Themen

Risikomanagement. Schaden

(Man sagt dafür auch, dass die Teilmenge U bezüglich der Gruppenoperationen abgeschlossen sein muss.)

Übertrittsprüfung 2015

Formale Grundlagen der Fehlertoleranz in verteilten Systemen

FMEA - Fehlermöglichkeits- und Einflussanalyse

GPS - System. Silva März

conjectmi Sicherheitskonzept

Gran Turismo Cars - WS 11/12

Aspekte der Hochverfügbarkeit in Servern für Telekommunikationsdienste

Seminar "Pleiten, Pech und Pannen der Informatik" (SoSe 2002) Betriebsfehler: Fehlertoleranz und Redundanz

Methoden zur Visualisierung von Ergebnissen aus Optimierungs- und DOE-Studien

Effizientes und ausfallsicheres Management von Wetterdaten. Herzlich willkommen VORTRAG

ProSafe-RS sicherheitsgerichtete Technik

Angewandte IT-Sicherheit

Entwurf E DIN EN (VDE ): FprEN :2008

Error detection and correction

Ist P(T) = p die Trefferwahrscheinlichkeit eines Bernoulli-Experiments,

Schriftlicher Test Teilklausur 2

Strukturelle Redundanz

Intern: Ceph Kurzeinführung in die verteile Storage-Lösung

Algorithmen und Datenstrukturen SS09. Foliensatz 15. Michael Brinkmeier. Technische Universität Ilmenau Institut für Theoretische Informatik

Universität Paderborn Die Universität der Informationsgesellschaft. Validierung und Verifikation (inkl. Testen, Model-Checking, Theorem Proving)

Einleitung Performance Netzwerk Leistungsaufnahme Skalierbarkeit Sicherheit Zuverlässigkeit Kompatibilität. Ziele und Maße. Dr.-Ing.

Analyse des Neigemoduls des Shuttles

Kombinatorische Beweisprinzipien

Lineare Algebra I (WS 12/13)

Algorithmische Anwendungen WS 2005/2006

Inhaltsübersicht. Geschichte von Elektronischen Wahlen Erwartete Eigenschaften von Protokollen. Merritt Election Protokoll

The Byzantine Generals' Problem

Qualitätssicherung von Software

Studiengang Informatik der FH Gießen-Friedberg. Sequenz-Alignment. Jan Schäfer. WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel

Validierung und Verifikation

(Miss-) Konzeptionen von Sicherheitsprinzipien

67 Zufallsvariable, Erwartungswert, Varianz

Schwerlast-Kugelgewindetriebe die Antriebslösung mit höherer Tragzahl

Transkript:

Proseminar Technische Informatik WS08/09 bei Georg Wittenburg, M.Sc. Zuverlässigkeit und Fehlertoleranz in der Technik Ein Vortrag von Sebastian Oliver Kalwa Berlin, 30.01.2009 1

Was ist Fehlertoleranz? Fehlertoleranz: Die Eigenschaft eines Systems auch bei begrenzter Anzahl ausgefallener Subsysteme weiter zu laufen. Fehler: Abweichung von korrekter Arbeitsweise, im englischen drei Begriffe: Fault, Error und Failure Fault: Fehlerursache, Fehlergrund Error: Fehlerzustand des Systems Failure: Systemversagen Fehlertoleranz versucht diese kausale Kette zu unterbrechen. 2

Beispiel Beispiel: Fault: Fehler im Algorithmus, z.b. Verwechslung von m/s und km/h Error: Falscher Variablenwert, z.b. Geschwindigkeit einer Rakete nach Start um Faktor 3,6 kleiner als angenommen Failure: Rakete nimmt kürzere Flugbahn und schlägt in eigenem Gebiet ein Mögliche Gegenmaßnahme: - Mehrfachimplementierung des Algorithmus durch mehrere Leute - Diese wären zu unterschiedlichen Ergebnissen gekommen: Error - Dem Error folgt kein Failure, da Fehler erkannt und Start abgebrochen 3

Anwendungsbereiche Fehlertoleranz notwendig in vielen Fällen: Hochzuverlässige Systeme: Telefonnetze dürfen nur wenige Minuten im Jahr ausfallen Wartungsfreie Systeme: Satelliten müssen lange durchhalten, da sie nicht gewartet werden können Festgelegte Wartungsintervalle: Ein Transportschiff wird nur im Heimathafen gewartet, sonst nicht Hochleistungsrechner: Haben hohe Zahl parallel arbeitender Komponenten, Ausfall einzelner Teile normal Sicherheitsrelevante Anwendungen: Moderne Kampfjets sind bei Ausfall des Bordcomputers für einen Menschen unmaneuvrierbar. 4

Was ist Zuverlässigkeit? Zuverlässigkeit: Eigenschaft, die geforderte Funktion in einem Zeitraum zu erfüllen. Beispiel: Eine Testreihe mit 100 Autos liefert nach einem Jahr folgende Ergebnisse zur Zuverlässigkeit: Monat 0 1 2 3 4 5 6 7 8 9 10 11 Ausfälle im Monat Noch funktionierend 0 0,04 0,13 0,22 0,16 0,12 0,04 0,06 0,05 0,07 0,06 0,05 1 0,96 0,83 0,61 0,45 0,33 0,29 0,23 0,18 0,11 0,05 0 5

Beispiel Die Werte auf einen Graphen übertragen: Die Angabe wie viele Geräte nach einer Zeit t noch funktionieren nennt man Überlebenswahrscheinlichkeit v(t). Hier z.b.: v(10)=0,05 6

Berechnung von Überlebenswahrscheinlichkeit Beispielsystem besteht aus zwei Komponenten e 1 und e 2. a) Fällt aus, wenn bereits eine Komponente ausfällt. Entspricht folgendem Schaltbild: Verknüpfung entspricht dem Schnitt zweier Mengen P( System überlebt ) =P( e 1 überlebt und e 2 überlebt ) = P( e 1 überlebt ) * P( e 2 überlebt ) 7

Berechnung von Überlebenswahrscheinlichkeit b) Fällt aus, wenn beide Komponenten ausfallen. Entspricht folgendem Schaltbild: Verknüpfung entspricht der Vereinigung zweier Mengen. P( System überlebt ) =P( e 1 überlebt oder e 2 überlebt ) =P( e 1 überlebt ) + P( e 2 überlebt ) P( e 1 überlebt ) * P( e 2 überlebt ) Inklusion und Exklusion 8

Wie erhöht man Überlebenswahrscheinlichkeiten? Seien nun an 80% dieser Ausfälle ein Bauteil schuld, das mit hoher Wahrscheinlichkeit in den ersten zwei Jahren kaputt geht. Möglichkeiten zur Erhöhung der Ausfallwahrscheinlichkeit: Verzicht auf dieses Teil und Wahl eines anderen Designs - Nicht immer Wahl von anderen Konstruktionen möglich Einbau eines Bauteils eines anderen Herstellers - Eventuell nicht möglich, da nur ein Produzent vorhanden oder andere zu teuer Mehrfacher Einbau dieses Bauteils - Wenn eins ausfällt, sind noch immer weitere vorhanden, die die Funktion gewährleisten - Kann auch teuer sein, wenn dieses Teil selbst teuer ist 9

Wie erhöht man Überlebenswahrscheinlichkeiten? Beispiel: Bauteil fällt mit 50% Wahrscheinlichkeit aus, kann nicht ersetzt werden. 5-facher Einbau: Überlebenswahrscheinlichkeit = W-keit, dass nicht alle Teile ausfallen = 1 0,5 5 = 0,96875 Vorher: Single Point of Failure - Ausfall eines Teils reicht zum Ausfall - Wahrscheinlichkeit zum Ausfall 50% Jetzt: Redundanz vorhanden - Mehrere Teile müssen zum Komplettausfall versagen - Wahrscheinlichkeit für Ausfall bei 5 Teilen unter 5% 10

Redundanz Beispiel Viele Systeme heutzutage ohne Redundanz nicht alltagstauglich: Schlechte Idee: Alle Triebwerke eines Flugzeugs mit einem gemeinsamen Stromkreis - Eine kaputte Leitung reicht zum Ausfall aller Triebwerke Gute Idee: Jedes Triebwerk mit mehreren eigenen Stromkreisen - Ausfall einzelner Leitungen undramatisch - Selbst bei Ausfall eines Triebwerks die anderen noch lauffähig - Ausfall aller Leitungen extrem unwahrscheinlich 11

Redundanzarten Strukturelle Redundanz: Komponenten sind mehrfach vorhanden und übernehmen untereinander bei Ausfall die Arbeit Beispiel: mehrere Stromleitungen für Flugzeugtriebwerke Zeitredundanz: Im Fehlerfall wird mehr Zeit für das Ergebnis benötigt Beispiel: Zahlensortieren nach Quicksort, wenn Ergebnis nicht korrekt, dann sortieren mit Heapsort Informationsredundanz: Daten erhalten zusätzliche Informationen um Korrektheit zu überprüfen Beispiel: Letzte Ziffer in Personalausweisnummer, CRC, FEC 12

Redundanzarten Funktionsredundanz: System erhält weitere Funktionen, ohne die es auch lauffähig wäre Beispiel: Testfunktionen Nicht immer ist eine klare Abgrenzung möglich. Beispiel: Zwei Komponenten berechnen Ergebnis, dritte prüft Übereinstimmung - Funktionsredundanz, auch bei einmaligem Berechnen lauffähig - Strukturredundanz, Komponente mehrfach vorhanden - Zeitredundanz, Überprüfung auf Gleichheit braucht Zeit 13

Weitere Redundanzeinteilung Statische Redundanz: - Hat nur Nutzen im Fehlerfall - Kann nur die gleiche Arbeit machen wie die zu ersetzenden Komponenten und keine eigene Aufgabe übernehmen Beispiel: Ersatzstromkreise in Flugzeugen bringen keinen Nutzen solange es noch andere Stromkreise gibt Dynamische Redundanz: - Auch bei keinem Fehler nützlich - Kann neben den anderen redundanten Komponenten eigene Aufgaben übernehmen Beispiel: Mehrprozessorsystem in dem CPUs ausfallen dürfen, CPU kann unabhängig von anderen arbeiten, aber auch bei Ausfall der anderen für alle einspringen 14

Fazit - Fehlertoleranz, insbesondere mit Redundanz, ist sinnvoll für Zuverlässigkeit von Systemen. - Hersteller von Geräten oder von Software ist auch für dessen Fehler verantwortlich. - Lieber etwas mehr Geld investieren als unzuverlässige Produkte zu machen - Kann Menschenleben und vor finanziellen Schäden schützen Beispiel: Explodierende Handyakkus wegen fehlendem Kurzschluss- Schutz, hat sogar schon Menschenleben gekostet - Zuverlässigkeit von Produkten wichtig für Image, Sparen kann im Endeffekt sogar zu Umsatzeinbußen führen 15

Quellen - Deutscher Personalausweis http://www.pruefziffernberechnung.de/p/personalausweis-de.shtml - Fehlertoleranz, Jürgen Ruf und Thomas Kropf http://www-ti.informatik.uni-tuebingen.de/~ruf/seminar0102/fehlertoleranz.pdf - Zuverlässigkeit in der Technik, Arnold Kaufmann R. Oldenburg Verlag München Wien 1970 - Fehlertolerante Rechensysteme, Prof. Dr. Winfried Görke R. Oldenburg Verlag München Wien 1989 - Tod durch Handy-Explosion, Markus C. Schulte von Drach http://www.sueddeutsche.de/wissen/194/425951/text/ 16