Datengau in meinem Bildarchiv? Nein danke! Sichere Langzeitarchivierung digitaler Fotografien Workshop TU Wien Wirtschaftskammer Wien Wolfgang Krautzer Studio Laxenburg Johannesplatz 4 2361 Laxenburg http://studio-laxenburg.at Andreas Rauber Inst. f. Softwaretechnik und Interaktive Systeme TU Wien Favoritenstr. 9-11/188 http://www.ifs.tuwien.ac.at/~andi
Fotoarchive und Werte Meist übersteigt der Wert eines Archivs deutlich die Kosten der Archivierung. Erst der Verlust aller Daten macht den Wert verständlich Die Hochwasserkatastrophe als privater (analoger) Datengau Die subjektive Bewertung ist unabdingbar! Erst durch deutliche Formulierung der Bewertung kann ich Entscheidungen treffen.
Einleitung Digitale Fotografie bietet unzählige Vorteile Elektronische/Digitale Speicherung von Information generell hat zahlreiche Vorteile -> Digitalisierungsprojekte aber: Diese Information ist ungleich anfälliger - Datenträger - Dateiformate - Metadaten Erfordert neue Lösungen um langfristige Bewahrung der Daten sicherzustellen -> Digitale Langzeitarchivieurng (DLZA / DP)
Einleitung Problemstellung DigitaleLangzeitarchivierung 2 Ebenen der Bedrohung digitaler Daten - Physische Ebene: Speicherung: - Probleme und Lösungsansätze - Praxiserfahrungen - Empfehlungen, best practice - Logische Ebene: Formate - Probleme & Lösungsansätze - Praxiserfahrungen, Probleme bei Standard-Konvertierung - Empfehlungen Ausblick: Trainings & Service-Modell Entwicklung
Speicherung digitaler Daten
Speicherung digitaler Daten Datenträger haben nur beschränkte Haltbarkeit - Errechnet vs. Laborbedingungen vs. real - Vorhersagbarkeit Datenträger sind anfällig auf unterschiedliche Störungen - magnetisch, mechanisch, Licht Datenträger erfordern regelmäßiges Handling - Umspulen, HDD in Betrieb, DVDs senkrechte Lagerung Datenträger sind für unterschiedliche Datenmengen geeignet - CD/DVD wenige GB, ext. HDD bis zu 1TB, RAID Systeme, Bandsysteme Datenträger erfordern spezifische HW - Laufwerke, Treiber
Speicherung digitaler Daten CD/DVD, hoch kompatibel aber sehr unpraktisch Haltbarkeit DVD, Qualitätsunterschiede Handling: Suchen und Finden Kopieren von großer Anzahl von DVDs Redundanz
Speicherung digitaler Daten RAID Systeme, gebunden an Server oder als freie Netzwerkspeicher (NAS) sind das Gebot der Stunde
Speicherung digitaler Daten Best Practice Redundante Speicherung An physisch getrennten Orten Unterschiedliche Technologien od. Datenträger- Marken/Serien Regelmäßige Verifikation RAID-5 Speicherung DVDs: - nur bei kleinen Datenmengen praktikabel - qualitativ hochwertige Rohlinge - qualitativ hochwertiger Brenner Externe Festplatten - Qualitativ hochwertige Platten - Regelmäßig in Betrieb nehmen und prüfen
Interpretation digitaler Daten
Interpretation digitaler Daten Objekte müssen von Datenträger gelesen werden - Verfügbarkeit von Lesegeräten - Haltbarkeit der Datenträger Digitale Objekte brauchen eine definierte Umgebung um zugreifbar zu sein: - Dateien brauchen bestimmte Programme - Programme brauchen bestimmte Betriebssysteme (-versionen) - Betriebssysteme brauchen bestimmte Hardware-Komponenten SW/HW Umgebung ist nicht stabil: - Dateien können nicht geöffnet werden - Metadaten können nicht interpretiert werden - eingebettet Objekte sind nicht zugreifbar - Programme laufen nicht - Information in digitaler Form ist verloren
Interpretation digitaler Daten Verschiedene Ansätze zur Langzeitbewahrung Investment Strategien: - Standardisierung, Datenextraktion, Encapsulation, Formatbeschränkung Kurzfristige Ansätze: - Museum, Rückwärtskompatibilität, Versionsmigration, Reengineering Mittel-/langfristig Ansätze: - Migration, Viewer, Emulation, (UVC) Alternative Ansätze: - Nicht-digitale Ansätze, Daten-Archäologie Keine optimale Lösung für alle Objekte
Interpretation digitaler Daten Migration: Transformation in anderes Format, kontinuierlich oder on-demand (Viewer) + Verbreitet im Einsatz + Vergleich mit un-migriertem Objekt zum Zeitpunkt der Migration + Jederzeit zugreifbar - Unerwünschte Änderungen unmittelbar oder über mehrere Migrationsschritte - Nicht für alle Objekte anwendbar - Kontinuierliche Migration erforderlich
Emulation: Interpretation digitaler Daten Emulation von Hardware oder Software + Prinzipien weit verbreitet + Zahlreiche Emulatoren verfügbar + Potentiell vollständige Funktionalitätsbewahrung + Objekt wird unverändert nutzbar gemacht - Objekt wird unverändert nutzbar gemacht - Komplexe Technologie, Forschungsaufwand - Erfordert in Zukunft Erfahrung im Umgang mit derzeitigen Systemen - Emulatoren müssen ebenfalls migriert/emuliert werden - Emulatoren bei komplexen Systemen potentiell fehlerhaft
Interpretation digitaler Daten Kodak DCR Format als Beispiel...
Interpretation in Photoshop...
Interpretation im Vergleich
Interpretation digitaler Daten Jeder RAW Konverter (und jede in der Kamera eingebaute JPG Interpretation) liefert andere Ergebnisse Software zur Interpretation wird nicht zwingend fortgesetzt Die bestmögliche Interpretation erfordert durchwegs Expertenwissen
Interpretation digitaler Daten Best Practice Aufheben des Originals (RAW) für eventuelle Verbesserungen in der Interpretation und als Original Umwandlung in ein stabiles Standardformat: - TIFF (mit LZW Komprimierung) - JPEG nur low-quality Surrogat Einbinden in eine Datenbank die alle (auch RAW Formate) interpretieren kann
Ausblick: Servicemöglichkeiten im Bereich der Dig. Fotografie Entwicklung eines LZA-Service-Systems Anbieten von Services ähnlich Antiviren-SW / Firewall Datensicherheit (Bit-level Preservation) - Datenträger-Migration, sichere Speicherung und Verwaltung Bewahrung der Information - Migration auf geeignete aktuelle Dateiformate - Bewahrung der Metadaten, Speicherplatz, Bildqualität,... - Qualitätssicherung der zum Einsatz kommenden Werkzeuge - Experten erstellen Migrationsregeln & Parameter Vertrauenswürdiges Digitales Langzeit-Archiv - Aufbau eines DLZA Systems - Zertifizierung DME: Digital Memory Engineering
http://www.ifs.tuwien.ac.at/dp