Automatische Langzeitarchivierung

Ähnliche Dokumente
Automatische Langzeitarchivierung

Digitale Langzeitarchivierung

Ein Dienst für die Digitale Langzeitarchivierung

Das digitale Langzeitarchiv SLUB

Dienstleistungen für die Digitale Langzeitarchivierung

Dienstleistungen von SLUB und TIB für die digitale Langzeitverfügbarkeit. Ein kooperativer Leistungsverbund

Die Eignung des Dateiformates PDF für die Langzeitarchivierung Probleme und Lösungen

Einführung in die Langzeitarchivierung

Ansätze zur Konzeptionierung der Langzeitarchivierung in Museen

Workflow Spezifikation für automatischen Ingest SLUBArchiv. SLUB Dresden. Version 1.2.1,

Langzeitarchivierung. Der Ansatz der Bayerischen Staatsbibliothek. aêk=qüçã~ë=tçäñjhäçëíéêã~åå=== jωååüéåéê=aáöáí~äáëáéêìåöëòéåíêìã VK=j êò=omnm

Was gehört eigentlich zur Datenübernahme bzw. zum Pre-Ingest bzw. zum Ingest?

Masterprojekt Langzeitarchivierung von Digitalisaten

Ein Digitales Archiv für alles? Verbundlösung Berlin-Brandenburg mit archivematica

Pilot IBM Langzeitarchiv Martin Walder IBM Schweiz

Das OAIS-Modell für die digitale Langzeitarchivierung

Ansätze zur Konzeptionierung der Langzeitarchivierung in Museen und Archiven

Preservation Planning im Digitalen Archiv Österreich. Hannes Kulovits

Beweissicheres elektronisches Laborbuch (BeLab)

Handreichung der AG media im Kompetenznetzwerk nestor: Langzeitarchivierung audiovisueller Medien

SWBdepot: Langzeitarchivierung in Bibliotheken, Archiven und Museen. SWBdepot Andreas Schack

Langzeitarchivierungsmetadaten. in Rosetta

Perspektiven der Langzeitarchivierung an der Bayerischen Staatsbibliothek. Dr. Astrid Schoger, , 100. Bibliothekartag, Berlin

Grundlagen der Langzeitarchivierung elektronischer Unterlagen

Bände auf Bändern Das Bibliothekarische Archivierungs- und Bereitstellungssystem (BABS) der BSB in der Praxis

Das Informationsmodell von OAIS

Migration und Emulation Angewandte Magie?

Digitales Archiv Österreich. Siemens IT Solutions and Services GmbH Alle Rechte vorbehalten.

Digitale Langzeitarchivierung von Daten Digital Preservation (DP)

Klaus Kempf. Elektronische Pflichtablieferung für Amtsdruckschriften an der Bayerischen Staatsbibliothek

Neue Entwicklungen zur digitalen Langzeitarchivierung (dlza) in Bayern. Dr. Markus Brantl Matthias Groß

Archiv der sozialen Demokratie. Archiv der sozialen Demokratie (AdsD) der Friedrich-Ebert-Stiftung

Langzeitarchivierung digitale Bestandserhaltung. Dr. Astrid Schoger, 97. Deutscher Bibliothekartag Mannheim, 03. Juni 2008

Cornelia Diebel ; Karlheinz Schmitt. Sammlung und Archivierung von Netzpublikationen an der DNB

Langzeitarchivfähige Dateiformate. SLUB Dresden. Version 1.3,

Arbeitspaket: Technik

Wie haben die Zentralen Fachbibliotheken ihre digitale Langzeitarchivierung organisiert?

Archivierung von digitalen Daten Lösungsansätze mit SIARD und OAIS

Obsoleszenz von Dateiformaten: Über das Älterwerden und Sterben von Dateien. Markus Lischer und Gregor Egloff

LZA-Metadaten für Retrodigitalisate. Anna Kugler

Einführung in das OAIS-Referenzmodell

Das Umsetzungsprojekt digitale Langzeitarchivierung im Bund des Österreichischen Staatsarchivs. Berthold Konrath Österreichisches Staatsarchiv

Einführung in die Problematik der Langzeitarchivierung elektronischer Dokumente

Neben der Online Version 2.3 ist eine Printversion 2.0 beim Verlag Werner Hülsbusch, Boizenburg erschienen.

Handreichung TIFF. SLUB Dresden. Version 1.2.2,

Kooperativer Aufbau eines Archivs digitaler Informationen (kopal) nestor Abschlussveranstaltung

Von der Digitalisierung zur Langzeitarchivierung - Normative Aspekte. Hamburg, Dr. Astrid Schoger Bayerische Staatsbibliothek nestor-partner

Langzeitarchivierungs-Policy der Deutschen Nationalbibliothek

Der Lifecycle von Unterlagen

Herausforderungen bei der Langzeitverfügbarkeit von

Herausgeber: Im Auftrag von: Kontakt: Heike Neuroth Hans Liegmann Achim Oßwald Regine Scheffel Mathias Jehn Stefan Strathmann

Preservation Planning im Kontext des EU-Projekts DURAARK

Langzeitarchivierung im Museum -ein Bericht zu praktischen und technischen Aspekten

Metadaten bei der Digitalisierung von analogen archivalischen Quellen. Kathrin Mileta, Dr. Martina Wiech

Bewahren der Vergangenheit für den Aufbruch in die Zukunft. Erkenntnisstand und Zukunft der digitalen Bibliotheken

Ein Pflichtenheft für digitale Archive?

Vom Piloten in den Produktivbetrieb Das Digitale Archiv des Bundesarchivs - Karsten Huth / Kathrin Schroeder. K. Huth / K. Schroeder

Datenaufbereitung im Vorfeld der Übernahme ins Archiv: Beispiel für einen Pre-Ingest-Workflow

An der Schnittstelle zum digitalen Langzeitarchiv

Wolfgang Peters-Kottig, Tim Hasler, Elias Oltmanns

Digitale Langzeitarchivierung an der TIB

Praktische Erfahrungen mit der Webarchivierung: Das Baden-Württembergische Online-Archiv (BOA)

Empfehlungen für die elektronische Archivierung

Kooperation & Nachnutzung der kopal- Lösung. Frank Klaproth

digitale Langzeitarchivierung mit scopeoais scope solutions ag

Der Lifecycle von Unterlagen

Grundsätze!zum!Umgang!mit! Daten!in!der!Servicestelle! Digitalisierung!Berlin!!

Langzeitsicherung i von Daten: Herausforderungen und Lösungen für KMUs

Anforderungen des Bundesarchivs an die Aussonderung elektronischer Akten

Metadaten für die Langzeitarchivierung

Begriffe der Informationsverwaltung

DIGITALE AUFTRAGSBESTÄTIGUNG

Records im Kontext Kontextualisierung 2.0 mit Matterhorn METS. 19. AUdS-Tagung Wien, Tobias Wildi,

Technische Aspekte der Langzeitarchivierung

VZG Digitale Sammlungen aus Bibliotheken

Digitale Langzeitarchivierung im Bibliotheksverbund Bayern mit Rosetta. Dr. Markus Brantl Matthias Groß

Transkript:

Automatische Langzeitarchivierung für die Digitalisierung mit Kitodo Sabine Krug, Fotos mit freundlicher Genehmigung von Jörg Sachse Sächsische Landesbibliothek, Staats- und Universitätsbibliothek Dresden (SLUB) Oktober 2016

Agenda Was ist ein Langzeitarchiv? Digitales Langzeitarchiv SLUBArchiv, Herausforderungen & Ziele Archivierung Retrodigitalisate Handreichungen & Rahmenbedingungen Kitodo, Architektur und Workflow Ingest-Preprocessing & Ingest Produktiver Einsatz Zusammenfassung und Ausblick 20. Oktober 2016 Seite 2

Digitale Langzeitarchivierung Definition und Ziele DIN 31644: Organisation (bestehend aus Personen und technischen Systemen), die die Verantwortung für den Langzeiterhalt und die Langzeitverfüg-barkeit von Information in digitaler Form sowie die Bereitstellung für eine bestimmte Zielgruppe übernommen hat. Ziele Sicherung der langfristigen Verfügbarkeit und Nutzung von digitalen Objekten (50 Jahre +) Berücksichtigung zukünftiger Nutzungsszenarien => Erhalt der Korrektheit (Bitstream Preservation) und => Erhalt der Interpretierbarkeit und Nutzbarkeit (Content Preservation) 20. Oktober 2016 Seite 3

Digitale Langzeitarchivierung Herausforderungen Schneller Medien-, Format- und Systemwandel Begrenzte Haltbarkeit der Trägermedien Integrität der Daten nimmt durch gezielte Modifikation oder Systemfehler ab Hardwareausfälle, Softwarefehler, Unglücksfälle Sichern der Korrektheit (Bit stream preservation) und Prüfen der Korrektheit bei großen Datenmengen Veralten der Dateiformate Software, die das Datenformat korrekt interpretieren wird nicht mehr entwickelt/gepflegt Veralten der Daten und Metadaten => Erhalt der Interpretierbarkeit und Benutzbarkeit Datendurchsatz zur Verarbeitung der täglich produzierten Daten 20. Oktober 2016 Seite 4

Digitales Langzeitarchiv SLUBArchiv Ziele und Stand Aufbau des Digitalen Langzeitarchivs der SLUB erfolgt im Rahmen eines Projektes (Mai 2012 bis Oktober 2014) Ziele Sichern der Langzeitverfügbarkeit der Digitalen Sammlungen der SLUB (Digitalisierung mit Kitodo, Elektronische Publikationen, Digitale Sammlung der Deutschen Fotothek, Digitales Audio/Video-Material der Mediathek) Vorbereitung einer Dienstleistung für andere sächsische Institutionen Stand: Produktiver Betrieb des Workflows für die Digitalisierung mit Kitdo.Production (Retrodigitalisate) seit 2015 Ca. 60 000 IEs, 3 000.000 Files, 43 TB Zertifizierung mit dem Data Seal of Approval im Juni 2015 Erweiterung und Anpassung für Kitodo Workflow im Rahmen des Landesdigitalisierungsprogramm Sachsen Q1 Q4 2016 20. Oktober 2016 Seite 5

Digitales Langzeitarchiv SLUBArchiv Grundsätze Verwendung als Dark Archive, in dem die Masterdaten verwaltet und archiviert werden die Präsentationsdaten bleiben in einem separaten Repository, können aber aus den Masterdaten erzeugt werden Automatisierung des Ingest, d.h. der Übernahme ins Langzeitarchiv, und des Access, d.h. des Zugriffs auf die Daten aus dem Langzeitarchiv (bis auf Fehlerfälle) Prüfsummen werden bereits im Produktionsprozess (bei der Digitalisierung) erzeugt und bei der Übernahme ins Langzeitarchiv geprüft Unterstützung einer definierten Menge von LZA-fähigen Datenformaten Übernahme ins Langzeitarchiv nur für erfolgreich geprüfte Dokumente 20. Oktober 2016 Seite 6

Ingest-Preprocessing (Submission application) Access-Postprocessing Archivierung Retrodigitalisate Architektur SLUBArchiv Preservation Planning Producer SIP Descriptive Info Ingest Plugins AIP Plugins Data Management ExLibris Rosetta Archival Storage Descriptive Info Queries Access Orders AIP ResultSet DIP Consumer Plugins Administration Management IT-Basisinfrastruktur bestehend aus Servern, SAN-Speicher, NAS-Speicher, Bandsystemen Kooperation mit dem Rechenzentrum der TU Dresden zum Produktivsystem 20. Oktober 2016 Seite 7

Archivierung Retrodigitalisate Kitodo für Massendigitalisierung Kitodo ist eine Software zur Unterstützung des Digitalisierungsworkflows SLUB Digitalisierungszentrum erzeugt ca. 3 Mio. Scans im Jahr Digitalisiert werden ausgewählte Printmaterialien Digitale Dokumente sollen automatisiert nach beendeter Bearbeitung ins SLUB Langzeitarchiv übernommen werden 20. Oktober 2016 Seite 8

Archivierung Retrodigitalisate Rahmenbedingungen für Produzent Handreichung für archivfähige Formate (Liste archivfähiger Formate) Gewährleistung Formaterkennung, Formatvalidierung und Metadatenextraktion Spezifikation SIP als Ablieferungspaket Verzeichnisstruktur und Bezeichnung Paketinhaltinhalt und Aufbau (IE) Festlegung Metadaten für SIP Beschreibung (SIP.xml) Schnittstellen im Workflow und Verantwortungsbereiche Zuständigkeiten für Löschung im Transferverzeichnis Protokolle und Auswertung Fehlerbehebung 20. Oktober 2016 Seite 9

Archivierung Retrodigitalisate Handreichung TIFF Festlegung verbindliches Subset der verfügbaren Funktionen Digitalisate müssen dem TIFF 6-Baseline-Standard entsprechen Verwendung ausschließlich Datentypen aus dem TIFF6-Standard Nur Images in bitonal, grayscale oder RGB zugelassen (kein Palette Color, keine Transparency Mask) nur genau ein Image File Directory (IFD) vorhanden Multipage-TIFF ist nicht erlaubt Grundsatz, dass Metadaten möglichst mit den bereits vorhandenen Tags abgebildet werden sollten Policy über notwendige, optionale und verbotene TIFF-Tags Tool zur Überprüfung (Open Source) checkit_tiff 20. Oktober 2016 Seite 10

Archivierung Retrodigitalisate Ausgangsdaten Nach der Digitalisierung und Bearbeitung (Katalogisierung, Strukturierung) wird eine digitale Einheit mit folgenden Daten an das Langzeitarchiv übergeben: Masterdaten in TIFF-Format Optional OCR-Daten im ALTO-XML- Format Metadaten in METS/MODS Prüfsummendatei 20. Oktober 2016 Seite 11

Archivierung Retrodigitalisate Wie Kommen die Retrodigitalisate ins SLUBArchiv? Create Kitodo MD record scan documents create checksums add descriptive & structural MD from catalog preservation & curation ingestprocessing in SLUBArchiv process via Submission Application export master data 20. Oktober 2016 Seite 12

Übernahme in SLUBArchiv Datenübernahme 20. Oktober 2016 Seite 13

Archivierung Retrodigitalisate Submission Application (Preprocessing) Prüft, ob neue, beendete Kitodo-Vorgänge vorhanden im Transferverzeichnis Validiert mit checkit_tiff mit Kitodo - Regelsatz Prüfung der Vollständigkeit & Integrität der Daten Transformation METS/MODS nach METS/DC Erstellt SIP Anstoßen der automatischen Übernahme durch Rosetta 20. Oktober 2016 Seite 14

Archivierung Retrodigitalisate Ingest Automatische Übernahme in Rosetta (muß für jeden Workflow konfiguriert und über Plugins/Programme angepasst werden) Prüfen der Vollständigkeit und Integrität der Dateien (Prüfsummen) Virusprüfung Identifikation des Datenformates (PRONOM-ID) Validierung = Prüfen der Korrektheit des Format mit Validierungstool (Jhove) Extraktion von technischen Metadaten Erstellen eines Archivpaketes Speicherung im Archivbereich 20. Oktober 2016 Seite 15

Zusammenfassung und Ausblick

Unsere Erfahrungen Dark Archive und lose Kopplung an das Produktionssystem hat sich bewährt Automatisierung spart Ressourcen und minimiert menschliche Fehler Handreichung zum TIFF und Bereitstellung Validierungstool minimiert TIFF Fehler Entwurf praxisnaher Testfälle und Dokumentation der Durchführung ist wichtig Größter Aufwand ist es, andere zu überzeugen in Jahrhunderten zu denken LZA-fähige Formate nutzen (Baseline TIFF) Probleme mit Ausgangsdaten vor der Aufnahme ins Langzeitarchiv lösen Kooperieren, Vernetzen, Austauschen Andreas Romeyke Referat 2.3 (romeyke@) 20. Oktober 2016 Seite 17

Danke! Sabine Krug Sächsische Landesbibliothek Staats- und Universitätsbibliothek Dresden (SLUB)