Automatische Langzeitarchivierung

Ähnliche Dokumente
Automatische Langzeitarchivierung

Das digitale Langzeitarchiv SLUB

Die Eignung des Dateiformates PDF für die Langzeitarchivierung Probleme und Lösungen

Dienstleistungen von SLUB und TIB für die digitale Langzeitverfügbarkeit. Ein kooperativer Leistungsverbund

Ein Dienst für die Digitale Langzeitarchivierung

Langzeitarchivierung. Der Ansatz der Bayerischen Staatsbibliothek. aêk=qüçã~ë=tçäñjhäçëíéêã~åå=== jωååüéåéê=aáöáí~äáëáéêìåöëòéåíêìã VK=j êò=omnm

Pilot IBM Langzeitarchiv Martin Walder IBM Schweiz

Ein Digitales Archiv für alles? Verbundlösung Berlin-Brandenburg mit archivematica

Formatvalidierung bei Forschungsdaten: Wann und wozu?

Logo. Michael Lautenschlager (DKRZ) WissGrid AP3 Review, Potsdam

Arbeitspaket: Technik

Das OAIS-Modell für die digitale Langzeitarchivierung

Vom Piloten in den Produktivbetrieb Das Digitale Archiv des Bundesarchivs - Karsten Huth / Kathrin Schroeder. K. Huth / K. Schroeder

Zusammenarbeit. Staatsarchiv Bezirke / Gemeinden. bei der digitalen Archivierung

Perspektiven der Langzeitarchivierung an der Bayerischen Staatsbibliothek. Dr. Astrid Schoger, , 100. Bibliothekartag, Berlin

Digitales Archiv Österreich. Siemens IT Solutions and Services GmbH Alle Rechte vorbehalten.

Beweissicheres elektronisches Laborbuch (BeLab)

Digitale Langzeitarchivierung von Daten Digital Preservation (DP)

Handreichung der AG media im Kompetenznetzwerk nestor: Langzeitarchivierung audiovisueller Medien

Grundlagen der Langzeitarchivierung elektronischer Unterlagen

Herausforderungen bei der Langzeitverfügbarkeit von

Neben der Online Version 2.3 ist eine Printversion 2.0 beim Verlag Werner Hülsbusch, Boizenburg erschienen.

Archivierung von digitalen Daten Lösungsansätze mit SIARD und OAIS

Kooperativer Aufbau eines Archivs digitaler Informationen (kopal) nestor Abschlussveranstaltung

Archiv der sozialen Demokratie. Archiv der sozialen Demokratie (AdsD) der Friedrich-Ebert-Stiftung

Metadaten für die Langzeitarchivierung

Langzeitarchivierung digitale Bestandserhaltung. Dr. Astrid Schoger, 97. Deutscher Bibliothekartag Mannheim, 03. Juni 2008

Langzeitsicherung i von Daten: Herausforderungen und Lösungen für KMUs

Anforderungen des Bundesarchivs an die Aussonderung elektronischer Akten

Partner im Kompetenznetzwerk Deutsche Digitale Bibliothek. Projekte und Leistungsangebote der Sächsischen Landesbibliothek

Kooperation & Nachnutzung der kopal- Lösung. Frank Klaproth

Neue Entwicklungen zur digitalen Langzeitarchivierung (dlza) in Bayern. Dr. Markus Brantl Matthias Groß

Einführung in das OAIS-Referenzmodell

Digitale Langzeitarchivierung im Bibliotheksverbund Bayern mit Rosetta. Dr. Markus Brantl Matthias Groß

Bewahren der Vergangenheit für den Aufbruch in die Zukunft. Erkenntnisstand und Zukunft der digitalen Bibliotheken

Das Informationsmodell von OAIS

Preservation Planning im Digitalen Archiv Österreich. Hannes Kulovits

Technische Aspekte der Langzeitarchivierung

Der Workflow zur Speicherung digitaler Daten in einem kooperativen Modell

Archivierung im Verbund

Der nestor-kriterienkatalog für vertrauenswürdige digitale Langzeitarchive

Migration und Emulation Angewandte Magie?

LZA-Metadaten für Retrodigitalisate. Anna Kugler

Einführung in die Problematik der Langzeitarchivierung elektronischer Dokumente

Digitale Langzeitarchivierung an der TIB

Ein Pflichtenheft für digitale Archive?

Cornelia Diebel ; Karlheinz Schmitt. Sammlung und Archivierung von Netzpublikationen an der DNB

Records im Kontext Kontextualisierung 2.0 mit Matterhorn METS. 19. AUdS-Tagung Wien, Tobias Wildi,

LANGZEITARCHIVIERUNG VON FORSCHUNGSDATEN Dipl.-Inf. Johannes Fricke

digitale Langzeitarchivierung mit scopeoais scope solutions ag

Digitale Langzeitarchivierung Pilotprojekt im Goportis-Verbund

Aufbau einer Infrastruktur für die digitale Archivierung im Staatsarchiv Basel-Stadt

Einführung von Rosetta an der Bayerischen. Basis für Langzeitarchivierungs- Dr. Astrid Schoger Bayerische Staatsbibliothek nestor-praktikertag 2013

An der Schnittstelle zum digitalen Langzeitarchiv

Langzeitarchivierung im Museum -ein Bericht zu praktischen und technischen Aspekten

Digitale Langzeitarchivierung mit Rosetta im Bibliotheksverbund Bayern (BVB) Matthias Groß

Warum digitalisieren Kulturinstitutionen? Strategien und Aspekte digitaler Bewahrung und Vermittlung am Beispiel der Österreichischen Mediathek

Aufbau und Hosting nachhaltiger Softwarelösungen durch die Verbundzentrale. Kathleen Neumann

Lang ist relativ kurz: Langzeitarchivierung am LRZ

Computer/Web-Stammtisch im Verein für Geschichte und Heimatkunde Oberursel (Taunus) e.v.

Das Repositorium für Forschungsdaten und publikationen der TU Berlin als Serviceplattform für die Wissenschaftler

1 Rechtliche Grundlagen

Digitale Bücher ins LRZ!? Aufgaben und Probleme der Langzeitverfügbarkeit von Information in digitaler Form

OAIS Das Open Archival Information System - Ein Referenzmodell zur Organisation und Abwicklung der Archivierung digitaler Unterlagen

Einführung in die digitale Langzeitarchivierung. Natascha Schumann. nestor-geschäftsstelle

Langzeitarchivierungskonzepte, Visualisierungsmöglichkeiten

Kosten der digitalen Langzeitarchivierung. AP5 - Kosten

Das Digitale Archiv des Bundesarchivs. Lösungsarchitektur

Innovative Dienstleistungen fördern: Verhandlung erweiterter Nutzungsszenarien für elektronische Medien

Metadaten bei der Digitalisierung von analogen archivalischen Quellen. Kathrin Mileta, Dr. Martina Wiech

AKTIVITÄTEN IN SACHSEN. Seminar Gesellschaftliche Strukturen im digitalen Wandel Referenten: Christian Hoffmann und Johannes Götze

MODUL 3-2: Daten Nutzen welche Daten wie für die Nachnutzung aufbereiten

Neben der Online Version 2.3 ist eine Printversion 2.0 beim Verlag Werner Hülsbusch, Boizenburg erschienen.

Forschungsdatendienste an einer Universität im Spagat zwischen Möglichkeiten und Realitäten

Goobi Community Edition

Tobias Steinke, Karlheinz Schmitt. Digitale Langzeitarchivierung als Service: Dienste und Kosten

Herausgeber. Im Auftrag von. Kontakt. Heike Neuroth Hans Liegmann Achim Oßwald Regine Scheffel Mathias Jehn Stefan Strathmann

Empfehlungen für die elektronische Archivierung

RADAR Geschäftsmodell, Preise und Verträge

Langzeitarchivierung. Praxis und Perspektiven der Bayerischen Staatsbibliothek. dêéöçê=eçêëíâéãééêi=_p_

edoc Nutzerschulungen 2007

Das Digitale Archiv NRW DA-NRW

DIGITALE UNTERLAGEN LANGFRISTIG NUTZBAR HALTEN. Tobias Wildi

Automatische Klassifikation: Stand der Technik und Veränderungen im Berufsbild des Dokumentars. Automatische Klassifikation:

Herausgeber. Im Auftrag von. Kontakt. Heike Neuroth Hans Liegmann ( ) Achim Oßwald Regine Scheffel Mathias Jehn Stefan Strathmann

Ergebnisse der Online-Umfrage Kompetenzen für eine digitale Souveränität. Berlin, Februar 2017

Öffentliche Bibliotheken als Partner bei der Archivierung persönlicher digitaler Materialien

versiondog Lieferantenmanagement

Ein landesweites Angebot für die Langzeitarchivierung digitaler Materialien für Gedächtnisorganisationen aller Kultursparten:

Sicherheitsaspekte der Langzeitarchivierung am Leibniz- Rechenzentrum. 09. Juni Rosa Freund

74 rechtlich unabhängige Unternehmen weltweit. Chief Executive Officer: Klaus Endress. Eigenkapitalrate 43,9 % Mitarbeiter 5,905

Zyklus Archivpraxis Schweiz, Modul 1 Digitale Langzeitarchivierung in der Praxis. Tobias Wildi, t.wildi@docuteam.ch

VZG Digitale Sammlungen aus Bibliotheken

Kooperativer Aufbau eines Langzeitarchivs digitaler Informationen

Was ARNE alles gelernt hat!

Metadaten für die Informationsversorgung von morgen: Kooperativ erstellen - gemeinsam nutzen

Pilotprojekt Digitale Langzeitarchivierung

Programm e-helvetica

Der neue Fachinformationsdienst Musikwissenschaft Service für die Forschung

Transkript:

Automatische Langzeitarchivierung für die Digitalisierung mit Goobi Andreas Romeyke, Dr. H. Berthold, C. Beissert, J. Sachse, Fotos mit freundlicher Genehmigung von Jörg Sachse Sächsische Landesbibliothek, Staats- und Universitätsbibliothek Dresden (SLUB) Juni 2014

Europäischer Fonds für regionale Entwicklung EFRE Konzeption und Realisierung einer effizienten Langzeitarchivierung

Agenda Was ist ein Langzeitarchiv? Digitales Langzeitarchiv SLUB Goobi Architektur und Datenfluss Ingest-Preprocessing Ingest Access-Postprocessing Produktiver Einsatz Unsere Erfahrungen Andreas Romeyke Referat 2.3 (romeyke@) 4. Juni 2014 Seite 3

Digitale Langzeitarchivierung Definition und Ziele DIN 31644: Organisation (bestehend aus Personen und technischen Systemen), die die Verantwortung für den Langzeiterhalt und die Langzeitverfügbarkeit von Information in digitaler Form sowie die Bereitstellung für eine bestimmte Zielgruppe übernommen hat. Ziele Sicherung der langfristigen Verfügbarkeit und Nutzung von digitalen Objekten (50 Jahre +) Berücksichtigung zukünftiger Nutzungsszenarien => Erhalt der Korrektheit (Bitstream Preservation) und => Erhalt der Interpretierbarkeit und Nutzbarkeit (Content Preservation) Andreas Romeyke Referat 2.3 (romeyke@) 4. Juni 2014 Seite 4

Digitales Langzeitarchiv SLUB Ziele und Stand Aufbau des Digitalen Langzeitarchivs der SLUB erfolgt im Rahmen eines Projektes (Mai 2012 bis Oktober 2014) Ziele Sichern der Langzeitverfügbarkeit der Digitalen Sammlungen der SLUB (Digitalisierung mit Goobi, Elektronische Publikationen, Digitale Sammlung der Deutschen Fotothek, Digitales Audio/Video-Material der Mediathek) Vorbereitung einer Dienstleistung für andere sächsische Institutionen Stand: Implementierung und Test von Workflows für die Digitalisierung mit Goobi und Elektronische Publikationen (Qucosa) erfolgreich Erweiterter Testbetrieb für Goobi-Workflow; Inbetriebnahme Q3/2014 Anpassung und Inbetriebnahme des Qucosa-Workflows nach Umstellung des Repositories; Inbetriebnahme Q1/2015 Autor Abteilung 4. Juni 2014 Seite 5

Digitales Langzeitarchiv SLUB Grundsätze Verwendung als Dark Archive, in dem die Masterdaten verwaltet und archiviert werden die Präsentationsdaten bleiben in einem separaten Repository, können aber aus den Masterdaten erzeugt werden Automatisierung des Ingest, d.h. der Übernahme ins Langzeitarchiv, und des Access, d.h. des Zugriffs auf die Daten aus dem Langzeitarchiv (bis auf Fehlerfälle) Prüfsummen werden bereits im Produktionsprozess (bei der Digitalisierung) bzw. der Annahme (bei Elektronischen Publikationen) erzeugt und bei der Übernahme ins Langzeitarchiv geprüft Unterstützung einer definierten Menge von LZA-fähigen Datenformaten Übernahme ins Langzeitarchiv nur für erfolgreich geprüfte Dokumente Autor Abteilung 4. Juni 2014 Seite 6

Goobi Goobi ist eine Software zur Unterstützung des Digitalisierungsworkflows SLUB Digitalisierungszentrum erzeugt ca. 3 Mio. Scans im Jahr Digitalisiert werden ausgewählte Printmaterialien Digitale Dokumente sollen automatisiert nach beendeter Bearbeitung ins SLUB Langzeitarchiv übernommen werden Andreas Romeyke Referat 2.3 (romeyke@) 4. Juni 2014 Seite 7

Herausforderungen Allgemein Schneller Medien-, Format- und Systemwandel Begrenzte Haltbarkeit der Trägermedien Integrität der Daten nimmt durch gezielte Modifikation oder Systemfehler ab Hardwareausfälle, Softwarefehler, Unglücksfälle Veralten der Dateiformate Software, die das Datenformat korrekt interpretieren wird nicht mehr entwickelt/gepflegt Speziell Datendurchsatz zur Verarbeitung der täglich produzierten Daten (200 bis 500GB pro Tag + Migration) Prüfen der Korrektheit bei großen Datenmengen über Monitordaten Intellektuelle Prüfung beim Ingest (1% der SIPs) Andreas Romeyke Referat 2.3 (romeyke@) 4. Juni 2014 Seite 8

Ingest-Preprocessing (Submission application) Access-Postprocessing Architektur Preservation Planning Producer SIP Descriptive Info Ingest Plugins AIP Plugins Data Management ExLibris Rosetta Archival Storage Descriptive Info Queries Access Orders AIP ResultSet DIP Consumer Plugins Administration Management IT-Basisinfrastruktur bestehend aus Servern, SAN-Speicher, NAS-Speicher, Bandsystemen Kooperation mit dem Rechenzentrum der TU Dresden zum Produktivsystem Andreas Romeyke Referat 2.3 (romeyke@) 4. Juni 2014 Seite 9

IT-Basisinfrastruktur Autor Abteilung 4. Juni 2014 Seite 10

Datenfluss Goobi Speicherbereich für den Goobi-Export NFS NFS Submission application Speicherbereich zur Übergabe an das Langzeitarchiv NFS NFS LZA-Software Rosetta Speicherbereich zur Ingest-Verarbeitung NFS NFS LZA-Software Rosetta Permanentspeicher FC Andreas Romeyke Referat 2.3 (romeyke@) 4. Juni 2014 Seite 11

Ausgangsdaten und Ingest-Preprocessing Prüfen, ob beendete Goobi-Vorgänge vorhanden Prüfung der Vollständigkeit Prüfen der Integrität über Prüfsummen Transformation der Metadaten Übergabe ins Langzeitarchiv Andreas Romeyke Referat 2.3 (romeyke@) 4. Juni 2014 Seite 12

Ingest Automatische Übernahme (muß für jeden Workflow konfiguriert und über Plugins/Programme angepasst werden) Prüfen der Vollständigkeit und Integrität der Dateien (Prüfsummen) Virusprüfung Identifikation des Datenformates (PRONOM-ID) Validierung = Prüfen der Korrektheit der Daten (Jhove) Extraktion von technischen Metadaten Erstellen eines Archivpaketes Speicherung im Archivbereich Autor Abteilung 4. Juni 2014 Seite 13

Access-Postprocessing Export der Daten aus dem SLUB Langzeitarchiv Postprocessing application erstellt automatisch Goobi-Vorgang zur Wieder- oder Weiterverarbeitung in Goobi Autor Abteilung 4. Juni 2014 Seite 14

Produktiver Einsatz Dafür müssen noch folgende Ziele erreicht werden: Erreichen des erforderlichen Durchsatzes für tägliche Produktion und Migration Lasttests und Tuning Automatisierung der Änderungen (AIP Update) mit allen nötigen Parametern Andreas Romeyke Referat 2.3 (romeyke@) 4. Juni 2014 Seite 15

Unsere Erfahrungen Dark Archive und lose Kopplung an das Produktionssystem hat sich bewährt Automatisierung spart Ressourcen und minimiert menschliche Fehler Entwurf praxisnaher Testfälle und automatische Durchführung ist wichtig Ein Langzeitarchiv ist kein Archiv und kein Backup Größter Aufwand ist es, andere zu überzeugen in Jahrhunderten zu denken LZA-fähige Formate nutzen (siehe nächster Vortrag) Probleme mit Ausgangsdaten vor der Aufnahme ins Langzeitarchiv lösen - Option auf zukünftige Ressourcen ist problematisch Kooperieren, Vernetzen, Austauschen Andreas Romeyke Referat 2.3 (romeyke@) 4. Juni 2014 Seite 16

Kontakt/Nachfragen Web: http://www./ueber-uns/digitale-langzeitarchivierung Email: romeyke@ Autor Abteilung 4. Juni 2014 Seite 17