Zyklus Archivpraxis Schweiz, Modul 1 Digitale Langzeitarchivierung in der Praxis Tobias Wildi, t.wildi@docuteam.ch 1
Das Archiv ist digital. 2
3
Ziele dieses Moduls Einführung in die Grundproblematik der digitalen Langzeitarchivierung Praxiserfahrungen präsentieren und zur Diskussion stellen Pragmatische und auch für kleine Archivinstitutionen finanzierbare Ansätze aufzeigen Lösungs- und nicht problemorientierte Herangehensweise Diskutieren Sie mit! 4
Ablauf 9.30 9.40 Begrüssung 9.40 10.10 Alain Dubois: OAIS-Referenzmodell 10.15 11.00 Tobias Wildi: Bewertung, Übernahme, Datenaufbereitung 11.00 12.30 Pause, Gruppenarbeit, Gruppenpräsentationen 12.30 13.30 Mittagessen 13.30 14.30 Das Langzeitarchiv als Organisationsprojekt 14.30 15.00 Pause 15.00 16.00 Der digitale Lesesaal Apéro 5
Referenten Alain Dubois, Records Management und digitale Archivierung im Staatsarchiv Wallis Andreas Nef, Entwickler im Bereich digitale Archivierung, Docuteam Andreas Steigmeier, Schwerpunkt Records Management, Docuteam Tobias Wildi, Schwerpunkt digitale Archivierung, Docuteam 6
Dokumentation Handouts: Orientierungshilfe für den heutigen Tag Die Präsentationen und Referenzen auf wichtige Links stellen wir nach dem heutigen Tag online auf: http://code.google.com/p/darcunite/ 7
8
Bewertung, Übernahme und Datenaufbereitung Tobias Wildi, t.wildi@docuteam.ch 9
Lernziele Bewertung, Selektion, Informationsverlust Übernahme, Verbindung zwischen Datenproduktion und Archiv Datenaufbereitung, Archivstrategien Übung: Senden Sie Datenbestände in die Zukunft! 10
Ausgangslage: Lifecycle Phase active Phase passive Création / réception Classement Elimination Archives intermédiaires Elimination Archives historiques Destruction Destruction Geschäftsprozesse sind digital Es gibt keine Alternative zur digitalen Archivierung 11
Beispiel GIS 12
Es braucht Lösungen...... um Daten in den produktiven Systemen zu bewerten... um die Daten auszukoppeln und in ein Archiv zu überführen... zu erschliessen... allenfalls mit Papierunterlagen in Verbindung zu bringen (Hybriddossiers)... die einzelnen Schritte nachvollziehbar zu dokumentieren 13
Vorbereitung im Produktivsystem 1 Bewertung / Selektion Aufbewahrungsfristen definieren Archivwürdigkeit festlegen (Bildung einer historischen Überlieferung) Dossiers abschliessen Bei Projekt- / Prozessende Nach einer bestimmten Frist (z. B. Jahresdossiers) 14
Vorbereitung im Produktivsystem 2 Neu bei elektronischer Geschäftsführung Datenschnittstellen definieren für Daten (Dateiformate) und Metadaten (in aller Regel über XML) Technische Schnittstelle für Export definieren (SOAP,.NET, Java...) Was kostet die Archivierung und Pflege eines bestimmten Datenbestandes pro Zeiteinheit? Welchen Einfluss auf die Kosten haben unterschiedliche Datenqualitäten (Bilder, Audio, Video)? Dossiers abschliessen, Übergabe ins Langzeitarchiv geschieht in digitalen Archiven oft viel zeitnaher als in Papierarchiven 15
Beispiel im Ordnungssystem Im Records Management werden die Grundlagen zur Bewertung hinterlegt Beispiel AEW Energie AG 16
Authentizität Welche Aspekte des digitalen Objekts sollen in die Zukunft transportiert werden? Identifizierbarkeit Integrität (korrekter, unveränderter Datenstrom) Identität Inhalt Struktur Kontext Originales Erscheinungsbild Verhalten
Ablieferungsvereinbarung: Grundsätzliches Schriftlich festlegen, was in welchem Rhythmus und in welcher Form ans Archiv abgeliefert werden soll. Nicht nur an den Registratur- oder Aktenplan denken, sondern auch an Fachapplikationen und Informationen ausserhalb der Ordnungssysteme. Basiert auf ISO 20652 «Space data and information transfer systems Producer-archive interface Methodology abstract standard». Ist menschen- und maschinenlesbar (XML-Dokument) und wird als Teil der Nachweisakten im Archiv behandelt.
Ablieferungsvereinbarung Inhalt Ziel: Dokumentation des Entstehungskontextes, des Selektionsentscheids, allfällige besondere Schutzbestimmungen und Ablieferungsschemas Für jeden Datenbestand wird zusammen mit der abliefernden Stelle ein Submission Agreement erstellt. Dieses umfasst: Project Description Ingest Project Narrative Survey Report Data Submission Sessions Ablieferungsschema (Rhythmus, Nutzdaten, Metadaten, Verantwortlichkeiten)
Beispiel Submission Agreement, Teil I <?xml version="1.0" encoding="utf-8"?> <submagr xmlns="http://www.docuteam.ch/xmlns/submagr" xmlns:xsi="http://www.w3.org/2001/xmlschema-instance" xsi:schemalocation="http://www.docuteam.ch/xmlns/submagr http:// www.docuteam.ch/xmlns/submagr.xsd" said="sa-chcom-1" title="digitalisate Rasterbild" status="valid"> <producer> <contact contactid="prod01"> <organisation>abb Schweiz AG</organisation> <departement>ch-com, Historisches Archiv</departement> <shortname>chcom</shortname> <person>tobias Wildi, Docuteam GmbH</person> <phone>+41 (0)56 470 03 37</phone> <mail>t.wildi@docuteam.ch</mail> </contact> </producer> <archive isil="ch-001543-7"> <contact contactid="arch01"> <organisation>abb Schweiz AG</organisation> <departement>ch-com, Historisches Archiv</departement> <shortname>chcom</shortname> <person>tobias Wildi, Docuteam GmbH</person> <phone>+41 (0)56 470 03 37</phone> <mail>t.wildi@docuteam.ch</mail> </contact> </archive>
Beispiel Submission Agreement, Teil II <surveyreport> <records> <generaldescription>rasterbilder, teilweise auch mit Textdaten gemischt (PDF)</generalDescription> <creation>die Bilder stammen aus verschiedenen Quellen wie Digitalisierungsprojekte oder digitaler Fotografie.</creation> <copyright>je nach Quelle sind die Bildrechte gesondert abzuklären und im Archivverzeichnis festzuhalten.</copyright> </records> <appraisaldecision>archiviert werden Bilder mit einem langfristig dokumentarischen Charakter, die das visuelle Gedächtnis des Unternehmens dokumentieren.</appraisaldecision> </surveyreport>
Beispiel Submission Agreement, Teil III <datasubmissionsession dssid="dss-01"> <title>rasterbilder</title> <schedule> <variable>nach Bedarf</variable> </schedule> <transfer initiator="arch01" secure="false"> <mode>sipcreator</mode> <instruction> Das Archivpersonal erzeugt selber aus den vorhandenen Digitalisaten ein SIP. </instruction> </transfer> <category>zuwachs</category> <recordtypes>stillimage</recordtypes> <fileformats> <puid>fmt/10</puid> <puid>fmt/44</puid> </fileformats> <namingconventions>der Dateiname richtet sich nach dem archivinternen Mediastandard für Rasterbilder.</namingConventions> <packaging>die Bilder werden vor der Ablieferung nach Themen, Orten oder Ereignissen gruppiert (Dossiers).</packaging> </datasubmissionsession> </submagr>
Ablieferungen: der Fahrplan
Werkzeuge und Schnittstellen für die Datenübernahme Archivierung aus dem Dateisystem: SIP-Creator Webarchivierung HTTrack wget Wayback-Machine ERMS ech-0039: egovernment-schnittstelle Datenbanken SIARD Reporting-Werkzeuge 24
SIP-Creator als Ablieferungswerkzeug Jede Ablieferung bezieht sich auf ein SA Auswahl der Daten Schreiben in einen Hotfolder im Zip-Format
Ingest (vom SIP zum AIP) Ziel: Aufbereitung der Daten für die Langzeitarchivierung Qualitätscheck (technisch und intellektuell) Wenn notwendig Virenprüfung Identifikation der Datenformate Migration in archivtaugliche Formate wie PDF/A, Tiff, Text, Wave, etc. Extraktion von administrativen und technischen Metadaten Verpacken Erschliessen in der Archivdatenbank Endprodukt: Archivinformationspaket
SIP-Creator Hotfolder Auftrag Rückmeldung Ingestwerkzeuge: Einzelschritte, Workflows Quality Assurance Virus Check scopeingest: Steuert den Ingest- Workflow Ste Identification Migration Metadata Extraction Packaging Generate Descriptive Info Edit AIP Freeze AIP Write to Repository Create PID Garbage-Collection AIP im Filesystem löschen Nachricht an den Producer, dass Original gelöscht werden kann
Eingliederung in eine Speicherumgebung (digitaler Magazinraum) http://www.fedora-commons.org/ Geschützte, kontrollierte Ablage und Verwaltung von digitalen Objekten, Versionierung, Integritätsprüfung Fedora ersetzt kein Archivinformationssystem (unterschiedliche Funktionen innerhalb OAIS) Das System ist skalierbar. Auf Fedora müssen (Web-)Applikationen aufgebaut werden.
Beispiel: Archival Storage in Baden Innerhalb der Speicherinfrastruktur der Stadt (die Stadt betreibt ein eigenes Rechenzentrum) Virtualisierte Umgebung mit VMWare Gleiche Archivdatenbank für digitale und konventionelle Archivinhalte.
Screenshot MFO
Erkenntnisse Ein sorgfältig konzipierter und umgesetzter Ablieferungspfad erhöht die Lebensdauer der digitalen Objekte. Dazu braucht es: Organisationsprojekt Dokumentierte Bewertungsentscheide Werkzeuge für die Übernahme und Datenaufbereitung Protokollierung (Nachvollziehbarkeit) Wo möglich die gleiche Arbeitsweise wie bei der Papierarchivierung verwenden. Schwierig wird es bei der Ablieferung von komplexen Objekten (digitale Archivierung auf Knopfdruck gibt es nicht)
Aufgabe: Senden Sie Datenbestände in die Zukunft! 1. Beschreiben Sie den digitalen Bestand. 2. Formulieren Sie Bewertungskriterien: Was ist archivwürdig? 3. Erstellen Sie ein Submission Agreement 38
Gruppen Gruppe 1: Verwaltungsschriftgut, Export aus einem Geschäftsverwaltungssystem der Stadt Baden Leitung: Andreas Steigmeier Raum: Herrenzimmer, 1. Stock Gruppe 2: Bilder und Digitalisate Leitung: Alain Dubois Raum: Gruppe 3: Webarchivierung am Beispiel des Special Court for Sierra Leone http://www.sc-sl.org/ Leitung: Andreas Nef Raum: Jura Gruppe 4: Ein digitales Kunstwerk Leitung: Tobias Wildi Raum: Jura 39
Submission Agreement Bewertungs- / Selektionskriterien Informationen zum Producer (so dass dieser auch in 100 Jahren noch identifizierbar ist) Kurzbeschreibung der abzuliefernden Unterlagen Ablieferungsrhythmus Copyright-Informationen Welche Metadaten bestehen bereits und in welcher Form übernehmen Sie sie? Packaging (Dossierbildung, in welchen logischen Einheiten archivieren Sie?) Viruscheck notwendig? Fileformate für die Übergabe 40
41