Projekt Aufbau eines Digitalen Archivs im Bundesarchiv Werkstattbericht über den individuellen Umgang mit Massendaten



Ähnliche Dokumente
Hinweise zur Langzeitspeicherung und Aussonderung

Vom Piloten in den Produktivbetrieb Das Digitale Archiv des Bundesarchivs - Karsten Huth / Kathrin Schroeder. K. Huth / K. Schroeder

Umzug der abfallwirtschaftlichen Nummern /Kündigung

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Hinweise zum elektronischen Meldeformular

AUTOMATISCHE -ARCHIVIERUNG. 10/07/28 BMD Systemhaus GmbH, Steyr Vervielfältigung bedarf der ausdrücklichen Genehmigung durch BMD!

Das SIARD Format und die zugehörige Tool-Landschaft

MIT NEUEN FACHTHEMEN

Newsletter: Februar 2016

Leitfaden. zur Registrierung und Beschaffung einer elektronischen Signatur für die IKK classic Ausschreibungsplattform.

Handbuch für Gründer. Daniela Richter, Marco Habschick. Stand: Verbundpartner:

Informations- und Kommunikationsinstitut der Landeshauptstadt Saarbrücken. Upload- / Download-Arbeitsbereich

Ist Excel das richtige Tool für FMEA? Steve Murphy, Marc Schaeffers

» Weblösungen für HSD FM MT/BT-DATA

A. Ersetzung einer veralteten Govello-ID ( Absenderadresse )

Ihre Fragen unsere Antworten rund um die Fusion der Sparkassen Wesel und Dinslaken-Voerde-Hünxe. Mehrwert der Fusion. Das Wichtigste vorab:

Zwischenablage (Bilder, Texte,...)

Nutzung des Retain-Archivs

Die Aktive Projektakte. Archiv- und Digitalisierungslösungen für den Anlagenbau

Anwendungsbeispiele Sign Live! Secure Mail Gateway

BEDIENUNGSANLEITUNG: EINREICH-TOOL

Elexis-BlueEvidence-Connector

Dokumentation Bonuspunkteverwaltung. Verfasser(in) / Autor: Check it Consulting

Die Portallösung für Flexible Benefits und Sachbezüge

Für die Einrichtung des elektronischen Postfachs melden Sie sich wie gewohnt in unserem Online-Banking auf an.

Bereich METIS (Texte im Internet) Zählmarkenrecherche

Anleitung. Verschieben des alten -Postfachs (z.b. unter Thunderbird) in den neuen Open Xchange-Account

Rechnungshöfe des Bundes und der Länder. Positionspapier zum Thema Aktenführung

Datenschutz im Alters- und Pflegeheim

1. Adressen für den Serienversand (Briefe Katalogdruck Werbung/Anfrage ) auswählen. Die Auswahl kann gespeichert werden.

Das Archivierungssystem - Dokumentation für Anwender und Administratoren

ERASMUS+ im Schulbereich (COMENIUS) Mobility Tool. Berichterstattung über KA1 Mobilitätsprojekte. Stand: 23. Oktober 2014

Welche Bereiche gibt es auf der Internetseite vom Bundes-Aufsichtsamt für Flugsicherung?

Anleitung über den Umgang mit Schildern

D a s P r i n z i p V o r s p r u n g. Anleitung. - & SMS-Versand mit SSL (ab CHARLY 8.11 Windows)

ST Xenn Ihr Tor zur unkomplizierten

Bedeutung der Bestände

macs Support Ticket System

2.1 Präsentieren wozu eigentlich?

Datenexport aus JS - Software

Installation OMNIKEY 3121 USB

tntswisspost.com TNT SWISS POST AG RECHNUNGEN Einfache Kontrolle und effiziente Verarbeitung THE PEOPLE NETWORK 1/6

Mitteilung zur Kenntnisnahme

Mail-Signierung und Verschlüsselung

Widerrufsbelehrung der Free-Linked GmbH. Stand: Juni 2014

Externe Abfrage von für Benutzer der HSA über Mozilla-Thunderbird

Thorsten Sett-Weigel Berlin, den 28. März 2012 Finowstraße Berlin

I n f o r m a t i o n s s i c h e r h e i t i n G e m e i n d e n B e v ö l k e r u n g s z a h l < 6 000

Prodanet ProductManager WinEdition

Von der Bedarfsmeldung bis zur Rechnungsprüfung

Leitfaden zur Web- Anwendung der Sodexo BildungsKarte

Metadaten bei der Digitalisierung von analogen archivalischen Quellen. Kathrin Mileta, Dr. Martina Wiech

s aus -Programm sichern Wählen Sie auf der "Startseite" die Option " s archivieren" und dann die entsprechende Anwendung aus.

Erster Schritt: Antrag um Passwort (s. Rubrik -> techn. Richtlinien/Antrag für Zugangsberechtigung)

Anmerkungen zur Erstellung, dem automatisierten Versand und der automatisierten Auswertung von pdf-formularen

Einführung in die digitale Langzeitarchivierung. Natascha Schumann. nestor-geschäftsstelle

Leseauszug DGQ-Band 14-26

White Paper - Umsatzsteuervoranmeldung Österreich ab 01/2012

Programmmoduls für die CEMES-Plattform zur onlinebasierten Ermittlung der Leistungspunkte

Projekt Schule&Zeitung Schritt-für-Schritt- Anleitung München/Region

windream für Microsoft Office SharePoint Server

Anleitung zum LPI ATP Portal

Internationales Altkatholisches Laienforum

Informationen zum neuen Studmail häufige Fragen

Rundum-G. Die Anforderungen durch ständig steigende

Hilfedatei der Oden$-Börse Stand Juni 2014

MMS - Update auf Version 4.4

Synchronisations- Assistent

Dokumentation. Black- und Whitelists. Absenderadressen auf eine Blacklist oder eine Whitelist setzen. Zugriff per Webbrowser

Vorgehensweise bei Lastschriftverfahren

Dokumentation. Schnittstelle IKISS Bayerischer Behördenwegweiser. Stand:

Informationen zur Erstellung des Projektantrags in den IT-Berufen und zum AbschlussPrüfungOnlineSystem (CIC-APrOS)

TopKontor Handwerk. sirados - Kalkulationsdaten importieren - so einfach geht s! einfach sicher schnell

StudyDeal Accounts auf

Ihr persönlicher Leitfaden für die hotel.de

Schnell, sicher, umweltfreundlich und sparsam

Fragen und Antworten

BSI Technische Richtlinie

FAQ 04/2015. Auswirkung der ISO auf 3SE53/3SF13 Positionsschalter.

Herzlich Willkommen. Handeln statt abwarten, aber wie? Wie beginne ich ein DMS Projekt. Hans Lemke. Agenda das digitale Dokument März 2015

Benutzerhandbuch - Elterliche Kontrolle

Metadateneditoren für ArcGIS

Leitfaden zu VR-Profi cash

STRATO Mail Einrichtung Mozilla Thunderbird

Vorlage zur Kenntnisnahme. Stellungnahme des Senats zum Bericht des Berliner Beauftragten für Datenschutz und Informationsfreiheit für das Jahr 2009

E-Rechnung: Einfach, bequem und sicher zahlen

Speicher in der Cloud

smartdox connect for i5 Reibungslose d.3ecm Integration in die IBM i5 Umgebung

Dokumentation zur Versendung der Statistik Daten

Software Engineering. Sommersemester 2012, Dr. Andreas Metzger

[Customer Service by KCS.net] KEEPING CUSTOMERS SUCCESSFUL

Skript Pilotphase für Arbeitsgelegenheiten


Dokumentation zum Inco- FORM

Matrix42. Use Case - Sicherung und Rücksicherung persönlicher Einstellungen über Personal Backup. Version September

1. ORTENAUER MARKETINGPREIS BEWERBUNGSFORMULAR

iphone- und ipad-praxis: Kalender optimal synchronisieren

Melde- und Veröffentlichungsplattform Portal (MVP Portal) Hochladen einer XML-Datei

Whitepaper Anmeldeformular Bundestreffen VKM e.v.

Transkript:

Projekt Aufbau eines Digitalen Archivs im Bundesarchiv Werkstattbericht über den individuellen Umgang mit Massendaten KARSTEN HUTH, KATHRIN SCHROEDER 1. Ausgangssituation und Herausforderungen Die Archivierung digitaler Überlieferungen aus Behörden ist ein wichtiger Schwerpunkt der Abteilung B (Bundesrepublik Deutschland) des Bundesarchivs. Die ältesten Daten stammen aus den 70er Jahren 1 und können heute noch interpretiert werden. Hingegen fehlen für die Übernahme, Speicherung, Erschließung und dauerhafte Erhaltung elektronischer Bestände aus Behörden praktische Erfahrungen. Der aktuelle Bedarf für ein Digitales Archiv ergibt sich aus der voranschreitenden Umstellung der Bundesbehörden von einer papiergebundenen Aktenführung hin zum e-government. Bereits im Februar 2006 sind Aussonderungen an das Bundesarchiv erfolgt, weitere wurden angekündigt. Die Herausforderungen bestehen in der Neuartigkeit der Aufgabe und der Einführung eines mandantenfähigen, flexiblen Systems, das funktional den Anforderungen des Bundesarchivs langfristig gerecht wird und wirtschaftlich zugleich ist. Die Notwendigkeit zur Flexibilität des Archivs ergibt sich schon aus dem Umstand, dass Metadaten aus Vorgangsbearbeitungssystemen der Bundesbehörden in unterschiedlichen Formaten exportiert werden. Da diese Metadaten die Struktur und den Kontext der elektronischen Akten enthalten und somit auch zu primärem Archivgut werden, ist ihre Speicherung in einem einheitlichen Archivformat notwendig. Das Bundesarchiv hat sich deshalb entschlossen, ein Standard Archivierungsmodul (SAM) für die Übernahme von elektronischen Aussonderungen zu entwickeln. Eine Hauptaufgabe von SAM wird die Umsetzung der heterogenen Metadaten aus den Behördensystemen in ein einheitliches Archivformat sein. Die Koordinierungsund Beratungsstelle der Bundesregierung für Informationstechnik in der Bundesverwaltung (KBSt) fördert das Bundesarchiv bei der Entwicklung und beim Ausbau von SAM als EfA-(Einer-für-Alle)- Dienstleistung 2. Ein inkrementelles Vorgehen im Projekt wurde gewählt, um die Funktionalitäten des Digitalen Archivs dem aktuellen Bedarf anpassen zu können, soweit dies wirtschaftlich ist. Zunächst wurde in einer Pilotphase ein End-to-End-Prozess erfolgreich realisiert. Während der Pilotphase wurden Erkenntnisse gewonnen, die in einen detaillierten Anforderungskatalog für das zukünftige, produktive System eingeflossen sind. Im Anschluss an die Einführung des Systems werden Erweiterungen in mehreren Ausbaustufen folgen. 1 Siehe unter http://www.bundesarchiv.de/aufgaben_organisation/abteilungen/bundesrepublik/00203/index.html (letzter Zugriff 24.4.2007). 2 Siehe unter http://www.bundesarchiv.de/service/behoerdenberatung/01435/index.html (letzter Zugriff 3.4.2007). 42

Unser Beitrag beschreibt den Workflow während der Testphase. Dieser umfasst das Anbieten und Bewerten, die Übernahme, Speicherung und Recherche von elektronischen Akten. 2. Darstellung des End-to-End-Prozesses 2.1 Der organisatorische Vorlauf Bevor die erste Anbietung elektronischer Akten erfolgen kann, treten die Behörde und das Archiv in Kontakt. Dabei werden die technischen Einzelheiten der Datentransfers geklärt. Folgende Informationen müssen an das Archiv übergeben werden: Die Datenschemata der Metadaten aus dem Vorgangsbearbeitungssystem. Eine kurze technische Beschreibung der verwendeten Hardware/Software Struktur des Vorgangsbearbeitungssystems mittels eines Formulars des Bundesarchivs. Darüber hinaus werden in Absprachen zwischen Behörde und Archiv die zulässigen Dateiformate der Primärdokumente festgelegt. Präferenzformate für die Archivierung elektronischer Akten sind zur Zeit TIFF 6.0 und PDF/A. Die Behörde erhält anschließend eine eindeutige Behördenidentifikationsnummer und eine Profilnummer. Diese IDs dienen der eindeutigen Identifikation des Absenders und des im System hinterlegten technischen Profils. Es wurde berücksichtigt, dass eine Behörde mehrere Profile haben kann. Während der Pilotphase wurde die Behördenrolle vom Bundesarchiv übernommen. 2.2 Der Geschäftsprozess Anbieten und Bewerten Während der Testphase wurde das vierstufige Verfahren des DOMEA-Konzeptes 3 umgesetzt. Dabei erstellt die Behörde eine Anbieteliste über die Unterlagen, deren Aufbewahrungsfrist abgelaufen ist. Diese Anbieteliste beinhaltet die Metadaten aus dem Vorgangsbearbeitungssystem der Behörde und kann im XML- oder Excel- (CSV) Format an das Bundesarchiv übermittelt werden. In der Pilotphase wurde dies per E-Mail-Anhang realisiert. Die Behörde sandte die Daten an eine nur für diesen Zweck 3 Siehe unter DOMEA-Erweiterungssmodul Aussonderung und Archivierung Elektronischer Akten im Internet: http://www.kbst.bund.de/cln_047/nn_836802/content/standards/domea Konzept/domea node.html nnn=true (letzter Zugriff 3.4.2007). 43

bestimmte E-Mail-Adresse. Bei einer erfolgreichen Validierung der Legitimationsdaten (Behördenidentifikationsnummer/Profilnummer) initiierte des System anschließend den Geschäftsprozess. Zunächst wurden die eingehenden Metadaten gegen das im System hinterlegte Datenschema geprüft (s. 2.1). Das System generierte eine eindeutige Transaktionsnummer für den gesamten Archivierungsprozess und übermittelte sie per Mail an die Behörde. Die Transaktionsnummer wird für Prozesse, die in mehreren interaktiven Schritten ablaufen, benötigt. Nach erfolgreicher Validierung wurden die Daten in das vom Bundesarchiv definierte XML-basierte Datenformat XBARCH umgesetzt. Anschließend wurden die an der Testphase beteiligten Kolleginnen und Kollegen per E-Mail über den Eingang einer Anbieteliste informiert. Sie konnten sich beim System anmelden und auf die Anbieteliste zugreifen. Das System war vollständig web-basiert realisiert. Die archivfachliche Auswertung und Bearbeitung der Anbieteliste erfolgte über eine Eingabemaske, die mittels eines Standard-Web- Browsers aufgerufen wurde. Ziel der Bearbeitung war die Festlegung der Aussonderungsart, nachdem die Akten- und Vorgangsbetreffs auf ihre Archivwürdigkeit hin geprüft wurden. Als Parameter konnten A (Archivieren) und V (Vernichten) eingetragen werden. Nach Abschluss der Bewertung wurde das Bewertungsverzeichnis in das Metadatenformat der Behörde umgesetzt und per E-Mail der Behörde zugesandt. 2.3 Der Geschäftsprozess Übernahme der Aussonderungsdatei Die Behörde erstellte anhand des Bewertungsverzeichnisses eine Aussonderungsdatei. Diese beinhaltete Metadaten und Primärdaten der elektronischen Akten, welche vom Archiv mit A bewertet wurden. Vor dem Transfer der elektronischen Akten stand eine erneute Kontaktaufnahme zwischen der Behörde und dem Archiv an. Beide einigten sich auf einen Übertragungsweg und einen Zeitraum, in dem die Aussonderungsdatei an das Archiv transferiert werden musste. Der Datentransfer von der Behörde zum Archiv konnte Online über ein sicheres Übertragungsprotokoll oder Offline mittels Datenträger erfolgen. Die Aussonderungsdatei wurde in ein spezielles Verzeichnis übertragen, das vom System ständig auf neu eingehende Daten hin geprüft wurde. Die Aussonderungsdatei bestand aus einem ZIP-Container, in dem die Primärdaten und das Aussonderungsverzeichnis (mit den Metadaten des VBS) verpackt wurden. Zusätzlich zur Aussonderungsdatei war eine XML-Datei erforderlich, mit der sich die Behörde authentifiziert hat. Beispiel für eine Aussonderungsdatei Speicherung 44

2.4 Der Geschäftsprozess Ingest, Qualitätskontrolle und Übergabe an die Archivierungslösung Nach einem Eingang der Aussonderungsdatei wurden zunächst die Authentifizierungsdaten validiert, anschließend der ZIP-Container entpackt und die Daten auf Vollständigkeit geprüft. Das System kontrollierte, ob zu jedem Dokument, das im Aussonderungsverzeichnis aufgeführt ist, auch ein entsprechendes Primärdokument mitgeliefert wurde. Die Metadaten wurden in das XML-basierte Datenformat des Bundesarchivs (XBARCH) umgesetzt. Anschließend generierte das System die Archivsignaturen automatisch über einen implementierten Algorithmus. Die eingebundene Open-Source-Lösung JHOVE 4 ermittelte alle für die Archivierung relevanten technischen Metadaten (z.b. über das Dateiformat), die später den XBARCH-Metadaten hinzugefügt wurden. Die aufbereitete Aussonderungsdatei wurde an die Kolleginnen und Kollegen des zuständigen Fachreferats zur abschließenden Qualitätskontrolle weitergeleitet. Nach der Freigabe durch das zuständige Fachreferat wurden die Dateien (Metadaten und Primärdokumente) in Archival Information Packages (AIPs) 5 strukturiert. Jedes AIP enthielt ein Primärdokument und die dazugehörigen Metadaten in Gestalt einer XBARCH XML-Datei. Eine XBARCH- Datei gibt Auskunft darüber, zu welcher Akte und zu welchem Vorgang das Primärdokument gehört. Zusätzlich sind auch Angaben zu den übrigen Dokumenten des Vorgangs enthalten. Weiterhin gibt XBARCH Auskunft über den Verlauf der Aussonderungsphase, das Archivformat der Primärdokumente und die notwendigen technischen Anforderungen (Hardware und Software) zur Darstellung der Primärdokumente. Um die Authentizität der Primärdokumente zu erhalten, enthält XBARCH einen eindeutigen Hash-Wert, der während der Pilotphase von der Archivierungslösung für jedes Primärdokument generiert wurde. Zudem beschreibt XBARCH die technische Umgebung (VBS) der Behörde, aus der die Aussonderung stammt. Zum Abschluss des Ingest-Prozesses übergab die Softwarelösung, die für das Anbieten, Bewerten und Übernehmen der elektronischen Akten zuständig war, das Primärdokument und die XBARCH-Datei in einem unkomprimierten tar-archiv an die Archivierungslösung zur endgültigen Speicherung. Bei diesem Vorgang wurden eine Auswahl von Metadaten in eine Archivdatenbank importiert, welche die Archivobjekte verwaltet und gleichzeitig die Grundlage für die Recherche bildete. Zusätzlich legte die Softwarekomponente des Speichersystems auf dem Datenträger ein Verzeichnis über die auf diesem Träger gespeicherten AIPs an. Auf Basis dieser Verzeichnisse könnte im Bedarfsfall die Archivdatenbank sowie der Kontext der Daten vollständig rekonstruiert werden. Jedes AIP ist wie eine organische Zelle konzipiert, die Informationen über den Aufbau eines komplexeren Organismus enthält, zu dem sie gehört. Ein Nachteil dieser Methode ist die erhöhte Redundanz bei der Datenspeicherung. Jede XBARCH-Datei wird vermutlich im Durchschnitt 50 KB benötigen. 2.5 Recherche und Benutzung Nach einem erfolgreichen Archivierungsvorgang wurde die Behörde informiert, ein Report erstellt und die Daten für die Benutzung freigeschaltet. Es war eine hierarchische Navigation (Provenienz- Akte-Vorgang-Dokument) und gleichzeitig eine Suche nach konfigurierbaren Kriterien möglich. 4 Im Internet unter http://hul.harvard.edu/jhove/ (letzter Zugriff 11.04.2007). 5 Siehe Reference Model for an Open Archive Information System NASA - Washington, DC; 2002 S. 4-33 ff. Im Internet unter: http://public.ccsds.org/publications/archive/650x0b1.pdf (letzter Zugriff 11.04.2007). 45

3. Ergebnisse des Pilotprojekts Es ist gelungen, innerhalb von etwa zwei Monaten die Anforderungen des Bundesarchivs sowie alle wesentlichen Funktionen einer Archivierungslösung, d.h. vom Anfang (Produzenten-Archiv-Schnittstelle, Bewertung, Übernahme) bis zum Ende (Erschließung, Langzeitspeicherung, Access) mit zwei einfach zu integrierenden Standardlösungen umzusetzen. Die Testphase erfolgte unter praxisnahen Bedingungen, wodurch nachgewiesen wurde, dass bei der Aufbereitung und Führung von digitalen Daten für die Archivierung eine genügende Kontrolle über die technischen Prozesse erlangt und die Anwender weitgehend von unnötigen manuellen und fehleranfälligen Ad-hoc-Arbeitsschritten befreit werden können. Dadurch ist eine hohe Qualitätssicherung des eigentlichen Geschäftsprozesses möglich. 4. Ausblick Die nächste Projektphase betrifft die Ausschreibung für die erste Ausbaustufe eines produktiven digitalen Archivs. Die Unterlagen für eine Ausschreibung werden zur Zeit am Bundesarchiv angefertigt. In der Testphase konnten noch keine Geschäftsprozesse für die Migration von Dateiformaten erprobt werden. Nach dem heutigen Erfahrungsstand müssen Migrationen aber zwingend durchgeführt werden, um das elektronische Archivgut an die kommenden technischen Umgebungen anzupassen. Die dadurch unvermeidlichen Veränderungen am Archivgut müssen abgewogen, kontrolliert und sorgfältig dokumentiert werden. Nur so kann das Archiv die Authentizität seiner Objekte nachweisen und erhalten. Entsprechende Geschäftsprozesse sind für den Produktivbetrieb des Digitalen Archivs vorgesehen. Weiterhin sieht der Plan eine Erweiterung der Funktionalitäten des Digitalen Archivs bis 2010 vor. 46