Konzept zu persistenten URLs für Digitalisate in Archiven



Ähnliche Dokumente
Guide DynDNS und Portforwarding

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

Tutorial: Wie kann ich Dokumente verwalten?

Microsoft PowerPoint 2013 Folien gemeinsam nutzen

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

Adminer: Installationsanleitung

Die Dateiablage Der Weg zur Dateiablage

ARCHIV- & DOKUMENTEN- MANAGEMENT-SERVER PAPIER ARCHIVIEREN

FTP-Server einrichten mit automatischem Datenupload für

Lizenzen auschecken. Was ist zu tun?

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Updatehinweise für die Version forma 5.5.5

Installationsanleitung für CashPro im Mehrbenutzerzugriff/Netzwerkbetrieb

Bereich METIS (Texte im Internet) Zählmarkenrecherche

Anleitung zur Daten zur Datensicherung und Datenrücksicherung. Datensicherung

Advoware mit VPN Zugriff lokaler Server / PC auf externe Datenbank

Erstellen einer digitalen Signatur für Adobe-Formulare

SJ OFFICE - Update 3.0

Wordpress: Blogbeiträge richtig löschen, archivieren und weiterleiten

Urlaubsregel in David

Im Folgenden wird Ihnen an einem Beispiel erklärt, wie Sie Excel-Anlagen und Excel-Vorlagen erstellen können.

Inkrementelles Backup

Informations- und Kommunikationsinstitut der Landeshauptstadt Saarbrücken. Upload- / Download-Arbeitsbereich

Wichtige Hinweise zu den neuen Orientierungshilfen der Architekten-/Objektplanerverträge

Jederzeit Ordnung halten

Datensicherung. Beschreibung der Datensicherung

Abschluss Version 1.0

IRF2000 Application Note Lösung von IP-Adresskonflikten bei zwei identischen Netzwerken

Einfügen von Bildern innerhalb eines Beitrages

FlowFact Alle Versionen

1 Einleitung. Lernziele. Symbolleiste für den Schnellzugriff anpassen. Notizenseiten drucken. eine Präsentation abwärtskompatibel speichern

Leitfaden für den -Dienst

STRATO Mail Einrichtung Mozilla Thunderbird

OLXTeamOutlook 1.5 für Outlook 2003, 2002/XP, 2000 und 97/98

Datenübernahme von HKO 5.9 zur. Advolux Kanzleisoftware

Virtueller Seminarordner Anleitung für die Dozentinnen und Dozenten

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

4. BEZIEHUNGEN ZWISCHEN TABELLEN

Ablaufbeschreibung für das neu Aufsetzen von Firebird und Interbase Datenbanken mit der IBOConsole

icloud nicht neu, aber doch irgendwie anders

SICHERN DER FAVORITEN

Einrichtung des Cisco VPN Clients (IPSEC) in Windows7

Die Beschreibung bezieht sich auf die Version Dreamweaver 4.0. In der Version MX ist die Sitedefinition leicht geändert worden.

MORE Profile. Pass- und Lizenzverwaltungssystem. Stand: MORE Projects GmbH

Grundkenntnisse am PC Das Internet

Anleitung über den Umgang mit Schildern

Ablaufbeschreibung Einrichtung EBICS in ProfiCash

Handbuch. Adressen und Adressenpflege

Intranet Moodle

OUTLOOK (EXPRESS) KONFIGURATION POP3

Einer Outlook-Gruppe weitere Computer hinzufügen

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Neue Steuererklärung 2013 erstellen

ARCHIV- & DOKUMENTEN- MANAGEMENT-SERVER DATEIEN ARCHIVIEREN

PC-Umzug: So ziehen Sie Ihre Daten von Windows XP nach Windows 8 um

.htaccess HOWTO. zum Schutz von Dateien und Verzeichnissen mittels Passwortabfrage

OP-LOG

Benutzeranleitung Superadmin Tool

Doku Pro Dokumenten & Informationsmanagement

Anleitung - Archivierung

Produktschulung WinDachJournal

Musterlösung für Schulen in Baden-Württemberg. Windows Basiskurs Windows-Musterlösung. Version 3. Stand:

SEPA-Anleitung zum Release 3.09

Kurzinformation Zugang zur NOVA für dezentrale Administratoren

Synchronisations- Assistent

Er musste so eingerichtet werden, dass das D-Laufwerk auf das E-Laufwerk gespiegelt

Projekte Packen, Kopieren und Versenden

Installation im Netzwerk

Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER

Umstellung einer bestehenden T-Online Mailadresse auf eine kostenlose T-Online Fre -Adresse

Windows. Workshop Internet-Explorer: Arbeiten mit Favoriten, Teil 1

Die Statistiken von SiMedia

MOM - Medienforum Online-Medien Anleitung zum Ändern der Login-Nummer und des Passworts

FuxMedia Programm im Netzwerk einrichten am Beispiel von Windows 7

3 ORDNER UND DATEIEN. 3.1 Ordner

infach Geld FBV Ihr Weg zum finanzellen Erfolg Florian Mock

HANDBUCH PHOENIX II - DOKUMENTENVERWALTUNG

Anleitung zur Erstellung einer Batchdatei. - für das automatisierte Verbinden mit Netzlaufwerken beim Systemstart -

Tipps und Tricks zu Netop Vision und Vision Pro

Arbeiten mit dem neuen WU Fileshare unter Windows 7

Sichern der persönlichen Daten auf einem Windows Computer

Installationsanweisung Gruppenzertifikat

Kaiser edv-konzept, Inhaltsverzeichnis

SharePoint Demonstration

Dokumentation für die software für zahnärzte der procedia GmbH Onlinedokumentation

Sich einen eigenen Blog anzulegen, ist gar nicht so schwer. Es gibt verschiedene Anbieter. ist einer davon.

Meldung Lokale Anwendung inkompatibel oder Microsoft Silverlight ist nicht aktuell bei Anmeldung an lokal gespeicherter RWE SmartHome Anwendung

Konfiguration eines DNS-Servers

Arbeiten mit dem Outlook Add-In

S TAND N OVEMBE R 2012 HANDBUCH DUDLE.ELK-WUE.DE T E R M I N A B S P R A C H E N I N D E R L A N D E S K I R C H E

Favoriten sichern. Sichern der eigenen Favoriten aus dem Webbrowser. zur Verfügung gestellt durch: ZID Dezentrale Systeme.

Lernwerkstatt 9 privat- Freischaltung

Ihre Interessentendatensätze bei inobroker. 1. Interessentendatensätze

Kommunikations-Management

Handbuch ECDL 2003 Modul 2: Computermanagement und Dateiverwaltung Dateien löschen und wiederherstellen

KURZANLEITUNG CLOUD OBJECT STORAGE

Anleitungen zum Einfügen eines Partnerlinks in Ihre Website

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang

Transkript:

Konzept zu persistenten URLs für Digitalisate in Archiven Andres Imhof, für das Projekt Ausbau des Portals Netzwerk SED-/DGB-Archivgut zu einer Referenzanwendung für ein Archivprtal Deutschland am 23.10.2007 EINLEITUNG...2 TECHNISCHE INFRASTRUKTUR...2 PRÄSENTATION DER DIGITALISATE...3 PERSISTENT IDENTIFIER (PI) FÜR DIGITALISATE...3 URN (Uniform Ressource Names)... 4 ARK (Archival Resource Key)...4 Eigenständiges Konzept für das Archivportal D...5 ZUSAMMENFASSUNG...6

Einleitung Archive stellen sich zukünftig darauf ein, neben den bisher vorkommenden Medienformaten auch einen erheblichen Anteil an elektronischen Informationen langfristig zu archivieren. Dazu zählen auf der einen Seite die elektronischen Akten (ELAK), die elektronischen Dokumente aus den Dokumenten-Management-Systemen (DMS) und E-Mails sowie auf der anderen Seite nach und nach digitalisierte Altbestände, die der Öffentlichkeit freigegeben werden können. Das vorliegende Konzept behandelt ausschließlich den letzten Punkt, den Umgang mit den Digitalisaten, denn diesbezüglich sollte für das Projekt Archivportal D eine gemeinsame Vorgehensweise unter allen beteiligten Archiven abgestimmt werden. Zunächst wird erörtert, wo physikalisch die Dateien gespeichert werden sollten. Erst danach kann entschieden werden, welches Konzept zur Sicherung eines beständigen Zugriffs auf die Digitalisate im Sinne eines Persistent Identifiers (PI) im Archivportal D umgesetzt werden soll. Zu diesem Thema werden zwei, für das Archivwesen potenziell nutzbare PI-System vorgestellt, um schlussendlich eine eigenständige Lösung zu präsentieren. Technische Infrastruktur Zur Zeit ist im Archivwesen noch nicht entschieden, ob Serverleistungen, mit deren Hilfe elektronische Dateien, Images und dergleichen gespeichert werden, an externe Dienstleister abgetreten oder ob dieser Arbeitsbereich in eigener Regie aufgebaut werden soll. Bezüglich der oben genannten Daten aus den ELAK, DMS und der elektronischen Kommunikation müssen jedoch Archive da es ihr gesetzlicher Auftrag ist in jedem Fall ein Konzept und eine entsprechende Infrastruktur aufbauen. Ist eine solche Infrastruktur ohnehin vorhanden bzw. wird sie angedacht, sollte sie auch für die übrigen Daten der Digitalisate, die vorwiegend zur verbesserten Dienstleistung für die Nutzung via Web angefertigt werden, genutzt werden. Unter Infrastruktur werden in diesem Zusammenhang mehrere Dienstleistungszentren unter archivischer Führung verstanden, die über eine entsprechende Hardware für die Speicherung, über die notwendige Personalausstattung und das erforderliche Know-how über elektronische Langzeitarchivierung verfügen. U.a. gehören zur Hardwareausstattung Backup-Systeme mit Bandlaufwerken, weil diese eine hohe Kapazität, lange Lebensdauer, schnelle Datenübertragung bei großen Datenmengen und geringen Platzbedarf bei geringen Materialkosten gewährleisten. Das Betreiben dieser Infrastruktur lohnt sich für eine Institution erst ab einem bestimmten Datenvolumen. Für größere Staats- und Landesarchive sowie für das Bundesarchiv ist voraussichtlich jeweils eine eigenständig geführte Servereinrichtung selbstverständlich, vor allem da das Know-how in der Regel bereits vorhanden ist. Bei kleineren Stadt- und Kommunalarchiven wird je nach Größe eine Kosten-Leistungs-Rechnung eher zur Beauftragung eines externen Dienstleisters führen. Diese Funktion als Dienstleister könnte vom jeweiligen Landesarchiv oder vom Bundesarchiv übernommen werden. Auf diese Weise würden Ressourcen kostensparend gebündelt und die Handhabe des Staates, der Länder und Kommunen über das elektronische Archivgut wäre jederzeit gesichert. Gäbe es ein deutschlandweites Netz von Archiv-Rechenzentren könnten sich diese gegenseitig Backup-Services zur geordneten, redundanten Datensicherung innerhalb eines Archiv-Grids 1 garantieren. 2 Auch zukünftige technische Weiterentwicklungen könnten gemeinsam angegangen werden. Andere existierende Grids wiederum wie z.b. das TextGrid 3 könnten sich in das Archiv-Grid einbinden, um für die geisteswissenschaftliche Forschung die Archivdaten als Quellressource zu nutzen. Eine unter archivischer Führung 1 Ein Grid bezeichnet eine Infrastruktur, die eine integrierte, gemeinschaftliche Verwendung von meist geographisch auseinander liegenden Hochleistungsrechenzentren und deren Hardware, Software sowie Primärdaten erlaubt. 2 Vorbilder für ein Archiv-Grid finden sich in der folgenden, im Göttinger Universitätsverlag erschienen Publikation: Neuroth, Heike; Kerzel, Martina; Gentzsch, Wolfgang (Hg.): Die D-Grid Initiative. Göttingen 2007. Volltext unter: http://webdoc.sub.gwdg.de/univerlag/2007/d-grid_de.pdf

aufgebaute Infrastruktur bietet sowohl in Bezug auf den gesetzlichen Auftrag, als auch für die Weiterentwicklung archivischer Kompetenz in Zusammenhang mit Wissenschaft und Forschung erhebliche Vorzüge. Präsentation der Digitalisate Egal, wo Digitalisate als Einzelbilder gespeichert und langzeitarchiviert werden, jedes Image muss eine Kennung darüber erhalten, wo es abgelegt wird. Dies kann in einer Datenbank, innerhalb eines Filesystems auf einem geschützten Server oder auf einem öffentlich zugänglichen Webserver geschehen. Sowohl aus einer Datenbank mit Webschnittstelle als auch auf einem Webserver können die Digitalisate online abgerufen werden. Wenn sie nicht frei verfügbar sind, erfolgt dies nach einer entsprechenden Authentifizierung und Autorisierung. Die Digitalisate werden jedoch nicht zum Selbstzweck angefertigt. Sie sollen vielmehr aus den Onlinefindbüchern heraus direkt aufgerufen werden können. Diese elektronisch publizierten Findbücher werden zukünftig allerdings nicht nur in einem einzigen Zusammenhang wie etwa im Archiv selbst angeboten, sondern in verschiedenen Portalen mit unterschiedlicher thematischer oder regionaler Ausrichtung eingebunden sein. Die Findbücher, die jetzt in das Archivportal D einfließen sollen, machen ebenso in den jeweiligen Landesarchivportalen Sinn. Genauso gut könnten einzelne Bestände von Archiven in einer thematisch ausgerichteten Sicht gruppiert werden, wie z.b. alle Bestände zur deutschen Industriegeschichte. Dann wären Bestände zu Kultureinrichtungen davon nicht tangiert. Um aber aus jedem spezifischen Kontext heraus ohne Mehraufwand auf die Digitalisate innerhalb der Onlinefindbücher verweisen zu können, müssen die Images von jedem Standort aus und aus jeder Webanwendung heraus erreichbar sein. Wenn die Digitalisate nur innerhalb des jeweiligen Archivverwaltungssystems gespeichert sind, dann ist nicht gesichert, ob die Bilder aus den Systemen heraus abgerufen werden können. Gegebenenfalls müssen die Bilder für die Verwendung in anderen Portalen aus dem Archivverwaltungssystem heraus kopiert und im jeweiligen Portal erneut gespeichert werden. Diese Vorgehensweise würde wiederum eine ungeordnete, vielfach redundante Speicherung der Digitalisate für mehrere Portale bedeuten und damit einen erheblich höheren Kostenund Verwaltungsaufwand verursachen. Der erhöhte Aufwand kann aber einfach umgangen werden, indem alle Anwendungen nur auf ein und dasselbe publizierte Digitalisat zugreifen. Für die Präsentation der Digitalisate im Internet genügt jeweils eine einzige Speicherung auf einem Webserver. 4 Auch aus Sicht der Nutzerinnen und Nutzer ist es sinnvoll, von jeder Webseite und von jedem Blog 5 aus direkt auf Digitalisate verlinken zu können, so wie auch in gedruckten wissenschaftlichen Publikationen bis auf Folio-Ebene zitiert wird, so dass die digitalen Images sofort im wissenschaftlichen Kontext weiterverwendet werden können. Dazu muss die Möglichkeit angeboten werden, eine direkte URL zum Digitalisat zu kopieren und in den Blog einfügen zu können. Die Ablage der Images auf einem öffentlich zugänglichen Webserver nach einem festgelegten Ordnungsschema bietet hierfür den einfachsten Zugang. Persistent Identifier (PI) für Digitalisate Eine Herausforderung ist jedoch, die Richtigkeit der URL zum Digitalisat auf einem Webserver langfristig zu gewährleisten. Adressen zu Bildern können schnell wechseln. Es 3 http://www.textgrid.de/ 4 Redundante Datensicherung ist innerhalb eines Backup-Verfahrens notwendig, jedoch sollte Redundanz bei der Präsentation weitestgehend vermieden werden, weil dies den Speicherbedarf ohne Mehrwert erhöht. 5 Blogs oder Weblogs sind Online-Tagebücher oder -Journale, die eine zügige Forschungs- und Meinungspräsentation im Internet ermöglichen. Diese Publikationsform findet immer mehr Anwender auch aus der Wissenschaft und Forschung.

verändern sich fortlaufend Domains von Institutionen oder deren Servern. Es muss zudem möglich sein, Bestände einer Institution in eine andere zu wechseln, weil vielleicht Zuständigkeiten verschoben oder ganze Einrichtungen zusammengefasst oder ausgesondert werden. Aus diesem Grund kann nur ein Aufbau der URL gewählt werden, mit dem sich ändernde Adressen jederzeit eindeutig zuweisen lassen. Wege zu eindeutigen Adressen bieten die so genannten Persistent Identifier (PI), von denen weltweit bereits mehrere Umsetzungsformen existieren. Ein jüngst vom Projekt nestor 6 veröffentlichtes Handbuch, Eine kleine Enzyklopädie der digitalen Langzeitarchivierung [Version 0.1, März 2007], 7 das zwar noch nicht vollständig ist und sukzessive ergänzt werden wird, bietet bereits einen kurzen Überblick über die wichtigsten Konzepte zu PI. 8 Aus diesem Überblick werden zwei Lösungen vorgestellt, die für das Archivwesen vorstellbar wären, bevor eine eigenständige Umsetzungsvariante für PI dargestellt wird. URN (Uniform Ressource Names) Ein erfolgreiches Identifizierungsschema lautet URN (Uniform Resource Names) 9 und wird u.a. von der Deutschen Nationalbibliothek (DNB) für die elektronischen Publikationen der deutschen Bibliotheksverbünde und Verlage auf ihrem URN-Resolver angewendet. 10 Ziel der DNB ist es, dass jedes elektronische Dokument über seine gesamte Lebensdauer hinweg eindeutig identifiziert werden kann. D.h. jedes spezifische Dokument kann gefunden werden, auch wenn die Domain wechselt, die Ordnerstruktur umgebaut oder der Dateiname verändert wird. Dafür wird für jedes Dokument ein eindeutiger Identifier nach einer festgelegten Syntax vergeben. Hinter dem Identifier verbirgt sich dann die Domain, der Pfad und der Name der entsprechenden Datei. Es ist sogar möglich, zu mehreren Kopien der Datei zu verweisen, also eine 1:n-Beziehung abzubilden. Auf dem URN-Resolver werden entsprechend die Änderungen einer Domain nachvollzogen bzw. verwaltet, so dass dieser jederzeit den URN in die richtige URL umwandeln kann. Nachteilig an den URN ist, dass man für die direkte Auflösung in die entsprechende URL ein spezielles PlugIn für den jeweils verwendeten Browser benötigt. Eine einfache Eingabe des URN in die Eingabezeile des Browsers ohne das PlugIn führt nicht erfolgreich zum Dokument, was als Ausschlusskriterium für den Einsatz für die Digitalisate in Onlinefindbüchern gelten kann. ARK (Archival Resource Key) Der ARK (Archival Resource Key) 11 ist eine Entwicklung der California Digital Library und erlaubt den langzeitverfügbaren Zugriff auf alle möglichen Objekttypen. Digitale Dokumente, Datenbanken, Bilder, Software, Websites und sogar physikalische Objekte wie Statuen oder Bücher uvm. Der ARK kann auf dreifache Weise Verknüpfungen aufbauen: von einem Objekt zur zuständigen Institution, von einem Objekt zu den dazugehörigen Metadaten und zum Objekt selbst. Ein Beispiel: http://bnf.fr/ark:/13030/tf5p30086k Der Domainname kann sich ändern und muss bei einem Providerwechsel entsprechend nachbearbeitet werden. Nach ark:/ steht eine registrierte Nummer (eine so genannte NAAN, Name Assigning Authority Number) für die jeweilige Institution, in diesem Fall für die Französische Nationalbibliothek. Jede Institution kann eine solche NAAN erhalten. Um nun pro Institution die Langzeit-Identifier nach den ARK-Spezifikationen zu generieren, kann eine 6 http://www.langzeitarchivierung.de/modules.php?op=modload&name=paged&file=index&page_id=10 7 http://nestor.sub.uni-goettingen.de/handbuch/nestor-handbuch_01.pdf 8 siehe Kapitel 13.2 9 http://tools.ietf.org/html/rfc2141 10 siehe http://www.ddb.de/netzpub/erschl_lza/np_urn.htm 11 http://www.cdlib.org/inside/diglib/ark/, zur Spezifikation siehe: http://www.cdlib.org/inside/diglib/ark/arkspec.pdf

Open-Source-Software namens noid (nice opaque identifiers), die von der California Digital Library entwickelt wurde, verwendet werden. noid kann auch gleichzeitig als institutioneller Identifier Resolver eingesetzt werden. Ein Objekt mit einem ARK kann im Übrigen auch in der Syntax eines URN dargestellt werden. Dieses System ist einerseits flexibel und umfangreich in Bezug auf die Objekttypen und Informationen, die mit den Objekten verknüpft werden sollen. Andererseits müssen für jedes Objekt in dem Verwaltungssystem noid die Informationen erst eingearbeitet werden. Dieser Vorgang ist voraussichtlich sehr arbeitsintensiv. Zudem ist mit ARK allein das Problem der sich ändernden Domains nicht gelöst. Aus diesem Grund scheint auch der ARK kein Weg für den beständigen Zugriff auf die Digitalisate deutscher Archive zu sein. Eigenständiges Konzept für das Archivportal D Der Nachteil einer zentral organisierten Identifiervergabe wie der der DNB ist, dass dies eine Zentralredaktion mit entsprechendem Personal- und Kostenaufwand erfordert. Außerdem muss für jedes Objekt ein Identifier generiert werden, bevor das Objekt weiterverarbeitet werden kann. Bei elektronischen Publikationen liegt die URN-Vergabe am Schluss des Publikationsprozesses. Das einzelne digitale Objekt wird anschließend nicht mehr angefasst. Die Ablage auf einem Webserver und die Bekanntgabe beim URN-Resolver ist dort in einem automatisierten Geschäftsgang zusammengefasst. Bei digitalisierten Akten in Archiven sieht das bislang anders aus: Ein angefertigtes und gespeichertes Digitalisat muss grundsätzlich erst in ein Findbuch integriert werden, bevor es aus einem Onlinefindbuch heraus aufgerufen werden kann. Hierfür muss der Identifier bekannt sein und das setzt eine vorherige Lokalisierung (Speicherung) voraus. Demnach müssten alle Digitalisate erst lokalisiert werden (ein Speicherort benannt werden), anschließend einen URN oder ARK erhalten und könnten dann erst in das Onlinefindbuch integriert werden. Ein URN kann jedoch hinderlich für die Einarbeitung sein, weil die Benennung nicht so sprechend ist wie beispielsweise die bisherige Konvention, die Signaturen der Bestände und Verzeichnungseinheiten (VE) als Ordnernamen und Imagenamen mit ergänzter fortlaufender Zählung zu verwenden. Diese Struktur wird bereits während der Digitalisierung der Akten angelegt und von den Archivarinnen und Archivaren verstanden. Da die Ordnerstruktur festen Konventionen folgt und darüber hinaus exakt der Ordnung der Originale im Archiv entspricht, ist nicht davon auszugehen, dass sich diese Struktur ändern wird. Es ist sogar umgekehrt denkbar, aus dem Zusammenhang gerissene Images wieder in die Ordnerstruktur einzustellen, weil am Imagenamen die vom Archiv aufgestellte und dokumentierte Baumstruktur nach logischen Regeln abzulesen ist. Letztlich bleibt nur die Domain des Providers, bei dem die gesamten Daten gespeichert werden, unbeständig. Um die jeweilige Domain beständig werden zu lassen, kann diese für die eindeutige Zuordnung aller Digitalisate innerhalb der Darstellung im Archivportal D mit Hilfe der EAG- Datei des entsprechenden Archivs verwaltet werden. 12 Da für andere Funktionen im Archivportal D ohnehin eine EAG-Datei von allen beteiligten Archiven angelegt wird, können auch die Speicherorte der Digitalisate mitgeführt werden. Jedes Archiv behält damit die Hoheit über die eigene Domainverwaltung. Mit der Aktualisierung der eigenen EAG-Datei können interne Datenverschiebungen jederzeit für die Webpräsentation nachvollzogen werden. Dabei wäre sogar eine Differenzierung bis auf einzelne Bestände denkbar. Die von den Archivarinnen und Archivaren vergebenen URLs zu den Digitalisaten sehen in Bezug auf den Teil der Domain immer gleich aus. Mit der URL wird zunächst ein Nameserver 13 mit 12 Zur Zeit haben wir das EAG-Format aus Spanien noch nicht in englischer Fassung vorliegen und können daher nicht einschätzen, ob für die genannten Funktionen bereits Felder definiert sind. Nichtsdestotrotz ist eine zentrale archivbeschreibende Datei der richtige Weg. Sollten noch keine Felder für Domainzuweisungen vorhanden sein, müsste das Bundesarchiv das EAG-Format entsprechend erweitern. 13 Mit Nameserver sind sowohl die Rechner als auch die Programme auf ihnen gemeint, die Anfragen zum Domain-Namensraum beantworten.

Resolver 14 -Funktion angesprochen. Die URL beginnt also mit dem Domainnamen des Resolvers, dem folgt als nächstes die Signatur der Institution, die beim Anlegen der EAG- Datei vergeben wird, anschließend wird der Pfad zur Bilddatei aufgeführt. http://resolver.host.de/institutionssignatur/bestandssignatur/ve-signatur/ve- Signatur_Nummer.jpg Der Resolver stellt eine rekursive Anfrage an einen weiteren, ihm zugeordneten Nameserver. Dieser Nameserver verfügt über ein Programm, das die EAG-Dateien ausliest, die Institutionssignatur durch die korrekte Domain ersetzt und auf diese Weise die URL korrekt auflöst, wobei die Pfadangaben zu der Ordnerstruktur und der Bilddatei bestehen bleiben. http://digitalisate.bundesarchiv.de/bestandssignatur/ve-signatur/ve- Signatur_Nummer.jpg Mit Hilfe der aufgelösten neuen URL holt sich der nennen wir ihn einmal EAG- Nameserver von dem Adressaten die Antwort ab (die Bilddatei des Digitalisates) und gibt diese wieder an den Resolver zurück. Der Resolver wiederum liefert das Bild an den ursprünglich anfragenden Webbrowser zurück. Die aufgelöste URL ist also nicht zu sehen, da der Resolver die Antwort stellvertretend abliefert. So bleibt das oben zuerst genannte URL-Beispiel weiterhin sichtbar, damit Nutzerinnen und Nutzer sich ausschließlich die persistente URL kopieren können. Voraussetzung für das Funktionieren dieses vereinfachten Systems eines PI ist, dass bei einem Umzug der Digitalisierungsdaten von einem Server zum anderen die Ordnerstrukturen beibehalten werden. Allerdings gibt es auch keinen Grund die Struktur zu ändern, weil sie ein exaktes Abbild der Lagerungssituation der originalen Akten im Archiv ist. Für den Fall, dass eine Institution einzelne Bestände bzw. deren Digitalisate auf unterschiedlichen Server speichert, können auch diese in der EAG-Datei abgebildet werden. Da die Bestandsignaturen auch für die Benennung der Ordner verwendet werden, kann der Nameserver die EAG-Datei über die jeweiligen Domains hinaus auch auf der Bestandsebene abfragen. Der Vorteil dieses Systems ist, dass die einzelnen Archive dezentral die Langfristigkeit der URLs garantieren und lediglich der Betrieb des Resolvers und des EAG-Nameservers zentral aufrecht erhalten werden muss. Die Funktion des Resolvers ist lediglich eine feststehende, definierte URL an eine reale, jederzeit aktuelle URL weiterzuleiten und das Ergebnis wieder an den Webbrowser abzuliefern. Diese Lösung wäre sogar geeignet, wie beim URN-System eine 1:n-Beziehung abzubilden, wenn die Archive in ihrer EAG-Datei entsprechende Informationen ablegen würden. Es ist aber in Frage zu stellen, ob dies bei einem Mengenaufkommen von mehreren Millionen Bildern sinnvoll ist. Zusammenfassung Das Konzept beschreibt zunächst die dringende Notwendigkeit des Aufbaus technischer Infrastruktur innerhalb des Archivwesens. Größere Archive sollen dabei als Dienstleister für kleinere Archive fungieren, so dass keine Institution außen vor bleibt und starke, gut ausgelastete Kompetenzzentren die Qualität sichern. Zur technischen Infrastruktur zählen entsprechend große Server und das Know-how über elektronische Langzeitarchivierung. Ist eine leistungsstarke Infrastruktur an mehreren Standorten in Deutschland aufgebaut, kann diese wiederum in einem Grid zusammengefasst werden. Die Rechenzentren können in einem Grid gemeinsam und gegenseitig Rechenleistung, Speicherkapazität und Softwareanwendungen je nach Bedarf und Verfügbarkeit nutzen. Dadurch wird die Leistungsfähigkeit der Archivarbeit gesteigert, wie es andere Grid-Projekte in Deutschland beispielhaft vorführen. Onlinefindbücher werden zukünftig nicht nur in einem einzigen Zusammenhang publiziert werden, sondern in der Regel in verschiedenen Informationsportalen parallel erscheinen. In 14 Resolver sind Software-Module, die Informationen von anderen Nameservern abrufen. Sie fungieren als Schnittstelle zwischen Anwendung (z.b. Webbrowser) und Nameserver.

den Onlinefindbüchern sind je nachdem auch digitalisierte Seiten einzelner Verzeichnungseinheiten eingebunden. Um die Digitalisate aus jeder Anwendung heraus ansprechen zu können, sollten diese auf einem Webserver ohne Zugangsbeschränkung abrufbar sein. Damit wird umgangen, dass jede Portalanwendung alle Digitalisate für sich noch einmal speichern und in der Präsentation neu zuordnen muss. Das spart Verwaltungsund Speicheraufwand. Die Webpublikation über einen Webserver ermöglicht außerdem die direkte Verlinkung der Digitalisate durch Nutzerinnen und Nutzer in eigenen Webpublikationen. Das Konzept der Webpublikation von Digitalisaten auf öffentlichen Webservern setzt jedoch ein Resolvingsystem mittels Persistent Identifier (PI) voraus, um die langfristige Zugänglichkeit zum einzelnen Image zu sichern. Auch wenn bereits PI-Systeme existieren, die diese Sicherheit herstellen, so bieten sie nicht den Service an einfacher Handhabung und Kostenneutralität wie er für das Archivportal D sinnvoll ist. Darum wird eine vereinfachte Variante eines PI vorgestellt, die es ermöglicht, dass jedes Archiv selbst die Domains der eigenen Digitalisate verwaltet. Dies geschieht über die auch in anderen Funktionszusammenhängen des Archivportals D eingesetzte EAG-Datei. Das EAG-Format beschreibt die jeweilige Institution und Server-Domain, auf denen die archiveigenen Digitalisate gespeichert sind. Die Lokalisierung der Digitalisate kann bis auf die Bestandsebene heruntergebrochen werden, so dass auch einzelne Bestände bzw. deren Digitalisate auf unterschiedlichen Servern liegen können. Voraussetzung für das Gelingen dieses Konzeptes ist, dass die Ordnerstruktur der Digitalisate nach einem einheitlichen Schema mit der Verwendung von Bestands- und VE-Signaturen aufgebaut ist und nicht wieder verändert wird. Der Vorteil dieser gegenüber anderen PI-Systemen einfacheren Lösung sind die dezentrale Verwaltung und die geringen Kosten.