Herausforderungen für die Archive in der Informationsgesellschaft 6. Potsdamer I-Science Tag Zukunft der Informationsinfrastruktur an der Fachhochschule Potsdam am 17. März 2015 Gerald Maier 1
Inhalt Einführung Aufgaben und Funktion der öffentlichen Archive Archivierung genuin digitaler Unterlagen Digitalisierung von Archivgut Fazit Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 2
Einführung Aufgaben und Funktion der Archive Öffentliche Archive sind Bewahrer des Gedächtnisses der Gesellschaft, als Informationsdienstleister Informationsinfrastruktureinrichtungen und damit auch der Teil der Wissenschaft, landeskundliche Kompetenzzentren und wirken damit aktiv an der kulturellen Bildung mit, als Teil der Verwaltung in die Strukturen des Verwaltungshandelns und in den Life cycle des Verwaltungsschriftguts eingebunden Öffentliche Archive haben als rechtlichen Rahmen Archivgesetze. Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 3
Was ist Archivierung? Archive arbeiten nach dem Provenienzprinzip, d.h. Herkunfts- und Zuständigkeitsprinzip Öffentlich-rechtliche Archive: v.a. Landes-/Staatsarchive, Kommunalarchive, Universitätsarchive oder kirchliche Archive. Archivierungsauftrag ist durch Archivgesetze und Verordnungen geregelt, z.b. LArchG Baden-Württemberg von 1987 (1990, 2004): Das Landesarchiv verwahrt, erhält und erschließt als Archivgut alle Unterlagen, die von den Behörden, Gerichten und sonstigen Stellen des Landes, deren Funktionsvorgängern oder von Rechtsvorgängern des Landes übernommen worden sind und die bleibenden Wert haben (LArchG BW, 2,1) Unterlagen im Sinne des Gesetzes sind neben Schriftstücken auch Film- und Tonmaterialien sowie sonstige Informationsträger und maschinenlesbar auf diesen gespeicherte Informationen und Programme. (LArchG BW 2,2) Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 4
Informationsgesellschaft und Archive Digitale Informationen sind zunehmend ein wichtiger Bestandteil der Überlieferung in Archiven. Die Menge und die Heterogenität der Unterlagen, die originär in digitaler Form vorliegen, wächst beständig an. Unterschieden werden muss dabei zwischen: 1. born digital material wie elektronische Akten, Emails oder Fachinformationssysteme ( papierloses Büro ) und 2. (retro-)digitalisierten Unterlagen, d.h. Digitalisierung von ursprünglich analog vorliegenden Daten, um den Benutzerzugriff über Datennetze zu vereinfachen. Ein rasanter technologischer Wandel führt zum schnellen Veralten von Informationssystemen, Datenträgern und Datenformaten. Dies bewirkt eine akute Gefährdung der langfristigen Nutzbarkeit digitaler Objekte. Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 5
Archivierung genuin digitaler Unterlagen Ausgangslage und strategische Ziele Rahmenbedingungen und Anforderungen Provenienz und Formen von digitalem Archivgut Workflow für die Archivierung digitaler Unterlagen Bewertung und Übernahme ( Ingest ) Langzeitsicherung bzw. Bestandserhaltung ( Preservation Planning ) Bereitstellung für die Nutzung ( Access ) Ausblick Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 6
Was ist digitale Archivierung? Digitale (Langzeit-)Archivierung : steht für die unveränderbare, langzeitige bzw. dauerhafte Aufbewahrung digitaler Information Der Begriff Langzeitarchivierung ist im Prinzip ein Pleonasmus, da Archivierung den Langzeitaspekt bereits impliziert, er hilft aber den Unterschied zur Kurzzeitarchivierung bzw. zum Backup hervorzuheben. Archivierung im Sinne der Archivgesetze und der Verwaltungsarchive ist an sich schon eine Langzeitarchivierung : Archivierung= dauerhafte Aufbewahrung Unterscheidung Archivierung : Im Wirtschaftsleben: Aufbewahrung der Information und Zugriff für 10 bis 30 Jahre (u.a. Steuerrecht, Sozialrecht) Im öffentlich-rechtlichen Archiv: dauerhafte Aufbewahrung und dauerhafter Zugriff Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 7
Notwendige Rahmenbedingungen und Anforderungen für die Archivierung digitaler Unterlagen Für die Archivierung digitaler Objekte und Dokumente gibt es keine zum jetzigen Zeitpunkt endgültige und dauerhafte Lösung, die für alle Situationen und Objekt-/Dokumentgattungen geeignet ist. Wesentliche Erfolgsfaktoren für eine dauerhafte Langzeitsicherung digitaler Unterlagen sind die Schaffung der organisatorischen, rechtlichen und wirtschaftlichen Rahmenbedingungen und die Schaffung der technischen Rahmenbedingungen, d.h. Auswahl geeigneter technischer Erhaltungsmethoden bzw. -strategien sowie Aufbau eines Workflows für die Langzeitsicherung. Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 8
Organisatorische, rechtliche und wirtschaftliche Rahmenbedingungen Integration der Langzeitsicherung digitaler Information in den Arbeitsablauf der jeweiligen Institution als Daueraufgabe geeignete rechtliche Rahmenbedingungen (z.b. Weiterentwicklung der Archivgesetze) verlässliche Ressourcenplanung, insbesondere im Hinblick auf anstehende Migrationszyklen Fachpersonal mit unterschiedlichen Qualifikationen sachgerechte Infrastruktur, evtl. unter Anwendung eines Outsourcings institutionelle Arbeitsteilung, Aufbau von spartenspezifischen und/oder spartenübergreifenden Kooperationen auf nationaler und internationaler Ebene Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 9
Auswahl einer geeigneten technischen Erhaltungsstrategie Migration Bitstream Preservation, d.h. Sicherung der Daten auf der physischen Ebene Datenträgermigration, d.h. Kopieren auf neue Speichermedien Formatmigration, d.h. Umwandung in neue, aktuelle Dateiformate Emulation Das Umfeld wird an die digitalen Objekte angepasst Das digitale Objekt bleibt dabei unverändert Konversion/Medienwechsel Analogisierung von digitalen Dokumenten, z.b. Ausbelichtung auf (Farb-)Mikrofilm mit der Möglichkeit der Redigitalisierung Hardware/Technical Preservation ( Computermuseum ) Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 10
Technische Rahmenbedingungen und Anforderungen an die Infrastruktur Standardisierung im Umfeld der digitalen Archivierung. Kriterien dafür sind: weite Verbreitung, offene Spezifikation/Norm spezielle Entwicklung für die Langzeitsicherung Metadaten-Standards (z.b. PREMIS, METS, EAD) Persistente Identifier für Access (z.b. URN, PURL, DOI) Dateiformate (v.a. offene Formate) Hardware: Speichertechnologien (z.b. Storage Area Network), Servertechnologie mit Virtualisierung Software: Archivsysteme/Repositories/ Digitale Magazine in Form von Storage-Manager -Anwendungen, Emulatoren Import-/Export-Schnittstellen, Application Programming Interfaces (APIs) (z.b. SOAP-Schnittstellen) Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 11
Provenienz und Formen von digitalem Archivgut Digitales Archivgut hat normalerweise dieselbe Provenienz, also Herkunft, wie analoges Archivgut. Folgende Szenarien kann man sich z.b. vorstellen: Eine Papierregistratur wird durch eine elektronische Registratur (ECMS, DMS) ersetzt ( elektronische Akte ). Eine Papierregistratur wird durch Fachinformationssysteme auf Datenbankbasis ergänzt (hybride Aktenführung). Beispiele für digitales Archivgut im Landesarchiv Baden-Württemberg: Emails, Volkszählungsstatistik, Kriminalstatistik, elektronisches Liegenschaftskataster, elektronisches Grundbuch/ elektronische Grundakten, elektronische Personalverwaltung, Umweltinformationssysteme, Behörden-Websites Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 12
Workflow für die Archivierung digitaler Unterlagen 1. Behördenberatung und Maßnahmen im Vorfeld der Archivierung 2. Auswahl der archivwürdigen Unterlagen bzw. archivische Bewertung digitaler Unterlagen 3. Übernahme/Export aus laufenden Systemen 4. Aufbereitung, Erschließung und Speicherung ( Ingest ) 5. Bestandserhaltung ( Preservation Management und Preservation Planning ) 6. Bereitstellung für die Nutzung ( Access ) Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 13
Übernahme aus laufenden Systemen Entwicklung von Exportmethoden und Exportwerkzeugen Mitwirkung bei der Konzeption und Implementierung von Exportschnittstellen unter Berücksichtigung von Standards Berücksichtigung von rechtlichen Bedingungen für einen Export (v.a. Datenschutzrecht vs. Archivrecht) DIMAG-IngestList, Landesarchiv Baden-Württemberg http://sourceforge.net/projects/ingestlist/ Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 14
Digitale Bestandserhaltung ( Preservation Management/Planning ) Organisatorische und technische Maßnahmen zur Aufrechterhaltung der Persistenz eines digitalen Magazins Überwachung der Datenintegrität (z.b. über Hashwert-Prüfungen) Überwachung, Planung und Durchführung notwendiger Migrationen (d.h. Refreshing, Formatmigration, Datenträgermigration) G-DIMAG, Landesarchiv Baden-Württemberg Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 15
Bereitstellung für die Nutzung Access in Form von sog. DIPs über spezielle Nutzungsumgebungen innerhalb des Informationssystems Für komplexe dynamische Objekte, wie beispielsweise Fachinformationssysteme oder Forschungsdaten kann die Nutzung über eine an das digitale Magazin angebundene Emulationsumgebung ( Emulation as a Service ) erfolgen, wie sie z.b. im bwfla- Projekt entwickelt wurde. LABW DIMAG (1) DO (2) SID, URL (3) URL (4) Save XML as file (Metadaten) bwfla-ingest Workflow bwfla-ingest (Webservice) Webserver bwfla-ingest-webseite bwfla-projekt (http://bw-fla.uni-freiburg.de): Access aus DIMAG des Landesarchivs Baden-Württemberg über bwfla-emulations- Service Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 16
Digitale Archivierung Ausblick Die Archivierung digitaler Unterlagen wird bereits aktiv betrieben und muss zusätzlich zu den bereits bestehenden traditionellen Aufgaben von den Archiven geleistet werden. Sie erfordert zusätzliche permanente Ressourcen, Kooperationen, spezielles, arbeitsteiliges Know-how, unterschiedliche Qualifikationen und eine stetige Weiterentwicklung des archivarischen Berufsbildes. Geeignete technische Erhaltungsstrategien wie Migration, Emulation oder Konversion müssen weiter evaluiert und auch parallel eingesetzt werden. Für die Bereitstellung archivrechtlich gesperrter digitaler Archivalien müssen geeignete organisatorische und technische Lösungen gefunden werden, z.b. Intranet- Nutzung im Lesesaal oder virtueller, digitaler Lesesaal im Web. Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 17
Digitalisierung von Archivgut Ziele und Strategie Voraussetzungen und Rahmenbedingungen Der Digitalisierungsworkflow für die Online- Präsentation Präsentation in archivischen Online-Informationssystemen und Portalen Weiterentwicklung der archivischen Erschließung Virtueller, digitaler Lesesaal Perspektiven für die Langzeitsicherung von Digitalisaten Ausblick Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 18
Ziele der Digitalisierung von Archivgut Die Digitalisierung von Archivgut erfordert einen hohen Ressourceneinsatz und tangiert verschiedene archivische Fachaufgaben wie die Erschließung und Bereitstellung für die Nutzung, aber auch den Bereich der Bestandserhaltung. Das Hauptziel der Digitalisierung von Archivgut ist, die Online-Nutzung der faksimilierten Originale im Kontext der Erschließung zu ermöglichen ( virtueller, digitaler Lesesaal ). Erreicht wird dieses durch den Nachweis in institutionseigenen, überregionalen und auch spartenübergreifenden Websites, Portalen und Online-Informationssystemen Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 19
Entwicklung von Digitalisierungsstrategien Institutionelle Digitalisierungsstrategien: Beispiel: Landesarchiv Baden-Württemberg von 2007 Festschreibung strategischer Ziele und Aktionsfelder Umsetzung der Digitalisierungsstrategie erfolgt mittels eines internen Aktionsplans, der ständig fortgeschrieben wird und mit einer Liste der zu digitalisierenden Bestände Seit 2012: eigene Koordinierungsstelle für die Digitalisierung von Archivgut Übergreifende Digitalisierungsstrategien: Beispiel: Drittmittelförderung der Deutschen Forschungsgemeinschaft: DFG-Pilotprojekt Digitalisierung von archivalischen Quellen (Mitte 2013 Mitte 2015) http://www.archivschule.de/de/forschung/digitalisierung/ Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 20
Formen der Digitalisierung im Archiv Digitalisierung oder Retrokonversion von Papierfindmitteln als Voraussetzung für digitale Online-Findmittel, d.h. Volltextdigitalisierung von Erschließungsinformationen Image-Digitalisierung von Archivgut für die Online-Präsentation innerhalb des Erschließungskontexts im Internet und Intranet ( virtueller, digitaler Lesesaal ) und ggf. Download und Export in kollaborative Plattformen der Digital Humanities über APIs für Nutzerkopien im Rahmen der Reproduktionen- Dienstleistung als Ausgangsform für die Mikrofilmerstellung durch Ausbelichtung Volltextdigitalisierung von archivischen Quellen mit der Möglichkeit der Volltextsuche (z.b. wissenschaftliche Edition) Digitalisierung von Archivgut zur Substitution der Originale (z.b. Digitalisierung von Tonbändern) Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 21
Digitalisierung im Archiv Fotowerkstatt im Landesarchiv Baden-Württemberg, Abteilung Hauptstaatsarchiv Stuttgart Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 22
Rahmenbedingungen für die Digitalisierung von Archivgut Finanzierung: Drittmittel, v.a. DFG, Kultur(gut)stiftungen der Länder, EU, Sondermittel für Infrastrukturförderung in Forschung und Lehre durch Bund und Länder, private Stiftungen (z.b. Volkswagenstiftung) Reguläre Haushaltsmittel der digitalisierenden Einrichtungen fachliche und technische Rahmenbedingungen: Standards und Regelwerke, v.a. DFG-Praxisregeln Digitalisierung oder GND-Normdaten für Erschließung Integration von Software-Werkzeugen (Autorensysteme, Content-Management-Systeme) für den Digitalisierungs-Workflow und die Bildverwaltung in den archivischen Informationssystemen Aufbau sogenannter Reproduktionenverwaltungen, d.h. Repositorien für die (Langzeit-)Sicherung, Verwaltung und Nachnutzung von (Master-)Digitalisaten im Rahmen einer Speicherinfrastruktur Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 23
Der Digitalisierungsworkflow für die Online-Präsentation Arbeitsbereiche: Auswahl der geeigneten Objekte oder Bestände Objekt-Digitalisierung, z.b. Image-Digitalisierung Bildaufbereitung und Erstellung der Online- Präsentation durch Verbindung der digitalen Objekte mit Erschließungsinformationen Speicherung, Langzeitsicherung und Bildverwaltung Für jeden der verschiedenen Arbeitsbereiche müssen gegebenenfalls verschiedene Prozessschritte berücksichtigt und abgearbeitet werden. Dabei sind einzelne Schritte auch über verschiedene Arbeitsbereiche hinweg miteinander verzahnt. Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 24
Content Management Systeme mit Viewer oder Präsentationsmodule für digitalisiertes Archivgut Weiterentwicklung von archivischen Content- Management-Systemen/ Präsentationsmodulen, u.a. Bestellfunktion für Digitalisate Weiterentwicklung des DFG-Viewers für archivische Bedürfnisse und Bereitstellung als Service im Rahmen der Deutschen Digitalen Bibliothek und des Archivportals-D Bild-CMS des Landesarchivs Baden-Württemberg Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 25
Präsentation in archivischen Online- Informationssystemen und Portalen institutionelle archivische Online- Informationssysteme, z.b. Online-Findmittelsystem des Landesarchivs Baden- Württemberg (http://www.landesarchivbw.de/web/46734) übergreifende archivische Portale, v.a. Archivportal-D (https://www.archivportal-d.de) Europäisches Archivportal (http://www.archivesportaleurope.net) spartenübergreifende Portale, z.b. DDB Deutsche Digitale Bibliothek (https://www.deutsche-digitale-bibliothek.de) LEO-BW Landeskundliches Informationssystem Baden-Württemberg (http://www.leo-bw.de) Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 26
Portallandschaft für Archive Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 27
Weiterentwicklung der archivischen Erschließung im Rahmen von Informationssystemen und Portalen Weiterentwicklung und Verwendung von EAD(DDB) als Austausch- und Lieferformat, Weitergabe über standardisierte Schnittstellen Erschließung mit Normdaten zur Generierung von Linked Data im Kontext des Semantic Web Einbeziehung von User Generated Content über kollaborative Erschließung in Form von Crowdsourcing Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 28
Normdaten als Bindeglieder des Semantic Web Ermöglicht dem Nutzer eine institutionen- und spartenübergreifende Recherche in semantischen Zusammenhängen, d.h. z.b. Archivalien, Handschriften, Bücher, Sammlungsobjekte zum selben Ort und/oder derselben Person Erschließung mit Normdaten, d.h. Verwendung der Gemeinsamen Normdatei (GND) zur eindeutigen und maschinenlesbaren Identifikation von Personen/Persönlichkeiten, im Bereich der Geografie etc. portalübergreifende Verlinkung über BEACON-Dateien Möglichkeiten der (teil-)automatisierten Anreicherung von Erschließungsinformationen mit Normdaten Beispiele für Portale mit Normdaten unterstützter Suche: DDB, LEO-BW, Deutsche Biographie Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 29
Vernetzung von Datenbeständen im Semantic Web Linking Open Data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/ Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 30
Kollaborative Erschließung in Form von Crowdsourcing Herausforderungen sind: Ermittlung geeigneter Materialien, z.b. Fotobestände Definition und Motivation einer Crowd (bestimmte Gruppe oder alle?, warum mitmachen?) Abgrenzung zwischen fachlicher Erschließung und User Generated Content Implementierung von Crowdsourcing-Funktionalitäten oder Importschnittstellen für die Integration der Crowd - Daten in die archivischen Fachinformationssysteme Beispiel: Projekt des Landesarchivs Baden-Württemberg und des Vereins für Computergenealogie zur elektronischen Erfassung der badenwürttembergischen Kriegsgräberlisten (http://www.landesarchiv-bw.de/web/56361) Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 31
Virtueller, digitaler Lesesaal Bereitstellung von Erschließungsinformationen in Form der CC0-Dedication und von Digitalisaten in Form von CC-BY-Lizenzen (Open Access-Strategie): Nutzung im Internet über Präsentationsmodule und Viewer ohne Authentifizierung Download und kostenfreie Nachnutzung ist möglich. Nutzung von nach Archivrecht gesperrten Erschließungsinformationen und digitalisiertem Archivgut bzw. Nutzung von urheberrechtlich geschütztem Archivgut: Nutzung im Intranet (Lesesaal) oder Internet über Viewer mit gesicherter Verbindung und Authentifizierung Im Normalfall ist kein Download und keine Nachnutzung bzw. Weitergabe möglich. Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 32
Langzeitsicherung von Digitalisaten Werden Retrodigitalisate genauso wie genuin digitales Archivgut behandelt? Aufbau einer Reproduktionenverwaltung als Teil eines archivischen Informationssystems Unterscheidung von Master- und Präsentationsformen Ablage der Digitalisate im Filesystem eines Storage Area Networks, z.b. Large Scale Data Facility des KIT Karlsruhe exaktes und eindeutiges System zur Kenennung und Kennzeichnung (IDs) der Digitalisate Speicher-Workflow mit breitbandiger und sicherer Netzanbindung interne Recherche-Instrumente wie z.b. Bild-Explorer, Bild-Suche Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 33
Digitalisierung von Archivgut Ausblick Weiterentwicklung der Strategien und Definition von Kriterien für die Auswahl des vordringlich zu digitalisierenden Archivguts (v.a. Forschungsnachfrage, kulturpolitische Priorisierungen, Einzelbedarf on Demand oder Aspekte der Bestandserhaltung) Einbeziehung der nutzungs- bzw. urheberrechtlich gesperrten Materialien des 20. Jahrhunderts Weiterentwicklung, Evaluierung und Implementierung neuer innovativer Methoden, Standards und Technologien wie Semantic Web, Crowdsourcing und geschützter virtueller, digitaler Lesesaal Verankerung der benötigten Finanzmittel für Bestandserhaltung und Digitalisierung in den Haushalten der Informationsinfrastruktur-Einrichtungen. Dabei sind Haushaltsmittel, Drittmittel und ggf. Private Public Partnerships in ein ausgewogenes Verhältnis zu setzen. Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 34
Fazit Mit der Archivierung von genuin digitalen Unterlagen sowie mit der (retrospektiven) Digitalisierung von konventionellem Archivgut leisten Archive als Informationsdienstleister einen wichtigen Beitrag für die wissenschaftliche Forschung und hier insbesondere für die sog. Digital Humanities. Die großen Herausforderungen sind neben dem Mengenproblem die Entwicklung von sachgerechten Formen der Bereitstellung für die Nutzung: in rechtlicher Sicht (v.a. Weiterentwicklung des Archivund Urheberrechts für die Online-Nutzung), in fachlicher Sicht (v.a. Vernetzung der Erschließung mit anderen Sparten über Normdaten) und in technischer Sicht (v.a. virtueller, digitaler Lesesaal, Digitale Magazine und Reproduktionenverwaltungen ) Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 35
Vielen Dank! Prof. Dr. Gerald Maier Landesarchiv Baden-Württemberg Eugenstraße 7, 70182 Stuttgart Tel.: +49 711 212-4279 Fax: +49 711 212-4283 Email: gerald.maier@la-bw.de Website: www.landesarchiv-bw.de Herausforderungen für die Archive in der Informationsgesellschaft G. Maier 36