Langzeitarchivierung aus Sicht einer Regionalbibliothek der rheinland-pfälzische Archivserver edoweb Stand und Perspektive der Archivierung landeskundlicher Netzpublikationen Lars Jendral Workshop des Projekts BABS am 11. Mai 2007 Bayerische Staatsbibliothek München
Was ist das Landesbibliothekszentrum? Im Landesbibliothekszentrum Rheinland-Pfalz (LBZ) sind die die Bibliotheca Bipontina in in Zweibrücken, die die Pfälzische Landesbibliothek in in Speyer (PLB), die die Rheinische Landesbibliothek in in Koblenz (RLB), die die Büchereistelle Koblenz und und die die Büchereistelle Neustadt vereint.
Aufgabe des LBZ...... Sammlung, Erschliessung, Bewahrung und Vermittlung der Rheinland-Pfalz-Literatur (einschl. Digitalisierung) und Erstellung der Landesbibliographie, Pflichtexemplarbibliothek......
Was ist das hbz? Das Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen ist eine zentrale Dienstleistungs- und Entwicklungseinrichtung für Bibliotheken innerhalb und außerhalb von Nordrhein- Westfalen. http://www.hbz-nrw.de/
und edoweb Technischer Partner beim Aufbau von edoweb Im Rahmen der Integrationsstrategie des hbz auch Veränderungen an Struktur des edoweb Medienserver unter Digitool 3.0 (Exlibris) Kataloganreicherung Serverhosting für elektronische Objekte Langzeitarchivierung für elektr. Objekte u. Websites
Vorgeschichte edoweb Immer mehr Pflichtexemplare erscheinen in elektronischer Form Landeskundlich relevante Websites verlangen dauerhafte Speicherung AG Regionalbibliotheken in D forciert Ausweitung des Sammelauftrages seit Juni 2002
Ursprungsideen Automatisches Sammeln und Regathern von landeskundlichen Websites Einfache Katalogisierungsstandards Systematische Suchmöglichkeit (Vorbild Pandora) nach Hauptgruppen der DDC und der Rheinland-Pfälzischen Bibliographie (RPB)
edoweb-historie August 2002: Vereinbarung zwischen RLB und hbz zum Aufbau eines Archivservers für elektronische Pflichtexemplare und landeskundliche Websites Januar 2003: Beginn des Projektbetriebes auf Basis des Dokumentenverwaltungssystems OPUS Dezember 2003: Freischaltung für die Öffentlichkeit als edoweb
Ergebnisse mit OPUS Aufbau von 2 Archivservern für elektronische Dokumente und Websites Gathern von Websites mit Httrack Suche in bibliographischen Metadaten und systematisches Browsen Ungeklärt: Langzeitarchivierung Verzeichnungsmöglichkeiten für nichtmonographische Netzpublikationen / Zeitschnitte waren 2004 noch nicht möglich
OPUS-Ablösung Frühjahr 2005: Entscheidung des hbz, OPUS durch Digitool abzulösen, da im hbz Vereinheitlichung der hausinternen Dokumentenverwaltungssysteme anstand Aufbau des hbz-medienservers unter Digitool seit Herbst 2005 erste Testmigration der edoweb-daten im März 2006 Datenmigration Anfang Sept. 2006 eingeschränkter Produktionsbetrieb für LBZ ab Herbst 2006
Neuerungen durch Digitool I Darstellung von elektr. Zeitschriften(heften) und Zeitschnitten von Websites (in Arbeit) Vereinfachte Katalogisierung im Verbundkatalog (versuchsweise mit GKD-Ansetzung) Ende der Insellösung Einbindung in lokalen LBZ-Katalog Einbindung in die Meta-Suche der Digitalen Bibliothek (u.a. gemeinsam mit der RPB)
Neuerungen durch Digitool II Ausrichtung auf Langzeitarchivierung im Kontext Medienserver hbz Angebot nach Sachgruppen angedacht
Datenaustausch AG mit der Deutsche Nationalbibliothek, Landesbibliotheken in Baden-Württemberg, hbz, BibliotheksServiceZentrum Baden- Württemberg PREMIS (Preservation Metadata Implementation Strategies) Universelles Objektformat (UOF) OAI
Rechtliche Situation (allgemein) Sammeln von Medienwerken in nichtkörperlicher Form Bundesrecht: geregelt durch Gesetz über die Deutsche Nationalbibliothek vom Juni 2006 Landesrecht: Baden-Württemberg hat seit Februar gesetzliche Grundlage, Sachsen-Anhalt und Berlin arbeiten auf bisheriger Grundlage
Rechtliche Situation (Rheinland-Pfalz) Schriftliche Genehmigung muss bei Rechteinhabern eingeholt werden Seit 2004: per Verordnung ist edoweb offizieller Archivserver für elektronische Amtsdruckschriften Ausweitung des gesetzlichen Sammelauftrages auf elektronische Medien seit 2006 vom Ministerium positiv beschieden
Projekt AULA I Automatisiertes Extrahieren von Informationen landeskundlich relevanter Objekte Ziel 1: automatisches Erkennen und Einsammeln von landeskundlich relevanten Websites Ziel 2: Aufbau einer Special Interest Suchmaschine
Projekt AULA II Tests mit Suchmaschine Nutch (open source), später mit FAST Data Search (kommerziell) Suche mit verschiedenen Parametern Ortsliste des Statistischen Landesamtes Postleitzahlen Schlagwörter und Titelstichwörter (Festschrift, Jubiläum...) aus Rheinland-Pfälzischer Bibliographie
Projekt AULA III Nur Suche mit einzelnen Kriterien, keine kombinierte Suche Ergebnisse schon brauchbar, Präzision ausbaubar Beendigung der 1. Testphase bis zur Schaffung der rechtlichen Grundlage zum automatisierten Einsammeln der Websites
Ausblick Nach erfolgreichem Einstieg in Echtsystem: Ausweitung auf PLB Speyer; Kooperation mit Landeshauptarchiv Rheinland-Pfalz geplant Automatisches Regathern von landeskundlichen Websites und Erstellung von Zeitschnitten steht vor Realisierung
Anregungen und Fragen? Lars Jendral jendral@lbz-rlp.de http://www.lbz-rlp.de/cms/rheinische-landesbibliothek/