Empfehlungen zum Aufbau von OAI kompatiblen Dokumentenservern und deren Integration in die Digitale Bibliothek



Ähnliche Dokumente
Dokumentenserver: Praxisfragen

Fragebogen. zur Erschließung und Sicherung von Online-Dokumenten. Auswahl von elektronischen Publikationen

Windows 10 - Probleme

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Mobile Intranet in Unternehmen

Informationen zum neuen Studmail häufige Fragen

Nicht kopieren. Der neue Report von: Stefan Ploberger. 1. Ausgabe 2003

Speicher in der Cloud

HANDBUCH PHOENIX II - DOKUMENTENVERWALTUNG

Nutzung von GiS BasePac 8 im Netzwerk

[Customer Service by KCS.net] KEEPING CUSTOMERS SUCCESSFUL

mobilepoi 0.91 Demo Version Anleitung Das Software Studio Christian Efinger Erstellt am 21. Oktober 2005

Neue Medien in der Erwachsenenbildung

Terminabgleich mit Mobiltelefonen

8. Tübinger Symposium Handschriften, Alte Drucke. VD16/17 Massendigitalisierung Neue Entwicklungen. 8. Tübinger Symposium Handschriften, Alte Drucke

Ist Excel das richtige Tool für FMEA? Steve Murphy, Marc Schaeffers

Advoware mit VPN Zugriff lokaler Server / PC auf externe Datenbank

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Thematische Abfrage mit Computerlinguistik

Synchronisations- Assistent

ONLINE-AKADEMIE. "Diplomierter NLP Anwender für Schule und Unterricht" Ziele

Primzahlen und RSA-Verschlüsselung

Mehr Transparenz für optimalen Durchblick. Mit dem TÜV Rheinland Prüfzeichen.

Anleitung über den Umgang mit Schildern

URN Workflow-Unterstützung mit OPUS. Silke Schomburg /Anette Seiler Hochschulbibliothekszentrum des Landes NRW (HBZ)

Open Archives Initiative - Protocol for Metadata Harvesting (OAI-PMH)

Anleitung zum Herunterladen von DIN-Vorschriften außerhalb des internen Hochschulnetzes

Fehler und Probleme bei Auswahl und Installation eines Dokumentenmanagement Systems

Installationshinweise für OpenOffice Portable auf einem Wechseldatenträger Stand: 27. März 2003 LS Stuttgart, Kaufmännische ZPG

MORE Profile. Pass- und Lizenzverwaltungssystem. Stand: MORE Projects GmbH

Insiderwissen Hintergrund

Matrix42. Use Case - Sicherung und Rücksicherung persönlicher Einstellungen über Personal Backup. Version September

L10N-Manager 3. Netzwerktreffen der Hochschulübersetzer/i nnen Mannheim 10. Mai 2016

Pädagogik. Melanie Schewtschenko. Eingewöhnung und Übergang in die Kinderkrippe. Warum ist die Beteiligung der Eltern so wichtig?

Verbünde als Kompetenzzentren für Bibliotheken

Hilfedatei der Oden$-Börse Stand Juni 2014

Begriff 1 Begriff 2 Datenbank 1

Verwenden von OnlineUebungen.ch nichts einfacher als das!

Was leistet ein Content Management System?

Internationales Altkatholisches Laienforum

Kurzanleitung fu r Clubbeauftragte zur Pflege der Mitgliederdaten im Mitgliederbereich

Mehr Interaktion! Aber einfach und schnell!

teamsync Kurzanleitung

Handbuch. NAFI Online-Spezial. Kunden- / Datenverwaltung. 1. Auflage. (Stand: )

Internet online Update (Mozilla Firefox)

Abenteuer e-commerce Erfolgreich mit dem eigenen Onlineshop.

Konzentration auf das. Wesentliche.

2. Psychologische Fragen. Nicht genannt.

ELSTER Daten versenden

Übung - Konfigurieren einer Windows 7-Firewall

Örtliche Angebots- und Teilhabeplanung im Landkreis Weilheim-Schongau

Urheberrecht in der Schule Was Lehrer, Eltern, Schüler, Medienzentren und Schulbehörden vom Urheberrecht wissen sollten

Breitband im ländlichen l

Koordinatenmesstechnik und CAX-Anwendungen in der Produktion

Schulung Marketing Engine Thema : Einrichtung der App

Information zum Prüfungswesen Geprüfte(r) Logistikmeister(in) Handlungsspezifische Qualifikationen

Sichere Anleitung Zertifikate / Schlüssel für Kunden der Sparkasse Germersheim-Kandel. Sichere . der

SAP Benutzerleitfaden zu DocuSign

ALLGEMEINE INFORMATIONEN

Externe Abfrage von für Benutzer der HSA über Mozilla-Thunderbird

mobifleet Beschreibung 1. Terminverwaltung in der Zentrale

DIE ANWENDUNG VON KENNZAHLEN IN DER PRAXIS: WEBMARK SEILBAHNEN IM EINSATZ

Nutzung der Onleihe Schritt für Schritt

Stundenerfassung Version 1.8 Anleitung Arbeiten mit Replikaten

BOKUbox. Zentraler Informatikdienst (ZID/BOKU-IT) Inhaltsverzeichnis

Welches Übersetzungsbüro passt zu mir?

Anleitung für den Elektronischen Lesesaal der Martin-Opitz Bibliothek

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse Lösung 10 Punkte

BEDIENUNG ABADISCOVER

OJS-Leitfaden für Zeitschriftenmanager

1. EINLEITUNG 2. GLOBALE GRUPPEN Globale Gruppen anlegen

Tipps und Tricks zu den Updates

Anleitung. Lesezugriff auf die App CHARLY Termine unter Android Stand:

ecaros2 Installer procar informatik AG 1 Stand: FS 09/2012 Eschenweg Weiterstadt

1 Mathematische Grundlagen

Weiterentwicklung digitaler Bibliothekssysteme zu OpenArchives-Systemen

Bedienungsanleitung: Onlineverifizierung von qualifiziert signierten PDF-Dateien

Die 5 besten Internet-Ressourcen für Ihren Urlaub

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang

Was sind Jahres- und Zielvereinbarungsgespräche?

II. Zum Jugendbegleiter-Programm

Kapitel 4 Die Datenbank Kuchenbestellung Seite 1

Proxy. Krishna Tateneni Übersetzer: Stefan Winter

AutoCAD Dienstprogramm zur Lizenzübertragung

HP Product Content Syndication Steigern Sie Ihre Add-to-Cart Rate in 3 einfachen Schritten

Wege zur Patientensicherheit - Fragebogen zum Lernzielkatalog für Kompetenzen in der Patientensicherheit

Was macht Layer2 eigentlich? Erfahren Sie hier ein wenig mehr über uns.

Bereich METIS (Texte im Internet) Zählmarkenrecherche

Neomentum Coaching. Informationsbroschüre für Studienteilnehmer

Anleitung. Verschieben des alten -Postfachs (z.b. unter Thunderbird) in den neuen Open Xchange-Account

Das Handbuch zu Simond. Peter H. Grasch

White Paper DocCheck Search

ITT AQUAVIEW WEB-Server. Kurzbedienungsanleitung

Geyer & Weinig: Service Level Management in neuer Qualität.

Gemeinsamer Bibliotheksverbund: Übertragung von Datenexporten für den Verbundkatalog Öffentlicher Bibliotheken

Drucken aus der Anwendung

Geld Verdienen im Internet leicht gemacht

Mailbox Ihr Anrufbeantworter im primacom-netz Anleitung. Inhaltsverzeichnis. 1 Mailbox einrichten. 1.1 Ersteinrichtung. 1.

Discovery Service. Evolution oder Revolution?

White Label-Programm (WL)

Transkript:

Empfehlungen zum Aufbau von OAI kompatiblen Dokumentenservern und deren Integration in die Digitale Bibliothek Erarbeitet von der AG Dokumentenserver im Auftrag des Beirats des Hochschulbibliothekszentrums des Landes Nordrhein-Westfalen (beschlossen am 30. Juli 2003)

Inhaltsverzeichnis 1. Einführung...3 2. Aufgabenstellung...3 3. Ausgangslage...3 4. Empfehlungen...6 4.1. HBZ Dienstleistungen...6 4.1.1. Serviceprovider des Verbundes Nordrhein-Westfalen und Rheinland-Pfalz...6 4.1.2. Serviceprovider weltweit...7 4.1.3. Aggregierender Datenprovider...7 4.1.4. Hosting von Dokumentenservern für kleine Institutionen...8 4.1.5. Integration der Daten in die Metasuche der Digibib...8 4.1.6 Fortbildung...8 4.2. Dokumentenserver...9 4.2.1. Die OAI-Schnittstelle...9 4.2.3. Sets...9 4.2.4. Persistent Identifier...10 4.2.5. Langzeitarchivierung...10 4.3 Inhalte...11 4.4. Regionale Aspekte...11 4.5 SSG-Bibliotheken und Pflichtexemplarbibliotheken...12 5. Perspektiven...12 6. Zusammenfassung...12 7. Arbeitsgruppe...13 2

1. Einführung An den Universitäten und Fachhochschulen in Nordrhein-Westfalen und Rheinland-Pfalz entstehen im Rahmen von Forschung, Lehre und Studium vielfältige elektronische Publikationen, die von reinen Textdokumenten bis hin zu komplexen multimedialen interaktiven Veröffentlichungen reichen. Bei den meisten dieser Publikationen handelt es sich häufig um sogenannte graue Literatur, die nicht über kommerzielle Verlage vertrieben wird. Durch den Fortschritt in der Informationstechnologie und den breiten Einsatz gerade in den Hochschulen liegt es nahe, diese Dokumente elektronisch zu verbreiten. Obwohl die Bibliotheken, manchmal in Zusammenarbeit mit den Rechenzentren oder anderen Institutionen, in den vergangenen Jahren Dokumentenserver aufgebaut haben, ist diese Literatur zurzeit gar nicht oder nur sehr unzureichend gemeinsam recherchierbar, obwohl sie in der Regel mit Metadaten erschlossen ist. Dieses Papier will einen Weg aufzeigen, wie die wissenschaftlichen Dokumente der beteiligten Hochschulen automatisiert in einer gemeinsamen Metadatenbank erfasst und damit für die internationale Wissenschaft nachweisbar werden. Die vorgeschlagene Lösung bedient sich der von der Open Archives Initiative (OAI) 1 entwickelten Schnittstelle. 2. Aufgabenstellung Im vorliegenden Papier konzentriert sich die AG Dokumentenserver 2 auf den Einsatz des OAI Protocol for Metadata Harvesting (OAI PMH) der Open Archives Initiative bei den an den Hochschulen der Länder Nordrhein-Westfalen und Rheinland-Pfalz betriebenen Dokumentenservern. Dabei handelt es sich einerseits um Handlungsempfehlungen für das Hochschulbibliothekszentrum (HBZ), die als Grundlage für die Entwicklung von HBZ- Dienstleistungen im OAI-Umfeld (Service- und Datenproviderdienste sowie verwandte Dienstleistungen) dienen sollen und andererseits um Empfehlungen für die Serverbetreiber an den Hochschulen, hinsichtlich der auf lokaler Ebene zu schaffenden grundlegenden Voraussetzungen für den Einsatz von OAI-PMH in der HBZ-Verbundregion. 3. Ausgangslage Ein Jahr nach dem Gründungstreffen der OAI im Oktober 1999 wurde Anfang 2000 das OAI- Protokoll für Metadaten Harvesting in der Version 1.0 veröffentlicht. Diese Version hatte den Charakter einer Experimentier und Entwicklungsversion. Nachdem zahlreiche Datenprovider das Protokoll getestet und in der Praxis erprobt hatten, wurde im Juni 2002 die Version 2.0 des Protokolls veröffentlicht. Weil die Ziele und die Organisationsstruktur von OAI inzwischen in zahlreichen Veröffentlichungen 3 beschrieben worden sind, sei hier nur der erste Satz der Einleitung zur Protokollversion 1.1. zitiert, der die Ziele gut beschreibt. The goal of the Open Archives Initiative Protocol for Metadata Harvesting is to supply and promote an application independent interoperability framework that can be used by a variety of communities who are engaged in publishing content on the Web. 4 Entsprechend lassen sich die Ziele der Open Archive Initiative in den folgenden Punkten zusammenfassen: 3

- Metadatenaustausch, unabhängig von der eingesetzten Dokumentenserversoftware - freier Zugriff auf die Metadaten - internationale Ausrichtung - einfache Technologie, basierend auf einheitlichen Standards - Verbreitung von wissenschaftlichen Inhalten Das Protokoll bietet die Basis für den Metadatenaustausch zwischen den Datenprovidern (Dokumentenservern) und Serviceprovidern, die mit Hilfe dieser Metadaten weitere Dienstleistungen anbieten. Die Vorteile dieses Austauschprotokolls sind die internationale Ausrichtung, die einfache Implementierbarkeit insbesondere auf der Seite der Datenprovider und die Verwendung gängiger Webstandards, wie XML und Dublin Core 5. Diese Vorzüge haben vielerorts zu einer raschen Implementierung des Protokolls schon kurz nach seiner Veröffentlichung geführt. Zum Ende der Versuchphase der Protokollversion 1.1 gab es über 100 registrierte Datenprovider, die zusammen mehr als eine Million Metadatensätze nachwiesen. Die Verteilung der Datenprovider nach der Anzahl ihrer Metadatensätze zeigt die folgende Abbildung (Die Daten wurden mit dem Serviceprovider ARC ermittelt). 45 40 Zahl der Archive 35 30 25 20 15 10 24 40 17 5 0 8 7 5 < 50 50-500 500-1.500 1.500-10.000 > 10.000 > 100.000 Stand: 23.09.02 Anzahl der Metadatensätze Zu den größten Datenprovidern zählen die Archive der NASA, der Library of Congress und die Preprintserver der Physik (arxiv). Seit dem Juni 2002 ist die Protokollversion 2.0 veröffentlicht worden und die bisher registrierten Datenprovider mussten ihre Implementation auf die neue Version anpassen und sich bis Ende des Jahres 2002 neu registrieren. Am 18.11.03 waren 127 Datenprovider bei der OAI registriert, die die Protokollversion 2.0 implementiert hatten, darunter die beiden Universitätsbibliotheken Duisburg und Dortmund mit ihren Dokumentenservern. Neben den registrierten Datenprovidern gibt es auch etliche Dokumentenserver, die die OAI-Schnittstelle schon mit der verwendeten Software mitbringen. Eine Vielzahl der bereits von der OAI-Community entwickelten Lösungen steht als Open Source Software zur Nachnutzung bereit. Die Universität Duisburg konnte beispielsweise die Lösung der Virginia Polytechnic Institute and State University übernehmen, um mit deren System ihre elektronischen Hochschulschriften zu verwalten. Auch die vom HBZ für ihre Hosting-Dienste verwendete Software OPUS hat eine solche OAI-Schnittstelle. Für MILESS 4

wurde sie im Rahmen des MyCore-Projektes entwickelt und wird zur Zeit durch den Serviceprovider der Humboldt Universität getestet. Neben kompletten Lösungen für eine Dokumentenserversoftware gibt es aber auch zahlreiche hilfreiche Tools, die die Implementierung des Protokolls erleichtern. So hat die Universitätsbibliothek Dortmund auf ihrem Dokumentenserver Eldorado, dem die Software Hyperwave zugrunde liegt, mit Hilfe des Perl-Tools XMLFile von Virginia Tech. die OAI-Schnittstelle implementiert. Die vorangestellte Auflistung zeigt, dass ein großer Vorteil dieses Protokolls darin besteht, dass jede Einrichtung die für sich optimale Dokumentenserversoftware auswählen kann, da das Protokoll über Standardschnittstellen implementiert werden kann. Jeder Standort bleibt so in der Wahl seines Dokumentenservers frei. Der Aufbau von Serviceprovidern hat aufgrund der fehlenden Datenprovider nach der Veröffentlichung des Protokolls verzögert eingesetzt. Inzwischen gibt es jedoch eine Reihe bei der OAI-Community registrierte Serviceprovider, die vielversprechende neue Dienstleistungen realisiert haben. So können zum Beispiel bei Citebase Search verschiedene Suchkriterien, unter anderem auch ein Citation Impact, angegeben werden. Bei icite versucht man, einen automatischen Zitierindex für Physikzeitschriften zu entwickeln. Viele dieser Angebote befinden sich noch im Projektstatus, aber sie zeigen schon jetzt neue Entwicklungen auf. Bei den Serviceprovidern kann man zwischen zwei Grundtypen unterscheiden. Auf der einen Seite gibt es diejenigen, die nur eine reine Suchfunktionalität über die Datenprovider anbieten. Auf der anderen Seite gibt es Serviceprovider, die, meist thematisch eingeschränkt, weitergehende Dienstleistungen, wie Personalisierung, Profildienste, eigener Dokumentenbereich etc. anbieten. Zu der ersten Kategorie gehört der älteste und umfassendste Serviceprovider ARC, der von der Old Dominion University entwickelt wurde. ARC sammelt zur Zeit über regelmäßiges Harvesting die Metadaten von gut 100 Archiven ein und weist 1,2 Millionen Metadatensätze nach. Zu dieser Gruppe gehört ebenfalls der Serviceprovider der Humboldt Universität 6 zu Berlin. Zu der zweiten Kategorie gehören die Serviceprovider MyOAI 7 und Torii 8, die als weitergehende Dienstleistungen einen Profildienst, einen persönlichen Bereich mit Annotationen zu gefundenen Dokumenten und einen Alertingservice mit Emailadresse anbieten. Der Serviceprovider Torii hat sich auf Mathematik und Physik spezialisiert. Hier wird eine Verknüpfung zu den Diensten von icite und SLAC-Spires 9 hergestellt, die eine Zitatanalyse ermöglichen und damit eine Art Impactfaktor erstellt. Das OAI-PMH bietet zur Zeit die beste Möglichkeit, den Metadatenaustausch zu gewährleisten und bietet zugleich die Voraussetzung zur Organisation und Implementierung von Mehrwertdiensten. 5

4. Empfehlungen 4.1. HBZ Dienstleistungen 4.1.1. Serviceprovider des Verbundes Nordrhein-Westfalen und Rheinland-Pfalz Bei den verstreut auf lokalen Dokumentenservern von Universitäts- und Fachhochschulbibliotheken vorgehaltenen elektronischen Publikationen handelt es sich um wichtige Teile der wissenschaftlichen Produktion aus Nordrhein-Westfalen und Rheinland-Pfalz. Angesichts der Empfehlungen des Wissenschaftsrats und der Hochschulrektorenkonferenz ist zu erwarten, dass die Bedeutung dieser Dokumentenserver in Zukunft stetig zunehmen wird. Forschungsergebnisse aus den Hochschulen sollen nach den Wünschen der Hochschulrektorenkonferenz zumindest parallel zu ihrer Veröffentlichung in Fachzeitschriften auch auf frei zugänglichen Dokumentenservern der Hochschulen angeboten werden. Voraussetzung für die Verbreitung dieser frei zugänglichen Publikationen ist ihr zentraler Nachweis. In diesem Zusammenhang übernimmt das HBZ eine wichtige Funktion. Die dezentral vorgehaltenen elektronischen Publikationen aus den beteiligten Hochschulen sollten hier zentral nachgewiesen werden und recherchierbar sein. Mit OAI-PMH existiert ein technischer Standard, mit dem ein zentraler Nachweis realisiert werden kann. Das Konzept des OAI-Protokolls unterscheidet Datenprovider und Serviceprovider. Datenprovider sind Dokumentenserver, die das OAI-Protokoll als Schnittstelle installiert haben. Damit erlauben sie das Einsammeln von Metadaten der lokal vorgehaltenen Dokumente in Dublin Core und anderen Metadatenformaten über einfache HTTP-Abfragen. Die Serviceprovider sammeln über diese Schnittstelle die Metadaten verschiedener Datenprovider ein, speichern sie in einer eigenen, zentralen Datenbank und bieten Suchoberflächen für eine zentrale Suche über diese Metadaten und andere Dienstleistungen an. Die Metadaten sind auf Grund der dezentralen Erzeugung in der Regel von hoher Qualität und Aktualität. Insbesondere die sachliche Erschließung ist häufig von sehr hoher Qualität, da sie oft gemeinsam von Autor und Bibliothekaren vorgenommen wird. Die Bibliotheken aus dem Einzugsgebiet des HBZ sollten bei ihren Dokumentenservern das OAI-Protokoll implementieren also im Sinne der OAI-Terminologie zu Datenprovidern werden und das HBZ sollte eine zentrale Datenbank aufbauen, in die die regelmäßig eingesammelten Metadaten eingespielt werden. Für diese Datenbank kann dann eine zentrale Suche über die elektronischen Publikationen aus den beteiligten Bibliotheken angeboten werden. Der im Metadatensatz vorhandene Link zum Dokument führt aus dem Suchergebnis bei der zentralen Suche auf den jeweiligen lokalen Datenprovider zurück. Bereits existierende Serviceprovider, die die OAI-Schnittstelle von Dokumentenservern nutzen, bieten ihre Software z. T. kostenlos zur Nachnutzung bzw. Weiterentwicklung an (z. B. Serviceprovider der HU Berlin oder ARC). Diese Software sollte vom HBZ auf ihre Tauglichkeit für einen Serviceproviderdienst geprüft werden, um ineffektive Doppelprogrammierungen zu vermeiden. Neben einer zentralen Suchmöglichkeit sollte vom HBZ als weitere Dienstleistung auch eine ständig aktualisierte Nutzungsstatistik der Metadaten im Internet zur Verfügung gestellt 6

werden. Eine solche Nutzungsstatistik wird vor allem von den Autoren und Herausgebern der elektronischen Publikationen gewünscht. Langfristig wünschenswert wäre neben einer OAI-Schnittstelle bei allen Dokumentenservern in NRW auch das Angebot einer solchen Schnittstelle bei kommerziellen Volltextangeboten. Im Rahmen der digitalen Bibliothek werden zur Zeit z.b. die elektronischen Zeitschriften von fünf Verlagen konsortial bezogen. Das Angebot der Metadaten von Zeitschriftenaufsätzen dieser Verlage über eine OAI-Schnittstelle würde die Integration dieser Daten in den Serviceproviderdienst des HBZ ermöglichen. In der konsortialen Erwerbungspolitik sollte in Zukunft bei der Prüfung von Verlagsangeboten auch das Angebot einer solchen Schnittstelle in die Bewertung einbezogen werden. Erste Beispiele für die Installation einer OAI-Schnittstelle bei kommerziellen Anbietern existieren bereits. Das Institute of Physics z.b. liefert die Metadaten seiner elektronisch verfügbaren Publikationen an das Projekt Physdoc in Oldenburg, wo diese Daten dann gemeinsam mit frei verfügbaren Volltexten bibliographisch recherchiert werden können. 4.1.2. Serviceprovider weltweit Sobald der zentrale Nachweis der frei verfügbaren elektronischen Publikationen aus nordrhein-westfälischen und rheinland-pfälzischen Bibliotheken realisiert ist, ist zu prüfen, inwieweit das Einsammeln von Metadaten auf weitere Anbieter frei verfügbarer Volltexte ausgeweitet werden sollte. Hierzu könnte die Liste der bei der OAI registrierten Datenprovider im einzelnen ausgewertet werden. Der Serviceprovider ARC an der Old Dominion University (Norfolk, Virginia) z.b. bietet ein Suchinterface über zur Zeit ca. 1,2 Millionen Volltexte an. Die URLs dieser Metadatensätze sind im Vergleich zu anderen Links verhältnismäßig stabil, da sie von den Datenprovidern selbst gepflegt werden. Die Ausweitung des Harvesting auf andere Datenprovider würde die HBZ-Suche aufwerten und durch Volltexte wie z.b. Dokumente aus dem MIT, der Virginia Tech University oder den Preprints des arxiv, der Library of Congress oder des OCLC bereichern können. 4.1.3. Aggregierender Datenprovider Neben einer zentralen Suchmöglichkeit könnten mit den in der zentralen Datenbank beim HBZ gespeicherten Metadaten der lokalen Dokumentenserver aus NRW weitere Funktionen erfüllt werden. Das HBZ sollte für die an nordrhein-westfälischen und rheinland-pfälzischen Bibliotheken produzierten elektronischen Volltexte als aggregierender Datenprovider für andere Serviceprovider dienen. Voraussetzung ist die Implementierung einer OAI-Schnittstelle bei der zentralen Datenbank des HBZ. Ein zentraler Datenprovider für die beteiligten Universitäten und Fachhochschulen böte zwei Vorteile: Durch die große Anzahl der angebotenen Dokumente wäre der Datenprovider HBZ in der Landschaft der internationalen Anbieter frei verfügbarer elektronischer Volltexte bedeutend attraktiver, als es die lokalen Dokumentenserver für sich allein genommen sein können. Die Anzahl der Serviceprovider, die die nordrhein-westfälischen und rheinland-pfälzischen Metadaten anbieten, würde sich dadurch wahrscheinlich erhöhen. Außerdem würden die kleineren lokalen Server entlastet, wenn andere Serviceprovider nicht jeden Dokumentenserver einzeln besuchen müssten, sondern alle Daten zentral beim HBZ abgeholt werden könnten. 7

4.1.4. Hosting von Dokumentenservern für kleine Institutionen In einigen Einrichtungen kann derzeit die Veröffentlichung von elektronischen Inhalten nicht angeboten werden. Entweder fehlen die notwendigen Ressourcen oder aber der Aufwand wird gemessen an der zu erwartenden Zahl elektronischer Veröffentlichungen noch als zu hoch angesehen. Um auch den Angehörigen dieser Einrichtungen die Möglichkeit zur elektronischen Veröffentlichung zu geben, sollte das HBZ einen Dokumentenserver mit OAI-Schnittstelle betreiben, wie es bereits für einige FHBs der Fall ist. Dabei stellt das HBZ den Einrichtungen die entsprechende Datenbank, die geeigneten Tools und den technischen Support zur Verfügung, Ansprechpartner für Interessierte ist aber weiterhin die Einrichtung vor Ort. Damit können den Interessierten vor Ort die entsprechenden Möglichkeiten zur zentral nachgewiesenen elektronischen Veröffentlichung zur Verfügung gestellt werden, was dann im Umkehrschluss auch das Interesse etwa der jeweiligen Angehörigen der Hochschule vor Ort erhöht. 4.1.5. Integration der Daten in die Metasuche der Digibib Die Digibib bietet seit langem die Suche in den Metadaten elektronischer Volltexte aus dem Verbundkatalog Digitale Dokumente an. Die lokal gespeicherten Volltexte auf den Dokumentenservern der beteiligten Hochschulen sind bisher nur zu einem sehr geringen Teil hier nachgewiesen. Mit der Einrichtung eines zentralen Serviceproviders beim HBZ und der Speicherung der über die OAI-Schnittstelle eingesammelten Metadaten in einer zentralen Datenbank wäre die Einbeziehung dieser Daten in die integrierte Suche der Digibib leicht zu realisieren. Die bisher im Verbundkatalog digitaler Dokumente vorhandenen Metadaten könnten ihrerseits über eine OAI-Schnittstelle in die zentrale Datenbank integriert werden. Wenn, wie oben diskutiert, weitere größere Datenbestände internationaler Datenprovider in den Serviceproviderdienst des HBZ aufgenommen würden, könnte sich die Anzahl der elektronischen Metadaten, die über die Digibib recherchierbar sind, schnell vervielfachen. 4.1.6 Fortbildung Dem Bereich Fortbildung kommt im Zusammenhang mit dem automatischen Transfer von Metadaten eine große Bedeutung zu. So erfordert die Einrichtung einer OAI Schnittstelle bei den lokalen Dokumentenservern zunächst sicherlich Hilfestellungen für die beteiligten Mitarbeiter in den Bibliotheken. Metadatenformate, die Definition der Sets und die Vergabe von URNs (Uniform Ressource Name) müssen abgestimmt werden. Da mit einer kontinuierlichen Weiterentwicklung der OAI-Schnittstelle und auch der Metadatenstandards zu rechnen ist, wird es sich bei dem einzurichtenden Fortbildungsangebot des HBZ nicht um eine terminierbare Einrichtung handeln. Vielmehr sollte die Entwicklung der Metadaten- und Schnittstellenstandards beim HBZ verfolgt werden und von hier an die beteiligten Bibliotheken so aktuell wie möglich weitergegeben werden. Möglich wäre in diesem Zusammenhang auch die Einrichtung einer Mailingliste für Dokumentenserverbetreiber. 8

Neben der Fortbildung für die Administratoren von Dokumentenservern sind die Mitarbeiterinnen und Mitarbeiter, die vor Ort die Autoren betreuen, besonders wichtig im Hinblick auf die Langzeitarchivierung der Dokumente. Hier sollten Schulungen in den verschiedenen Textverarbeitungssystemen angeboten werden mit dem Schwerpunkt der weitgehenden automatischen Konvertierung in ein Archivierungs- und Präsentationsformat. 4.2. Dokumentenserver 4.2.1. Die OAI-Schnittstelle Die OAI-Schnittstelle bietet die Möglichkeit, Metadaten unterschiedlicher Server in einer Metadatenbank zu sammeln. Auf diese Datenbank können verschiedene Dienstleistungen aufgesetzt werden, z. B. Suchdienste und Personalisierung. Unabhängig von der technischen Realisierung der lokalen Dokumentenserver wird ein performanter und einheitlicher Zugang zu ursprünglich heterogenen Datenbanken bereitgestellt. Das OAI-PMH ist ein internationaler Standard, der im Vergleich zu Z39.50 sehr einfach zu implementieren ist. Das Protokoll basiert auf sechs einfachen HTTP- Abfragen 10, die sich über eine CGI-Schnittstelle realisieren lassen. Das Protokoll unterstützt die Ausgabe der internen Metadaten in unterschiedlichste Metadatenformate. Mit der Anfrage ListMetadataFormats werden alle Metadatenschemata angefordert, die der Datenprovider anbietet. Um die Interoperabilität zu gewährleisten, muss jeder Datenprovider das Metadatenformat Dublin Core ohne weitere Qualifier unterstützen. Darüber hinaus können zusätzlich auch weitere (umfassendere) Metadatenschemata verwendet werden, deren Ausgabe durch ein entsprechendes XML-Schema verifizierbar sein muss. So bietet die Library of Congress neben Dublin Core auch die Metadaten im MARC- Format, in MARC21 und mods an. 11 Wollte man also eine MAB-Ausgabe der auf den einzelnen Dokumentenservern vorhandenen Metadaten realisieren, müsste ein entsprechendes XML-Schema festgelegt werden. Die Initiatoren des Protokolls haben hier sehr weitsichtig gehandelt, indem sie kein Metadatenschema fest vorgeschrieben haben, sondern neben der Basis des kleinsten gemeinsamen Nenners (weltweit Dublin Core), die Möglichkeiten geschaffen haben, Metadaten für die verschiedensten Zwecke auf der Basis des Protokolls auszutauschen. Dies setzt allerdings voraus, dass die Metadaten auf der Seite der Dokumentenserver sehr flexibel abgefragt und ausgegeben werden können. 4.2.3. Sets Die OAI-Sets (standardisierte Strukturen für die Archivbeschreibung) ermöglichen mit ihrer Differenzierung eine genauere Recherche. In dem Papier Inhaltliche Gestaltung der OAI-Schnittstelle empfiehlt die DINI die Verwendung von Sets auf drei Gebieten: Neben einer inhaltlichen Einteilung gemäß der DNB-Sachgruppen werden Sets für die unterschiedlichen Publikationstypen und die verschiedenen Dokumentformate empfohlen. Die inhaltliche Untergliederung ist bewusst einfach gehalten sie soll nur eine grobe fachliche Ausrichtung darstellen und dient vor allem dem selektiven Abfragen von fachspezifisch ausgerichteten Serviceprovidern. In Verbindung mit den Sach- 9

gruppennummern soll auch die Umstellung auf DDC ohne größere Schwierigkeiten vollzogen werden können. Diesen Empfehlungen stimmen wir zu und schlagen sie den Betreibern der Dokumentenserver des Verbundes vor. 4.2.4. Persistent Identifier Persistent Identifier ermöglichen eine Verlinkung von Dokumenten, so dass sie auch nach einer Umstrukturierung des Dokumentenservers noch gefunden werden können. Die Deutsche Bibliothek hat in einem Projekt die technische Realisierung von URNs als eine Möglichkeit untersucht. Nach dem Projektende bietet die DDB als zentrale Institution die Vergabe von URNs an, und sie stellt einen Resolvingmechanismus zu Verfügung, der von der URN zur URL führt. So ist es bei Adressänderungen möglich, auch nach der Umgestaltung einer Website die einzelnen Dokumente weiterhin zu finden wenn man den Namen oder die URN kennt, und wenn die Adressänderung dem Resolvingdienst (der DDB) mitgeteilt wurde. Es wird empfohlen, dass die Hochschulen, die Regionalbibliotheken und das HBZ URNs auf ihren Dokumentenservern einsetzen, so dass eine weitere Vorgabe zur Langzeitverfügbarkeit der Dokumente gewährleistet ist. Weiterhin könnte auf Basis von URNs eine Dublettenkontrolle realisiert werden. Sollte sich die Vergabe von URNs als praktikabel für alle Dokumente erweisen, könnte auch das HBZ einen Resolvingdienst anbieten, zumal die DDB eine Dezentralisierung ihres Resolvingdienstes anstrebt. 4.2.5. Langzeitarchivierung Fehlende Konzepte zur Langzeitarchivierung werden sich als tickende Zeitbombe herausstellen. Wenn nicht sofort gehandelt wird, ist es möglich, dass viele wertvolle Dokumente in digitaler Form in fünf bis zehn Jahren unbrauchbar geworden sind. Es besteht akuter Handlungsbedarf. Das HBZ sollte sich in Zusammenarbeit mit den Bibliotheken zukünftig zu einem Kompetenzzentrum für Langzeitarchivierung entwickeln. Da die Langzeitarchivierung nicht nur ein Problem ist, welches die Bibliotheken betrifft, sondern auch die Archive und in zunehmenden Maße auch die Museen, ergibt sich hier ein hoher Koordinierungsbedarf. Zur Zeit gibt es für die Langzeitarchivierung, die Strategien der Migration und der Emulation erste Ansätze, allerdings sind diese meist nur theoretischer Natur. Insgesamt ist hier ein großer Entwicklungs- und Forschungsbedarf festzustellen. Diese Probleme sind nur in internationaler Zusammenarbeit zu lösen. Mit Blick auf die Langzeitarchivierung wäre es sinnvoll, wenn neben den bibliographischen Metadaten auch die technischen Metadaten erfasst würden. Aber auch auf diesem Gebiet liegen die Standardisierungen erst in den Anfängen. 10

4.3 Inhalte Ziel eines Serviceproviders ist es, die wissenschaftliche Literatur der angemeldeten Datenprovider zu bündeln, sie leichter recherchierbar zu machen und einem erweiterten Nutzerkreis zur Verfügung zu stellen. Das HBZ wird diese Aufgabe für die elektronischen Veröffentlichungen mit wissenschaftlichen Inhalten aus Nordrhein-Westfalen und Rheinland-Pfalz übernehmen. Zur Qualifizierung der Beiträge wäre ein eigenes Peer Review wie bei Zeitschriftenaufsätzen ein wünschenswertes Mittel, kann aber zum jetzigen Zeitpunkt noch nicht gefordert werden. Stattdessen sollten die Hochschulen Auswahlkriterien anwenden, die angemessene Qualität annehmen lassen, etwa weil sie bereits eine Begutachtung durchlaufen haben, z.b. Sammelwerke, Kongressbände, Forschungsberichte, Aufsätze in E-Zeitschriften oder Reihen, sowie gleichzeitige Veröffentlichung auf Fachbereichsservern, in MathNet u.ä. Dissertationen und Habilitationsschriften sind begutachtet und somit grundsätzlich geeignet zur Veröffentlichung auf einem Datenprovider. Bei Diplom-, Magister- und Seminararbeiten, sollte die Publikation durch ein Mitglied des Lehrkörpers empfohlen worden sein. Problematisch für eine Veröffentlichung auf Hochschulschriftenservern sind Dokumente mit dynamischen Inhalten. Nicht ausgeschlossen sind jedoch Überarbeitungen, für die eine Versionskontrolle mit Zeitmarken möglich ist. 4.4. Regionale Aspekte Digitale Informationen sind ebenso wie gedruckte Informationen selbstverständlicher Teil des kulturellen Erbe eines Landes. Daher werden zunehmend auch digitale Ressourcen von kultureller und regionaler Bedeutung gesammelt, bereitgestellt und archiviert. Die Arbeitsgruppe empfiehlt, die grundlegenden Voraussetzungen dafür zu schaffen, diese wertvollen Inhalte über OAI-Schnittstellen recherchierbar zu machen, um sie in spezielle Serviceproviderangebote integrieren zu können. Neben dem von der DINI vorgeschlagenen DNB-Sachgruppen-Set zur inhaltlichen Beschreibung, sollte ein Set oder Metadatenschema entwickelt werden, das eine Ressource als regionales Dokument beschreibt. Da die Diskussion hierzu gerade erst begonnen hat, wird vorgeschlagen, mit den Setbezeichnungen Rheinland, Westfalen, Ruhrgebiet, Rheinhessen und Pfalz zu beginnen. Mittelfristig sollten Schnittstellen geschaffen werden, um bei Bedarf per OAI-PMH verfügbare Metadaten direkt in die lokalen Kataloge, Regionalbibliographien und Verbundkataloge einbringen zu können. Kleinen regionalen und kulturellen Institutionen könnte von den nächstgelegenen (Pflichtexemplar) Bibliotheken ein Upload Ihrer Dokumente ermöglicht werden, d.h. sowohl ein Hosting der Dokumente als auch der OAI-Metadaten. 11

4.5 SSG-Bibliotheken und Pflichtexemplarbibliotheken Besonderes Interesse verdienen die von den SSG-Bibliotheken und Pflichtexemplarbibliotheken gesammelten Dokumente. Hier sollte es möglichst einheitliche Meldeprozesse oder andere eindeutige Kennzeichnungen geben, damit die Weitermeldung automatisch erfolgen kann. Elektronische Publikationen müssen den für sie thematisch zuständigen SSG-Bibliotheken angezeigt werden können. Es bietet sich dabei an, auf Seiten des Serviceproviders Profildienste, Alerting-Services u.ä. anzubieten, um so ein automatisiertes Verfahren zur Benachrichtigung der entsprechenden SSG-Bibliothek zu schaffen. 5. Perspektiven Sobald der Serviceprovider die Metadaten von den Datenprovidern eingesammelt hat, ist die Funktion des OAI-Protokolls beendet. Die anschließende Weiterverarbeitung und die Entwicklung darauf aufbauender Dienstleistungen ist die Arbeit einer digitalen Bibliothek. Hier bietet sich natürlich eine Integration in die Entwicklung der Digitalen Bibliothek beim HBZ an, wobei nun die lokalen Dokumentenserver mit einbezogen werden müssen. Sollte die Suchfunktionalität der digitalen Bibliothek um eine Volltextkomponente erweitert werden, die zum Beispiel eine Volltextindexierung oder die Extraktion der zitierten Literatur ermöglicht, bieten sich die Dokumentenserver / Datenprovider der beteiligten Partner als Basis für diese Entwicklung an. Neben der Volltextindexierung wären aber auch automatische Klassifizierungen mit einem fachbezogenen Schwerpunkt als Entwicklungsmöglichkeiten zu nennen. Sobald die lokalen Dokumentenserver einen Standard erreicht haben, der sie als ein vertrauenswürdiges Archiv ausweist, könnte man unter Einbeziehung der Fachgesellschaft und anderer Institutionen wie der DINI und der IuK mit der Entwicklung eines kontrollierten Systems des Peer Reviewing beginnen. Auch ist es denkbar, dass bestimmte Einrichtungen, wie z. B. die ZBMed eine Sammlung fachspezifischer elektronischer Dokumente in den Verbund der Dokumentenserver einbringen. Da die lokalen Dokumentenserver eine wichtige Basis für die Inhalte der Digitalen Bibliothek sind (neben den kommerziellen Angeboten), sollten die Weiterentwicklungen der angebotenen Dienstleistungen koordiniert erfolgen. 6. Zusammenfassung Die AG Dokumentenserver empfiehlt für die Region Nordrhein-Westfalen und Rheinland- Pfalz den Austausch der auf den lokalen Dokumentenservern gehaltenen Metadaten und dem HBZ auf der Basis des Protokolls der Open Archives Initiative zu realisieren. Dies setzt voraus, dass auf Seiten der lokalen Dokumentenserver eine OAI-Schnittstelle existiert. Somit empfiehlt die AG den Hochschulen, die Dokumentenserver bisher ohne OAI- Schnittstelle betreiben, diese zeitnah entsprechend auszurüsten. Bei der Implementierung der OAI-Schnittstelle sollen die Einrichtungen durch Fortbildungen, Workshops und Support durch Experten unterstützt werden. Auf der Basis der von den lokalen Dokumentenservern eingesammelten Metadaten soll das HBZ einen Serviceproviderdienst aufsetzen, dessen Funktionalitäten im Laufe der Zeit ausgebaut werden sollen. 12

Zu Beginn steht eine gemeinsame Suche über alle Dokumentenserver und die Integration dieser Suche in die digitale Bibliothek. Für Institutionen, die nicht in der Lage sind, einen eigenen Dokumentenserver zu betreiben, bietet das HBZ diese Möglichkeit an (Hosting von Dokumentenservern). In einem zweiten Schritt soll das HBZ als aggregierender Datenprovider gegenüber den anderen Serviceprovidern auftreten, damit durch die größere Anzahl der angebotenen Dokumente die Attraktivität für die Serviceprovider steigt, die Metadaten aus NRW / Rheinland-Pfalz für ihre Dienste einzusammeln. Gleichzeitig soll das HBZ die Funktionalitäten des eigenen Serviceproviders ausbauen und die eigenen Sammelaktivitäten auf die anderen Datenprovider ausdehnen. 7. Arbeitsgruppe Dr. Bruno Klotz-Berendes (Vorsitz; UB Dortmund, Redaktion) Petra Heine (stellv. Vorsitz, UB Duisburg) Volker Lenhardt (UB Essen) Jörg Lorenz (ULB Münster) Uwe Müller (Gast, Rechenzentrum HU Berlin) Elmar Schackmann (RLB Koblenz) Tobias Schwarck (FHB Dortmund, Redaktion) Dr. Silke Schomburg (HBZ) Anette Seiler (Gast, HBZ) 1 Informationen zu dieser Initiative und die Protokollspezifikation zur Aktuellen Version 2.0 finden sich unter www.openarchives.org 2 Die AG Dokumentenserver berät das Hochschulbibliothekszentrum (HBZ) hinsichtlich Fragestellungen, die im Rahmen des Entwicklungsprozesses der Dokumenten- bzw. Hochschulschriftenserver-Infrastrukturen an den Hochschulen des Landes Nordrhein- Westfalen entstehen. Dabei spielen die Aspekte zum weiteren Ausbau und zur Integration eine zentrale Rolle. 3 Van de Sompel, H. ; Lagoze, C.: The Santa Fe Convention of the Open Archives Initiative, in: D-Lib Magazine. Vol. 6. 2000, no. 2 http://www.dlib.org/dlib/february00/vandesompeloai/02vandesompel-oai.html Ginsparg, P.; Luce, R. ; Van de Sompel, H.: The Open Archives initiative aimed at the further promotion of author self-archived solutions. 1999, http://www.openarchives.org/meetings/santafe1999/ups-invitation-ori.htm Rush-Feja, D.: Die Open Archives Initiative (OAI), in: Bibliothek 25. 2001. Nr. 3, S. 291 300 Lagoze, C. ; Van de Sompel, H.: The Open Archives Initiative: Building a low-barrier interoperability framework. 2001, Vortrag auf der JCDL2001, http://www.openarchives.org/documents/oai.pdf Lynch, Clifford A. -Metadata Harvesting and the Open Archives Initiative, in: ARL: A Bimonthly Report on Research Library Issues and Actions 217 (August 2001), http://www.arl.org/newsltr/217/mhp.html 4 Open Archives Initiative Protocol for Metadata Harvesting - Version 1.1. 2001, http://www.openarchives.org/oai/openarchivesprotocol.html 13

5 Die Grundlage bildet Dublin Core ohne weitere Qualifier. 6 http://www.edoc.hu-berlin.de/oaisearch/ 7 http://www.myoai.org 8 http://torii.sissa.it 9 http://www.slac.stanford.edu/spires/hep/ 10 Das OAI-PMH ermöglicht die folgenden sechs Anfragen: 1. GetRecord, 2. Identify; 3. ListIdentifiers; 4. ListMetadataFormats; 5. ListRecords und 6. ListSets 11 http://memory.loc.gov/cgi-bin/oai2_0?verb=listmetadataformats 14