Dokumentation Goobi-Plugin für einen Import mittels SRU 1 Dokumentation Goobi-Plugin Technische Dokumentation für ein Goobi-Plugin zum Import von Katalogdaten via SRU für die Humboldt- Universität zu Berlin Revision Datum Goobi Änderungen 1 15.08.2013 1.9.3 Initaler Entwurf 2 20.08.2013 1.9.3 Erweiterungen für die Konfiguration von Personen
Dokumentation Goobi-Plugin für einen Import mittels SRU 2 Inhaltsverzeichnis 1 Einführung... 3 2 Voraussetzung... 3 3 Installation und Konfiguration... 3 4 Konfiguration der Metadatenzuordnung... 4 5 Konfiguration von Personentypen... 5 6 Nutzung in Goobi... 6 7 Zusätzliche Details... 7
Dokumentation Goobi-Plugin für einen Import mittels SRU 3 1 Einführung Das vorliegende Dokument beschreibt eine Entwicklung der intranda GmbH für den Import von Meta- und Strukturdaten aus dem ALEPH-Katalog der HU Berlin nach Goobi. Die Publikationstypen Monographie, mehrbändiges Werk und Zeitschrift werden unterstützt. Dabei werden die Daten über eine SRU-Schnittstelle abgefragt. 2 Voraussetzung Vorausgesetzt wird der Einsatz von Goobi Version 1.9.3. Außerdem muss die Verbindung zum ALEPH-Katalog gewährleistet sein. 3 Installation und Konfiguration Das Plugin selbst muss unter folgendem Pfad installiert werden: /opt/digiverso/goobi/plugins/opac/sruopacplugin.jar Außerdem wird eine Mapping-Datei (siehe Abschnitt Konfiguration der Metadatenzuordnung ) unter folgendem Pfad benötigt: /opt/digiverso/goobi/xslt/marc_map.xml Zur Verwendung des Plugins in der Maske zum Anlegen eines neuen Vorgangs in Goobi muss in der Datei goobi_opac.xml eine Konfiguration definiert werden. Die Konfigurationsdatei finden Sie unter folgendem Pfad: /opt/digiverso/goobi/config/goobi_opac.xml Folgender Eintrag innerhalb des Bereichs opaccatalogues muss eingefügt werden: <catalogue title="hu-berlin(sru)"> <config address="aleph20.ub.hu-berlin.de" database="hub01" description="humboldt Universität Berlin" port="5661" opactype="sru"/> </catalogue> Wichtig ist hier der Eintrag opactype= SRU sowie die zur Datenbank passenden Attribute address, database und port. Die Attribute title und description sind beliebig wählbar, sollten aber sinnhaft zur gewählten Datenbank passen.
Dokumentation Goobi-Plugin für einen Import mittels SRU 4 4 Konfiguration der Metadatenzuordnung Das Plugin liest einen Datensatz im MARCXML-Format ein. Die Zuordnung der darin enthaltenen Metadaten erfolgt über die XML-Datei: /opt/digiverso/goobi/xslt/marc_map.xml. Diese XML-Datei ist folgendermaßen aufgebaut: <map> <metadata [logical= true/false ] [phyiscal= true/false ] [anchor= true/false ] [child= true/false ] [separateoccurances= true/false ] separatexphaths= true/false [separator= : ]> <name>metadata1</name> <marcfield tag= 001 [ind1= - ] [ind2= - ] subfields= a ></marcfield> <marcfield tag= 002 [ind1= - ] [ind2= - ] subfields= bc ></marcfield>... </metadata> <metadata> <name>metadata2</name> <marcfield tag= 003 subfields= a ></marcfield> </metadata> </map> Jedes Element metadata ist über das Unterelement name mit einem Goobi-Metadatum gleichen Namens verknüpft. Die Unterelemente marcfield kennzeichnen die MARCXML-Felder, die diesem Metadatum zugeordnet werden und durch die Attribute tag, ind1, ind2 und subfields identifiziert werden. Dabei sind lediglich die Attribute tag und subfields verpflichtend. Ist ind2 nicht explizit aufgeführt, werden alle Elemente mit ind2= 2 für untergeordnete Werke ignoriert. Das Attribut subfields kann ein oder mehrere MARC-subfields enthalten, die gemeinsam in dasselbe Goobi-Metadatum geschrieben werden, getrennt durch den separator-string (siehe unten). Sollen Werte aus verscheidenen subfields in getrennte Metadaten geschrieben werden, müssen jeweils eigene marcfield-elemente angelegt werden. Die genaue Art der Verknüpfung wird in den Attributen von metadata konfiguriert, die im Folgenden beschrieben werden: Element logical phyiscal anchor Bedeutung Metadatum wird in logische Strukturelemente geschrieben Metadatum wird in physische Strukturelemente geschrieben wenigstens eines von logical/physical muss true sein, damit das Metadatum überhaupt geschrieben wird Metadatum wird in das Anchor-Element der logischen Struktur geschrieben.
Dokumentation Goobi-Plugin für einen Import mittels SRU 5 Default ist false, außer für Zeitschriften. child SeparateOccurances SeparateXPaths separator Metadatum wird in das erste Kindelement des Anchor-Elements der logischen Struktur geschrieben. Default ist true, außer für Zeitschriften. Mehrfach auftretende MARC-Felder werden in separate Goobi-Metadaten geschrieben. Dieses Attribut kann auch für einzelne subfields separat gesetzt werden. Default ist false. Die Werte aus verschiedenen MARCsubfields dieses metadata-elements werden in separate Goobi-Metadaten geschrieben. Default ist false. Für SeparateOccurances=false oder SeparateXPaths=false werden die einzelnen Werte innerhalb des Goobi-Metadatums durch die hier definierte Charakterfolge getrennt. Default ist (Leerzeichen). Nicht konfigurierbar ist die Zuordnung von Feld 453$a zur PPN des übergeordneten Werkes (bei Bänden von mehrbändigen Werken) und die Zuordnung von Feld 959$a zum Strukturtyp dieses Datensatzes. 5 Konfiguration von Personentypen Personen können optional über ein Pseudo-Metadatenelement konfiguriert werden. <metadata logical= true ><name>person</name>...</metadata> Zusätzlich zu den Unterelementen <marcfield> enthält dieses Element Unterelemente <Rolle>, mit den Attributen subfield und value. Jedes dieser Elemente definiert einen Personentyp (oder Rolle). Das Attribut subfield enthält den Code des Marc-Subfields, in dem der Typ bzw. die Rolle der Person definiert ist. Das Attribut value enthält den Wert des Marc-Subfields, der dort für eine bestimmte Rolle steht. Der Text des <Role>-Elementes beinhaltet den Namen des Goobi- Personentyps in den Personen, die mit dieser Rolle geschrieben werden sollen. <metadata logical="true"> <name>person</name> <Role subfield="b" value="">author</role>
Dokumentation Goobi-Plugin für einen Import mittels SRU 6 <Role subfield="b" value="[hrsg.]">editor</role> <marcfield tag="100"></marcfield> </metadata> Im diesem Beispiel sind zwei Personentypen definiert: Autor und Herausgeber. Danach werden alle Personen aus den Marc-Feldern mit tag= 100 als Author importiert, wenn das Marc- Subfield $b nicht existiert oder leer ist, oder als Editor, wenn dort der Text [Hrsg.] steht. Es können auch mehrere <Role>-Elemente auf denselben Personentyp verweisen, wenn es z.b. verschiedene Bezeichnungen in subfield $b dafür gibt. 6 Nutzung in Goobi In Goobi wird ein neuer Datensatz über die Aktion Einen Vorgang auf Basis dieser Produktionsvorlage anlegen eingerichtet. Abbildung 1: Einen Vorgang auf Basis dieser Produktionsvorlage anlegen Um die Daten aus dem ALEPH-Katalog zu importieren, muss im Feld Suche in Opac der Titel des in der goobi_opac.xml eingerichteten Kataloges ausgewählt werden (z.b. HU-BERLIN (SRU)) und im leeren Textfeld rechts davon entweder die Verbuchungsnummer oder die PPN des gewünschten Datensatzes. Ein Klick auf den Link Übernehmen startet die Abfrage, die nach erfolgreicher Durchführung die Felder der Eingabemaske füllt.
Dokumentation Goobi-Plugin für einen Import mittels SRU 7 Abbildung 2: OPAC abfragen Endgültig angelegt wird der Vorgang durch Klick auf Speichern am unteren rechten Seitenrand. Sollten benötigte Daten fehlen, bleibt die Eingabemaske bestehen und entsprechende Meldungen werden im oberen Bereich ausgegeben. 7 Zusätzliche Details Für weitere Details stehen die Entwickler von Goobi und der Plugins jederzeit zur Verfügung. Bitte wenden Sie sich an folgende Ansprechpartner: Ansprechpartner: Florian Alpers Steffen Hankiewicz Robert Sehr Jan Vonde Kontakt: intranda GmbH Bertha-von-Suttner Str. 9 D 37085 Göttingen http://www.intranda.com goobi@intranda.com