Die EOD Suchmaschine ein Erfahrungsbericht zum Einsatz der Open-Source Software VuFind als Suchmaschine für Katalogdaten im ebooks-on-demand-netzwerk Österreichischer Bibliothekartag, 20.10.2011 Silvia Gstrein, ULB, Abt. für Digitalisierung - silvia.gstrein@uibk.ac.at
Überblick Kurz zusammengefasst: Was ist EOD? Warum eine eigene Suchmaschine? Die Entscheidungsfindung Die Implementierung Status quo
EOD: ebooks on Demand [source: http://www.flickr.com/photos/timetrax/376152628/] Digitaler Dokumentenlieferservice für Bücher Gemeinfrei Von Buchdeckel zu Buchdeckel Mit hoher Qualität und inklusive OCR Serviceorientiert Aus einer Nutzer-/Forscher-/Lesersicht: Wie kann jemand, der ein bestimmtes Buch in digitaler Form braucht, dieses Buch hier und jetzt bekommen, wenn es noch nicht digitalisiert wurde?
EOD der Service Digitale Bibliotheken & Europeana Kennzeichnen der Werke für Digitalisierung auf Anfrage Bibliothek: Scannen & Bilder übertragen
EOD aus Bibliothekssicht Order Data Manager Zentrale Datenbank mit Zugriff über Web-Interface Verwaltung und Bearbeitung der Bestellungen Nur Zugriff auf die eigenen Bestellungen Automatisierte E-Mails an Besteller Jede Bibliothek kann die Vorlagen für e-mails, Buch- Covers, Kundenserviceseiten anpassen Digital Object Generator Zentraler Bestandteil zur Generierung des digitalen Objekts OCR Texterkennung: Antiqua und Fraktur (Abbyy Recognition Server 3) Automatisierte Cover Generierung PDF & RTF (optional) Auslieferung Abbyy XML für Bibliothek Automatische Generierung des Streaming-Links für den Download
Wer bietet diesen Service an?
Koordinator: Universität Innsbruck, Bibliothek Dzt. > 30 Partner in 12 Staaten
Internationale Netzwerkpartner Deutschland Dänemark Estland Frankreich Portugal Schweden Schweiz Slowakei Slowenien Tschechische Republik Ungarn Bayerische Staatsbibliothek, Bibliotheken der Universitäten Regensburg, Greifswald, Humboldt Universität zu Berlin, SLUB Dresden National- und Universitätsbibliothek Estnische Nationalbibliothek, Universitätsbibliothek Tartu Medizinbibliothek in Paris, UD Strassbourg Portugiesische Nationalbibliothek Universitätsbibliothek Umeå, Schwedische Nationalbibl. Schweizerische Nationalbibliothek, Bibliothek am Guisanplatz UB Bratislava, Slowakische Akademie der Wissenschaften National- und Universitätsbibliothek Mährische Bibliothek in Brünn, Akademische Bibliothek in Olmütz, Technische Nationalbibliothek in Prag, Tschechische Akademie der Wissenschaften Ungarische Széchényi Nationalbibliothek, Ungarische Akademie der Wissenschaften
EOD in Österreich Universitätsbibliothek Salzburg Universitäts- und Landesbibliothek Tirol Universitätsbibliothek Wien Bibliothek der Medizinuniversität Wien Wienbibliothek im Rathaus St. Pölten Diözesanarchiv Universitätsbibliothek Graz
Wie finde ich ein Buch für diesen Service?
Beispiel 1 Beispiel Schweizerische Nationalbibliothek www.helveticat.ch Suche nach robinson 1799
Beispiel 2 Beispiel Österr. Verbundkatalog http://aleph20-prod-acc.obvsg.at/f Suche nach Tegnérs Frotjofs Saga http://permalink.obvsg.at/ac07783705
Beispiel 3 Beispiel BSB Verbundkatalog http://opac.bibbvb.de:8080/infoguideclient.fasttestsis/start.do? Suche nach Lütgendorf Einfluß der Sittenlehre
http://www.books2ebooks.eu/odm/orderformul ar.do?formular_id=41&sys_id=bv001410890
Der EOD Button Die Digitalisierung von Büchern über EOD kann bestellt werden über: OPACs der teilnehmenden Bibliotheken Einige nationale bzw. (über)regionale Verbundkataloge Digitalisierte Zettelkataloge Worldcat: Pilot mit BSB, z.b. http://www.worldcat.org/title/rhetorica-etdialectica/oclc/165930073 Überblick: http://books2ebooks.eu/catalogue.php5
Rückblende 2007: EOD startete als EU-Projekt im Programm eten DoD Feedback im Review richtig positiv, aber...
The project targets a difficult market, the digitisation of old books, but it provides an interesting model to help libraries to perform this work, and offer the ebooks for free later on. To achieve its objective the project still has to address some critical issues, like a possible central database Finally the project would undoubtedly benefit from the creation of a common catalogue to facilitate the search for the clients Seriously consider combining individual OPAC's into one, global DoD catalogue - eten DoD 1. review 2007
E-Odyssey oder: Die Suche nach einer Suchmaschine
Ausgangssituation Metadatensätze aus vielen versch. OPACs Keine ILS Funktionalität benötigt Multilingualität: Muss Google indexierbar Moderater Preis als wichtiges Thema (weil Netzwerk über Mitgliedsgebühren) Software-Entwicklungsressourcen vorhanden
Mehrere Anläufe Angebote von großen komerziellen Anbietern eingeholt 2008 Masterthesis: Prototyp entwickelt im Rahmen von Vgl. ORACLE Volltext-Suche vs. Apache Lucene Experimente mit MetaLib
Die Entscheidung 2009: Evaluierung verschiedener opensource Lösungen: VuFind, Blacklight, LibraryFind, Scriblio, Am Schluß Entscheidung zw. VuFind vs Blacklight: Solr-MARC PHP als Frontend JAVA/SOLR backend vs. Ruby/rails Multilingual, erweiterbar, anpassbar Sehr sauberer Code
Ende 2010 Instanz von VuFind online: http://search.books2ebooks.eu Import-Prozess adaptiert MarcXML und MARC21 OAI-PMH bzw. Datenbankabzüge auf FTP Profile pro Bibliothek, Transformationen, z.b. MAB2 => MARCXML Konvertierung Eine Lösung für die meisten EOD- Mitgliedsbibliotheken Die Implementierung Außer für spezielle MARC-Ausprägungen Digitalisierte Zettelkataloge Meiste Aufwand: nicht technische Implementierung, sondern Kommunikation mit EOD-Partnern
Heutige Situation: 2.534.593 Datensätze Von urheberrechtsfreien Bücher, die zur Digitalisierung angeboten werden plus bereits digitalisierte Bücher Hälfte der Bibliotheken bereits integriert SiteXML google: die meisten Besucher kommen über die Google-Suche antipalus maleficorum kränze aus dem böhmischen dichtergarten "lehrbegriff des naturrechts" ebook Updatemechanismus implementiert
Nutzung ca. 650 individuelle Besuche pro Tag, mit Spitzen bis zu fast 1000 individuellen Besuchen/Tag Davon 90% Ergebnis von Google-Suchen Steigende Bestellzahlen, Bsp. BSB Bereits jetzt soviele Bücher digitalisiert und ausgeliefert wie sonst im ganzen Jahr 1/3 der Bestellungen aus EOD Suchmaschine 1/3 aus Worldcat 1/3 aus lokalem OPAC bzw. Verbund-OPAC
http://search.books2ebooks.eu => Google: Das Radetzkyfest zu Innsbruck
Und nun? Verbesserungen Mehr Kataloge von mehr Bibliotheken Link zurück auf Datensatz im Original-OPAC De-Duplizierung? Beim Datensatz anzeigen, ob es bereits eine digitalisierte Version im Netz gibt (Europeana SearchAPI, ) Lösung für digitalisierte OCR-gelesene Zettelkataloge
Danke für Ihre Aufmerksamkeit! silvia.gstrein@uibk.ac.at Besuchen Sie uns auch an unserem Stand, 1. Stock!