Ein Java Repository für digitalen Content in Bibliotheken

Ähnliche Dokumente
Content Management in der Cloud mit JCR und Oracle. Dominic Weiser,

Web Content Management Systeme

Integrationsstrategie

:HE'DWHQEDQN$QELQGXQJ PLW-DYD6HUYOHWVEDVLHUHQG DXI$SDFKH-6HUY2UDFOHL

<MyCoRe> Eine Software für verschiedene Repositorien

Administration von Artikelbearbeitungsgebühren mittels EPrints

miless Der Dokumentenserver auf dem Campus Essen der Universität Duisburg-Essen

DECUSnet Konfiguration. IT-Symposium Alphaserver 2100 OpenVMS V TCPIP-Services

Internet-basierendes Autorensystem zur Erschließung historischen Kulturguts. Thorsten Ludewig. Juni 2004

Dokumenten- und Publikationsserver

Das Repositorium für Forschungsdaten und publikationen der TU Berlin als Serviceplattform für die Wissenschaftler

OSGi-basierte Webapplikationen Ein Erfahrungsbericht

5. Programmierschnittstellen für XML

Organisation und Systeme SOA: Erstellung von Templates für WebService Consumer und Provider in Java

Content-Management- Systeme (CMS) Inhaltsverwaltungssystem, Redaktionssystem

Praxisbeispiel: Deutsche Digitale Bibliothek

Berater-Profil Senior Web-Developer (OO-Analyse und -Design) Sun Certified Java Programmer

Typo3. Thomas Lüthi. Beitrag zur "CMS-Battle" vom 7. Juni 2010 Campus Bern.

Multimediale Dokumentenserver als E-Learning Content Repository

Universitätsbibliothek Essen der Universität Duisburg-Essen

Testmanagement mit SYNECT: Ein Beispiel aus der Praxis. Ralf Arens CLAAS Selbstfahrende Erntemaschinen GmbH

Open Source Datenbanken

5. Programmierschnittstellen für XML

Vom Hochschulschriftenserver zum Institutionellen Repositorium - zur Weiterentwicklung der OPUS-Software

Java-Bausteine für Internet-Anwendungen auf Basis von XML

Systemvoraussetzungen

Grundlagen der Web-Entwicklung

Systemvoraussetzungen

Web Services. XML, WSDL, SOAP und UDDI Einblicke und Ausblicke J.M.Joller 1

ALKIS- und Dienst-Nutzung mit Mapbender

Judaica recherchieren

ErfaGroup EEG5 21. Oktober 2003 Unternehmensweite rechtsgültige Archivierung

MyCoRe als Objektspeicher eines Verteilten Zeitschriften-Servers?

Zukunft der Oracle Applikationsentwicklung: ADF & XDB

ECM mit Lexmark ES. Enterprise Content Management-Lösung mit Saperion, Kofax, Readsoft und Perseptive. März 2016

Systemvoraussetzungen

E-Business Architekturen

Einsatz von Lucene im BAM-Portal

Aggregation, Archivierung und Aufbereitung elektronischer Ressourcen am BSZ Baden-Württemberg

Reporting Lösungen für APEX wähle Deine Waffen weise

Preis nach den ersten 30 Tagen Kostenlos Kostenpflichtig. Modellierungsnutzer 3 Concurrent Ihre Wahl

Systemvoraussetzungen

GSI WebDAV Service. Dennis Klein,

Jürgen Keiper Deutsche Kinemathek. Offene Quellen, offene Netze Perspektiven von Open Source-Software im Archiv- und Museumsbereich

aktuell Universitätsbibliothek Duisburg-Essen Dipl.-Wirt.Inform. Frank Lützenkirchen

Kapitel 1 Überblick Content Management und Digitale Bibliotheken

COI-BUSINESSFLOW FILESYSTEM IMPORTER MODUL INFORMATION

Abitur mit Schwerpunkt Wirtschaft und Verwaltung Studium Wirtschaftsinformatik Universität Essen

VDB- Jahresversammlung 2003 in der UB Tübingen. 23. Mai 2003 Elektronik und Papier: Dienstleistungen in einer dezentralen Hochschulbibliothek

WS 2011/12 Modul GEO 406 Web-basierte Informationssysteme. Dr. Sven Kralisch. Vorbesprechung

Funktion Jahrgang Wohnort Nationalität Ausbildung Qualifikationen / Zertifikate Sprachen IT Erfahrung seit Schwerpunkte Branchen Verfügbarkeit

VISkompakt. Inside. Referent. ! Name: Alexander Wedekind! Funktion: Consultant! Firma: PDV-Systeme Erfurt! Kontakt: Alexander.Wedekind@pdv.

Oracle 10g und SQL Server 2005 ein Vergleich. Thomas Wächtler 39221

Fakultät für Informatik & Wirtschaftsinformatik DB & IS II - SS noch einmal. XQuery... Andreas Schmidt Oracle XQuery 1/12

CARSTEN EMRATH. Abschluss Diplom (FH) Fach Angewandte Informatik. Sun Certified Programmer for the Java 2 Platform, Standard Edition 1.

VISkompakt V2. Internals. Referent. 1M05 Internals von VISkompakt 15:00 Uhr 16:00 Uhr. Entwicklungsleiter von VISkompakt. PDV-Systeme Erfurt

Entscheidung für ein neues Verbundsystem im Südwestdeutschen Bibliotheksverbund SWB

ERP System CATUNO.pro

Datenbank und Informationssysteme

Grundzüge und Vorteile von XML-Datenbanken am Beispiel der Oracle XML DB

Was ist 'Goobi'?: Verfahrensweise und Einbindung eines Verwaltungsprogramms in das DigiZeit-Projekt an der SUB Goettingen

Systemvoraussetzungen [Version: 18.0] [Datum: ]

OAIS-konforme Langzeitarchivierung von Multimediadaten. KoLa 2015 Berlin, Alexander Herschung, startext GmbH

Das ERM-System in der. Forschungszentrums Jülich Ingrid Heinen, Teamleiterin Erwerbung

Oracle XML Publisher - Überblick - Jürgen Vester Manager Sales Consulting Stuttgart Oracle Deutschland GmbH. Page 1

Grundlagen der Web-Entwicklung INF3172

Jakarta Turbine Ein Open Source Framework fÿr Webanwendungen. KNF Kongre 2001 Henning P. Schmiedehausen

Herzlich Willkommen! eine praxisnahe Übersicht. Mit Java ins Web - mb@bebox.franken.de (c) Michael Behrendt -

Elasticsearch und die Oracle Datenbank

Mapbender3 Workshop. Christian Wygoda. FOSSGIS Dessau 2012

Alles Backend oder was?

Agenda. IT-Symposium Secure Enterprise Search. Suchen und finden mit Suchmaschinen. Oracle SES Überblick

Analyse und praktischer Vergleich von neuen Access- Layer-Technologien in modernen Webanwendungen unter Java. Oliver Kalz

Tobias Kühne Seite 1; Seminar Javabasierte Webtechnologien. Wikis

Relationale Datenbanken Kursziele

DataFinder. FrOSCon Miriam Ney Deutsches Zentrum für Luft- und Raumfahrt e.v., Berlin/Köln/Braunschweig

Catalogue Enrichment. "Neue Wege der Erschließung" Stephani Scholz

Das Redaktionssystem UCMS. Beschreibung Technisches Profil

CampusSource-Workshop

Kooperation & Nachnutzung der kopal- Lösung. Frank Klaproth

StreamServe Persuasion Überblick über neues StreamServe-Release Dipl.-Ing. Walter Moser, BRAINWORX it GmbH

Semantische und konzeptionelle Modellierung

PL/SQL Web-Services mit Oracle 11g

1 Copyright 2012, Oracle and/or its affiliates. All rights reserved.

Dipl. Wirtsch.-Ing. Lars Geldner Nürnberg,

Das TextGrid & DARIAH-DE Repositorium

Fujitsu BeanConnect TM V3.0 Software 0 FUJITSU LIMITED 2013

5. Thüringer GIS-Forum ALK/ALB WEB - der moderne Auskunftsarbeitsplatz

Ulrike Schwinn Dipl.-Math. Oracle Deutschland GmbH. Kultur und Informatik - Datenverwaltung 04.Juli 2007

Architekturen. Von der DB basierten zur Multi-Tier Anwendung. DB/CRM (C) J.M.Joller

<Cocoon Day="2003-Nov-18" /> Cocoon & WebDAV. Guido Casper. Competence Center Open Source S&N AG

DHA Junior - Software Engineer. Personaldaten. Ausbildung / Studium. Branchenkenntnisse. Geburtsjahr: 1991 Deutsch, Englisch, Spanisch

Grundlagen der Web-Entwicklung

PM/CS - Datenübernahme in Instandhaltung und Kundenservice

Remote Communications

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004

Notes2DB. Machen Sie Ihre Notes-Datenbanken relational! Vortragender: Mag. Ing. Johannes Fiala, Fiala Web Development GmbH

Sie haben Ihr Ziel erreicht

8 Gauss Interprise AG

Transkript:

Ein Java Repository für digitalen Content in Bibliotheken 9. Sun Summit Bibliotheken 13.-14. November 2007, Deutsche Nationalbibliothek Christof Mainberger, BSZ

Digitale Bibliotheken verwalten digitalen Content Retrodigitalisierung Bild-Archiv Web-Site BLOG Hochschulschriftenserver Kataloganreicherung Medienserver Lehr- Lernplattform Langzeitarchivierung Institutionelles Repositorium Elektronischer Semesterapparat Virtuelle Auskunft Multimedia Wiki Elektronische Zeitschrift Museums-Dokumentation Back-Files 9. Sun Summit Bibliotheken, 14.11.07, Christof Mainberger (BSZ) 2

und benötigen dazu Werkzeuge! Erschließung Recherche Präsentation OAI Z39.50 Open URL Import (Ingest) Export Normdaten Datenmodell Workflow Zugriffskontrolle Statistik Administration / Konfiguration Backend Daten und Metadaten 9. Sun Summit Bibliotheken, 14.11.07, Christof Mainberger (BSZ) 3

Varianten des Backends von Repositorien Http Web- Anwendung SQL File- IO SQL*??? RDBS und Dateisystem Dateien ebenfalls im RDBS Spezielle Datenhaltung Unterschiedliche Schnittstellen zwischen Frontend und Backends 9. Sun Summit Bibliotheken, 14.11.07, Christof Mainberger (BSZ) 4

Standard-Schnittstelle für Content Repositories Http Web- Anwendung??? SQL File- IO SQL*??? RDBS und Dateisystem Dateien ebenfalls im RDBS Spezielle Datenhaltung EINE Schnittstelle, die die Varianten der Datenhaltung abstrahiert. 9. Sun Summit Bibliotheken, 14.11.07, Christof Mainberger (BSZ) 5

Anforderungen an eine Schnittstelle Beliebige Medienobjekte, beliebige Metadaten Verbindung von Medienobjekt und Metadaten Hierarchische Sammlungsstruktur Unterstützung von XML, feingranulare Rechteverwaltung Versionierung Volltextsuche, leistungsfähige Programmierschnittstelle (API) Standardisierung, breite Unterstützung und erschwingliche Implementierungen 9. Sun Summit Bibliotheken, 14.11.07, Christof Mainberger (BSZ) 6

Der JAVA-Standard für Content-Repositories JCR Resultat des JCP170-Prozesses, Juli 2005 Apache, BEA, Day Software, Fujitsu, HP, IBM, Novell, Oracle, SAP, Sun Microsystems, u.v.a.m. JCR definiert ein abstraktes hierarchisches Datenmodell mit XPath als Anfragesprache XML-Protokoll für Im- und Export von Datenbeständen Transaktionen, Versionierung, Observation, Locking und SQL Open Source Implementierung: Apache Jackrabbit wird fortgesetzt im JCP283: Zugriffskontrolle, Mehrfachhierarchien, 9. Sun Summit Bibliotheken, 14.11.07, Christof Mainberger (BSZ) 7

SWBplus als JAVA Content Repository SWBplus verwaltet die Kataloganreicherungen des BSZ: Inhaltsverzeichnisse, Abstracts, Klappentexte, etc. derzeit ca. 155.000 Anreicherungen aus 12 Bibliotheken und 14 Verlagen Dezentrales Scannen und zentrale OCR Keine eigene Rechercheoberfläche ; Abruf der Anreicherungen als Original, Text oder PDF über URLs Export der Anreicherungen in lokale OPACs Anfang 2007 wurde für SWBplus von ORACLE auf eine APACHE-Jackrabbit Installation migriert. SWB SWBplus 9. Sun Summit Bibliotheken, 14.11.07, Christof Mainberger (BSZ) 8

Architektur des SWBplus-Repository Apache- Tomcat SWBplus- Servlets RMI-Client Jackrabbit-Servlet Jackrabbit 9. Sun Summit Bibliotheken, 14.11.07, Christof Mainberger (BSZ) 9

(Vereinfachtes) Datenmodell von SWBplus Enrichment PPN Autoren Titel ISBNs Versionierbar Inhaltsverzeichnis Sprache OCR-Qualität Original Rezensionen Abstract, PDF Text Rezension[1] Name Größe Rezension[2], <enrichment ident="258311665" type="rez"> <authors><author>romain..</author></authors> <titles><title>catalogue des...</title></titles> <publishers><publisher> </publisher></publishers> <years><year>2006</year></years> <places><place>diet </place></places> <isbns> <isbn>3-85 </isbn></isbns> <expression type= inh" label= Inhaltsverzeichnis"> <manifestations> <lang>fre</lang> <ocr-quality>orig</ocr-quality> <manifestation type="orig"> <filename>/orig/bsz1234.pdf</filename> </manifestation> <manifestation type="ocr"> <filename>/ocr/bsz1234.pdf</filename> </manifestation> <manifestation type="txt"> <filename>result/txt/bsz1234.txt</filename> </manifestation> </manifestations> </expression> </enrichment> 9. Sun Summit Bibliotheken, 14.11.07, Christof Mainberger (BSZ) 10

Abfrage von SWBplus Beispiel: http://swbplus.bsz-bw.de/bsz08762818xinh.pdf oder oder //enrichment[swbplus:ppn= 08762818x ] /swbplus:inhaltsverzeichnis/swbplus/pdf SELECT./swbplus:inhaltsverzeichnis/swbplus:PDF FROM swbplus:enrichment WHERE swbplus:ppn= 08762818x getenrichment( 08762818x ).getinh().getpdf() mit Hilfe einer Abbildung auf ein JAVA-Objektmodell 9. Sun Summit Bibliotheken, 14.11.07, Christof Mainberger (BSZ) 11

Freiheitsgrad in der Datenhaltung Http SWBplus APACHE Jackrabbit XML- Export / Import Filesystem Derby- DB Migration der Daten in eine (beliebige) SQL-Datenbank 9. Sun Summit Bibliotheken, 14.11.07, Christof Mainberger (BSZ) 12

Fazit: It works! Und nun: Anwendung des JCR für kleinere Anwendungen Warten auf JCP283 Warten auf industrielle Implementierungen: IBM, Oracle,, SUN,? 9. Sun Summit Bibliotheken, 14.11.07, Christof Mainberger (BSZ) 13

Vielen Dank für Ihre Aufmerksamkeit! christof.mainberger@bsz-bw.de Tel.: 0 75 31 / 88 4468 9. Sun Summit Bibliotheken, 14.11.07, Christof Mainberger (BSZ) 14