MyCoRe als Objektspeicher eines Verteilten Zeitschriften-Servers?



Ähnliche Dokumente
Universitätsbibliothek Essen der Universität Duisburg-Essen

MILESS / MyCoRe. Ein praktisches Beispiel zur hochschulübergreifenden Zusammenarbeit von Bibliotheken und Rechenzentren

Dokumenten- und Publikationsserver

<MyCoRe> Eine Software für verschiedene Repositorien

Dissertationsserver mit miless / MyCoRe:

MyCoRe und MILESS Architektur und Technik

miless Der Dokumentenserver auf dem Campus Essen der Universität Duisburg-Essen

Multimediale Dokumentenserver als E-Learning Content Repository

E-Learning und Digitale Bibliotheken mit MILESS und MyCoRe

Kooperation & Nachnutzung der kopal- Lösung. Frank Klaproth

Weiterentwicklung digitaler Bibliothekssysteme zu OpenArchives-Systemen

MyCoRe > V1.0: Technische Weiterentwicklung

Anbindung LMS an Siemens S7. Information

Jens Kupferschmidt Universitätsrechenzentrum

Website-Verwaltung mit Content Management Systemen

Metadateneditoren für ArcGIS

SemTalk Services Stand: Februar 2015

Open Source / Open Content für das Lernen mit digitalen Medien: Billig und wenig Qualität? Prof. Dr. Hans-Werner Six FernUniversität Hagen

Eclipse Equinox als Basis für Smart Client Anwendungen. Christian Campo, compeople AG, Java Forum Stuttgart 2007

Content-Management- Systeme (CMS) Inhaltsverwaltungssystem, Redaktionssystem

Software Engineering. Zur Architektur der Applikation Data Repository. Franz-Josef Elmer, Universität Basel, HS 2015

Herzlich Willkommen! eine praxisnahe Übersicht. Mit Java ins Web - mb@bebox.franken.de (c) Michael Behrendt -

Digitalisierung - und was kommt dann? Langzeitarchivierung in Deutschland und Europa

OAIS-konforme Langzeitarchivierung von Multimediadaten. KoLa 2015 Berlin, Alexander Herschung, startext GmbH

Internet-basierendes Autorensystem zur Erschließung historischen Kulturguts. Thorsten Ludewig. Juni 2004

easycms Content Management System

DiPP Golden Road zum Open Access

XINDICE. The Apache XML Project Name: J acqueline Langhorst blackyuriko@hotmail.de

Das Repositorium für Forschungsergebnisse der TU Berlin. Pascal-Nicolas Becker Universitätsbibliothek PubMan Days 2013 München,

EJB Beispiel. JEE Vorlesung 10. Ralf Gitzel

Das Repositorium für Forschungsdaten und publikationen der TU Berlin als Serviceplattform für die Wissenschaftler

Intentionen und Ziele

TYPO3 Slide Lightwerk GmbH

DMSEXPLORER PRODUKTINFORMATIONEN

PRESman. Presentation Manager. Reduzieren Sie nachhaltig die Kosten für das. Erstellen, Verwalten und Verteilen Ihrer

IAWWeb PDFManager. - Kurzanleitung -

Zur Definition von Web-Services

Folgende Voraussetzungen für die Konfiguration müssen erfüllt sein:

Von miless zu MyCoRe - Entwicklung von Dokumenten- und Publikationsservern

Integrierte Literaturverwaltung in Moodle

Persistenzschicht in Collaborative Workspace

5. Programmierschnittstellen für XML

XML - Extensible Markup Language. Agenda - Oracle XML DB

Fragment Identifiers, Template Handles

ThULB Suche. Ein Discovery System für die ThULB Jena. GeSIG Discovery Summit, Dr. Thomas Mutschler

5. Programmierschnittstellen für XML

LCM-6 Digital Signage Software

BIF/SWE 1 - Übungsbeispiel

KURZANLEITUNG CLOUD OBJECT STORAGE

Allgemeiner Leitfaden zum Einfügen suchmaschinenoptimierter Texte

Die Technologie der Mumie

Architektur des agimatec-validation Frameworks

Was leistet ein Content Management System?

BusinessMail X.400 Webinterface Gruppenadministrator V2.6

AS/point, Ihr Partner die nächsten 10 und mehr Jahre -

OWASP Stammtisch München Sep 2014 XSS und andere Sicherheitslücken aus der Perspektive des Programmcodes

16.4 Wiederverwendung von COTS-Produkten

Session Beans & Servlet Integration. Ralf Gitzel ralf_gitzel@hotmail.de

FTP-Leitfaden Inhouse. Benutzerleitfaden

aktuell Universitätsbibliothek Duisburg-Essen Dipl.-Wirt.Inform. Frank Lützenkirchen

Wiki als strukturierte Datenbasis Die Web-App»Orte jüdischer Geschichte«und andere Praxisbeispiele

GATE General Architecture for Text Engineering. Alexander Hein & Erik Dießler (VL Text Analytics )

Forschungsdaten in der Hochenergiephysik - Aufgaben der Bibliothek

Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen

peer-to-peer Dateisystem Synchronisation

Wiederholung: Beginn

Referenzen TYPO3 Projekt Slider für Reiseberichte Stand: Februar 2015

BI in der Cloud eine valide Alternative Überblick zum Leistungsspektrum und erste Erfahrungen

Prozessunterstützung durch BPR-, BPM- und Workflow-Systeme

JPC Visualisierung in Java

Sehr geehrte Faktor-IPS Anwender,

DataSpace 2.0 Die sichere Kommunikations-Plattform für Unternehmen und Organisationen. Your Data. Your Control

Flexible Skalierbare Hardware unabhängige Lösungen zur revisionssicheren & Lang-Zeit Datenarchivierung

ISA Server 2004 Erstellen eines neuen Netzwerkes - Von Marc Grote

Datenbanken. Prof. Dr. Bernhard Schiefer.

Web2Lead. Konfiguration

Die Entwicklung eines Glossars (oder eines kontrollierten Vokabulars) für ein Unternehmen geht üblicherweise in 3 Schritten vor sich:

RESTful Web. Representational State Transfer

Intelligente Informationssysteme CoreMedia Smart Content Technology. Grundlagen

Inhalt. 1 Übersicht. 2 Anwendungsbeispiele. 3 Einsatzgebiete. 4 Systemanforderungen. 5 Lizenzierung. 6 Installation. 7 Key Features.

pro4controlling - Whitepaper [DEU] Whitepaper zur CfMD-Lösung pro4controlling Seite 1 von 9

Java und XML 2. Java und XML

smartdox connect for i5 Reibungslose d.3ecm Integration in die IBM i5 Umgebung

Lehrveranstaltung Grundlagen von Datenbanken

Windows Server 2012 R2 Essentials & Hyper-V

Metadaten METS. Markus Schnöpf Berlin-Brandenburgische Akademie der Wissenschaften IDE. IDE Autumn School 2012, Chemnitz

LCM-6 Digital Signage Software

T Y P O 3 M I T M A G E N T O E C O M M E R C E M I T E N T E R P R I S E C O N T E N T M A N A G E M E N T

Verwalten Sie Ihre Homepage von überall zu jeder Zeit! Angebote und Informationen auf

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

Diplomarbeit: GOMMA: Eine Plattform zur flexiblen Verwaltung und Analyse von Ontologie Mappings in der Bio-/Medizininformatik

Albert HAYR Linux, IT and Open Source Expert and Solution Architect. Open Source professionell einsetzen

Open Source GIS - das alternative geogovernment

Innovative Kommunikations- und Verwaltungslösung für Unternehmen in der Pflege- und Gesundheitsbranche

FTP-Leitfaden RZ. Benutzerleitfaden

e-books aus der EBL-Datenbank

windream für Microsoft Office SharePoint Server

Schwacke Schnittstelle

ALKIS- und Dienst-Nutzung mit Mapbender

Architekturen. Von der DB basierten zur Multi-Tier Anwendung. DB/CRM (C) J.M.Joller

Transkript:

MyCoRe als Objektspeicher eines Verteilten Zeitschriften-Servers? http://miless.uni-essen.de/ http://www.mycore.de/ Frank Lützenkirchen HochschulRechenZentrum der Universität Essen

MILESS Überblick MILESS: Multimedialer Lehr- und Lernserver Essen Genauer: Multimedialer Lehr- und Lernmittel-Server Nicht: E-Learning-System (Kursmanagement, Diskussionsforen,...) Essener Digitale Bibliothek: Infrastruktur für die Universität Essen In Essen für Essen entwickelte Applikation, d.h. ursprünglich zugeschnitten auf Essener Anforderungen Dublin Core Datenmodell, XML-Schnittstellen, beliebige Dateitypen Benötigt IBM Content Manager, DB2 unter AIX oder NT Java-Applikation bestehend aus Servlets & Applet für Autoren Open Source unter GNU General Public License, nichtkommerziell Nachnutzung durch 12 andere Universitäten erfolgreich, z. B. Leipzig (Bach Digital), Jena (Urmel), Münster (Miami) Zunehmende Flexibilisierung zur einfacheren Nachnutzung Teil von CampusSource NRW, Ursprung des MyCoRe Projekts

MILESS Basis: Content Manager V7 Abbildung: Marc Schlüpmann, Universität Essen

Architektur Content Manager V8

IBM Content Manager als Basis eines MyCoRe VZS Objektspeichers Verteilte Architektur mit mehreren Objekt-Servern / Resource Managern Hohe Skalierbarkeit: Millionen von Dokumenten, Terabytes von Dateien Beliebige Dateitypen: PDF, PS, aber auch XML, Word, LaTeX... Integrierte Sicht auf Metadaten und Volltexte Kombinierte Suche in Metadaten und Volltext mit linguistischen Features Hierarchisches Speichermanagement über Tivoli Storage Manager Backup von Metadaten und Inhalten Auslagerung selten genutzter Objekte auf Offline-Medien (Bandarchiv) Langzeitarchivierung (physisch) über Tivoli Storage Manager Mechanismen

MILESS Software-Architektur Abbildung: Marc Schlüpmann, Universität Essen

Abhängigkeit vom Hersteller IBM bei einer MILESS / MyCoRe Lösung? Langfristige Unabhängigkeit vom Datenbank-Backend war schon immer ein Ziel, das sich in der Systemarchitektur wiederspiegelt Persistenz-Layer bildet eigene Datenstrukturen und Suchabfragen auf Content Manager Strukturen und Abfragesprache ab XML Schnittstellen für Import und Export Darstellung sämtlicher Metadaten im XML Format Wesentliche Teile der Funktionalität sind "oberhalb" von CM realisiert Implementierung alternativer Persistenz-Adapter in MyCoRe, z. B. Metadaten: Implementierung für XML:DB API, z. B. Apache Xindice (GPL) Content: Statt CM Objektservern auch Flat Filesystem Audio/Video Streaming: Statt IBM VideoCharger Server auch Real Server Trennung von Applikation und Persistenz-Layer ist realisierbar IBM Content Manager: für langfristige, speicherintensive Lösungen Open Source Backends: für kleinere Lösungen, Zukunftssicherheit

Bisher: MILESS Datenmodell Dokumentenmodell ist Umsetzung des Dublin Core Element Set: Creator, Publisher, Contributor, Title, Subject, Description, Source, Coverage, Rights, Type, Format, Date, Language,... Ergänzt um Modell für Personen / Körperschaftsdaten: Personen, Namensformen, Kontaktinformationen,... Ergänzt um Modell für Dokumenten-Derivate und Dateien Ein Dokument in verschiedenen Formaten (HTML, PS, PDF,...) Metadatensatz ist abgestimmt auf / mit Deutsche Bibliothek: Elektronische Dissertationen

Übersicht MILESS Datenmodell Abbildung: Marc Schlüpmann, Universität Essen

Dissertation in verschiedenen Formaten

Dissertation in LaTeX, Anzeige-Applet

MyCoRe: Entstehung und Ziele Essener Lösung MILESS ist spezialisiert auf die Essener Anforderungen (z. B. in Datenmodell, Graphische Oberflächen) MILESS Community der Nachnutzer brachte zusätzliche Anforderungen, Flexibilisierungswünsche, neue Anwendungsgebiete ein Daher, ausgehend von MILESS, gemeinsame Entwicklung eines flexiblen, anpassbaren Software-Kerns ( core ) zur Erstellung von digitalen Bibliothekssystemen / Archivlösungen (allgemein Content Repositories -> CoRe), für verschiedene Backend-Datenbanken, unter anderem IBM Content Manager Entwicklung als Open Source auf Java-Basis unter GNU GPL Kern, ergänzt um Anpassungen und Erweiterungen, bildet jeweils eine lokale Lösung, z. B. für Münzsammlung, Papyri- Archiv, Objektspeicher eines Verteilten Zeitschriftenservers

MyCoRe: Projektbeteiligte Universität Essen: Rechenzentrum, Bibliothek, Medienzentrum Universität Jena: Rechenzentrum, Bibliothek Universität Leipzig: Rechenzentrum Universität Münster: Rechenzentrum, Bibliothek Universität Halle: Rechenzentrum, Bibliothek Universität Freiburg: Rechenzentrum Universität Rostock: Rechenzentrum, Bibliothek, Informatik Prof. Heuer Universität Bonn: Rechenzentrum Universität Greifswald: Rechenzentrum Universität Hamburg. Rechenzentrum, Bibliothek Gesellschaft für wissenschaftliche Datenverarbeitung Göttingen Universität Uppsala / Louisiana Tech University: Architectural History IBM Deutschland: Content Manager Gruppe, Forschung & Lehre Weitere potentielle Beteiligte / interessierte zukünftige Nutzer / Kontakte Düsseldorf, Bochum, Mainz, BASF Ludwigshafen, Paul Hartmann AG...

MyCoRe: Ziele und Funktionalität Konfiguration statt Programmierung Konfigurierbares Metadatenmodell Konfigurierbares Layout über XSL Stylesheets Flexibles internes logisches Dateisystem Audio-/Video-Unterstützung Unterstützung verschiedener Datenbank-Backends Verteilte Suche über mehrere Systeme XML Import/Export Schnittstellen HTML GUI auch als Metadaten-Editor für Autoren Anbindung Benutzer-/Rechteverwaltung an LDAP,... Schnittstellen für OAI, Z.39.50, Web Services: SOAP...

MyCoRe: Datenmodellierung

Einordnung von Dokumenten in hierarchische (Fach-)klassifikationen

MyCoRe Datenmodell für ein Zeitschriften-Repository konfigurierbar Konfiguration des Metadaten-Satzes für Zeitschrift, Jahrgang, Band, Heft, Artikel usw. Modellierung der Hierarchie dieser Objekttypen zueinander Laden der Zeitschriftenartikel über XML Import oder interaktiv Navigation durch den Bestand: Zeitschrift -> Artikel -> Text Jedes Objekt (Zeitschrift, Artikel, Abstract, Volltext,...) ist direkt über eine URL erreichbar Persistent Identifier: NBN URNs für MyCoRe (Projekt CARMEN AP4) werden derzeit implementiert (Dissertationen) -> hier nicht hinreichend (?) OpenURL: Bisher noch nicht betrachtet, aber leicht realisierbar, denn: Jedes Objekt (Metadaten, Datei) besitzt intern eine eindeutige ID Suche nach Objekten über XQuery Schnittstellen Für Remote Query, Browsing etc. verschiedene Schnittstellen OAI, HTTP + XML, Web Services (SOAP/JAX-RPC)

MyCoRe: Architektur

Verteilte Suche in MyCoRe: Remote Query Server & Clients Präsentation Suchergebnisse Client Lokale Suche Server HTTP / XML Lokale Suche Lokale Suche z.b. Content Manager Lokale Suche Quelle: M. Zarick, Universität Rostock Lokale Suche

Generieren von HTML Seiten durch MyCoRe Servlets: Trennen von Logik & Layout 1 Client Browser HTML Page 4 Unabhängig voneinander anpassen pflegen entwickeln MCRLayoutServlet XML Document 3 Daten XSL Stylesheet Layout-Anweisungen 2 MyCoRe Servlet Verarbeitungslogik

MyCoRe LayoutServlet: Ein Objekt, verschiedene Stylesheets Client Browser 1 HTML Page A 4a HTML Page B 4b MCRLayoutServlet XML Document MyCoRe Servlet 2 3a XSL Stylesheet A 3b XSL Stylesheet B

MyCoRe LayoutServlet: Ein Objekt, verschiedene Stylesheets XSL Stylesheet kann gewählt werden durch Servlet Code (Java-Programmierung) Benutzer über HTTP Request Parameter: http://.../testpage.xml?xsl.style=dcoutput -> dcoutput.xsl Automatisch aus XML document type ermittelt: <person>...</person> -> person.xsl Verwendung verschiedener Stylesheets für verschiedene Applikationen (-> VZS) verschiedene Ausgabeformate (Experte, Gastnutzer,...) verschiedene Sprachen (Internationalisierte Bezeichner,...)

MyCoRe LayoutServlet: Drei Quellen von darzustellendem XML 1a MILESS Derivate Servlet 2a Stored XML Document as part of a MILESS derivate XSL Stylesheet Client Browser 1b Other MyCoRe Servlet 2b 3 1c Dynamically generated XML Document Static XML Document from Web Server Filesystem 2c MyCoRe Layout Servlet 4 Output HTML Page

MyCoRe als Objektspeicher? + Open Source: Zugriff auf den Quellcode ist gegeben + Über IBM Content Manager: Hochgradige Skalierbarkeit, auch verteilt + Datenmodell und Schnittstellen XML / XSL basiert + Datenmodell eines Zeitschriftenservers ist abbildbar + Schnittstellen: OAI, HTTP & XML, Web Services via SOAP/JAX-RPC + MyCoRe / IBM CM Know How an 12 Universitäten (UB & RZ) - Noch in Entwicklung, viele Funktionen aber schon realisiert Ende des Jahres erste vollständige Demo-Applikation + Gestaltungsspielräume: Welche Funktionen / Schnittstellen sind für einen VZS Objektspeicher noch nötig?

Vielen Dank für Ihre Aufmerksamkeit! Haben Sie weitere Fragen? http://miless.uni-essen.de/ http://www.mycore.de/