Qucosa Project. Aufbau eines Cross Media Repository. https://creativecommons.org/licenses/by/4.0/



Ähnliche Dokumente
8. Tübinger Symposium Handschriften, Alte Drucke. VD16/17 Massendigitalisierung Neue Entwicklungen. 8. Tübinger Symposium Handschriften, Alte Drucke

Weitere Informationen finden Sie unter:

Kooperation & Nachnutzung der kopal- Lösung. Frank Klaproth

Acht Gute Gründe für Integration und einen Content Backbone

Praxisbeispiel: Deutsche Digitale Bibliothek

FORGE2015 HDC Session 4. Nachhaltige Infrastruktur als technologische Herausforderung. Tibor Kálmán Tim Hasler Sven Bingert

LZA-Metadaten für Retrodigitalisate. Anna Kugler

Referenz-Konfiguration für IP Office Server. IP Office 8.1

InfoPoint vom 9. November 2011

CONVERIS- OAR (Open Access Repository) Dr. Wolfram Schüßler

Das Repositorium für Forschungsdaten und publikationen der TU Berlin als Serviceplattform für die Wissenschaftler

DMC. Document Management and Control PMC. Project Management and Control. Programm-Information. Impressum 2. Allgemein 2 Kontakt 2

TYPO3 Slide Lightwerk GmbH

Installation des CMS-Systems Contao auf einem Windows-Rechner mit XAMPP

Best Practice: Integration von RedDot mit Livelink DM im Intranet/Extranet

Produktvorstellung: CMS System / dynamische Webseiten. 1. Vorwort

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

SAP NetWeaver Gateway. 2013

Goobi Community Edition

Das Open Text Media Management im Einsatz. Herausforderungen Best-Practice Erfahrungen

DiPP Golden Road zum Open Access

AS/point, Ihr Partner die nächsten 10 und mehr Jahre -

TYPO3 in der Praxis. KuKo Rosenheim. 21. Oktober 2009

Projekte verwalten mit TextGrid

Microsoft SharePoint 2013 Designer

Open Source / Open Content für das Lernen mit digitalen Medien: Billig und wenig Qualität? Prof. Dr. Hans-Werner Six FernUniversität Hagen

Free Software Strategy In the Public Administration of South Tyrol. 12. November 2010

PCC Outlook Integration Installationsleitfaden

Content Management System mit INTREXX 2002.

INDIVIDUELLE SOFTWARELÖSUNGEN CUSTOMSOFT CS GMBH

Open Content-Lizenzen für digitale Lernmaterialien

Dokumentenserver: Praxisfragen

Publikationsunterstützende Massnahmen von Bibliotheken am Beispiel von Open Access- Zeitschriften

Modernes Anliegenmanagement mit dem Mängelmelder

Aktualisierung der Lizenzierungsrichtlinien für Adobe Produkte

Der beste Plan für Office 365 Archivierung.

Langzeitarchivierung bei Datenträgern. Was wir dürfen und was wir dürfen sollten

Metadaten bei der Digitalisierung von analogen archivalischen Quellen. Kathrin Mileta, Dr. Martina Wiech

Website-Verwaltung mit Content Management Systemen

Die Zertifizierungsstelle der TÜV Informationstechnik GmbH bescheinigt hiermit dem Unternehmen

Content Management Datenbanken, Schnittstellen

Alles Backend oder was?

und der Helmut-Schmidt-Universität / Universität der Bundeswehr (HSU) Universitätsbibliothek (UB) Holstenhofweg Hamburg

Vermeiden Sie es sich bei einer deutlich erfahreneren Person "dranzuhängen", Sie sind persönlich verantwortlich für Ihren Lernerfolg.

Einrichten des Elektronischen Postfachs

Digitalisierung für Einsteiger. Praxisorientierter Workshop für Unternehmer

SOL-IT insurancecube. Verwalten. Verbinden. Überblicken.

Leistungsstarke Enterprise Apps. Für Menschen erdacht. Für Veränderungen entwickelt.

Alle alltäglichen Aufgaben können auch über das Frontend durchgeführt werden, das in den anderen Anleitungen erläutert wird.

Dissertation über MADOC veröffentlichen (10 Schritte)

Cornelia Diebel. Herausforderungen und Lösungsansätze in der Deutschen Nationalbibliothek

LCM-6 Digital Signage Software

Content Management Playout Encryption Broadcast Internet. Content Management Services

Discovery Service. Evolution oder Revolution?

BI in der Cloud eine valide Alternative Überblick zum Leistungsspektrum und erste Erfahrungen

Webseiten mit fragwürdigen Aufrufen von "spy & track" - Unternehmen

Langzeitarchivierung von Netzpublikationen Das DFG-Projekt BABS an der Bayerischen Staatsbibliothek

Rechtssichere -Archivierung

Phaidra Permanent Hosting, Archiving and Indexing of Digital Resources and Assets.

Verwenden von Adobe LiveCycle ES3 Connector für Microsoft SharePoint

Auktionen erstellen und verwalten mit dem GV Büro System und der Justiz Auktion

Unsere Produkte. Wir automatisieren Ihren Waren- und Informationsfluss. Wir unterstützen Ihren Verkaufsaußendienst.

Strategie & Kommunikation. Trainingsunterlagen TYPO3 Version 4.3: News Stand

Administrator Handbuch

Einleitung: Frontend Backend

Der Schutz von Patientendaten

Multichannel Challenge: Integration von Vertriebsorganisation und Contact Center in der Versicherung

S-Verein VereinshomepagePLUS

Gesetzliche Aufbewahrungspflicht für s

Übungen zur Softwaretechnik

Neue Funktionalität in mobidas 1.3. erp Serie

Dokumentenmanagement als Dienst (DMS as a Service, DaaS)

Netzgestalten

IT IS ,- US-$. 50 IT IS

Step by Step Webserver unter Windows Server von Christian Bartl

SERVICE SUCHE ZUR UNTERSTÜTZUNG

Der Kultur-Hackathon

UNIX-Stammtisch, TU Chemnitz. UNIX-Stammtisch: Chemnitz, Content Management mit TYPO3. Sebastian Meyer.

Lizenzierung von Windows Server 2012

INHALTSVERZEICHNIS Allgemeine Beschreibung... 3 Verwendung der Webseite... 4 Abbildungsverzeichnis... 12

Hilfe bei Adobe Reader. Internet Explorer 8 und 9

Content-Management- Systeme (CMS) Inhaltsverwaltungssystem, Redaktionssystem

Kriterienkatalog für DDB-Aggregatoren

Schulung Marketing Engine Thema : Einrichtung der App

1. Erstellung, aus einer Idee wird ein digitaler Bestandteil einer Website.

Einführung Software Domänenspezifische Anpassung Demo Ausblick. ERM mit OntoWiki. Andreas Nareike

Web Content Management

Migration von statischen HTML Seiten

INFORMATION LIFECYCLE AKTUELLE TRENDS IM INPUT MANAGEMENT CENIT EIM IT-TAG 13. JUNI 2013 IN STUTTGART LARS LAMPE

EIDAMO Webshop-Lösung - White Paper

1. Einschränkung für Mac-User ohne Office Dokumente hochladen, teilen und bearbeiten

Fragebogen zur Datenbank

Best Practice für Schulträger, Schulorganisationen und Schulzentren

Preise pdfmachine ZUGFeRD

Webseitenintegration. Dokumentation. v1.0

Lizenz Verwaltung. Adami Vista CRM

ONET: FT-NIR-Netzwerke mit zentraler Administration & Datenspeicherung. ONET Server

Fachkommission FH-Bibliotheken (FHB)

doubleslash Net-Business GmbH

Transkript:

Qucosa Project Aufbau eines Cross Media Repository https://creativecommons.org/licenses/by/4.0/

$ whoami Ralf Claussnitzer Sächsische Landesbibliothek Staats- und Universitätsbibliothek Dresden (SLUB) IT Abteilung seit 2008 Software Entwicklung und -Architektur WWW @claussni github.org/claussni

Ausgangspunkt Institutionelles Repositorium Qucosa Mandantenfähig Universitäten, Hochschulen, Forschungsinstitute, Bibliotheken Basierend auf OPUS 4 und TYPO3 Two-Tier: Web Service Backend + CMS Frontend Einfache IR Software Komplexes Content Management System Status Quo End-Of-Project = End-Of-Resources Veraltetet PHP Codebasis Nachfrage nach neuen/zeitgemäßen Features Resource Discovery System hat Recherchemaske nicht abgelöst

Gesamtlösung für alle Digitalen Objekte - 1 Anforderungen Hochschulschriftenserver Entwicklung von Pre-Print, über Post-Print-Volltext zu Gold Open Access Fokussierung auf Dissertationen im PDF Format Sekundär auch Bilder und Tondokumente, DVD Oft Einbettung in Webseiten der Universität Integration mit anderen System drangestrickt Anforderungen der DNB OAI-PMH Spezielles Protokoll mit inhaltlichen Aspekten: xmetadissplus Pflichtexemplarrecht und Administrative Workflows

Gesamtlösung für alle Digitalen Objekte - 2 Digitalisate Behandlung bisher getrennt von Repositorien in Digitalen Sammlungen und Bilddatenbanken Born Digitals und Retrodigitalisiate teilen sich viele Eigenschaften (URIs, Dateien, Präsentation im Web) Datenqualität deutlich homogener (Bilder, Beschreibungsformate wie METS/MODS) Metadatenerfassung meist ausreichend standardisiert

Gesamtlösung für alle Digitalen Objekte - 3 Sammlung vs. Langzeitarchivierung Möglichst umfassende Sammlung von Netzpublikationen erfordert Verringerung der (technischen) Qualitätsanforderungen (echte) Langzeitarchivierung erfordert aber hohe Qualität Umwandlung nicht immer möglich (oder erlaubt) Definition von Service Levels Nutzer schon bei der Abgabe Informieren Gute Archivierbarkeit Schlechte Archivierbarkeit Keine Archivierbarkeit

Perspektiven Born-Digitals und Retrodigitalisate gleichartig behandeln Digitale Objekte mit Metadaten und Anhängen Metadatenstandards voll ausnutzen Weg von Bibliothekarisch (/Katalog-) orientierten Datenbankschemata Organisatorisch-Technische Vorteile Verringerung der Systemvielfalt Weniger Technologien; Mehr Transparenz

Warum Fedora? Fedora fokusiert auf Infrastruktur Out-of-the-box Software fokussiert IR Anwendungsfälle und GUI Hohes Abstraktionsniveua Loose gekoppelte Dienste als Systemmodell Speicherung unabhängig vom Metadatenschema Unsere Anforderungen Weiterentwicklung des Metadatenschemas Vielzahl an Medientypen Veraltetet Speicherinfrastruktur Vollständige Migration ist keine Option Möglichkeit von irreperablen Inkonsistenzen

Architekturansatz - 1 Internet Services Presentation TYPO3 Administration OAI Fedora Elasticsearch SWORD Proai 1 API-A OAI River API Proai 2 API-M JMS API Proai n

Architekturansatz - 2 Weitere Verbesserungen Konsequente Verwendung von Message Bus Konzepten SOA mit Microservices Ablösung des Elasticsearch River Index ES Rivers werden nicht mehr unterstützt Apache Camel / SLUB d:swarm Projekt Datentransformation Nachrichten Routing Fedora 4.x Workspaces (Entwürfe) Hierarchische Datenbank Federated Storage

Stand der Entwicklungen Fedora 3.8.0-RC1 als Repository Generisch, Schemaunabhängig ElasticSearch 1.2.x Cluster-fähiger Suchindex (Lucene Core, REST API) Indexierung der Daten mit Fedora River (Eigenentwicklung) Fedora 4 nächster großer Schritt, aber: Fundamental anderes Konzept Migration von Fedora 3.x erst mit Fedora 4.1 geplant Generisches Messaging und Application Integration SLUB Datenmanagement Plattform d:swarm für Suchindex Ralf Claußnitzer, IT SLUB, (@claussni) 09.10.2014

Nachnutzung der Ergebnisse Open Source Projektergebnisse auf GitHub https://github.com/slub Lizensierung GPLv3 TYPO3 Frontend Apache License 2.0 Fedora Komponenten; Java Services Elasticsearch River Andere Open Source Lizenzen Für Erweiterungen bestehender Fedora Commons Dienste

Thanks! Questions?

Gesamtlösung für alle digitalen Objekte Anforderung: Open Access Publishing Plattform Weniger qualifizierte erschlossene Beiträge bedeuten mehr Aufwand für die Bearbeiter, mehr Nachfragen, mehr Änderungen Unter Umständen müssen Publikationsanfragen abgelehnt werden (keine Thematische Einschränkung, aber inhaltliche) Unklare Lizenzsituation bzw. Patentsituation kann zum Veranlassen einer Sperrung führen Häufig müssen Embargofristen beachtet werden (Konflikt mit Abgabe und Ablieferungspflicht DNB) Neue Veröffentlichung -> neue bibliothekarische Metadaten (schwierig bei einfachen Datenbankkonstruktionen) Dubletten (Erkennung? Repository muss potentielle Kandidaten finden und den Administratoren vorschlagen) Ralf Claußnitzer, IT SLUB, (@claussni) 09.10.2014

Gesamtlösung für alle digitalen Objekte Anforderung: Elektronische Pflichtexemplare (1) Gesetzliche geforderte Abgabe aller elektronisch Publikationen an die Bibliothek Basis: Pflichtexemplarrecht Zweck des Pflichtexemplarrechtes ist heute vorrangig die möglichst vollständige Archivierung aller Veröffentlichungen eines Landes als Zeugnis des kulturellen Schaffens, ihre bibliografische Dokumentation und die Zugänglichmachung für die Allgemeinheit. Die Bibliotheken sind deshalb gesetzlich dazu verpflichtet, Pflichtexemplare auf unbegrenzte Zeit aufzubewahren und eine Nationalbibliographie zu erstellen. (*) http://de.wikipedia.org/wiki/pflichtexemplar Ralf Claußnitzer, IT SLUB, (@claussni) 09.10.2014

Gesamtlösung für alle digitalen Objekte Anforderung: Elektronische Pflichtexemplare (2) 7 Beschaffenheit von Netzpublikationen und Umfang der Ablieferungspflicht (1) Unkörperliche Medienwerke (Netzpublikationen) sind in marktüblicher Ausführung und in mit marktüblichen Hilfsmitteln benutzbarem Zustand abzuliefern. Eine Pflicht zur Ablieferung besteht nicht, wenn die Ablieferungspflichtigen im Rahmen des 16 Satz 2 des Gesetzes über die Deutsche Nationalbibliothek mit der Bibliothek vereinbaren, die Netzpublikationen zur elektronischen Abholung bereitzustellen. Für die Ablieferung von Netzpublikationen gilt 2 Abs. 3 entsprechend; für die Bereitstellung zur elektronischen Abholung gilt 2 Abs. 3 Satz 1 entsprechend. (2) Die Ablieferungspflicht umfasst auch alle Elemente, Software und Werkzeuge, die in physischer oder in elektronischer Form erkennbar zu den ablieferungspflichtigen Netzpublikationen gehören, auch wenn sie für sich allein nicht der Ablieferungspflicht unterliegen. Dies gilt insbesondere für nicht marktübliche Hilfsmittel, die eine Bereitstellung und Benutzung der Netzpublikationen erst ermöglichen und bei den Ablieferungspflichtigen erschienen sind. Sie sind zusammen mit den Netzpublikationen abzuliefern oder zur elektronischen Abholung bereitzustellen. http://www.gesetze-im-internet.de/pflav/ 7.html Ralf Claußnitzer, IT SLUB, (@claussni) 09.10.2014

Gesamtlösung für alle digitalen Objekte Anforderung: Elektronische Pflichtexemplare (3) Nicht nur Open Access Publikationen Portale mit unterschiedlich lizensiertem Inhalt Formatqualität? Archivierbarkeit? Rechtliche Bedingungen? Keine freie Verfügbarkeit bei gleichzeitiger Ablieferungspflicht über öffentliche Schnittstellen? Wie dem Pflichtexemplar-Gesetz genügen? Bibliothek kann Veröffentlichung im archivierbaren Format fordern, aber diese Forderung durchzusetzen ist oft nicht praktikabel Schulung und Hilfe anbieten Ralf Claußnitzer, IT SLUB, (@claussni) 09.10.2014

Vorhandene Workflows vernetzen Workflows zur Bearbeitung von elektronischen Publikationen meist sehr individuell und Erfassungs-fokussiert Werkzeuge sind entsprechend spezialisiert Workflows für Digitalisate auf Durchsatz optimiert -> ohne Automatisierung ist dem Aufkommen eines Digitalisierungszentrums nicht beizukommen Produktion der digitalen Objekte unterschiedlich. Verwaltung und Präsentation hingegen sehr ähnlich! Technische Workflows: Archivierung, Backup, Migration, Datenhaltung, Bereitstellung Ralf Claußnitzer, IT SLUB, (@claussni) 09.10.2014

Verschiedene Präsentationsformate Liegen digitale Objekte in bekannten Formaten vor, können automatische (on-demand) Umwandlungen erfolgen, z.b. PDF als epub ausliefern Digitalisate werden bereits in herunterladbaren PDFs angeboten Inhaltsverzeichnisse, wenn Strukturmetadaten das hergeben Weiter denkbar: Video Anzeige Bildvorschau (Thumbnails) Audio Streaming OCR Text Einbettung Ralf Claußnitzer, IT SLUB, (@claussni) 09.10.2014