Dr. Silke Schomburg (hbz), Jürgen Kett (DNB) Die Evaluierung der Verbundsysteme Stand der Planungen in den Verbünden
DFG-Ausschreibung T1 Neuausrichtung überregionaler Informationsservices 2 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
Stand in den Verbünden Mehrere Planungssitzungen der AG Verbundsysteme Ziel: gemeinsames Vorgehen Offene Gespräche zu potentiellen Themenfeldern nach der Sitzung bei der DFG im Juli 2011 Offenlegen der Präferenzen bzw. der möglichen Interessensgebiete Veröffentlichung der DFG-Ausschreibung im Jan. 2012 Termine: 30.3., 15.5., 15.10.2012, Förderbeginn 2013 3 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
Kernforderungen der DFG-Ausschreibung Nationaler Nachweis: Deduplizierte Daten zusammengeführt auf (zumindest) nationaler Ebene Katalogisierung: Funktional einheitliche Katalogisierungs- und Datenplattform Datenschutz: Datenhoheit im nationalen Rechtsraum (ohne eingrenzende Nutzungsregeln) Nutzungsrechte: Datenbereitstellung zur freien Nachnutzung (Linked Open Data) 4 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
Kernforderungen der DFG-Ausschreibung (2) Offene und dokumentierte Schnittstellen Anbindung an web-basierte Endnutzersysteme (unter Wahrung datenschutzrechtlicher Bestimmungen) Einbettung in ein organisatorisches Gesamtkonzept Nachhaltiger Betrieb einschließlich geeigneter Geschäftsmodelle 5 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
Erwartungen an die Projektergebnisse Der bestehende Servicelevel muss gehalten / verbessert werden Ergebnisse müssen auch ohne Förderung tragfähig sein (Förderung ist Anreiz, nicht Anlass oder Bedingung) Konkrete produktive Resultate bereits vor und während der Projektlaufzeit Aber auch: Über das Projektende hinausgehende Weichenstellungen (Projektende ist nicht Ende der Entwicklungslinie) 6 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
Idee: Serviceplattform 7 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
Serviceplattform: synergetische Arbeitsteilung Gemeinsame Dienstleistungen aus einem Guss / geschlossenes Auftreten Gemeinsam gepflegte Infrastruktur und Daten als Basis: Erweiterbare und offene Plattform Einbindung Dritter über offene Schnittstellen Verteilte serviceorientierte Architektur Integration ins Web / Linked Open Data Echtzeitsynchronisation über moderne Webstandards
Ziele Veränderung der klassischen Verbunddienstleistungen Innovation durch Öffnung und Transparenz Orientierung an heterogenen Benutzergruppen Öffnung der Systeme für potentielle neue Dienstleistungen 9 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
Eine Bibliothekarin Das System soll meine tägliche Arbeit und meine Arbeitsabläufe optimal unterstützen. 10 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
Ein Bibliotheksbenutzer Was kann ich hier finden? Wie kann ich darauf zugreifen? 11 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
Eine Wissenschaftlerin Ich muss alle relevanten Informationen zu einem Thema finden und für meine wissenschaftliche Arbeit nachnutzen. 12 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
Ein Techniker Ich brauche eine gut dokumentierte und stabile API und offene Daten. 13 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
Umsetzung 14 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
Drei Phasen
AGV-Aktivitäten Beispiel Culturegraph 16 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
Herausforderung: Datenvernetzung Retrospektive Vernetzung: - Bestehende Datenbestände vernetzen/verknüpfen - Dubletten erkennen und zusammenführen Künftige Erschließung - Keine Dubletten entstehen lassen - Keine Doppelarbeit mehr - Gemeinsame Identifier Vernetzung mit Dritten 17 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
culturegraph als Wegweiser in der LOD-cloud verschiedene Dienste Resolving & Lookup-Dienst?! verschiedene Schnittstellen versteckte Dubletten LOD- Anbieter 19 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
Erreichter Stand Projekt erfolgreich abgeschlossen Skalierbare, performante Infrastruktur wurde aufgebaut Aktueller Datenbestand: - Monografien seit 1945 - aktuell ca. 88 Mio. Datensätze im System - Siehe https://wiki1.hbz-nrw.de/display/ SEM/Datenlieferungen+der+Verbuende Beta-Dienst online: http://culturegraph.org 20 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
Webdienst Demonstrator
Weiteres Vorgehen Datenlieferung: - Bereinigung fehlerhafter EKI-Verwendung - Regelmäßige Datenlieferungen in MARC21 Folgeprojekte: - Retrospektive Vernetzung der AGV: Intensive Nutzung der Plattform - Künftige Erschließung: Integration von CG in den Erschließungsprozess - Vernetzung mit Dritten: Erweiterung um weitere Fremddaten 22 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
Vielen Dank! 23 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
Anhang 24 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
Warum Linked Data? Datensilos Weltweite Datenbank aus vernetzten Daten 25 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
1. Use URIs as names for things 2. Use HTTP URIs so that people can look up those names. 3. When someone looks up a URI, provide useful information, using standards (RDF, SPARQL) 4. Include links to other URIs, so that they can discover more things (Tim Berners-Lee, 2007)
NPs, Wikipedia, Homepages, Dienste Linked Data Wissenschaftl. Daten Soziale Daten Nachrichten, Ereignisse Normen, Standards Internat. Bibliografien Gebäude Kunstwerke Archivalien
Offen und dynamisch - externe Datasets: Verlagsdaten, soziale Netze, Wikipedia, Nachrichten, etc. - Qualitätssicherung: z.b. Selbstkontrolle durch Community Qualitätsgeprüfte Automatismen - Automatische Verfahren zur Vermittlung zwischen Kern und Sphäre. - Gepflegt und verwaltet durch KWEs z.b.: Vernetzungsverfahren auf culturegraph.org Stabil und verlässlich - Persistente Knoten mit einer strikten, transparenten Policy: keine Löschungen, Versionierung - Gepflegt und verwaltet durch Kulturund Wissenschaftseinrichtungen (KWE) Basierend auf etablierten Standards
Culturegraph: Datenmodell CG A B C Cache [MARC21] a b c identifizierende Merkmale A B C Datenquelle (aktuellster Stand) Partner A Partner B Partner C 29 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
Culturegraph: Beispiel Katalogisierung D 6 1? (Titel, isbn,...) CG abc ac 2 acd abc 5 3 C A C Partner C D A A 4 A A B Partner D Partner A Partner B 30 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
Culturegraph Beispiel: Resolving URI für einen einzelnen Datensatz: http://www.culturegraph.org/about/bsz- 282649239/html Persistente URI für die durch den Datensatz beschriebene Manifestation: http://www.culturegraph.org/resource/urn:nbn:de:eki: BSZ282649239 (noch nicht produktiv / erst nach Datenbereinigung und Neulieferung) 31 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012
Culturegraph Beispiel: Lookup Eingabe: OCLC-Nummer 241527647 Rückgabe: - Trefferset mit allen Manifestationen, die diese OCLC-Nummer haben (im Idealfall genau ein Treffer), z.b.: urn:nbn:de:eki:bsz282649239 - Trefferset mit allen Datensätzen, die diese OCLC-Nummer haben: - BSZ-282649239 - BVB-BV023393003 - HEB-202503178 Aktueller Stand: http://www.culturegraph.org/search?query=id%3a2415 27647 32 Sektion IV: Die Evaluierung der Verbundsysteme - Stand der Planungen 28.03.2012