Linked Open Projects. Nachnutzung von Projektergebnissen als Linked Data

Ähnliche Dokumente

Linked Open Projects Reuse of Project Results as Linked Data

Das Archivportal Europa Neuer Blick auf die eigenen Daten

Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour auf bibliografischen Metadaten

Auch der eigene Katalog als Quelle: Zusammenführung von elektronischer und gedruckter Fassung; verschiedenen Auflagen usw.: Fließender Übergang zu

Reporting Services und SharePoint 2010 Teil 1

RDF und RDF Schema. Einführung in die Problematik Von HTML über XML zu RDF

Arbeiten Sie gerne für die Ablage?

Anforderungen an die HIS

Karten-Freischaltung mit dem UNLOCK MANAGER

Sarah Hartmann. Von der Formalerschließung zum Metadatenmanagement II. 1 RDA, MARC und Co. Österreichischer Bibliothekartag 2011

Die Deutsche Nationalbibliografie in der Linked Data Cloud

Barrierefreie Webseiten erstellen mit TYPO3

BlueEvidence Services in Elexis

Freie und vernetzte Daten:

Artikel Schnittstelle über CSV

Benutzerhandbuch MedHQ-App

Anleitung OpenCms 8 Webformular Auswertung

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

Kurzanweisung für Google Analytics

bitte auf den Button Baudaten-Fenster öffnen klicken. (oder über das Menü -> STAMMDATEN -> BAUDATEN anklicken)

Solarstrom selbst erzeugen und speichern so geht s!

Ihre Interessentendatensätze bei inobroker. 1. Interessentendatensätze

Wie richten Sie Ihr Web Paket bei Netpage24 ein

Allgemeiner Leitfaden zum Einfügen suchmaschinenoptimierter Texte

Metadaten bei der Digitalisierung von analogen archivalischen Quellen. Kathrin Mileta, Dr. Martina Wiech

Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER

Bauteilattribute als Sachdaten anzeigen

LabTech RMM. Integration von Teamviewer. Vertraulich nur für den internen Gebrauch

Grundbegriffe der Informatik

Die Nationalbibliografie als Linked Data Technische Aspekte des Linked Data Service der DNB

Fragebogen. zur Erschließung und Sicherung von Online-Dokumenten. Auswahl von elektronischen Publikationen

AUTOMATISCHE -ARCHIVIERUNG. 10/07/28 BMD Systemhaus GmbH, Steyr Vervielfältigung bedarf der ausdrücklichen Genehmigung durch BMD!

Bekannte Fehler / Offene Punkte Online- Versorgungsschnittstelle

Anleitung. Update/Aktualisierung EBV Einzelplatz Homepage. und Mängelkatalog

e-books aus der EBL-Datenbank

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Die Entwicklung eines Glossars (oder eines kontrollierten Vokabulars) für ein Unternehmen geht üblicherweise in 3 Schritten vor sich:

Anleitung zur Daten zur Datensicherung und Datenrücksicherung. Datensicherung

Metadaten METS. Markus Schnöpf Berlin-Brandenburgische Akademie der Wissenschaften IDE. IDE Autumn School 2012, Chemnitz

Ihr CMS für die eigene Facebook Page - 1

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

SEMINAR Modifikation für die Nutzung des Community Builders

Um zusammenfassende Berichte zu erstellen, gehen Sie folgendermaßen vor:

Computerunterstützte Sacherschliessung in der Zentralbibliothek Zürich

Tragen Sie bitte im Anmeldefeld die Daten ein, die Sie von uns erhalten haben.

Anleitung über den Umgang mit Schildern

Anleitung zur Mailumstellung Entourage

Wahlmodul MI-IT-Workshop

So erstellen Sie nützliche Beschreibungen zu Ihren Tradingdaten

FULFILLMENT VON ALLYOUNEED

Schnittstelle DIGI-Zeiterfassung

Schulungsunterlagen zur Version 3.3

Anlegen eines virtuellen http Server unter Exchange 2003 mittels HOSTNAME

1 Einleitung. Lernziele. automatische Antworten bei Abwesenheit senden. Einstellungen für automatische Antworten Lerndauer. 4 Minuten.

Die Online-Meetings bei den Anonymen Alkoholikern. zum Thema. Online - Meetings. Eine neue Form der Selbsthilfe?

3. Neuen Newsbeitrag erstellen Klicken Sie auf das Datensatzsymbol mit dem +, damit Sie einen neuen Newsbeitrag erstellen können.

Whitepaper. Produkt: combit Relationship Manager. Einbindung externer FiBu-/Warenwirtschaftsdaten. combit GmbH Untere Laube Konstanz

TTS - TinyTimeSystem. Unterrichtsprojekt BIBI

Wenn Sie das T-Online WebBanking das erste Mal nutzen, müssen Sie sich zunächst für den Dienst Mobiles Banking frei schalten lassen.

Platzhalter für Bild, Bild auf Titelfolie hinter das Logo einsetzen. Was enthält der Online-Katalog der UB Braunschweig?

ACDSee Pro 2. ACDSee Pro 2 Tutorials: Übertragung von Fotos (+ Datenbank) auf einen anderen Computer. Über Metadaten und die Datenbank

teischl.com Software Design & Services e.u. office@teischl.com

Universal Dashboard auf ewon Alarmübersicht auf ewon eigener HTML Seite.

Dokumentenlenkung - Pflicht oder Kür-

:: Anleitung Hosting Server 1cloud.ch ::

Internet online Update (Internet Explorer)

Kurzanleitung OOVS. Reseller Interface. Allgemein

Meet the Germans. Lerntipp zur Schulung der Fertigkeit des Sprechens. Lerntipp und Redemittel zur Präsentation oder einen Vortrag halten

Acht Gute Gründe für Integration und einen Content Backbone

Facebook I-Frame Tabs mit Papoo Plugin erstellen und verwalten

Virtueller Seminarordner Anleitung für die Dozentinnen und Dozenten

Verkaufen Sie doch wo Sie wollen. Ihr einfacher Weg zu mehr Umsatz und dauerhaft steigendem Erfolg im E-Business

Hilfe zur Urlaubsplanung und Zeiterfassung

WORKSHOP für das Programm XnView

Benutzerhandbuch. Leitfaden zur Benutzung der Anwendung für sicheren Dateitransfer.

Website freiburg-bahai.de

Mehr Transparenz für optimalen Durchblick. Mit dem TÜV Rheinland Prüfzeichen.

Kapitalerhöhung - Verbuchung

Einrichten eines POP-Mailkontos unter Thunderbird Mail DE:

Mit Linked Open Data in die Zukunft

System-Update Addendum

Verwendung des IDS Backup Systems unter Windows 2000

Social viral - genial

Internet online Update (Mozilla Firefox)

Standard-Kontaktformular

Urlaubsregel in David

pro4controlling - Whitepaper [DEU] Whitepaper zur CfMD-Lösung pro4controlling Seite 1 von 9

Culturegraph. Plattform für Wissensvernetzung. Daniel Schäfer, Jürgen Kett

Einrichtung eines -Kontos bei Mac OS X Mail Stand: 03/2011

Stecken Sie Ihren USB Stick oder Ihre externe USB Festplatte in den USB Steckplatz des Sinus 154 DSL SE.

SEPA Lastschriften. Ergänzung zur Dokumentation vom Workshop Software GmbH Siemensstr Kleve / /

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Portfolio: "Die Ratten" von Gerhart Hauptmann

INDEX. Öffentliche Ordner erstellen Seite 2. Offline verfügbar einrichten Seite 3. Berechtigungen setzen Seite 7. Öffentliche Ordner Offline

7. Übung - Datenbanken

Kurze Anleitung zum Guthaben-Aufladen bei.

Konfiguration von Exchange 2000 zum versenden und empfangen von Mails & Lösung des SEND after POP Problems

RDS mit Summon, VuFind und SISIS-SunRise

Quick Reference Historie des Dokuments

Transkript:

Nachnutzung von Projektergebnissen als Linked Data Kai Eckert (Dipl.-Inf., Dipl.-Wirt.-Inf.) kai.eckert@bib.uni-mannheim.de Magnus Pfeffer (Dipl.-Inf., M.A. LIS) magnus.pfeffer@bib.uni-mannheim.de

Überblick Nachnutzung von Projektergebnissen Projekte Linked Data Service der UB Mannheim Ausblick

Was denn für Projekte? Projekte, die Daten erzeugen In vielen (Bibliotheks-)Projekten werden Daten erzeugt Aber auch in anderen Bereichen: Umfragen Census of Marine Life Studien...

Projekte Große Projekte Kleine Projekte Studenten Wissenschaftler Arbeitsgruppen BMBF, DFG... Hohe Qualität Spielereien

Was passiert mit den Daten? Die Nachnutzung der Daten ist wichtig... laut den Projektanträgen Die Nachnutzung ist schwierig Die Daten sind ja gar nicht repräsentativ... Da fehlen doch aber noch Daten... In der Qualität kann man das aber nicht verwenden... Da haben wir doch gar kein Feld mehr frei... Das ist ja gar nicht in XYZ 4.3... Wo kämen wir denn da hin......

Und Recht haben sie! Unterschiedliche Ansprüche bei Datenerzeugern und Datennutzern. Konkrete Anwendungen können oft im Vorfeld noch gar nicht bekannt sein. Integration in bestehende Datenbanken ist schwierig. Trotzdem sind die Daten wertvoll. Insbesondere in der Gesamtheit aller Projekte

Wo ist denn nun das Problem? Nachnutzung im Ganzen schwierig Nachnutzung erfordert Auswahl von Daten Aggregation von Daten Integration von Daten Hoher Aufwand für jede Datenquelle

Umsetzung Bisher Bisher Zugang Einheitlicher Zugriff Archive im Web Möglichkeit der Selektion Datenformat Einheitliche Syntax Maschinenlesbar CSV, XML Vokabular Nachvollziehbare Semantik Spaltenüberschrift Projektübergreifend Feldbeschreibung Ressourcen Verknüpfung mit den Ursprungsdaten Lokale/ uneinheitliche ID

Umsetzung Bisher Bisher Zugang Einheitlicher Zugriff Archive im Web Unhandlich Möglichkeit der Selektion Grob Datenformat Einheitliche Syntax Maschinenlesbar CSV, XML OK Vokabular Nachvollziehbare Semantik Spaltenüberschrift Projektübergreifend Feldbeschreibung Uneinheitlich Ressourcen Verknüpfung mit den Lokale/ Ursprungsdaten uneinheitliche ID Nicht eindeutig

Alternative: Linked Data Bisher Linked Data Zugang Einheitlicher Zugriff Archive im Web URI Dereferencing Möglichkeit der Selektion Sparql Datenformat Einheitliche Syntax Maschinenlesbar CSV, XML RDF Vokabular Nachvollziehbare Semantik Spaltenüberschrift externes Vokabular Projektübergreifend Feldbeschreibung Verknüpfbar Ressourcen Verknüpfung mit den Lokale/ URI Ursprungsdaten uneinheitliche ID

Projekte

Projekte mit Metadaten Konkordanzen Verknüpfung Katalogeintrag mit Katalogeintrag Verknüpfung Normdateneintrag mit Normdateneintrag Anreicherung Verknüpfung Katalogeintrag mir sonstigen Daten Erschließung Verknüpfung Katalogeintrag mit Normdateneintrag Datenservice Katalogdaten für Forschung und Lehre Zentrale Normdatenverwaltung

Automatische Erschließung Projekt Automatische Verschlagwortung nach STW DFG Projekt (2007-2009) Basis: Aufsatzdaten aus den Nationallizenzen Umfang: > 10.000 Abstracts Ziel: Qualitative Bewertung der Verfahren Daten im CSV-Format

Automatische Erschließung Ausgangsdaten Aufsatzdaten MAB2, Konversion nach Dublin Core einfach LCSH Schlagwörter vorhanden STW Als Linked Data (SKOS) verfügbar Herausforderungen Trennen der STW und LCSH Trennen von automatischer und manueller Erschließung Trennen der Ergebnisse von unterschiedlich parametrisierten Indexierungsläufen

Automatische Erschließung Umsetzung 1: Eigene Sub-Properties LCSH oder STW über concept scheme erkennbar manuell oder automatisch Lauf 1..n Trennung durch Auswahl der sub-property Zusammenführung durch Mapping sub-property dc:subject Skaliert nicht für viele Indexerläufe

Automatisches Erschließen Informationen über einzelne Zuweisung Metametadaten / Provenienz

Automatische Erschließung Umsetzung 2: Named Graphs Ausgangsdaten im eigenen Graph LCSH wahlweise als dc:subject oder sub-property Ergebnisse jedes Laufs des Indexers in separaten Graph Parameter, etc. als Properties des Graph-URLs STW wahlweise als dc:subject oder sub-property Trennung durch explizite Auswahl der Graphen in SparQL Zusammenführung durch Aggregation der Graphen Skaliert für viele Indexierungsläufe

Anreicherung von Katalogdaten Projekt SWBPlus Kooperation im Südwestverbund Zusatzinformationen für den Katalog: Inhaltsveerzeichnisse Klappentexte Cover Umfang: Alle Neuerscheinungen im Verbund Geschlossener Nutzerkreis

Anreicherung von Katalogdaten Ausgangsdaten Katalogdaten SWB MAB2, wahlweise MARC21 Anreicherungsinformationen XML Daten PDF / Bilddateien FTP Download Herausforderungen Abrufen der Anreicherung einzelner Titel Trennen der Primär- und Anreicherungsdaten Anreicherung über Verbundgrenzen hinweg

Anreicherung von Katalogdaten Umsetzung 1: getrennte Properties SWB-Katalogdaten in DC Anreicherungsinformationen mit eigenem Vokabular Umsetzung 2: named graphs Eigene Graphs für die unterschiedlichen Daten Freie Wahl des Vokabulars für Primär- und Katalogdaten Beide Varianten möglich Named graphs mit Vorteilen

Konkordanzen Projekt Abgleich SWB/HeBIS Umfang: 22 Millionen Titeldaten Ziel: Übernahme von Erschließungsdaten Daten Verbundabzüge in MAB2 Abgleichsdaten im CSV-Format Herausforderungen Transitive Hülle Schiere Datenmenge

Konkordanzen Umsetzung Eigene Property für Äquivalenz in Bezug auf Sacherschließung Eigener Graph zur Zusammenfassung der Äquivalenzinformationen aus einem Abgleichslauf Definition der Transitivität in OWL

Linked Data Service (LDS) der UB Mannheim

Linked Data Service der UB Mannheim Prototyp und Testsystem Vergleich von Softwaresystemen Skalierung bei großen Datenmengen Alternativen bei Darstellungen in RDF Testbed für die W3C Library Linked Data Incubator Group Testbed für die DCMI Metadata Provenance Task Group Showcase HTML Ansicht und RDF/XML Download Metadaten und Normdaten als Linked Data Verknüpfung mit bestehenden Angeboten Hosting von verschiedenen Projektdaten

Datensets SWB-Titeldaten 13.349.777 Titel HeBIS-Titeldaten 9.283.428 Titel RVK 813.586 Konzepte In Summe mehr als 178 Millionen RDF-Tripel

URI http://data.bib.unimannheim.de/data/swb/<ppn> http://data.bib.unimannheim.de/data/hebis/<ppn> http://data.bib.unimannheim.de/data/hbz/<ppn> http://data.bib.unimannheim.de/data/rvk/<notation> Beschreibung Titel aus dem Südwestdeutschen Bibliotheksverbund (SWB), <PPN> entspricht der internen Identifikationsnummer des SWB. Titel aus dem Hessischen Bibliotheksinformationssystem (HeBIS), <PPN> entspricht der internen Identifikationsnummer des HeBIS. Titel aus dem Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen (HBZ), <PPN> entspricht der internen Identifikationsnummer des HBZ. Klassifikationen nach der Regensburger Verbundklassifikation (RVK). <NOTATION> entspricht der RVK-Notation, das Leerzeichen wurde durch _ ersetzt (z.b. FB_1575).

URI Bezeichnung Hinweis dc:title Titel Haupttitel in Vorlageform plus Zusatz dc:creator Urheber Autoren in Ansetzungsform Nachname, Vorname oder Bezeichnung der Körperschaft. dc:contributor Mitwirkende/r Weitere Beteiligte, wie Herausgeber o.ä., in Ansetzungform Nachname, Vorname oder Bezeichnung der Körperschaft. dc:date Zeitangabe Erscheinungsjahr dc:publisher Verleger(in) Verlag isbd:p1008 has edition statement Informationen zur Auflage dc:identifier Identifikator Die ISBN als URI: uri:isbn:<isbn> dc:language Sprache Die Sprache, nach ISO 639-2 (B) dc:subject Thema Schlagworte nach SWD mit URI der DNB, Klassifikationen nach RVK mit URI der UB Mannheim (s.o.). rdfs:seealso siehe auch Links zu anderen Linked Data Angeboten, z.z. zum Book Mashup Dienst der FU Berlin. ubma:equals For Classification Andere Ausgabe Hierbei handelt es sich um das Ergebnis eines Projekts der UB Mannheim, das durch diesen Dienst leicht nachgenutzt werden kann.

UBMA SWB RVK dc:subject ubma:equalsforclassification ubma:equalsforclassification HeBIS ubma:equals For Classification HDZ dc:subject GND rdfs:seealso RDF Bookmashup

Linked Data Service (Public Beta) Website / Dokumentation http://data.bib.uni-mannheim.de/ Sparql Endpoint http://data.bib.uni-mannheim.de/sparql/ URI-Dereferencing (httprange-14) 303 Verweis auf HTML oder RDF Darstellung Technische Basis Zur Zeit Virtuoso Universal Server Andere Systeme in Evaluation

Einfache Nachnutzung Standardisierte Schnittstelle: select distinct?titles where { <http://data.bib.uni-mannheim.de/data/swb/305776088> ubma:equalsforclassification?titles. } titles http://data.bib.uni-mannheim.de/data/hebis/214418405 http://data.bib.uni-mannheim.de/data/hebis/212760327

Studentenprojekt Rechercheportal Wirtschaftsinformatik Laufzeit: 1 Jahr (HWS 2010, FSS 2011) 10 Studenten Aufbereitung bibliographischer Daten, Mashup Zugriff auf Daten der UB Mannheim via LDS Bedingung: Jegliche Datenaufbereitung wird als RDF, bzw, via Sparql-Endpoint zur Verfügung gestellt.

Ideen und Pläne Ergänzung der geladenen Daten Verlinkung von Personen und Körperschaften mit der PND Vollständige Implementierung der RVK als Linked Data Integration von Projektergebnissen und neuen Daten Automatische Inhaltserschließung Automatisch und manuell erstellte Konkordanzen Nutzungsdaten aus Katalog und Ausleihsystem Provenienzinformationen Know-How-Transfer

Viel Spaß beim Spielen! http://data.bib.uni-mannheim.de/ Vielen Dank für Ihre Aufmerksamkeit! http://slideshare.net/kaiec