Frank Lützenkirchen, Universitätsbibliothek Duisburg-Essen Import und Anreicherung von Metadaten Dieses Werk ist lizenziert unter einer Creative Commons Namensnennung 4.0 International Lizenz.
Motivation Universitätsbibliographie, Repositorium Einfacher Import von Publikationsdaten Anreichern vorhandener Datensätze Zusammenführen von Dubletten Automatisierter Import über RSS-Feeds (Scopus, PubMed: RSS > Publikations-ID > Import) Basisfunktionalität als Framework mit Implementierungen in MyCoRe, Modul mycore-mods 2
MODS Enrichment Resolver Import von Publikationsdaten über beliebige, konfigurierbare Identifier, z. B. DOI, IEEE Article No., PubMed ID, ISBN, PPN, ISSN, ZDB ID, Signatur, Beliebige, konfigurierbare Datenquellen Konvertierung nach MODS (i.d.r. via XSL) Zusammenmischen mit vorhandenen Daten: anreichern und verbessern Sequentiell und iterativ für alle Ebenen der Publikation (Publikation, Überordnung, Serie) 3
Beispiel-Konfiguration Datenquellen # Configuration to import new publication by given ID: MCR.EnrichmentResolver.DataSources.import =EVALuna IEEE (Scopus PubMed CrossRef DataCite) (Aleph LOBID GBV SWB) ZDB JOP # Scopus MCR.EnrichmentResolver.DataSource.Scopus.IdentifierTypes=doi scopus MCR.EnrichmentResolver.DataSource.Scopus.doi.URI =xslstyle:scopus2mods,genre2genre:%mcr.scopus.api.url%abstract/doi/{0}?apikey= MCR.EnrichmentResolver.DataSource.Scopus.scopus.URI =xslstyle:scopus2mods,genre2genre:%mcr.scopus.api.url%abstract/scopus_id/{0}?apikey= # CrossRef MCR.EnrichmentResolver.DataSource.CrossRef.IdentifierTypes=doi MCR.EnrichmentResolver.DataSource.CrossRef.doi.URI =xslstyle:crossref2mods, :http://api.crossref.org/works/{0}/transform/application/rdf+xml 4
Konfigurierbarer Ablauf EVALuna IEEE Scopus PubMed CrossRef DataCite Aleph LOBID GBV SWB ZDB sequentiell, iterativ: vertikal: Alle Datenquellen werden befragt horizontal: Die erste positiv antwortende Datenquelle gewinnt, weitere überspringen JOP 5
Beispiel: Import via DOI 6
Beispiel: Import via DOI 7
Beispiel: Import via DOI 8
MODS Merger Die gleiche Publikation in verschiedenen Datensätzen Zusammenmischen der Daten auf MODS Ebene, hierarchisch, iterativ, konfigurierbar Nicht vorhandenene Daten ergänzen Vorhandene Daten ggf. durch bessere ersetzen Zusammenführen von Datenquellen beim Import Anreichern vorhandener Daten aus externen Quellen Zusammenführen von Dubletten 9
identisch vs. gleich vs. besser <mods:name type="personal"> <mods:displayform>mueller, T.</mods:displayForm> <mods:nameidentifier type= orcid >0001-1234-5678-9999 </mods:nameidentifier> </mods:name> + <mods:name type="personal"> <mods:namepart type="family">müller</mods:namepart> <mods:namepart type= given">thomas</mods:namepart> </mods:name> = <mods:name type="personal"> <mods:namepart type="family">müller</mods:namepart> <mods:namepart type= given">thomas</mods:namepart> <mods:nameidentifier type= orcid >0001-1234-5678-9999 </mods:nameidentifier> </mods:name> 10
Ausblick Weitere Datenquellen: Web of Science, EZB, Primo Central, DOAJ, JCR, OADOI, Sherpa/Romeo Anreichern von Autoren-IDs (ORCID, lokal) über Affiliation, E-Mail 11
Vielen Dank für Ihre Aufmerksamkeit! Frank Lützenkirchen Leiter Dezernat Digitale Bibliothek Universitätsbibliothek Duisburg-Essen frank.luetzenkirchen@uni-due.de 12