DataCite DOIs, Services und Kooperationen 12.01.2016 Jan Brase, Britta Dreyer, Brigitte Hausstein, Birte Lindstädt Datenpublikationen mit DOIs persistent und zitierbar DataCite / Helmholtz Open Science Workshop
Warum Forschungsdaten publizieren? Transparenz und Nachprüfbarkeit der Forschungsergebnisse Nachnutzung in neuen Kontexten Vermeidung von Doppelarbeit Sichtbarkeit der Daten wissenschaftliche Reputation durch Zitationen Erfüllung der Anforderungen von Fördereinrichtungen wie DFG und EU oder der eigenen Institution Leitlinien zum Umgang mit Forschungsdaten (DFG) Open Data Pilot, Horizon 2020 2
Probleme Forschungsdaten sind nach wie vor größtenteils nicht öffentlich zugänglich Forschungsdaten werden nicht oder uneinheitlich mit Metadaten beschrieben Für das Referenzieren und Zitieren von Forschungsdaten hat sich bisher kein Standard durchgesetzt Widerstand bzw. wenig Bewusstsein bei den Forschenden 3
Forschungsdatenmanagement Maßnahmen zur Sicherstellung der Nutzbarkeit von Forschungsdaten für eigene/gemeinsame Nutzung im wissenschaftlichen Arbeitsprozess für eine Nachnutzung als Dokumentation der korrekten wissenschaftlichen Arbeitsweise für die Archivierung Ziele definieren Qualitätssicherung Replizierbarkeit Nachnutzbarkeit Data Management Pläne als Instrument 4
Lebenszyklus von Forschungsdaten Jens Ludwig, Harry Enke (Hrsg.): Leitfaden zum Forschungsdaten- Management. 2013 5
Übergreifende Aufgaben Jens Ludwig, Harry Enke (Hrsg.): Leitfaden zum Forschungsdaten- Management. 2013 6
DOI Resolving DOI als persistenter Identifikator verweist auf das Objekt selbst, ein DOI-Name bleibt unabhängig von URL-Änderungen gültig DOI-Namen sind zitierfähig DOI-Namen können in jedem Handleserver weltweit aufgelöst werden, ohne Kenntnis der Vergabeinstitution Weltweit bereits über 120 Mio. DOI-Namen vergeben, ein Großteil davon für elektronische Versionen von Zeitschriftenartikeln 7
DOI-Registrierung 1998 Gründung der International DOI Foundation (IDF) als übergeordnete Organisation Derzeit 9 Registrierungsagenturen Das IDF System garantiert vertrauenswürdige Verantwortlichkeiten, einheitliche Standards und Workflows DOI ist eine geschützte Marke DOI ist eine Vermarktung des technisch geprägten Handle Systems Mai 2012: Das DOI-System ist ISO Standard 26324 DOI steht für Publikation (Zitierfähigkeit, Nachhaltigkeit) 8
DOI-Registrierungsagenturen CrossRef Zeitschriftenartikel, Bücher, Konferenzberichte DataCite Forschungsdaten, graue Literatur, nicht-textuelle Materialien EIDR Filme, TV-Serien und andere kommerzielle Filmmaterialien Airiti, Inc. Traditionelle chinesische Materialien CNKI (China National Knowledge Infrastructure) Chinesische e-journals, Zeitungen, Dissertationen, Konferenzbände etc. ISTIC (The Institute of Scientific and Technical Information of China) Zeitschriften des chinesischen Marktes JaLC (Japan Link Center) wissenschaftliche und akademische Publikationen in Japan medra (multilingual European DOI Registration Agency) Internet- Dokumente 9 OP (Publications Office of the European Union) Dokumente der Europäischen Union
Historie von DataCite 2003: DFG Projekt der TIB mit World DataCenters bzgl. Publikation von Forschungsdaten 2005: TIB wird erste DOI-Registrierungsagentur für Forschungsdaten. Von Anfang an wird auch graue Literatur registriert. 03/2009: Paris Memorandum bzgl. der Zusammenarbeit von 6 europäischen Informationseinrichtungen 12/2009: Gründung von DataCite mit 7 Mitgliedern 10
DataCite Globales Konsortium getragen von lokalen Einrichtungen Fokus: Verbesserung des Zugangs zu und der Zitierung von Daten und anderen nicht-textuellen Inhalten In Kooperation mit Datenzentren und anderen Einrichtungen, die Daten vorhalten Auf dem DOI-System basierend mit Überlegungen andere Persitent Identifier (PID) aufzunehmen Gegründet am 1. Dezember 2009 in London Aktuell 24 Mitglieder + 8 assoziierte Mitglieder (2015) aus 19 Ländern; 27 Mitglieder + 8 assoziierte Mitglieder (2016) 11
DataCite Mitglieder ANDS Australian National Data Service BIBSYS, Norway British Library California Digital Library CERN European Organization for Nuclear Research CRUI Conference of Italian University Rectors ETH Zürich, Switzerland Gesis, Germany INIST-CRNS Institute for Scientific and Technical Information, France JaLC Japan Link Center Hungarian Academy of Sciences Library and Information Centre NRC-CISTI National Research Council Canada / Canada Institute for Scientific and Technical Information NRCT National Research Council of Thailand OSTI Office of Scientific and Technical Information, USA Purdue University Libraries, USA SAEON South African Environmental Observation Network Swedish National Data Service SUB Göttingen, Germany Technical Information Center of Denmark TIB, Germany TU Delft Library, The Netherlands University of Tartu, Estonia ZB MED, Germany ZBW, Germany 12 Neue Mitglieder 2016 CSIC - Spanish National Research Council FAO Food and Agriculture Organisation of the United Nations, Italy SPbSTU - Peter the Great St.Petersburg Polytechnic University Affiliated members Digital Curation Center, UK Microsoft Research, USA ICPSR Interuniversity Consortium for Political and Social Research, USA KISTI Korea Institute of Science and Technology Information BGI Beijing Genomic Institute, China IEEE, USA Harvard University Library, USA GWDG, Germany
DataCite Struktur Registrierungsagentur International DOI Foundation DataCite Geschäftsstelle (TIB) Mitgliedsinstitution Mitgliedsinstitution Associate Stakeholder Data Centre Data Centre Datenzentrum Data Centre Data Centre Datenzentrum 13
Ziele von DataCite Leichteren Zugang zu Forschungsdaten ermöglichen Akzeptanz von Forschungsdaten als relevanter, zitierfähiger Bestandteil des wissenschaftlichen Leistungsausweises stärken Datenarchivierung unterstützen, sodass Forschungsresultate verifiziert und nachgenutzt werden können Entwicklung von Standards, Workflows und Best Practices 14
DataCite Working Groups Metadata Working Group Weiterentwicklung des DataCite Metadatenschemas unter Berücksichtigung von bestehenden Standards und Anforderungen der Wissenschaft Policy and Best Practices Working Group (PBPWG) Leitlinien für DataCite-Mitglieder Empfehlungen für DOI-Vergabe und Zitierung von Forschungsdaten: Dynamische Daten, Versionierung, Granularität Verfolgen aktueller Entwicklungen und Initiativen Anstoßen und Begleiten von Entwicklungen bei Datacite 15
Workflow Metadaten & URL Datenzentrum DOI Kataloge/Suchportale Daten Wissenschaftler 16
Inhaltstypen 6.8 Mio DOI-Registrierungen bis 12/2015 für die folgenden Typen: 17
Metadaten I Vorgabe der IDF, ein Mindestmaß an identifizierenden Metadaten vorzuhalten DataCite Metadata Schema Metadatenschema für die Verlinkung von Daten und anderen Objekten Disziplinübergreifend Auf Dublin Core basierend
Metadaten II Struktur des Metadatenschemas Pflichtelemente, empfohlene und optionale Elemente Pflicht: Identifier, Creator, Title, Publisher, PublicationYear Mit nächster Version des Metadatenschemas ResourceType (z.b. Dataset, Image, Text) ebenfalls Pflicht Metadata Working Group: Weiterentwicklung des Metadatenschemas Aktualisierungen der kontrollierten Vokabulare Verbesserungen in der Dokumentation Austausch mit der Community 19
DataCite - Staff Executive Director - Trisha Cruise Technical Director - Martin Fenner (THOR) Senior Developer - Sebastian Peters Communication Director - Laura Rueda (THOR) Business Manager: - Britta Dreyer 20
THOR TECHNICAL AND HUMAN INFRASTRUCTURE FOR OPEN RESEARCH 30 month project (start: June 2015) funded by European Commission: Horizon 2020 budget of 3.5 Mio domains: high energy physics, life sciences, earth sciences, and humanities Natural next step from ODIN; in part implementing the ODIN Roadmap 21
THOR Participants Led by The British Library 10 project partners from 7 countries EMBL-EBI Elsevier Labs
THOR Inhalte What will THOR do? Technical = Human = seminars documentation information 23
DataCite Search Entwicklung aus dem THOR Projekt Nächster Schritt: ORCID-Auto update 24
DataCite Search CC License 25
DataCite Search Citation Service 26
DataCite Lab Search Add to ORCID 27
DataCite Search Profile 28
Metrics for Research Data Zitierungen (Data Citation Index) Daten werden nicht zitiert Keine Standards (Metadaten?, Referenzlisten?) Bereinigte Zugriffstatistiken http://www.projectcounter.org/ 29
Making Data Count (MDC) NSF founded project to design and develop metrics that track and measure data use data-level metrics (DLM) Citation tracking through full article search open access journals PLOS and Europe PMS DataCite is hosting the DLM service from PLOS 30 https://dlm.datacite.org/
Data-Level Metrics (DLM) Ein API für Metrics Eintrag im DataCite Search 31
DataCite Link Store Basis ist Lagotto open source application von PLOS Collect events around scholarly content (DOI Event Tracker) Article-Level Metrics, Data-Level Metrics und Software-Level-Metrics ORCID DataCite CrossRef Github Verschiedene Filter z.b. Anzeige aller Publikationen zu einer ORCID Zusammenarbeit mit CrossRef Ist die Zukunft für Metrics 32
DataCite Link Store Sources 33
DataCite Link Store Status 34
DataCite Link Store Software Citation Code repositories are the places where the actual work on software takes place If this is the first release of your code then you should give it a version number of 1.0. Fill in any release notes and click the Publish release button. The Github/Zenodo integration assigns a DOI to a particular Github release of a software repo 35 https://guides.github.com/activities/citable-code/ https://blog.datacite.org/software-citation-workflows/
DataCite Link Store Software Citation 36
Status Page 37
DataCite Services Links Blog Citation Formatter Content Resolver Data-Level Metrics Homepage Link Store MDS OAI-PMH Service Profiles Schema Search Statistics https://blog.datacite.org http://crosscite.org/citeproc http://data.datacite.org/ https://dlm.datacite.org https://www.datacite.org https://ls.datacite.org https://mds.datacite.org http://oai.datacite.org https://profiles.datacite.org http://schema.datacite.org https://search.datacite.org/ http://stats.datacite.org 38
ToDoList ORCID DataCite DOI ORCID in DataCite Metadata Feedback DataCite Labs projects 39
Kooperationen I Thomson Reuters Data Citation Index Harvesten von Metadaten über DataCite Vorteile für Kunden: Sichtbarkeit im Web of Science re3data.org Verzeichnis von Datenrepositorien Zusammenführung von re3data.org und Databib unter dem Dach von Datacite 40
Kooperationen II Research Data Alliance (RDA): DataCite affiliated member Endorsement of the Force11 Joint Declaration of Data Citation Principles 41
Kooperationen III In Zusammenarbeit mit CrossRef http://crosscite.org/citeproc/ Der Citation Formater stellt Zitierungen in über 100 Formaten bereit. http://crosscite.org/cn/ Über die Content Negotiation kann maschinell direkt auf verschiedene (vorher hinterlegte) Medienformate eines Objektes zugegriffen werden. Mit STM Verlagen Verbesserung des Zugriffs auf und der Findbarkeit von Forschungsdaten Förderung von bidirektionalen Verlinkungen zwischen Datensätzen und Publikationen in Datenarchiven Erhöhung der Sichtbarkeit von Links zwischen Publikationen und Datensätzen 42
Danke für Ihre Aufmerksamkeit! 43