RESEARCH DATA REPOSITORY http://www.radar-projekt.org http://www.radar-service.eu RADAR Ein Forschungsdaten-Service für Archivierung und Publikation RESEARCH DATA REPOSITORY Frankfurt am Main, 06.-07.06.2016 Angelina Kraft Technische Informationsbibliothek (TIB), Hannover
Agenda für Montag, 06.06.2016 Willkommen & Kaffee - RADAR-Konzept, Services, Metadaten, Rollen- & Rechtemanagement - Systemarchitektur & Speicherinfrastruktur - Geschäftsmodell Mittagspause 13-14:00 Uhr - Live-Präsentation des Produktivsystems - 1. Diskussionsrunde Kaffeepause 15:30-15:45 Uhr - Angedachte Mehrwertdienste - 2. Diskussionsrunde Ende Tag 1-17:30 Uhr 2
Agenda für Dienstag, 07.06.2016 09:00 - Willkommen & Kaffee - Vorstellung API & Konfiguration - Anwendungsbeispiele Kaffeepause 10:30-10:45 Uhr - Diskussionsrunde Ende des Workshops, Mittagessen 12-13:00 Uhr 3
Projektübersicht Ziel: Etablierung eines Research Data Repository (RADAR) für wissenschaftliche Institutionen zur Archivierung und Publikation von Forschungsdaten Gewährleistung: Auffindbarkeit & Nachnutzbarkeit Fokus: Long Tail - ergänzendes Angebot, keine Konkurrenz zu etablierten Datenzentren generisches Repositorium Laufzeit: September 2013 August 2016 Projekt: System: http://www.radar-projekt.org http://radar-service.eu 4
Das Dienstleistungskonzept 1. Private Domäne 2. Kollaborative Domäne 3. Öffentliche Domäne 4. Domäne Dissemination Arbeitsplatz des Wissenschaftlers Infrastruktur des Instituts Suche Portal DataCite & mehr Fachportale, Wissenschaftler Datenauswahl Datendokumentation Datentypen / Datenformate Upload & Beschreibung Datenpakete Datenreview Verfügbarkeit Archivierung Publikation Nachnutzung Modifiziert nach Treloar, A., Harboe-Ree, C. (2008) Data management and the curation continuum. How the Monash experience is informing repository relationships. VALA2008 14th Biennial Conference, Melbourne Und Klump, J. (2009) Managing the Data Continuum. Online: http://oa.helmholtz.de/fileadmin/user_upload/data_continuum/klump.pdf 5
FDM Wohin mit den Daten? Herausforderung der long-tail Daten: Sehr heterogen Keine einheitlichen Prozesse bei der Datenerhebung, Speicherung & Publikation Kostenfaktor: Infrastruktur für Langzeitarchivierung & Publikation Lösungsansätze: Fachspezifische Datenrepositorien oder Interdisziplinäre Datenrepositorien Ein Praxisbeispiel: RADAR DFG-Ausschreibung: Überregionale Informationsinfrastrukturen Überblick: www.re3data.org Quelle: Ferguson et al. (2014): Big data from small data: data-sharing in the 'long tail' of neuroscience. DOI: 10.1038/nn.3838 The majority of datasets produced through research are part of the Long Tail of Research Data Quelle: Humphrey C (2014): OpenAIRE-COAR Conference, Athens 6
Suche: RADAR, DataCite & darüber hinaus 1. RADAR: Facettensuche Freier Zugriff auf alle publizierten Datenpakete 2. DataCite: Publizierte Datenpakete werden im Metadatenstore indexiert 3. Portale: Metadaten-Harvest über API, Beispiel ORCID & TIB (DataCite) 7
Arbeitsbereich: Upload, Share, Review Nutzerverwaltung: Anlage aller erforderlichen Nutzer im RADAR-System sowie die Vergabe von Rechten Optionale Vorgabe von Arbeitsbereich-Metadaten Upload & Bearbeitung von Datenpaketen 8
Archivierung Disziplinübergreifende Datenarchivierung Wählbare Haltezeiten (5, 10 oder 15 Jahre) RADAR Identifier Abgestufte Zugriffsrechte: - Default: Daten & Metadaten privat - Optional: Selektive Rechtevergabe, z.b. Zugriff für (externe) Partner/Kuratoren RADAR-ID Verlängerung, Publikation oder Löschung nach Ablauf der Haltefrist 9
Peer-Review Funktion Status in Begutachtung Nicht mehr editierbar Eindeutiger Link (URL + Token) Link kann an Verlag/Editor/Gutachter weitergeben werden Link = Zugriff auf Datenpaket ohne weitere Authentifizierung Abschluss der Begutachtung: Bearbeitungsmodus oder Publikation Peer-Review Zeitraum: Bis zu 6 Monate Datenpaket im temporären Speicher URL URL 10
Publikation Erweitertes Angebot Datenpublikation Open Data DataCite DOI Nachnutzungsrechte Optionales Embargo: 1-12 Monate Metadaten CC0 Lizenz Metadaten harvestbar über OAI-PMH (RADAR/DataCite/DublinCore) Automatisierte Anbindung an Dienste wie - DOI Event Tracker - Thompson Reuters Data Citation Index - Altmetric,. API DOI DOI 11
Adaptives Metadatenschema 10 Pflichtparameter Identifier* (RADAR-ID/DOI) Creator* Title* Publisher* Production year or time span Publication year* Subject area Resource* Rights* Rightsholder 12 Optionale Parameter Additional title Description Keyword Contributor Language* Alternate identifier* Related identifier* Geo location* Data source Software type Data processing Related information Ziel: Minimale Metadaten, die das Datenpaket hinreichend beschreiben * basiert auf Metadata Kernel v3.1 12
Adaptives Metadatenschema How To: Metadaten Upload via User Interface oder API UI: Manuelle Eingabefelder oder Upload XML-Datei Arbeitsbereich Template: Möglichkeit einer Metadaten-Vorlage Features: Archivierung: Metadaten nicht öffentlich default / optional anpassbar Publikation: Metadaten öffentlich, CC0, harvestbar über OAI-PMH Pflichtfelder auf Ebene/Entität eines Datenpakets Optionale Metadaten für Unterverzeichnisse/Dateien Kompatibel zu DataCite, Dublin Core Resource Type = Pflichtfeld (Dataset, Collection, Model, Software, ) als Voraussetzung für Indexierung in externen (Fach)Portalen 13
Status für Datenpakete In Bearbeitung - PENDING Initialer Status, Datenpaket kann bearbeitet werden (Modifizierung, Update, Löschung) Datenpaket im temporären Speicher In Begutachtung - IN REVIEW Datenpaket wurde zur Begutachtung bei Verlag/Editor eingereicht und ist temporär gesperrt; Review-URL Datenpaket im temporären Speicher Archiviert - ARCHIVED Datenpaket ist archiviert & mittels RADAR ID identifiziert (keine weitere Bearbeitung) Publiziert - PUBLISHED Datenpaket ist publiziert & mittels DOI identifiziert (keine weitere Bearbeitung) 14
Rollen & Rechte Kurator(en) verwaltet, gibt Daten ein gewährt Zugriff Administrator (Vertragspartner) verwaltet Forschungsdaten & Metadaten im Arbeitsbereich gibt Daten ein Sub-Kurator(en) erzeugt Review (optional) Freigabe Gesicherte URL Ansicht Metadaten & Datendownload Editor/ Reviewer Unregistrierter Nutzer Ansicht Metadaten & Datendownload Archivierung oder Publikation Datendownload Ansicht Metadaten Ansicht Metadaten & Datendownload Registrierter Nutzer
Forschungsdaten FAIR Principles Findable auffindbar Accessible zugänglich Interoperable kompatibel Quelle: Wilkinson et al. (2016) The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data DOI: 10.1038/sdata.2016.18 Reuseable wiederverwendbar 16
Zusammenfassung: Forschungsdaten in RADAR Findable auffindbar Facettensuche, DOI, sowie Interoperabilität zu nationalen & globalen Datennetzwerken (z.b. DataCite) Accessible zugänglich Möglichkeit der Archivierung oder Publikation Interoperable kompatibel (Meta)Daten über Schnittstellen verfügbar (z.b. OAI-PMH / API) Reuseable wiederverwendbar Kuration, Review, Download, Lizenzen für Nachnutzung 17
RESEARCH DATA REPOSITORY http://www.radar-projekt.org http://www.radar-service.eu Ende Teil 1 - Vielen Dank für Ihre Aufmerksamkeit! Kontakt: info@radar-projekt.org angelina.kraft@tib.eu