Data-Pilotprojekt UZH Forschungsdatenmanagement - Services und Infrastrukturen Daniel Gloor, HBZ daniel.gloor@hbz.uzh.ch Hauptbibliothek 12.6.2017 Data-Pilotprojekt UZH, Daniel Gloor Seite 1
Is there a reproducibility crisis? Baker, M. (2016). 1,500 scientists lift the lid on reproducibility. Nature 533: 452-454. 12.6.2017 Data-Pilotprojekt UZH, Daniel Gloor Seite 2
Wie können wir der Krise begegnen? Gutes Forschungsdatenmanagement Forschungsresultate werden nachvollziehbar reproduzierbar nachnutzbar http://www.data.uzh.ch 12.6.2017 Data-Pilotprojekt UZH, Daniel Gloor Seite 3
Forschungsdatenmanagement Support Data Management Support Data Management Planning Active Data Infrastructure Data Repository 12.6.2017 Data-Pilotprojekt UZH, Daniel Gloor Seite 4
Situation UZH Was fehlt im Bereich Forschungsdatenmanagement? Im Vergleich mit anderen LERU Mitgliedern: Go-To Person / Zentrale Anlaufstelle Beratungsangebot (Datenmanagementpläne) Infrastruktur für Datenablage / Datenpublikation Ab Oktober 2017: Neue SNF Open Research Data Richtlinien 12.6.2017 Data-Pilotprojekt UZH, Daniel Gloor Seite 5
Data-Pilotprojekt HBZ - Vorgehen Projektpartner Hydrologie und Klima Gruppe (Prof. Dr. Jan Seibert) Epidemiologie chronischer Erkrankungen (Prof. Dr. Milo Puhan) Fragestellungen Bedürfnisse im Bereich Forschungsdatenmanagement? Anforderungen Infrastruktur für die Datenablage, Datenpublikation, Datenarchivierung? Welche Dienstleistungen können von HBZ / ZB angeboten werden? Business Case Bottom-up Vorgehen 12.6.2017 Data-Pilotprojekt UZH, Daniel Gloor Seite 6
Konkrete Bedürfnisse (1) Hydrologie (Bsp. Niederschlagsmessungen/Abflussmessungen) Möglichkeit zur einfachen, geschützten Ablage von Felddaten Problem: Nachvollziehbarkeit von Daten aus PhD und Postdoc Projekten Datenannotation Möglichkeit zum Teilen und Publizieren der Daten Schnittstellen für Datenvisualisierungen Langzeitarchivierung der Daten 12.6.2017 Data-Pilotprojekt UZH, Daniel Gloor Seite 7
Konkrete Bedürfnisse (2) Epidemiologie (Bsp. Langzeit-Kohortenstudien) Geschützte Ablage von Studiendaten (Fragebogendaten, inkl. Messungen von physiologischen Parametern) Sensitive Daten Definition von Zugangsbeschränkungen Versionskontrolle Möglichkeit zum kontrollierten (geschützten) Teilen der Daten Langzeitarchivierung der Daten 12.6.2017 Data-Pilotprojekt UZH, Daniel Gloor Seite 8
Zwischenfazit Fehlende Angebote vor allem im Bereich der Datenablage inkl. Datenarchivierung Anforderungen von der geschützten Datenablage bis hin zur Datenpublikation Institutionelles Datenrepositorium, wo disziplin- oder fachspezifische Lösungen fehlen («long-tail») Langzeitarchivierung der Daten, >10 Jahre (SUK P-2 DLCM) 12.6.2017 Data-Pilotprojekt UZH, Daniel Gloor Seite 9
Infrastrukturkomponenten Speicher / Hosting «Datentresor» Metadaten Daten- Repositorium Geschützte Datenablage Datenpublikation FAIR Prinzipien Schnittstellen 12.6.2017 Data-Pilotprojekt UZH, Daniel Gloor Seite 10
Testinstallationen Repositorium Software Ziel Testen von Benutzeroberflächen (Usability) Testen von Datenablage Workflows Sammeln von Erfahrungen im Einrichten, Konfigurieren und Betrieb eines Datenrepositoriums Vorgehen Vorevaluation von Open Source Lösungen Auswahl von geeigneten Software Kandidaten 12.6.2017 Data-Pilotprojekt UZH, Daniel Gloor Seite 11
Testinstallationen Dataverse Erfüllt out-of-the-box schon viele Anforderungen Einfache aber komplette User Interfaces Fokus auf Open Data Publikationen, jedoch geschützte Datenablage möglich Bisher erhaltene Feedbacks mehrheitlich positiv https://dataverse.org/ 12.6.2017 Data-Pilotprojekt UZH, Daniel Gloor Seite 12
Ausblick Institutionelles Datenrepositorium soll Bestandteil des Business Case sein DSpace Testinstallation für weitere Tests (neu hinzugekommene Anforderungen) Definition von Workflows / Review Prozesse für die Datenablage 2. Hälfte 2017 Zeit für «Community Outreach» 12.6.2017 Data-Pilotprojekt UZH, Daniel Gloor Seite 13
Danke für Ihre Aufmerksamkeit! 12.6.2017 Data-Pilotprojekt UZH, Daniel Gloor Seite 14