Workshop: Forschungsdatenmanagement 18. Juni 2015 Forschungsdateninfrastruktur das Konzept des Landes Baden-Württemberg Gerhard Schneider (direktor@rz.uni-freiburg.de)
Übersicht Grundlegende Infrastrukturen Projektvorbereitungsphase Erhebung / Verarbeitung von Forschungsdaten Forschungsdatenspeicherung Archivierung / langfristige Zugriffssicherung Nachweissysteme zu Forschungsaktivitäten Problemerkennung Forschungsdateninfrastruktur -- das Konzept des Landes Baden-Württemberg 2
FDM in Baden-Württemberg Status Quo - Dezentrale, variierende Angebote von lokalen E-Science Diensten der Landesuniversitäten Allgemein: Dokumenten- bzw. Volltextserver für Artikel, Dissertationen und Studienarbeiten Unterschiedliche Ausprägungen - Lokale Repositorien (falls vorhanden) - Lokale Beratungsangebote - Landesweite escience-dienste (bw*-dienste) Vom MWK geförderte Projekte Forschungsdateninfrastruktur -- das Konzept des Landes Baden-Württemberg 3
Grundlegende Infrastrukturen Baden-Württembergs extended Lan (BelWü ) Verbindet Universitäten, Hochschulen, Schulen, öffentliche Bibliotheken und sonstige wissenschaftliche und öffentliche Einrichtungen Aktuell: 100G zwischen den Universitäten bwidm - Föderatives Identitätsmanagement der badenwürttembergischen Hochschulen - Seit Juni 2013 im Betrieb - Basis für alle standortübergreifenden bw-dienste Large Scale Data Facility (LSDF) - Zentralisierter Großspeicher (5 PB) - Grundlage der Dienste bwsync&share, bwdataarchiv, bwfilestorage, Forschungsdateninfrastruktur -- das Konzept des Landes Baden-Württemberg 4
Projektvorbereitungsphase Ausgangssituation - Gesteigertes Bewusstsein bzgl. Wert wissenschaftlicher Daten - Gedanke: Aus öffentlichen Geldern geförderte Forschung soll allen zugutekommen. Das betrifft auch die erhobenen Daten. - Drittmittelgeber fordern von Wissenschaftlern immer häufiger einen Datenmanagementplan (DMP) oder ähnlichen Punkt ein. DMP wichtig für die Fokusierung - Definition Nachnutzungsszenarien - Reduktion der Datenmenge (ggfls! Regeln?) - Planung für die Datenaufbewahrung zu Beginn (!!) Ein DMP-Tool kann Wissenschaftler{{},inne}n Arbeit bei der Erstellung eines effektiven DMPs abnehmen. Forschungsdateninfrastruktur -- das Konzept des Landes Baden-Württemberg 5
DMP-Tool DMP-Tool - Teilaspekt des IQF-Projektes: Landesweit koordinierte Strukturen für Nachweis und effiziente Nachnutzung von Forschungsdaten DMP-Tool als BW-weite FDM Infrastruktur - Soll von mehreren Einrichtungen genutzt werden können, gleichzeitig sollen lokale Anpassungen und lokale Inhalte möglich sein - Aufwand für Betrieb und Weiterentwicklung soll möglichst gering sein Das Tool soll als kooperatives Instrument im badenwürttemberg-weiten (gerne auch deutschlandweiten) FDM eingesetzt werden können Forschungsdateninfrastruktur -- das Konzept des Landes Baden-Württemberg 6
Erhebung / Verarbeitung von FD Baden-Württembergs Umsetzungskonzept für das Hochleistungsrechnen (bwhpc) - Steigende Leistungsklasse von 3 bis 0 Forschungsdateninfrastruktur -- das Konzept des Landes Baden-Württemberg 7
Erhebung / Verarbeitung von FD Virtuelle Forschungsumgebung - Aktuell u.a. im E-Science Förderprogramm vom MWK - Standardisierte Images fördern nachvollziehbare und archivierbare Umgebungen Beispiel CernVM - provide all the building blocks for a virtualised analysis environment for High Energy Physics experiments. - Vorläufer: bwlehrpool / eklausuren Minimalinvasiv - Parallel zu bestehenden Installationen Integration in lokale Umgebung - Images abstrakt, damit zwischen Einrichtungen austauschbar - unabhängig von dem ausgewählten virtuellen Labor Forschungsdateninfrastruktur -- das Konzept des Landes Baden-Württemberg 8
Kooperative Infrastruktur Forschungsdateninfrastruktur -- das Konzept des Landes Baden-Württemberg 9
Forschungsdatenspeicherung bwsync&share - Dropbox Ersatz Online-Speicherdienst für Mitarbeiter und Studenten in BW - Externe Nutzer bei Freigabe zugriffsberechtigt - Infrastrukturproblem typisch für Projekte Nicht für personenbezogene Daten vorgesehen 25 GB/User für Forschungsdaten meistens zu wenig Fachunabhängige Repositorien - HeiDATA (Uni Heidelberg), MADATA (Uni Mannheim), FreiDok plus* (Uni Freiburg) *Aktuell noch im Aufbau Forschungsdateninfrastruktur -- das Konzept des Landes Baden-Württemberg 10
Archivierung / langfristiger Zugriff TSM/ADSM - Archivierungsangebot über TSM von vielen Landesuniversitäten angeboten - Überwiegend unbegrenzte Haltedauer - Wahrnehmung Wird überwiegend von Projekten / Arbeitsgruppen verwendet => geringere Nutzung von einzelnen Forschern - Problem Kein Archiv im eigentlichen Sinne Ausgelagertes Metadatenmanagement bwdataarchiv - Aufbau einer technischen Infrastruktur zur digitalen Langzeitarchivierung - Entwicklung eines Dienstes Langfristige Aufnahme z.b. Daten von abgeschlossenen Projekten Grundlage für verschiedene andere Dienste - z.b. RADAR, bwdatadiss Forschungsdateninfrastruktur -- das Konzept des Landes Baden-Württemberg 11
Archivierung / langfristiger Zugriff RADAR (Research Data Repository) - Entwicklung deutschlandweiter Dienst - Bestimmbare Zugriffsrechte, Persistente Referenzierung - Publikationsangebot Dauerhafte Archivierung - Archivierungsangebot Daten nicht öffentlich sichtbar, Haltedauer 5, 10, 15 Jahre - Dienstorientiertes Kostenmodell bwdatadiss - Etablierung erweiterter Infrastruktur, um Forschungsdaten von Dissertationen abzulegen und zu referenzieren - Rechte- und Rollenkonzept falls aus datenschutzrechtlichen Gründen die Daten nur Promovenden und Betreuern zugänglich sein dürfen - Weitere Aspekte Zitierfähigkeit, persistente Identifier, formale Qualitätssicherung, strukturierte Metadaten, Anforderungen bzgl. Formate Forschungsdateninfrastruktur -- das Konzept des Landes Baden-Württemberg 12
Archivierung / langfristiger Zugriff Langfristige Zugriffssicherung Beispiel bwfla (funktionale Langzeitarchivierung) - Entwicklung einer emulationsbasierten Erhaltungsund Zugriffsstrategie - Aufbau eines technischen Dienstes für die einfache Nutzung komplexer Technologien - Zugriffssicherung für obsolete digitale Objekte Forschungsdateninfrastruktur -- das Konzept des Landes Baden-Württemberg 13
Forschungsinformationssysteme (FIS) Forschungsaktivitäten und Beteiligung an standortübergreifenden Aktivitäten - Informationen zu Publikationen, Projekten, Patenten, Partnern, Promotionen und Preisen sowie deren Verbindungen und Beziehungen zueinander - Unterstützt (??) Forschende bei Planung neuer Projekte + Durchführung aktueller Forschungsprojekte - Liefert Zahlen und Fakten zu Forschungsschwerpunkten => Strategien ableiten + Qualitätssicherung - Unterschiedliche Ausprägung an den Landesuniversitäten Beispiel: FreiDok plus und teilweise Forschungsdatenbank (beides Uni Freiburg) - Fernziel (?): Zusammenschluss der einzelnen FIS für eine Landesübersicht Forschungsdateninfrastruktur -- das Konzept des Landes Baden-Württemberg 14
bwfdm-communities Problemfelder durch umfangreiche Interviews identifiziert - Informationsdefizit bei Urheberrecht, Datenschutz, Beratungsund Informationsdienste, Dienstangebote - Zugang zu außeruniversitären Daten (z.b. Behördendaten) z.b. fehlende Standardisierung - Wissenschaftliche Zusammenarbeit / Datenaustausch - FDM noch nicht zufriedenstellend verbreitet Verbesserung der Lehre? - Fehlende (fach-)spezifische Repositorien Müssen von der Community kommen, ansonsten Nutzen fraglich - Formate und Standards (veraltet, inkompatibel, proprietär) Problematisch: Austausch, OpenData, Archivierung, - Lizenzproblematik Landeslizenzen, Probleme für Archivierung - Fehlende allgemeine Archive, langfristige Zugriffssicherung Forschungsdateninfrastruktur -- das Konzept des Landes Baden-Württemberg 15