4. RADAR-WORKSHOP KARLSRUHE, 25./26. JUNI 2018 EINFÜHRUNG UND GRUNDLEGENDE KONZEPTE. Matthias Razum, FIZ Karlsruhe Dr. Angelina Kraft, TIB, Hannover

Ähnliche Dokumente
RADAR Archivierung und Publikation von Forschungsdaten als Baustein für die NFDI. Matthias Razum, 04. Oktober 2018

Haftung, Vertrag, Datenschutz am Beispiel von RADAR Perspektive eines Diensteanbieters. Fabian Rack, Matthias Razum

RADAR Archivierung und Publikation von Forschungsdaten. Matthias Razum DINI Jahrestagung 2017 Göttingen, 05. Oktober 2017

RADAR. ABLAGE & NACHNUTZUNG von FORSCHUNGSDATEN. Dr. Angelina Kraft. Technische Informationsbibliothek (TIB), Hannover

4. RADAR-WORKSHOP RADAR APPLICATION PROGRAMMING INTERFACE KARLSRUHE, 25./26. JUNI Matthias Razum, FIZ Karlsruhe

RADAR. Ein Datenrepositorium für den Long Tail of Research Data RESEARCH DATA REPOSITORY. Angelina Kraft

RADAR Vom DFG-Projekt zum nachhaltigen Service

RADAR. Ein Datenrepositorium für den Long Tail of Research Data RESEARCH DATA REPOSITORY. Angelina Kraft1, Jan Potthoff2

RADAR Ein Forschungsdaten-Service für Archivierung und Publikation

RADAR ABLAGE & NACHNUTZUNG von FORSCHUNGSDATEN

RADAR. Wo steht das Projekt? RESEARCH DATA REPOSITORIUM Matthias Razum FIZ Karlsruhe. mit Beiträgen der RADAR-Projektpartner

Bedarfsgerechte Weiterentwicklung von RADAR als Forschungsdaten- Repositorium für das KIT

RADAR Geschäftsmodell, Preise und Verträge

4. RADAR-WORKSHOP PREISE UND VERTRÄGE KARLSRUHE, 25./26. JUNI Matthias Razum, FIZ Karlsruhe

Beschreibung des Online-Dienstes RADAR

RADAR. FDM Dienstleistungen, Organisation & technische Infrastruktur RESEARCH DATA REPOSITORY. Angelina Kraft1, Thomas Engel2

RADAR: Interdisziplinäres Forschungsdatenarchiv RESEARCH DATA REPOSITORIUM. Dr. Angelina Kraft Angelina Kraft Hannover, den

ZB MED Leibniz-Informationszentrum Lebenswissenschaften

IHR WEG ZUR DOI-REGISTRIERUNG

Deskriptives Metadatenprofil für RADAR

RADAR. Matthias Razum. 30. April 2014 dbv Sektion 4: Frühjahrssitzung 2014

Das RADAR Projekt: Datenarchivierung und -publikation als Dienstleistung disziplinübergreifend, nachhaltig, kostendeckend

- Entwurf - Datenpublikation Workflows für die Archivierung und Publikation wissenschaftlicher Forschungsdaten in RADAR

Webplattform für die Bearbeitung, Publikation und Langzeitarchivierung von regionalwissenschaftlichen Forschungsdaten (LaZAR)

PROBADO Systemarchitektur

Dienstleistungsvertrag über die Nutzung des Datenzentrums RADAR

Forschungsdatenmanagement

DOI-Registrierung mit DataCite: Einführung und erste Schritte

ZB MED Leibniz-Informationszentrum Lebenswissenschaften

Metadaten und Identifikatoren

Data-Pilotprojekt UZH

FDM in den Wirtschaftswissenschaften Aktivitäten der ZBW

Digitale Langzeitarchivierung

Tools und Software für die Forschungsdatenhaltung ein Überblick. Dr. Janna Neumann Berlin, 11. Juni Workshop des Arbeitskreis Forschungsdaten

DOI-Desk der ETH Zürich: Ein Service für den Schweizer Hochschul- und Forschungsbereich

// TECHNISCHE INFORMATIONSBIBLIOTHEK INFORMATIONSZENTRUM FÜR DIE DIGITALISIERUNG VON WISSENSCHAFT UND TECHNIK

FIZ Karlsruhe und seine Rolle in OpenTA

Metadaten für die Langzeitarchivierung

Archivierung und Publikation von Forschungsdaten: Die Rolle von digitalen Repositorien am Beispiel des RADAR- Projekts Zusammenfassung:

Das Repositorium der TU Berlin für Forschungsdaten und Publikationen

Fachreferententagung Wirtschaftswissenschaften

Langzeitarchivierungsmetadaten. in Rosetta

ZB MED Leibniz-Informationszentrum Lebenswissenschaften

DOI-Registrierung mit DataCite in Deutschland

Forschungsdatenmanagement in den Umweltwissenschaften

Open Access Infotag Forschungsdatenmanagement

Neu bei der DOI-Registrierung?

Anbindung und Vernetzung verteilter heterogener Forschungsdaten das Projekt GeRDI

Forschungsdatenmanagement

Forschungsdatenmanagement im GrK MuSAMA an der Universität Rostock

E-INFRASTRUCTURES AUSTRIA DELIVERABLE Cluster D

Angewandte Forschung zu Datenlebenszyklen in der Helmholtz-Gemeinschaft und darüber hinaus

Tobias Kurze & Regine Tobias, E-Science Tage in Heidelberg am

Forschungsdatenmanagement an der Technischen Universität Berlin

Persistent Identifiers und die Zitation von Forschungsdaten. Brigitte Hausstein und Anja Wilde

Forschungsdatenmanagement an der Technischen Universität Berlin

Ein neues Bibliotheksmanagementsystem für wissenschaftliche Bibliotheken? Eine Evaluation von GBV und hbz

Open Science: Neue Aufgabenfelder für Bibliotheken

Mehr als nur die Emulation von Papier

Langzeitarchivierungskonzepte, Visualisierungsmöglichkeiten

Forschungsdaten an der Technischen Universität Berlin Archivierungsaspekte

Forschungsdatenmanagement in den Geistes- und Sozialwissenschaften

Effizientes Management von Forschungsdaten Gerald Jagusch, Jens Freund

Marine Network for Integrated Data Access

Formatvalidierung bei Forschungsdaten: Wann und wozu?

Offene Wissenschaft: Publikation von Forschungsdaten / Open Access für wissenschaftliche Texte

Forschungsdatenanbindung an Repositorien

openta Erläuterungen zum Fortsetzungsantrag an die DFG

Persistenzschicht in Collaborative Workspace

Die DFG-Ausschreibung Neuausrichtung überregionaler Informationsservices Bilanz und Ausblick. Dr. Anne Lipp, Bonn

Neu bei der DOI-Registrierung? Ihr Weg zum DOI!

Ein Java Repository für digitalen Content in Bibliotheken

Forschungsdaten archivieren und publizieren

Data Warehouse für boden- und agrarwissenschaftliche Forschungsdaten

Kurzvorstellung des EDaWaX-Projekts

H. Enke, Sprecher des AK Forschungsdaten der WGL

FID GEO: New services for open access to scientific literature, maps and research data

e-infrastructures Austria

Das Archivportal-D und die Deutsche Digitale Bibliothek. Neue übergreifende Recherchemöglichkeiten nach Quellen für die historische Forschung

DIGITAL OBJECT IDENTIFIER (DOI) FÜR TECHNIK UND NATURWISSENSCHAFTEN. So werden Ihre Forschungsdaten im Internet auffindbar und zitierfähig.

ReKliEs-De Abschlussworkshop. Datensuche und Datendownload

DARIAH-DE Repositorium

file:///c:/users/wpzsco/appdata/local/temp/tmp373d.tmp.htm

Forschungsdatendienste an einer Universität im Spagat zwischen Möglichkeiten und Realitäten

Das Projekt escidoc. M. Dreyer

DKRZ Datenhierarchie Von der Antragstellung bis zur Archivierung

DIE TIB IM FOKUS INFORMATIONSZENTRUM FÜR DIE DIGITALISIERUNG VON WISSENSCHAFT UND TECHNIK MITGLIED DER LEIBNIZ-GEMEINSCHAFT

Aufbau und Betrieb eines institutionellen Repositoriums für Forschungsdaten anhand des Datenrepositoriums OpARA

Daten- wo bleiben sie? Bernd Richter Bundesamt für Kartographie und Geodäsie

Content-Management-Systeme

Fachinformationsdienst Geowissenschaften der festen Erde

Forschungsdatenmanagement am LRZ im Kontext von GeRDI

REPLAY. Das Multimedia Portal System der ETH Zurich. Oder:

Handbuch Forschungsdatenmanagement

Forschungsdaten als Keimzelle für die lebenswissenschaftliche Forschung

Das Repositorium für Forschungsergebnisse der TU Berlin. Pascal-Nicolas Becker Universitätsbibliothek PubMan Days 2013 München,

Metadaten für die Langzeitarchivierung

Open Research Data Plattform Schweiz Pilot

Transkript:

4. RADAR-WORKSHOP KARLSRUHE, 25./26. JUNI 2018 EINFÜHRUNG UND GRUNDLEGENDE KONZEPTE Matthias Razum, FIZ Karlsruhe Dr. Angelina Kraft, TIB, Hannover

2 RADAR IM ÜBERBLICK GRUNDLEGENDE KONZEPTE FEATURES SCHEMATISCHE ARCHITEKUR

RADAR Research Data Repository RADAR (Research Data Repository) ist ein disziplinübergreifendes Forschungsdatenrepositorium für die Archivierung und Publikation von Forschungsdaten abgeschlossener wissenschaftlicher Studien und Projekte. September 2013 August 2016 Gefördert durch die DFG 3

RADAR auf einen Blick Vom DFG-Projekt zum Produkt Disziplinenübergreifend; Schwerpunkt Long Tail The majority of datasets produced through research are part of the Long Tail of Research Data Quelle: Humphrey C (2014): OpenAIRE-COAR Conference, Athens Keine Konkurrenz zu etablierten disziplinären Datenzentren Quelle: Ferguson et al. (2014): Big data from small data: data-sharing in the 'long tail' of neuroscience. DOI: 10.1038/nn.3838 Nachhaltiges, sich selbst tragendes Geschäftsmodell ist entwickelt 4

Lebenszyklus und Fokus 5

Features Service Level Datenarchivierung dark archive Flexible Haltefrist (5, 10, 15 Jahre) Datengeber bestimmen Zugriffsrechte (privat/geteilt/öffentlich) Service Level Datenarchivierung mit Datenpublikation Unbegrenzte Haltefrist (mindestens 25 Jahre) Optionale Embargos Vergabe eines DOI (DataCite) Schnittstelle für Peer Review Auswahl von Lizenzen, kein CC0 erforderlich Metadaten indexiert (RADAR, DataCite, OAI, Google) 6 Quelle: Wikimedia Commons/Simon A. Eugster. CC 3.0 BY SA

Aus der Community für die Community Workshops Präsentationen Publikationen Fachöffentlichkeit Wissenschaftlicher Beirat Beratung Evaluierung 7 Nutzer Testsystem Feedback muss von Aufbau den Bedarfen muss bedarfsgetrieben der Wissenschaft erfolgen ausgehen

RADAR als verteilte Informationsinfrastruktur 8

Schematische Architektur GUI User Interface A API User Interface B Management Layer / Repository RZ API TU Dresden/ZIH RZ API KIT/SCC RZ API Data Centre SpectrumProtect HPSS??? 9

Kooperationspartner Anbieter und Vertragspartner Marketing, Beratung und Training (gemeinsam mit FIZ Karlsruhe); DOI-Vergabe Datenarchivierung und IT-Infrastruktur Datenarchivierung 10

Datensicherheit Für archivierte/publizierte Daten: Datenpakete werden mit Checksum versehen Nach dem Schreiben wird Checksum direkt geprüft Drei Kopien an drei Standorten (2x Karlsruhe, 1x Dresden) Unterschiedliche Hard- und Software sowie Administration Regelmäßige Migration auf neue Speichermedien, dabei Prüfung der Datenintegrität Für temporäre Daten Redundantes Plattensystem (RAID-6) mit täglicher Sicherung Source: SCC, Karlsruher Institute for Technology (KIT) 11

RADAR Features Im Scope: Daten aus abgeschlossenen Projekten Bitstream preservation Drei Kopien, zwei Rechenzentren 25+ Jahre Haltefrist für publizierte Daten Außerhalb des Scopes: Management von aktiven Daten Funktionale Langzeitarchivierung Regelmäßige Fixity Checks Personenbezogene Daten Big Data -Disziplinen Long Tail -Daten Daten unterliegen deutschem bzw. EU-Recht 12 Source: Pixabay/User moritz320, CC0

Hierarchische Organisation der Inhalte Administrator Contract Administrator/Kurator Workspace Workspace Administrator/ (Sub)Kurator Dataset Dataset Folder File File File File 13

Datenpaket Forschungsdaten werden als Zusammenstellung von Dateien abgespeichert Daten werden als Paket archiviert/publiziert und abgerufen Das Paket wird über eine DOI identifiziert, nicht die darin enthaltenen Dateien Das Paket nutzt das BagIt-Format und enthält die vollständige Datei- und Ordnerstruktur der Forschungsdaten alle zugehörigen Metadaten einige übergreifende Informationen (Manifest, Checksum) Gespeichert wird das Paket als (komprimierte) ZIP-Datei 14

Metadaten Ziel: Minimale Metadaten, um ein Datenpaket disziplinübergreifend zu beschreiben und optional um disziplinspezifische Elemente zu ergänzen 10 verpflichtende Elemente Identifier* (RADAR-ID/DOI) Creator* Title* Publisher* Production year or time span Publication year* Subject area Resource* Rights* Rightsholder 13 optionale Elemente Additional title Description Keyword Contributor Language* Alternate identifier* Related identifier* Geo location* Data source Software type Data processing Related information Funder information * 15 * Basiert auf dem Metadata Kernel v4.1

Rollen- und Rechtekonzept - Bearbeitung Administrator richtet ein und administriert Arbeitsbereich bestimmt für Arbeitsbereich bestimmt für Arbeitsbereich Kurator Subkurator bearbeiten und paketieren Daten und Metadaten 16

Rollen- und Rechtekonzept - Review Administrator Arbeitsbereich richtet ein und ermöglicht Zugriff Kurator greift lesend zu Reviewer Subkurator 17

Rollen- und Rechtekonzept - Publikation Administrator Arbeitsbereich Kurator publiziert greift lesend zu Anonymer Nutzer Subkurator 18

Rollen- und Rechtekonzept - Archivierung Administrator Arbeitsbereich autorisiert Zugriff für bestimmte Nutzer Kurator archiviert greift lesend zu Autorisierter Nutzer Subkurator 19

Ingest Zweistufiges Verfahren Temporärer Arbeitsbereich Bearbeitung und Qualitätssicherung Übertragung von Einzeldateien oder Containern Protokoll: HTTP (geplant: GridFTP) Archivspeicher Keine Bearbeitung mehr möglich Übertragung von Datenpaketen Protokoll: SFTP (geplant: GridFTP) Quelle: User:Kku / Wikimedia Commons / CC BY-SA 3.0 20

Quotas Quotas dienen zur Begrenzung bzw. Steuerung der Nutzung Auf Vertrags- und Arbeitsbereichsebene möglich für temporären Speicher Archivspeicher Publikationsspeicher Auf Arbeitsbereichsebene ist eine Überprovisionierung möglich Wenn Quota auf Vertragsebene erschöpft ist, können auch in Arbeitsbereichen keine Daten mehr eingestellt werden Quotas dienen zur Kontrolle der auflaufenden Kosten 21

Embargos und Zugriffsrechte Publizierte Datenpakete können mit einem Embargo versehen werden Maximale Embargodauer ist 12 Monate Während dieser Zeit sind nur die Metadaten zugreifbar Archivierte Daten sind per Default nur für Kuratoren abrufbar Kuratoren können einzelnen RADAR-Benutzern Zugriff erlauben (Registrierung für Zugriff erforderlich) Kuratoren können auch ein Datenpaket vollständig freigeben (keine Registrierung für Zugriff erforderlich) 22

Zielgruppen Hochschulen und Forschungseinrichtungen Institutionelles Angebot zum Forschungsdatenmanagement Integration mit existierenden institutionellen Portalen Forschende Publikation und Archivierung von Forschungsdaten aus Projekten Kultureinrichtungen Langzeitarchivierung von Digitalisaten (Master) Access-Kopien für Online-Zugriff Quelle: Wikimedia Commons/User:Arthurrh. CC 3.0 BY SA 23

AUSBLICK

Ausbau der Features Software-Features Unterstützung lokaler Datenhaltung GridFTP Einführung von Kategorien (Tags) Barrierefreiheit Organisatorisches Zertifizierung (Core Trust Seal) Ausweitung des Geschäftsmodells Handreichung zu rechtlichen Fragen 25 Quelle: Wikimedia Commons/User:Tasma3197, CC-BY-SA 3.0

Ausblick Kundengewinnung Geschäftsplan sieht 8 Kunden im zweiten Jahr vor (bisher vier Verträge) Hochschulen als erste Kundengruppe Außerhochschulische Forschungseinrichtungen folgen Einbeziehung der Nutzer Vor-Ort Beratung Öffentliche Workshops Wissenschaftlicher Beirat 26

Vielen Dank! Fragen? www.radar-service.eu www.radar-projekt.org Except where otherwise noted, content on this site is licensed under a Creative Commons Attribution 4.0 International License.