Forschungsdatenmanagement Erstellen, Bearbeiten, Archivieren, Bereitstellen Dr. Jan Brase, Dr. Janna Neumann Hannover, 18.11.2013
Hintergrund Paradigmenwechsel Vor eintausend Jahren Empirische Wissenschaft: Beschreibung von Naturphänomene In den letzten einhundert Jahren entstand ein Theoretischer Zweig: Verwendung von Modellen, Generalisierungen In den letzten Dekaden ein Computerisierter Zweig: Simulation komplexer Phänomene Heute ist Wissenschaft Datenwissenschaft (escience): vereint Theorie, Experiment und Simulation. a a 2 4πG ρ c = Κ 3 a 2 2 Jim Gray, escience Group, Microsoft Research Seite 2
Problem Lineare Wertschöpfungskette der Wissenschaft werden Daten analysiert dargestellt sind verloren! interpretiert ergeben Information wird publiziert ist nachvollziehbar ergibt Wissen Publikation ist zugänglich Seite 3
Was sind Forschungsdaten Definitionen keine feste Definition, die alle Aspekte der Forschungsdaten umfassen stark vom jeweiligen Fachbereich abhängig Im Allgemeinen: Daten, die im Laufe der wissenschaftlichen Tätigkeit entstehen und als Grundlage für Forschungsergebnisse dienen A A reinterpretable representation of information in a formalized manner suitable for communication, interpretation, or processing. Digital Curation Centre Seite 4
Was ist Forschungsdatenmanagement Definition the active management and appraisal of data over the lifecycle of scholarly and scientific interest Digital Curation Centre http://www.jisc.ac.uk/whatwedo/programmes/preservation /dcc.aspxc alle Aktivitäten, ten, die mit der Aufbereitung, Speicherung, Archivierung und Veröffentlichung von Forschungsdaten verbunden sind. Simukovic, Kindling, Schirmbacher, (2013): Umfrage zum Umgang mit digitalen Forschungsdaten an der Humboldt-Universität zu Berlin. URN: urn:nbn:de:kobv:11-100213001 Seite 5
Was ist Forschungsdatenmanagement Anforderungen Give your data a structure it makes it easier to find things Forschung nachvollziehbar machen Forschung reproduzierbar machen Gute Daten untermauern qualitativ hochwertige Forschung Glaubwürdige und verifizierbare Interpretation Validierung Langzeitarchivierung Wissenschaftliche Anerkennung und Reputation Data-sharing führt zu Kollaboration und Zitation größerer Impact Rechtliche und ethische codes of conduct Quelle: A. Collins, Präsentation, Managing your digital research data Cambridge University Library, http://www.lib.cam.ac.uk/dataman/training.html#prepare Seite 6
Was ist Forschungsdatenmanagement Elemente Forschung / Daten-Management planen Daten erzeugen Daten dokumentieren (Prozessierung und Analyse) Speicherung und Sicherung Daten erhalten/bewahren Daten teilen Daten (nach)nutzen S. Jones et al., Research Data Management for librarians, Digital Curation Centre, 2013, S. 5, http://www.dcc.ac.uk/training/rdm-librarians Quelle: http://data-archive.ac.uk/create-manage/life-cycle Seite 7
Was ist Forschungsdatenmanagement Elemente Forschung / Daten-Management planen Daten erzeugen Daten dokumentieren (Prozessierung und Analyse) Speicherung und Sicherung Daten erhalten/bewahren Daten teilen Daten (nach)nutzen S. Jones et al., Research Data Management for librarians, Digital Curation Centre, 2013, S. 5, http://www.dcc.ac.uk/training/rdm-librarians Quelle: http://data-archive.ac.uk/create-manage/life-cycle Seite 8
Was ist Forschungsdatenmanagement Elemente Forschung / Daten-Management planen Daten erzeugen Daten dokumentieren (Prozessierung und Analyse) Speicherung und Sicherung Daten erhalten/bewahren Daten teilen Daten (nach)nutzen S. Jones et al., Research Data Management for librarians, Digital Curation Centre, 2013, S. 5, http://www.dcc.ac.uk/training/rdm-librarians Quelle: http://data-archive.ac.uk/create-manage/life-cycle Seite 9
Was ist Forschungsdatenmanagement Elemente Forschung / Daten-Management planen Daten erzeugen Daten dokumentieren (Prozessierung und Analyse) Speicherung und Sicherung Daten erhalten/bewahren Daten teilen Daten (nach)nutzen S. Jones et al., Research Data Management for librarians, Digital Curation Centre, 2013, S. 5, http://www.dcc.ac.uk/training/rdm-librarians Quelle: http://data-archive.ac.uk/create-manage/life-cycle Seite 10
Was ist Forschungsdatenmanagement Elemente Forschung / Daten-Management planen Daten erzeugen Daten dokumentieren (Prozessierung und Analyse) Speicherung und Sicherung Daten erhalten/bewahren Daten teilen Daten (nach)nutzen S. Jones et al., Research Data Management for librarians, Digital Curation Centre, 2013, S. 5, http://www.dcc.ac.uk/training/rdm-librarians Quelle: http://data-archive.ac.uk/create-manage/life-cycle Seite 11
Was ist Forschungsdatenmanagement Elemente Forschung / Daten-Management planen Daten erzeugen Daten dokumentieren (Prozessierung und Analyse) Speicherung und Sicherung Daten erhalten/bewahren Daten teilen Daten (nach)nutzen S. Jones et al., Research Data Management for librarians, Digital Curation Centre, 2013, S. 5, http://www.dcc.ac.uk/training/rdm-librarians Quelle: http://data-archive.ac.uk/create-manage/life-cycle Seite 12
Forschungsdatenmanagement Überlegungen Datenmanagementpläne werden nicht perfekt sein Sind keine statischen Dokumente Änderungen und Aktualisierungen im Forschungsprozess Schlüsselprobleme bedenken, die Daten beeinflussen könnten während der Arbeit mit den Daten in der Zukunft Besser ist es einen Plan zu haben, der Teilaspekte betrachtet, als gar keinen Plan zu haben Fragen Sie nach Rat, wenn Sie sich nicht sicher sind Seite 13
Forschungsdatenmanagement Pläne Struktur Projektbeschreibung Was für Daten werden erhoben/produziert Methode zur Datenorganisation Administrative Punkte: Födervoraussetzungen und gesetzliche Anforderungen Datenurheber/Eigentümer, weitere Stakeholder (Zielgruppe, Besitzer) Daten Zugriff und Sicherheit Backups Daten teilen und archivieren Was wird geteilt? Was wird wo archiviert? Welche Metadaten sind notwendig Verantwortlichkeiten Wer ist wofür zuständig? Budget Kostenabschätzung für Datenmanagement Quelle: http://libguides.anu.edu.au/datamanagement Lit.: ANU Data Management Manual Managing Digital Research Data at the Australian National University, 2013 Beispiel DMP: http://datalib.edina.ac.uk/xerte/user-files/2-datalib-nottingham/media/pg_dmp_form.swf Seite 14
Forschungsdatenmanagement Erste Schritte Verschiedene Elemente für die Entwicklung von Datenmanagement Quelle: Australian National Data Service website at http://www.ands.org.au/resource/data-management-planning.html Seite 15
Forschungsdaten Zitierung Leichte Wiederverwendbarkeit und Verifikation von Forschungsdaten Daten können (auf)gefunden werden (DOI, Metriken) Wissenschaftliche Anerkennung für die Sammlung und Dokumentation von Daten (Citation Index) Einhaltung der Regeln guter Wissenschaftlicher Praxis (DFG) Vermeidung von Duplikation Motivation für neue Forschung Die DOI-Registrierung ermöglicht eine elegante Verlinkung zwischen einem wissenschaftlichen Artikel und den im Artikel analysierten Forschungsdaten. Beispiel: http://dx.doi.org/10.1016/j.dsr.2008.08.009 (Artikel), verlinkt zu http://dx.doi.org/10.1594/pangaea.724325 (Daten) Seite 16
Forschungsdaten Zitierung Quelle: Australian National Data Service website at http://www.ands.org.au/guides/data_citation_poster.pdf Seite 17
Forschungsdaten teilen Nutzen http://openarchaeologydata.metajnl.com/about ISSN: 2049-1565 Published by Ubiquity Press (http://www.ubiquitypress.com/) Seite 18
Forschungsdaten DOI-System 1998 Gründung der International DOI Foundation (IDF) als übergeordnete Organisation Derzeit (11/2013) 09 Registrierungsagenturen (RA) CrossRef, DataCite RA zuständig für Identifier-Vergabe und Pflege der Identifier Das IDF System garantiert vertrauenswürdige Verantwortlichkeiten, einheitliche Standards und Workflows Seit Mai 2012: ISO Standard 26324:2012 Seite 19
DataCite Hintergrund Globales Konsortium getragen von lokalen Einrichtungen Fokussiert auf die Verbesserung des Zugangs zu und der Zitierung von Daten und anderen nicht-textuellen Inhalten In Kooperation mit Datenzentren und anderen Einrichtungen, die Daten vorhalten Entwicklung von Standards, Workflows und Best Practices Initial, aber nicht exklusiv auf dem DOI-System basierend Gegründet am 1. Dezember 2009 in London Seite 20
DataCite Geschichte 03 05 09 13 DFG Projekt mit dt. WDCs TIB ist offizielle DOI-RA Paris Memorandum DataCite als Verein in London gegründet 7 Mitglieder Robuste technische Infrastruktur STM-joint statement Summer meeting Hannover 2010 Berkeley 2011 Copenhagen 2012 Washington 2013 18 Mitglieder Über 2.0 Million DOI- Namen DataCite Statistik Content Negotiation Seite 21
DataCite Struktur International DOI Foundation tragen Mitglied DataCite Geschäftsstelle (TIB) Mitgliedsinstitution Mitgliedsinstitution Associate Stakeholder Data Centre Data Centre Datenzentrum Data Centre Data Centre Datenzentrum Zusammenarbeit Seite 22
DataCite Mitglieder Technische Informationsbibliothek (TIB), Deutschland ZB Med, Deutschland Gesis, Deutschland ZBW, Deutschland Canada Institute for Scientific and Technical Information (CISTI), California Digital Library, USA Purdue University, USA Office of Scientific and Technical Information (OSTI), USA Bibliothek der TU Delft, Niederlande The British Library Bibliothek der ETH Zürich Swedish National Data Service (SND) Australian National Data Service (ANDS) Technical Information Center of Denmark CRUI - Conference of Italian University Rectors, Italien L Institut de l Information Scientifique et Technique (INIST), Frankreich National Research Council, Thailand (NRCT) Ungarische Akademie der Wissenschaften Assozierte Mitglieder Digital Curation Center (UK) Microsoft Research Interuniversity Consortium for Political and Social Research (ICPSR) Korea Institute of Science and Technology Information (KISTI) Beijing Genomics Institute, China Institute of Electrical and Electronics Engineers (IEEE) Harvard University Library World Data System (WDS) GWDG Seite 23
DataCite search Searchterm: * Searchterm: uploaded:[now-7day TO NOW] Searchterm: relatedidentifier:* Searchterm: relatedidentifier:issupplementto\:10.1029* Searchterm:relatedIdentifier:*\:10.1055* Dr. Jan Brase, Dr. Janna Neumann, Forschungsdatenmanagement, 18.11.2013 Seite 24
OAI und Statistics OAI Harvester http://oai.datacite.org DataCite statistics (Resolution und Registration) http://stats.datacite.org Dr. Jan Brase, Dr. Janna Neumann, Forschungsdatenmanagement, 18.11.2013 Seite 25
Content negotiation DataCite content negotiation (Kooperation mit CrossRef) http://data.datacite.org http://crosscite.org/cn DOI Citation Formatter http://www.crosscite.org/citeproc/ Dr. Jan Brase, Dr. Janna Neumann, Forschungsdatenmanagement, 18.11.2013 Seite 26
Auflösung zum Zitat http://data.datacite.org/application/xdatacite+text/10.5524/100005 Li, j; Zhang, G; Lambert, D; Wang, J (2011): Genomicdatafrom Emperor penguin. GigaScience. http://dx.doi.org/10.5524/100005 Dr. Jan Brase, Dr. Janna Neumann, Forschungsdatenmanagement, 18.11.2013 Seite 27
Auflösung zu den RDF Metadaten http://data.datacite.org/application/rdf+xml/10.5524/100005 <rdf:rdf xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:owl="http://www.w3.org/2002/07/owl#" xmlns:j.0="http://purl.org/dc/terms/" > <rdf:description rdf:about="http://dx.doi.org/10.5524/100005"> <j.0:identifier>10.5524/100005</j.0:identifier> <j.0:creator>li, J</j.0:creator> <j.0:creator>zhang, G</j.0:creator> <j.0:creator>wang, J</j.0:creator> <owl:sameas>doi:10.5524/100005</owl:sameas> <owl:sameas>info:doi/10.5524/100005</owl:sameas> <j.0:publisher>gigascience</j.0:publisher> <j.0:creator>lambert, D</j.0:creator> <j.0:date>2011</j.0:date> <j.0:title>genomic datafromthe Emperor penguin (Aptenodytesforsteri)</j.0:title> </rdf:description></rdf:rdf> Dr. Jan Brase, Dr. Janna Neumann, Forschungsdatenmanagement, 18.11.2013 Seite 28
DataCite: Nächste Entwicklungen ORCID and DataCite Interoperability Network (http://odin-project.eu/ ) http://datacite.labs.orcid-eu.org/ Datensätze mit dem eigenen ORCID verbinden DataCite-Schnittstelle in 2014 Version von D-Space Seite 29
http://www.datacite.org Dr. Jan Brase, Dr. Janna Neumann, Forschungsdatenmanagement, 18.11.2013 Seite 30
TIB Strategie und Vision 3D-objects 3D-objects software software scientific scientificfilms films TIB research researchdata data simulation simulation text text Seite 31
TIB DOI-Service 2005 - TIB weltweit erste DOI-Registrierungsagentur für Forschungsdaten 2009 - TIB Gründungsmitglied von DataCite und Geschäftsführung in Hannover TIB vergibt DOI-Namen im Bereich Technik und Naturwissenschaften für Forschungsdaten, graue Literatur und weitere nicht-textuelle Materialien (Videos, Simulationen), sowie Open Access Artikel akademischer Herausgeber DOI-Namen gewährleisten Qualität, Langzeitverfügbarkeit und bieten Möglichkeit zur Referenzierung von Forschungsdaten Zugriff auf die Daten via GetInfo TIB Portal für technischnaturwissenschaftliche Fachinformation Seite 32
DOI-Service Workflow Metadata & URL DOI Forschungsdaten Browser interface oder Web service Katalog Daten Seite 33
DOI-Service Zahlen und Fakten DOI Vergabe (07.11.2013) 784.291DOI Namen registriert (>30.000 in 2013) ~ 90% Forschungsdaten, 10% graue Literatur, < 1% AV-Medien 62 Datenzentren (12 neue bisher in 2013) 50 Datenzentren in Deutschland, 12 in anderen Ländern Vertrag zwischen TIB und Datenzentren Erwerbung der Metadaten unter Bedingungen der Creative Commons Lizenz CC0 1.0 Universal (CC0 1.0) Public Domain Dedication Kostenlose DOI-Registrierung für akademische Einrichtungen in Deutschland Enge Kooperation mit DataCite Geschäftsführung an TIB Technische Infrastruktur (Metadata Store) Seite 34
Vielen Dank für f r Ihre Aufmerksamkeit! Offene Fragen? Wünsche? Kontakt: Janna.Neumann@tib.uni-hannover.de Jan.Brase@tib.uni-hannover.de Seite 35