Umgang mit Forschungsdaten



Ähnliche Dokumente
Auswertung des Fragebogens Rahmenbedingungen des Umgangs mit Forschungsdaten in der Region

Die Post hat eine Umfrage gemacht

Langzeitarchivierung von Forschungsdaten - und mehr. Bibliothek Information Schweiz: Kongress 2012 Konstanz, September 2012 Dr.

Umsetzung und Strategieentwicklung für die digitale Langzeitarchivierung an der ETH Zürich und der Universität Göttingen

Anleitung über den Umgang mit Schildern

Planung, Auswahl und Ingest

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Forschungsdaten zwischen «dunkler» Archivierung und Open Data

Vertrauen in Medien und politische Kommunikation die Meinung der Bürger

Was meinen die Leute eigentlich mit: Grexit?

Leichte-Sprache-Bilder

Nutzung des Retain-Archivs

L10N-Manager 3. Netzwerktreffen der Hochschulübersetzer/i nnen Mannheim 10. Mai 2016

Dokumentenserver: Praxisfragen

Vertrauenswürdiges digitales Langzeitarchiv Zertifizierung an der TIB

40-Tage-Wunder- Kurs. Umarme, was Du nicht ändern kannst.

Bilder zum Upload verkleinern

Anwendungsbeispiele. Neuerungen in den s. Webling ist ein Produkt der Firma:

S TAND N OVEMBE R 2012 HANDBUCH DUDLE.ELK-WUE.DE T E R M I N A B S P R A C H E N I N D E R L A N D E S K I R C H E

Diese Ansicht erhalten Sie nach der erfolgreichen Anmeldung bei Wordpress.

Konzentration auf das. Wesentliche.

Management von Forschungsdaten Der ETHZ-Lösungsansatz

Welches Übersetzungsbüro passt zu mir?

Hinweise zur Archivierung und Veröffentlichung von Abschlussarbeiten in der Digitalen Bibliothek der Hochschule Neubrandenburg

WIR STÄRKEN DIE WISSENSCHAFTEN IN ÖSTERREICH.

Persönliche Zukunftsplanung mit Menschen, denen nicht zugetraut wird, dass sie für sich selbst sprechen können Von Susanne Göbel und Josef Ströbl

Was man über das Perlenfinden wissen sollte...

Albert HAYR Linux, IT and Open Source Expert and Solution Architect. Open Source professionell einsetzen

In diesem Tutorial lernen Sie, wie Sie einen Termin erfassen und verschiedene Einstellungen zu einem Termin vornehmen können.

Staatssekretär Dr. Günther Horzetzky

Publikationsunterstützende Massnahmen von Bibliotheken am Beispiel von Open Access- Zeitschriften

Elternzeit Was ist das?

Pflegende Angehörige Online Ihre Plattform im Internet

Alle gehören dazu. Vorwort

GDPdU Export. Modulbeschreibung. GDPdU Export. Software-Lösungen. Stand: Seite 1

AUTOMATISCHE -ARCHIVIERUNG. 10/07/28 BMD Systemhaus GmbH, Steyr Vervielfältigung bedarf der ausdrücklichen Genehmigung durch BMD!

Diese Broschüre fasst die wichtigsten Informationen zusammen, damit Sie einen Entscheid treffen können.

Welchen Weg nimmt Ihr Vermögen. Unsere Leistung zu Ihrer Privaten Vermögensplanung. Wir machen aus Zahlen Werte

Intranet Moodle

- Entwurf - Datenpublikation Workflows für die Archivierung und Publikation wissenschaftlicher Forschungsdaten in RADAR

ELOoffice. Netzwerkinstallation. Software für Dokumentenmanagement und Archivierung. September ELO Digital Office GmbH.

Speicher in der Cloud

Was ist PDF? Portable Document Format, von Adobe Systems entwickelt Multiplattformfähigkeit,

Umfrage. Didaktischer Kommentar. Lernplattform

Produktvorstellung: CMS System / dynamische Webseiten. 1. Vorwort

DER SELBST-CHECK FÜR IHR PROJEKT

Ratgeber Stromanbieter wechseln

Info zum Zusammenhang von Auflösung und Genauigkeit

ÜBERGABE DER OPERATIVEN GESCHÄFTSFÜHRUNG VON MARC BRUNNER AN DOMINIK NYFFENEGGER

Bedienungsanleitung. Matthias Haasler. Version 0.4. für die Arbeit mit der Gemeinde-Homepage der Paulus-Kirchengemeinde Tempelhof

IT-SICHERHEIT IM UNTERNEHMEN Mehr Sicherheit für Ihre Entscheidung

Adventskalender Gewinnspiel

Professionelle Seminare im Bereich MS-Office

Erhaltung und Publikation von wissenschaftlicher Software

Social-Media Basis-Paket Ein einfaches und verständliches Unternehmens-Programm für den ersten Schritt

ALEMÃO. Text 1. Lernen, lernen, lernen

Nicht kopieren. Der neue Report von: Stefan Ploberger. 1. Ausgabe 2003

Leitfaden E-Books Apple. CORA E-Books im ibook Store kaufen. Liebe Leserinnen und Leser, vielen Dank für Ihr Interesse an unseren CORA E-Books.

Protect 7 Anti-Malware Service. Dokumentation

Handbuch. NAFI Online-Spezial. Kunden- / Datenverwaltung. 1. Auflage. (Stand: )

Berufsunfähigkeit? Da bin ich finanziell im Trockenen.

IHRE ZIELE SIND UNSERE HERAUSFORDERUNG FÜR INDIVIDUELLE LEISTUNGEN UND PERFEKTE LÖSUNGEN!

Bernadette Büsgen HR-Consulting

ARCHIV- & DOKUMENTEN- MANAGEMENT-SERVER DATEIEN ARCHIVIEREN

Die richtigen Partner finden, Ressourcen finden und zusammenführen

InteGREATer e.v. Berlin vor Ort

Datenblatt. Text-to-PDF Mailer 1.0 für Tobit David

1. Einführung. 2. Weitere Konten anlegen

Fotos in Tobii Communicator verwenden

Win 7 optimieren. Unser Thema heute: Meine erstellten Daten in eine andere Partition verschieben.

AUFBAUPROGRAMME YOU ONLY LIVE ONCE, BUT IF YOU DO IT RIGHT, ONCE IS ENOUGH.

Dr. Kraus & Partner Ihr Angebot zu Konfliktmanagement

D i e n s t e D r i t t e r a u f We b s i t e s

Um sich zu registrieren, öffnen Sie die Internetseite und wählen Sie dort rechts oben

Erfolg im Verkauf durch Persönlichkeit! Potenzialanalyse, Training & Entwicklung für Vertriebsmitarbeiter!

Texten für Gründer. Die Kraft der Sprache optimal für den Gründungs-Prozess nutzen

infach Geld FBV Ihr Weg zum finanzellen Erfolg Florian Mock

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Volksbank BraWo Führungsgrundsätze

Wie man Registrationen und Styles von Style/Registration Floppy Disketten auf die TYROS-Festplatte kopieren kann.

Titel BOAKdurch Klicken hinzufügen

Gut zu wissen: Hilfe für ereader-einsteiger Leitfaden Nr. 2: Wie lade ich meine ebooks in das Programm Adobe Digital Editions?

Der beste Plan für Office 365 Archivierung.

Partnerschaftsentwicklung für KMU

Installation der SAS Foundation Software auf Windows

Eine Anwendung mit InstantRails 1.7

ARCHIV- & DOKUMENTEN- MANAGEMENT-SERVER PAPIER ARCHIVIEREN

Outlook 2000 Thema - Archivierung

Instruktionsheft für neue Webshop Hamifleurs

.. für Ihre Business-Lösung

Eva Douma: Die Vorteile und Nachteile der Ökonomisierung in der Sozialen Arbeit

Dominik Stockem Datenschutzbeauftragter Microsoft Deutschland GmbH

Wir machen neue Politik für Baden-Württemberg

Senioren ans Netz. schreiben kurze Texte. Lektion 9 in Themen aktuell 2, nach Übung 7

Gesetzliche Aufbewahrungspflicht für s

Catherina Lange, Heimbeiräte und Werkstatträte-Tagung, November

Kaufkräftige Zielgruppen gewinnen

impact ordering Info Produktkonfigurator

Leit-Bild. Elbe-Werkstätten GmbH und. PIER Service & Consulting GmbH. Mit Menschen erfolgreich

Eigenen Farbverlauf erstellen

Transkript:

Umgang mit Forschungsdaten Library Lunchtime Learning, Fachhochschule Nordwestschweiz, Muttenz 25. März 2015 Dr. Matthias Töwe, Leiter Digitaler Datenerhalt, ETH-Bibliothek, ETH Zürich Matthias Töwe 25.03.2015 1

Überblick Lebenszyklus von Forschungsdaten Forschungsdatenmanagement Publikation von Forschungsdaten / Open Data Archivierung von Forschungsdaten Rolle der Bibliotheken Erfahrungen Diskussion Matthias Töwe 25.03.2015 2

Idealisierter Lebenszyklus von Forschungsdaten Matthias Töwe 25.03.2015 3

Zwei unterschiedliche Blickwinkel Organisieren Sie Ihre Daten während Sie damit arbeiten Teilen, erhalten und veröffentlichen Sie Daten für Dritte und für sich selbst! Matthias Töwe 25.03.2015 4

Kommt Ihnen das bekannt vor? "A story told in file names": Source: "Piled Higher and Deeper" by Jorge Cham www.phdcomics.com http://www.phdcomics.c om/comics/archive.php?comicid=1323 Copyright: Jorge Cham Used with permission. Matthias Töwe 25.03.2015 5

Forschungsdaten «Small Data» «Alltagsdaten», die jede und jeder Forschende erzeugt Strukturierte Daten (eher kleinteilig im Sinne von Einzeldateien) Überwiegend für die intellektuelle / manuelle Nutzung In diesem Fall geht es nicht um: Unstrukturierte Massendaten («Big Data»), die regelmässig als Ganzes mit wechselnden Algorithmen prozessiert werden sollen Matthias Töwe 25.03.2015 6

Genutzte Formate? (Umfrage ETH 2011/12) Matthias Töwe 25.03.2015 7

Planung des Umgangs mit Forschungsdaten I Fragen zum Datenmanagement im Projekt Welche Daten werden voraussichtlich erzeugt? Wie werden die Daten zunächst genutzt? Wie werden lebende Daten organisiert, dokumentiert und aufbewahrt? Welche Regeln gelten beim Umgang mit diesen Daten? Wie wird die Aufbewahrung für die Nachprüfbarkeit gelöst? Fragen bewusst stellen, vorhandene Tools berücksichtigen Aufwand budgetieren und Zeit vorsehen Viele Antworten vorläufig müssen im Projekt aktualisiert werden Matthias Töwe 25.03.2015 8

Einige Faustregeln Informieren Sie sich über Standards in Ihrem Fach und etablieren Sie zumindest für Ihre Gruppe ein einheitliches Vorgehen. Halten Sie klare Namenskonventionen für Ordner ein (z.b. Datentyp, Experiment, Version, Mitglied) Begrenzen Sie die Länge von Ordnernamen auf 15 bis 20 Zeichen Halten Sie eine Konvention für sprechende Dateinamen einschliesslich Versionsangabe ein (bis zu 25 Zeichen) und vermeiden Sie Sonderzeichen Stellen Sie sicher, dass Ihr Backup arbeitet und Sie Daten auch wirklich von dort wiederherstellen können. Nutzen Sie offene und dokumentierte Formate langfristige Nutzbarkeit Vermeiden Sie Verschlüsselungen und Komprimierung Nachnutzung Matthias Töwe 25.03.2015 9

Akteure im Lebenszyklus von Forschungsdaten Forschende Förderer / Hochschulen Förderer / Hochschulen Forschende / Peers Forschende Scientific IT Services Forschende / Peers Forschende Verlage Gutachter / Peers Forschende Forschende Matthias Töwe 25.03.2015 10

Darum geht es langfristig: Daten teilen und dauerhaft nutzbar erhalten Oft ist nur ein kleiner Teil des Forschungsoutputs zugänglich in Form von Publikationen Publikation Tabellen, Illustrationen Bedenklich nicht nur für Förderer und Steuerzahlerinnen, sondern auch für die Qualität der Forschung Analysierte und bearbeitete Daten Rohdaten Matthias Töwe 25.03.2015 11

Planung des Umgangs mit Forschungsdaten II Fragen zum Datenmanagement nach dem Projekt Für welche Daten wird eine (intensive) Nachnutzung erwartet? Welche Daten werden öffentlich gemacht? Welche Daten erfordern Anonymisierung oder Schutzmassnahmen? Welche Dokumentation ist nötig für die Nachnutzung? Welche Repositorien kommen in Frage (fachliche, institutionelle)? Frühzeitig Vorgaben von Förderern oder Hochschule erfragen Erfahrungen und Tools der eigenen Community nutzen Antworten beinhalten immer Annahmen über die Zukunft einige werden sich als unzutreffend erweisen Matthias Töwe 25.03.2015 12

Realistischeres lineares Modell Modell für eine nationale Struktur in der Chemie, aus: Konzeptstudie Vernetzte Primärdaten-Infrastruktur für den Wissenschaftler-Arbeitsplatz in der Chemie, TIB Hannover, FIZ Chemie Berlin, Universität Paderborn, 2010; S. 100 Matthias Töwe 25.03.2015 13

Was braucht es für die Veröffentlichung? Aus: Konzeptstudie Vernetzte Primärdaten-Infrastruktur für den Wissenschaftler-Arbeitsplatz in der Chemie, TIB Hannover, FIZ Chemie Berlin, Universität Paderborn, 2010; S. 141 Matthias Töwe 25.03.2015 14

Kommentare von Forschenden zur Nachnutzung von Daten We are struggling to cope with our own data and cannot deal with others data which requires effort to understand, reconstruct its context, verify it and make sure we have research questions which really fit the data s content. In our field, secondary analysis does usually not qualify for publication in top journals. We tried once to make our data available in a subject repository, but the effort to prepare and describe data according to their requirements was too big. Had we known how much effort it took to prepare our data according to the requirements of this journal, we would have chosen another journal for publication. Matthias Töwe 25.03.2015 15

Was braucht es für die Nachnutzung? Damit eine andere Person wissenschaftlich seriös mit vorhandenen Daten arbeiten kann, ist eine umfassende Dokumentation nötig Diese wird nur zum Teil durch Publikationen abgedeckt Messprotokoll Fehlerbreite Probennahme Algorithmen??? Zielsetzung Software Kontext Geräte Matthias Töwe 25.03.2015 16

Weitergehende Fragen des Vertrauens Datenproduzenten «Kann ich sicher sein, dass ich für die Nachnutzung meiner Daten ordentlich zitiert werde?» «Werden meine Daten in wissenschaftlich adäquater Weise genutzt?» Datennutzerinnen und -nutzer «Kann ich sicher sein, dass die Daten korrekt verarbeitet wurden?» «Kann ich sicher sein, dass die Daten zitierbar sind und in n Jahren noch verfügbar?» Matthias Töwe 25.03.2015 17

Sharing versus Openness Zwei unterschiedliche Ebenen des Teilens Data sharing mit persönlich bekannten Kolleginnen oder Partnern Vertrauen besteht Es gibt ein gemeinsames Verständnis, wie Daten verarbeitet und genutzt werden sollen Für die meisten Gruppen OK, aber sehr unterschiedlich in der Praxis Daten sind weltweit offen Viel mehr Vorbehalte und offensichtlich viel weniger Erfahrung! Matthias Töwe 25.03.2015 18

Zwei Seiten einer Medaille? Wenn Daten erhalten werden, aber für Dritte nicht offen sind, sind sie zwar nicht verloren, nützen aber nur den Produzenten etwas. Wenn Daten offen zugänglich gemacht werden, aber ohne oder mit wenig Kontextdokumentation, können sie ebenfalls nur den Produzentinnen nützen und selbst die könnten nach einiger Zeit Mühe haben, die Daten zu benutzen. Wenn Daten irgendwo für eine gewisse Zeit zugänglich gemacht werden, können sie nicht zitiert oder verlässlich nachgenutzt werden und die formale Anerkennung («Crediting») ist schwierig. Matthias Töwe 25.03.2015 19

Gewünschte Aufbewahrungsdauer? 2. Part - How long a period do you or your research group have in mind for storing data? PHYS BIOL INFK ITET MAVT MTEC MATL BAUG BSSE MATH CHAB ERDW GESS ARCH UWIS AGRL 0 20 40 60 80 100 % >10 years 10 years Survey and diagrams: S. Scheid Matthias Töwe 25.03.2015 20

Rolle der grösseren Bibliotheken Kompetenzen im Metadatenmanagement Bereits engagiert als Betreiber von (erweiterbaren) Repositorien für Publikationen in Arbeiten zur digitalen Langzeitarchivierung bei der Vergabe von Persistenten Identifikatoren bei der Online-Publikation Schnittstellenfunktion: zwischen Forschung und Publikationswesen zwischen Forschung und Verwaltung (Berichtspflichten usw.) Langfristig angelegte Trägerschaft und Finanzierung Das heisst aber nicht, dass sie alles selber machen sollten! Matthias Töwe 25.03.2015 21

Ziele der ETH-Bibliothek Nachprüfbarkeit von Resultaten erleichtern Richtlinien für gute wissenschaftliche Praxis unterstützen Niederschwellige Lösung(en) bieten für die befristete Aufbewahrung Abstimmung mit / Abgrenzung zu Informatikdiensten Datenmanagement unterstützen Nachnutzung erleichtern Veröffentlichung von Forschungsdaten unterstützen DOI-Registrierung als Teil der Dienstleistung anbieten Publizierte Daten dauerhaft verfügbar halten Wo möglich und sinnvoll: Aktive Erhaltungsmassnahmen (Formatmigration) planen Know-how aufbauen und ETH-Bibliothek als Dienstleisterin in diesem Kontext etablieren Matthias Töwe 25.03.2015 22

Was braucht es für die Nachnutzung? Was? Data Curation Datenerhalt Warum? Intellektuelle Nachnutzung ermöglichen Wer? Datenproduzenten Content Preservation Langzeitarchivierung Technische Nutzbarkeit sichern ETH-Bibliothek (ETH Data Archive) Bitstream Preservation Bit(strom)erhaltung Angepasst nach Jens Ludwig, Wissgrid Technische Stabilität gewährleisten Informatikdienste ETH Zürich Matthias Töwe 25.03.2015 23

Angebote für ETH-Angehörige Beratung Datenmanagement (im Aufbau) ETH Data Archive (Ex Libris Rosetta) Langzeitarchivierung oder befristete Aufbewahrung für min. 10 Jahre Access Rights: Open Access / ETH-intern / individuell / zeitverzögert Erhaltungsmassnahmen (Formatmigration) Massenprozesse und Einzelaktionen DOI-Registrierung für freigegebene Inhalte via DataCite Metadaten im Wissensportal der ETH-Bibliothek docuteam packer (Open Source) Viewer und Editor für lokal erstellte Dateistrukturen mit Metadaten Vorbereitung der Daten für die Übergabe an das ETH Data Archive Matthias Töwe 25.03.2015 24

Typische Kundenanfragen «Ich möchte ein Manuskript für einen Artikel einreichen. Der Herausgeber verlangt, dass die Rohdaten in einem Repository abgelegt werden sollen. Was kann ich tun?» «Wir archivieren bisher die Daten zu unseren Dissertationen auf CD-ROM und möchten eine bessere Lösung finden. Wie kann man das lösen?» «Wir möchten aus einem Artikel heraus Forschungsdaten verlinken, die öffentlich zugänglich sein sollen. Mit unseren eigenen Methoden haben wir sie ausgewertet, jetzt können andere Gruppen mit ihren Methoden weiterarbeiten. Wie machen wir das?» Matthias Töwe 25.03.2015 25

Fachhochschulen Teilweise hohe Dezentralisierung als Herausforderung Abweichende Anforderungen? Projektantrag «Data Life-Cycle Management» im Programm «Wissenschaftliche Information» der Schweizerischen Hochschulkonferenz Partner: EPFL, ETHZ, HES-SO (HEG), Unis Basel, Genève (Ltg.), Lausanne, Zürich, SWITCH Ziel: Nutzbare Ergebnisse (Empfehlungen, Leitlinien usw.) für alle und nutzbare Tools bzw. Services, vor allem von SWITCH für Angehörige von kleineren Institutionen Programmbeschreibung und Abstracts der Anträge per Februar 2015: http://www.swissuniversities.ch/de/organisation/projekte-und-programme/suk-p-2-wissensch-information-zugangverarbeitung-speicherung/ Matthias Töwe 25.03.2015 26

Erfahrungen Forschungsdatenmanagement ist Teil der Forschung. Reden Sie mit Fachkollegen im Haus und anderswo auch darüber und identifizieren Sie Best Practices. Nehmen Sie Einfluss auf die Diskussion! Schnittstellen zwischen Forschenden, Bibliothek und IT sind entscheidend: Helfen Sie mit, dass alle die gleiche Sprache sprechen oder zumindest merken, wenn sie es nicht tun. Nehmen Sie das Thema Forschungsdaten individuell und als Institution ernst aber bleiben Sie pragmatisch: Etwas konkret Sinnvolles zu tun ist besser, als nie zum ganz grossen Wurf zu kommen. Wir werden Fehler machen, falsche Entscheidungen treffen und müssen daraus lernen nichts zu tun ist keine Option. Matthias Töwe 25.03.2015 27

Mit auf den Weg (1) Denken Sie frühzeitig über Ihr Datenmanagement oder das Ihrer Gruppe in einem Projekt nach Machen Sie einen groben Datenmanagementplan auch wenn Sie dazu noch nicht verpflichtet sein sollten Was für Daten erhalten oder erzeugen Sie? Wie wollen Sie diese nutzen? Wie stellen Sie sicher, das wichtige Daten erhalten bleiben? Gibt es Daten, die Sie publizieren sollten oder möchten? Sollten und dürfen Sie zusätzliche Mittel für das Datenmanagement in einem Projektantrag einplanen? Matthias Töwe 25.03.2015 28

Mit auf den Weg (2) Nutzen Sie vorhandene Unterstützung Wenn Sie Daten an ein Online Repositorium abliefern sollen: Erkundigen Sie sich nach der Praxis in Ihrer Gruppe Sehen Sie auf http://www.re3data.org nach einem passenden fachspezifischen Repositorium oder Datenarchiv oder erkundigen Sie sich nach einem institutionellen oder fachübergreifenden Dienst (z.b. www.zenodo.org) Aufwändige technische Lösungen sind keine Voraussetzung für echte Fortschritte in der Qualität unseres Datenmanagements. Matthias Töwe 25.03.2015 29

Fragen? Dr. Matthias Töwe Leitung Digitaler Datenerhalt ETH-Bibliothek Rämistrasse 101 8092 Zürich 044 632 60 32 matthias.toewe@library.ethz.ch http://www.library.ethz.ch/digitaler-datenerhalt Matthias Töwe 25.03.2015 30