Data Archivist. Swiss Data Day. Oliver Watteler GESIS, Abt. Datenarchiv für die Sozialwissenschaften

Ähnliche Dokumente
Drum prüfe, wer sich ewig bindet Digitale Langfristsicherung von Forschungsdaten in den Sozialwissenschaften

Herausgeber. Im Auftrag von. Kontakt. Heike Neuroth Hans Liegmann ( ) Achim Oßwald Regine Scheffel Mathias Jehn Stefan Strathmann

Neben der Online Version 2.3 ist eine Printversion 2.0 beim Verlag Werner Hülsbusch, Boizenburg erschienen.

Herausgeber. Im Auftrag von. Kontakt. Heike Neuroth Hans Liegmann Achim Oßwald Regine Scheffel Mathias Jehn Stefan Strathmann

Automatische Langzeitarchivierung

Zusammenarbeit. Staatsarchiv Bezirke / Gemeinden. bei der digitalen Archivierung

Pilot IBM Langzeitarchiv Martin Walder IBM Schweiz

Herausgeber: Im Auftrag von: Kontakt: Heike Neuroth Hans Liegmann Achim Oßwald Regine Scheffel Mathias Jehn Stefan Strathmann

FDM in den Wirtschaftswissenschaften Aktivitäten der ZBW

Pilotprojekt Digitale Langzeitarchivierung

Herausgeber. Im Auftrag von. Kontakt. Heike Neuroth Hans Liegmann Achim Oßwald Regine Scheffel Mathias Jehn Stefan Strathmann

Herausgeber: Im Auftrag von: Kontakt: Heike Neuroth Hans Liegmann Achim Oßwald Regine Scheffel Mathias Jehn Stefan Strathmann

Konzept. Das Archivieren von Daten und Langzeitspeicher

Was ARNE alles gelernt hat!

Metadaten für die Langzeitarchivierung

Data Sharing mit SowiDataNet

Neben der Online Version 2.3 ist eine Printversion 2.0 beim Verlag Werner Hülsbusch, Boizenburg erschienen.

Herausgeber. Im Auftrag von. Kontakt. Heike Neuroth Hans Liegmann ( ) Achim Oßwald Regine Scheffel Mathias Jehn Stefan Strathmann

Herausgeber. Im Auftrag von. Kontakt. Heike Neuroth Hans Liegmann Achim Oßwald Regine Scheffel Mathias Jehn Stefan Strathmann

Langzeitarchivierungskonzepte, Visualisierungsmöglichkeiten

Records im Kontext Kontextualisierung 2.0 mit Matterhorn METS. 19. AUdS-Tagung Wien, Tobias Wildi,

Forschungsdatenmanagement

Archivierung im Verbund

Auswahl von Forschungsdaten

Herausgeber. Im Auftrag von. Kontakt. Heike Neuroth Hans Liegmann Achim Oßwald Regine Scheffel Mathias Jehn Stefan Strathmann

-Kriterien Kriterienkatalog vertrauenswürdige digitale Langzeitarchive. Brigitta Frucht, Christian Hillen, Svenja Kunze, Petra Liebner

Das Forschungsdatenzentrum (FDZ) Bildung am DIPF Archivierung und Bereitstellung von Daten der Bildungsforschung. Maike Porzelt

Der nestor-kriterienkatalog für vertrauenswürdige digitale Langzeitarchive

Vom Piloten in den Produktivbetrieb Das Digitale Archiv des Bundesarchivs - Karsten Huth / Kathrin Schroeder. K. Huth / K. Schroeder

Konzept für die Definition Signifikanter Eigenschaften von sozialwissenschaftlichen Forschungsdaten

Forschungsdatenmanagement und Förderauflagen zur Archivierung von Forschungsdaten in den Sozialwissenschaften

Handbuch Forschungsdatenmanagement

Beweissicheres elektronisches Laborbuch (BeLab)

Das Informationsmodell von OAIS

Das zweite Leben der Forschungsdaten. Die Gewährleistung von Förderauflagen zu Open Access am Beispiel von Horizon2020.

Kooperation & Nachnutzung der kopal- Lösung. Frank Klaproth

Aufbau einer Infrastruktur für die digitale Archivierung im Staatsarchiv Basel-Stadt

Datenaufbereitung im Vorfeld der Übernahme ins Archiv: Beispiel für einen Pre-Ingest-Workflow

Migration und Emulation Angewandte Magie?

Herausgeber. Im Auftrag von. Kontakt. Heike Neuroth Hans Liegmann ( ) Achim Oßwald Regine Scheffel Mathias Jehn Stefan Strathmann

GESIS - Datenarchiv für Sozialwissenschaften Köln / D

Digitale Langzeitarchivierung von Daten Digital Preservation (DP)

Langzeitarchivierung digitale Bestandserhaltung. Dr. Astrid Schoger, 97. Deutscher Bibliothekartag Mannheim, 03. Juni 2008

Weitere Infrastruktureinrichtungen für die sozialwissenschaftliche Forschung

Preservation Planning im Digitalen Archiv Österreich. Hannes Kulovits

Dienstleistungen von SLUB und TIB für die digitale Langzeitverfügbarkeit. Ein kooperativer Leistungsverbund

Innovative Dienstleistungen fördern: Verhandlung erweiterter Nutzungsszenarien für elektronische Medien

Bundesarchiv Koblenz, d Kerstin Schenke

Forschungsdaten an der Philosophischen Fakultät der Universität zu Köln

Data-Pilotprojekt UZH

Einführung in das OAIS-Referenzmodell

67. Westfälischer Archivtag, Gladbeck, 18. März 2015 Moderation: Dr. Stefan Schröder, Stadtarchiv Greven

Enterprise Content Management für Hochschulen

Digitales Archiv Österreich. Siemens IT Solutions and Services GmbH Alle Rechte vorbehalten.

DOI-Registrierung mit DataCite: Einführung und erste Schritte

Vorstellung. Begriffe und Anforderungen. Langzeitspeicherung / Archivierung. Basiskomponente?!

RADAR Geschäftsmodell, Preise und Verträge

Kapitel 8.6 Mikroverfilmung

Kosten der digitalen Langzeitarchivierung. AP5 - Kosten

Offenes Archiv-Informations-System die deutsche Übersetzung des OAIS-Referenzmodells

Dr. Markus Quandt, GESIS-Leibniz Institut für Sozialwissenschaften Björn Schreinermacher, Universität Bremen

Das OAIS-Modell für die digitale Langzeitarchivierung

Spaten trifft Daten 29. Mai 2015 Data Center for the Humanities (DCH)

Forschungsdatenmanagement an der Humboldt-Universität zu Berlin

Archivierung von digitalen Daten Lösungsansätze mit SIARD und OAIS

Begriffe der Informationsverwaltung

FORSCHUNGSDATEN MODUL 2-4: Die Daten auf dem Lebensweg: Langzeitarchivieurung

Zugang zu archivischer Information - invenio und Portale. Frauke Laufhütte, Rainer Jacobs

nestor: Projektdaten

Emulation als alternative Erhaltungsstrategie. Ergebnisse des Bibliotheksservice-Zentrums und des Landesarchivs Baden-Württembergs im Projekt bwfla

Archivierung mit PDF und XPS. Formate, Standards und Prozessabläufe

Arbeitspaket: Technik

PDF/A für gescannte Dokumente

digitale Langzeitarchivierung mit scopeoais scope solutions ag

Forschungsdatenmanagement an der Technischen Universität Berlin

Digital Preservation Policy. Grundsätze der digitalen Langzeitarchivierung am Datenarchiv für Sozialwissenschaften

Forschungsdatenmanagement

Universität zu Köln V O R S T E L L U N G

Langzeitarchivierung im Österreichischen Staatsarchiv

Herausgeber. Im Auftrag von. Kontakt. Heike Neuroth Hans Liegmann Achim Oßwald Regine Scheffel Mathias Jehn Stefan Strathmann

PDF/A Update und Dienstleistungen für die Langzeitarchiverung

Geeignete Dateiformate und Preservation Planning für Bilddateien

Open Access Infotag Forschungsdatenmanagement

Formatvalidierung bei Forschungsdaten: Wann und wozu?

Bewahrung digitalen Kulturguts als Herausforderung und die Rolle von nestor

Was ist ein Archiv? Archiv

Data Librarians oder: Welche Ausbildung brauchen wir für das Forschungsdatenmanagement in Deutschland?

Das Web-Portal forschungsdaten.info. Gefördert vom Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg

OAIS Das Open Archival Information System - Ein Referenzmodell zur Organisation und Abwicklung der Archivierung digitaler Unterlagen

Kompetenzzentrum für nicht-textuelle Materialien Kooperation Leibniz-Gemeinschaft <>TIB. Margret Plank Leibniz Gemeinschaft AK Presse

Glossar. Kanton St.Gallen Departement des Innern. Amt für Kultur Staatsarchiv St.Gallen

Digitale Langzeitarchivierung im Bund (Österreich) Berthold Konrath Österreichisches Staatsarchiv

Informations- / Bibliothekswissenschaft und Digital Humanities Gemeinsamer Aufbruch in das Zeitalter der digitalen Transformation

Technische Aspekte der Langzeitarchivierung

Dr. Mike Kühne. Philosophische Fakultät Institut für Soziologie Methoden der Empirischen Sozialforschung

Ein Dienst für die Digitale Langzeitarchivierung

Offener Zugang zu Forschungsdaten vs. Datenschutz: Institutionelle und technische Lösungsmodelle in den Sozial- und Wirtschaftswissenschaften

Anforderungen des Bundesarchivs an die Aussonderung elektronischer Akten

Empfehlungen für die elektronische Archivierung

Automatische Klassifikation: Stand der Technik und Veränderungen im Berufsbild des Dokumentars. Automatische Klassifikation:

Transkript:

Data Archivist Swiss Data Day Oliver Watteler GESIS, Abt. Datenarchiv für die Sozialwissenschaften 08.05.2017

Intro Data archivist noch kein anerkanntes Berufsfeld. Annäherung an das Konzept! (1) (2) (3) (4) (5) GESIS Archivare und Archive Sozialwissenschaftliche Forschungsdaten Archivierung Forschungsdaten bei GESIS Was macht ein Datenarchivar? 2

GESIS 3

Gegründet 1986, neu strukturiert 2007 Deckt den gesamten Lebenszyklus empirischer Forschung ab Ist Daten erhebende sowie Daten haltende Einrichtung Bietet ein breites Spektrum an Dienstleistungen rund um die empirische Sozialforschung 4

Datenarchivierung seit 1960 Ursprung 1960: Zentralarchiv für empirische Sozialforschung (1960) Seit 2007: Datenarchiv für die Sozialwissenschaften Ziel Unterstützung sozialwissenschaftlicher Forschung: Förderung von data sharing Angebot informationsreicher Datenquellen Aufgaben Angebot qualitativ hochwertiger Daten und Datenservices Entwicklung von Standards (z.b. DDI XML) Infrastrukturlösungen (z.b. Registrierung über da ra) Inhaltliche Sozialforschung und methodische Forschung zur Datenarchivierung und zum Forschungsdatenmanagement 5

ARCHIVE UND ARCHIVARE 6

Begriffsdefinitionen Archiv = Das Archiv (lat. archivum, altgr. Archeíon = die Behörde/Amtsstelle) bezeichnet zum einen die Institution oder Organisationseinheit, die Archivgut erfasst, erschließt, dauerhaft erhält und nutzbar macht. Zum anderen bezeichnet es das Gebäude oder den Raum (Magazin), der das Archivgut dauerhaft verwahrt (Quelle: Archivschule Marburg; http://www.archivschule.de/uploads/forschung/archivwissenschaftlicheterminologie/terminologie.html; Zugriff: 04.05.2017) 7

Archivgut = Archivgut bezeichnet alle in Archiven dauerhaft verwahrten Unterlagen, [ ]. Die Einzeleinheit wird auch Archivale (Pl. Archivalien) genannt. Zu Archivgut kann prinzipiell jeder Informationsträger erklärt werden. Archivfachliche Aufgaben: Übernahme Bewerten Erschließen Erhalten Bereitstellen (Quelle: Archivschule Marburg; http://www.archivschule.de/uploads/forschung/archivwissenschaftlicheterminologie/terminologie.html; Zugriff: 04.05.2017) 8

Wie ist ein Archiv strukturiert? Open Archival Information System (OAIS) ISO 14721 11

Klassische Archive vs. OAIS Klassisches Archiv Übernahme Bewertung Erschließen Erhalten Bereitstellen OAIS Ingest Data Management Archival storage & Preservation planning Access 12

Datenarchivar? Suche auf Deutsch? Fehlanzeige Suche auf Englisch? Data archivist 13

Lyon et al. (2015) Anforderungsanalye Auswertung Stellenanzeigen Data archivist - noch eher unübliche Tätigkeitsbeschreibung: Rolle von Archivaren oft umbenannt oder neu klassifiziert je nach Arbeitsfeld Schwerpunkte auf Datendokumentation, Datenaufbereitung, Datenintegration, und Datenkollektionen Die benutzte (traditionelle) Sprache spiegelt (klassische) Archivprinzipien 14

Include materials, systems, staff Data management Collection development Support grant activities Networking Degree information science Experience in digital data archives Experience in grant writing Proficiency in web technologies (Programming) Background knowledge social science research 16

SOZIALWISSENSCHAFTLICHE FORSCHUNGSDATEN 17

Sozialwissenschaftliche Daten Sozialwissenschaftlich = Alle Erfahrungswissenschaften, die sich systematisch gesellschaftlichem Zusammenleben befassen (Wörterbuch der Soziologie, 2007) mit Daten = Abbildung eines Ausschnittes der gesellschaftlichen Wirklichkeit zur Untersuchung von sozialen Phänomenen Erzeugung von Daten i.d.r. durch Messung = Zuordnung von Zahlen zu Objekten oder Ereignissen 18

Sozialwissenschaftlich relevante Daten Drei große Bereiche unterscheidbar: 1) Amtliche Statistik (z.b. Mikrozensus) 2) Prozess-produzierte Daten (z.b. Akten Sozialversicherung, Social Media Daten) 3) Empirische Sozialforschung = forschungsgenerierte Daten 19

Beispiel: Allgemeine Bevölkerungsumfrage der Sozialwissenschaften (ALLBUS) Seit 1980 alle 2 Jahre durchgeführte repräsentative Umfrage Ca. 3000 Befragte Verschiedene Erhebungsmodi Beispiel für die weitere Präsentation: ALLBUS 2000 als klassische Umfrage mit Stift und Papier (PAPI) 20

Fragebogen ALLBUS 2000 Treffen AK Archive, Berlin 17./18.02.2014 21

Treffen AK Archive, Berlin 17./18.02.2014 22

DATENARCHIVIERUNG BEI GESIS 23

Was archivieren wir? Forschungsdaten Auswahlkriterien: Beantwortung sozialwissenschaftlich relevanter Fragestellungen Daten nachnutzbar (Formate) Datenerhebung nachvollziehbar (Methodenbeschreibung) Erhebungsinstrument verfügbar Quantitative Daten Breiter Archivierungsauftrag Kooperation mit anderen Daten haltenden Einrichtungen (z.b. Forschungsdatenzentren) Keine Auswahl (z.b. Kassation) wie in staatlichen oder historischen Archiven! 24

Herausforderungen Sicherung neuer Datentypen (Beispiele) Social Media Daten (Fehlendes Einverständnis Teilnehmer) Gendaten (Datenmenge) Sicherung von Datenbanken (Formate) Bsp. Textsammlungen für Inhaltsanalysen Probleme mit Wechsel auf neue Versionen Software (z.b. Microsoft Access)! Sicherung von Videos und Audiodateien (Formate) Bsp. Videos von TV-Debatten in Wahlkämpfen Herausforderung durch Technikbrüche (z.b. Magnetbänder zu digitalen Dateien) Neue Analysesoftware (Formate) 25

Wie archivieren wir? Grundlegender Ablauf dem klassischen Archiv sehr ähnlich GESIS OAIS Datenakquisition (Pre-Ingest) Dateneingang Ingest Datenbeschreibung Langzeitarchivierung Datenaufbereitung Data Management Archival Storage & Preservation Planning Data Management Datenservice Access 26

Datenakquisition (Pre-Ingest) Vorbereitung der Übernahme ins Archiv Kommunikation mit Datengebern Anwendung Auswahlkriterien Vorbereitung Archivierungsvertrag 27

Dateneingang (Ingest) Übernahme ins Archiv Technische Prüfung der Daten und Dokumente Lesbarkeit Dateien Formate Inhaltliche Prüfung der Daten Datenschutzrelevante Informationen Urheberrechtlich geschützte Materialien Übereinstimmung Daten und Dokumente Vollständigkeit Keine Plausibilitätsprüfung! 28

Datenbeschreibung (Dokumentation) Dokumentation in XML ASCII-Format DDI-Standard (Entwicklung DDI Alliance) Vorteile Längere Haltbarkeit Findmittel Datenbestandskatalog Leichte Überführbarkeit in andere DB Online-Katalog (DB) Leichte Überführbarkeit in andere Export in XML möglich Formate (z.b. Pdf) 29

Langzeitarchivierung (LZA) Erhaltung Bitstream Preservation für 10 Jahre oder LZA Archivieren mehr als dauerhafte Speicherung ( Bitstream Preservation ): Erhalt der digitalen Objekte nur ein Ziel! Erhalt von Verfügbarkeit und Interpretierbarkeit! Erhalt der Informationen, die durch digitale Objekte repräsentiert sind! Kernkonzepte: Integrität ( Orginalität der digitalen Objekte) Authentizität ( Echtheit der digitalen Objekte) 86. Deutschen Archivtag 2016 Koblenz 30

Bsp. Herausforderung Dokumente Papierdokument > Digitalisat 300 dpi 56 Graustufen TIFF als Sicherungsformat Pdf als Serviceformat Umstellung auf Pdf/A 86. Deutschen Archivtag 2016 Koblenz 31

Online-Instrumente (Quelle: German Internet Panel 2016) 32

Unsere Antworten Wenige dezidierte Datenformate! Weg von proprietären Formaten: Trennung von Daten und Datendefinition! Möglichst genaue Dokumentation des Entstehungskontextes und damit der Datenbedeutung! Derzeit Arbeit an Archivierungsstrategie mit einem möglichst generischen Kern! 33

Datenservice Off-site : Datendownload (oder Versand Datenträger) On-site : Secure Data Center 34

WAS MACHT EIN DATENARCHIVAR? 35

Definitionsversuch Datenarchivar m/w, eine Person, verantwortlich für die Übernahme, Bewertung, Erschließung, den Erhalt und die Bereitstellung von Daten. Datenarchivare teilen sich ihre Aufgaben mit Datenbibliothekaren und Datenkuratoren, wobei ihr Fokus auf der Langzeitarchivierung der Daten liegt. Datenarchivare müssen über fachspezifisches Wissen zu ihren Daten verfügen und den Umgang mit entsprechenden Werkzeugen zur Bearbeitung und Auswertung dieser Daten beherrschen. 36

Vielen Dank für Ihre Aufmerksamkeit!

Referenzen Lyon, L and Mattern, Eleanor and Acker, Amelia and Langmead, Alison (2015) Applying Translational Principles to Data Science Curriculum Development. In: ipres 2015, November 2-6, 2015, Chapel Hill, North Carolina. (http://d-scholarship.pitt.edu/27159/1/applying_translational_principles_to_dat.pdf; Zugriff: 02.05.2017) Neuroth, Heike; Achim Oßwald; Regine Scheffel; Stefan Strathmann; Karsten Huth (Hg.): nestor-handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung, Version 2.3, Göttingen 2010 (http://nestor.sub.uni-goettingen.de/handbuch/index.php; Zugriff: 04.05.2017) Rat für Sozial- und Wirtschaftsdaten (RatSWD) (Hg.), Forschungsdatenmanagement in den Sozial-, Verhaltens- und Wirtschaftswissenschaften. Orientierungshilfen für die Beantragung und Begutachtung datengenerierender und datennutzender Forschungsprojekte, Berlin 2016 (http://www.ratswd.de/dl/ratswd_output3_forschungsdatenmanagement.pdf; Zugriff: 05.05.2017) 38