Anwendungsfall Sozialwissenschaften: Kollaborative Datenauswertung in virtueller Arbeitsumgebung



Ähnliche Dokumente
Virtuelle Forschungsumgebung für die Sozial- und Wirtschaftswissenschaften VFU SuW. Erster Nutzungsworkshop Göttingen, 21.

Peter Bartelheimer, Tanja Schmidt Diesseits der Datenschnittstelle Nutzung von Forschungsdaten in virtuellen Arbeitsumgebungen

Peter Bartelheimer Daten in Virtuellen Forschungsumgebungen

Forschungsdatenmanagement in disziplinären Verbundprojekten eine Praxisreflexion

Arbeiten im Verbund nichttechnische und technische Anforderungen

Das Forschungsdatenzentrum Des Statistischen Bundesamtes

Protokoll des 2. Workshops Virtuelle Arbeitsumgebung für sozioökonomische Forschung und Berichterstattung Göttingen,

Dateninfrastruktur für qualitative Daten: das Zentrum elabour

Modellprojekt. Kollaborative Datenauswertung und Virtuelle Arbeitsumgebung VirtAug. Zwischenbericht. Juni 2010

Das Verbundprojekt Virtuelle Forschungsumgebung für die Sozioökonomische Berichterstattung. (VFU soeb 3)

Das Forschungsdatenzentrum (FDZ) Bildung am DIPF Archivierung und Bereitstellung von Daten der Bildungsforschung. Maike Porzelt

Forschungsdatenzentren in Deutschland - Zugang und Weiterentwicklung von Mikrodaten

Workshop. Virtuelle Arbeitsumgebung für sozio-ökonomische Forschung und Berichterstattung. Göttingen, 05. November 2010 Harry Enke (AIP)

Protokoll des Workshops Fachwissenschaftliche Anforderungen an eine virtuelle Arbeitsumgebung für SOEB Göttingen, 9. Februar 2010

Workshop.»Virtuelle Arbeitsumgebung für Forschung und Berichterstattung mit Wirtschafts- und Sozialdaten«Göttingen, 19. Juli 2010

Forschungsdaten und Forschungsdateninfrastrukturen in den Wirtschaftswissenschaften.

Langzeitarchivierungskonzepte, Visualisierungsmöglichkeiten

FORSCHUNGSDATENZENTRUM DER STATISTISCHEN LANDESÄMTER - FORSCHUNGSDATENNETZWERK -

DOI s bei GESIS. Oliver Watteler, Abt. Datenarchiv Sozialwissenschaften

Forschungsdatenmanagement

Offener Zugang zu Forschungsdaten vs. Datenschutz: Institutionelle und technische Lösungsmodelle in den Sozial- und Wirtschaftswissenschaften

Das Forschungsdatenzentrum der Bundesanstalt für Arbeit

SAS im Forschungsdatenzentrum der Statistischen Landesämter

Sozioökonomische Modellierung (soem) auf Basis von INFORGE im Rahmen der sozioökonomischen Berichterstattung (soeb)

Sozioökonomische Modellierung (soem) auf Basis von INFORGE im Rahmen der sozioökonomischen Berichterstattung (soeb)

Forschen mit dem Mikrozensus Bericht aus der Projektarbeit

Innovative Dienstleistungen fördern: Verhandlung erweiterter Nutzungsszenarien für elektronische Medien

SOEP und DOI. Jan Goebel (DIW Berlin) 12. Dezember DataCite Workshop:Forschungsdatenmanagement

FDM in den Wirtschaftswissenschaften Aktivitäten der ZBW

Erwerbs- und Zeitmuster in der sozioökonomischen Berichterstattung

Mikrodaten der amtlichen Statistik: Rahmenbedingungen der Nutzung und Angebot

Zugang zu Mikrodaten des Zensus 2011 über die Forschungsdatenzentren des Bundes und der Länder. Nina Storfinger

Erwerbs- und Zeitmuster in der sozioökonomischen Berichterstattung

Fragebogen des Forschungsdatenzentrums der BA im IAB zum Datenbedarf

Weitergedacht Remote Data Access in der Virtuellen Forschungsumgebung: Proof of Concept

Das Forschungsdatenzentrum im Zielkonflikt zwischen Datenschutz und Forschungsfreiheit

Forschungsdatenzentren (FDZ) der amtlichen Statistik

Beweissicheres elektronisches Laborbuch (BeLab)

Data Warehouse für boden- und agrarwissenschaftliche Forschungsdaten

Elasticsearch in Forschungsinfrastrukturen der Sozial- und Bibliothekswissenschaften Cloud-skalierbare Suche in Volltexten und strukturierten Daten

PASS Panel Arbeitsmarkt und soziale Sicherung

Sekundäranalyse von komplexen Datensätzen: Erfahrungen aus den Nutzerschulungen des Sozio-oekonomischen Panels (SOEPcampus)

Die informationelle Infrastruktur in Deutschland

Bericht über die Veranstaltung des Forschungsverbunds Sozioökonomische Berichterstattung am 13. November 2009

Einführung in das Metadatenschema der VFU soeb 3

Initiative in Deutschland Ziele und Maßnahmen des BMBF. Die E-SCIENCE-Initiative

Datenzugang für die Wissenschaft am Beispiel der amtlichen Krankenhausstatistik

Umgang mit Forschungsdaten -

infinite Eine informationelle Infrastruktur für das E-Science Age

Veröffentlichungsversion / Published Version Abschlussbericht / final report

FIZ Karlsruhe und seine Rolle in OpenTA

IANUS als fachspezifisches Forschungsdatenzentrum für die Altertumswissenschaften in Deutschland

Weitere Infrastruktureinrichtungen für die sozialwissenschaftliche Forschung

Sozial ist, was Arbeit schafft? Teilhabemuster im Umbruch und neue Unsicherheiten. Präsentation: Sabine Fromm (SOFI)

Die Allianz-Initiative der Wissenschaftsorganisationen und Ihre Aktivitäten im Bereich Open Access

Data Sharing mit SowiDataNet

KONSUM UND TEILHABE VON ÄLTEREN

Zum Effekt von Abgaben und Transfers auf die personelle Einkommensverteilung

Forschungsdaten. Forschungsdatenmanagement und Infrastrukturen. Albrecht Schmidt

Erwerbshaushalte und nicht standardisierte Beschäftigung Ergebnisse aus dem Mikrozensus

Archivische Methoden zur digitalen Langzeitarchivierung von Forschungsdaten

Welche Daten kann die amtliche Statistik zur Analyse von Verdienstunterschieden zwischen Männern und Frauen Bereitstellen?

Persistent Identifiers und die Zitation von Forschungsdaten. Brigitte Hausstein und Anja Wilde

Rechtliche Rahmenbedingungen

Arbeitszeitwünsche von Frauen und Männern Einflussfaktoren und Realisierungschancen

Die Beschäftigtenstichprobe und weitere Daten des Forschungsdatenzentrums der BA im IAB

Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Leipzig, 21. März 2007

openta Erläuterungen zum Fortsetzungsantrag an die DFG

Rede von Gerd Heyer Referatsleiter "Grundsatzfragen der Arbeitsmarktpolitik" im Bundesministerium für Arbeit und Soziales

FORSCHUNGSDATENMANAGEMENT IN NRW

Das beweissichere elektronische Laborbuch in der PTB. BeLab

MODUL 3-2: Daten Nutzen welche Daten wie für die Nachnutzung aufbereiten

Forschungsdatenzentrum

Forschungsdatenmanagement

Open Science: Neue Aufgabenfelder für Bibliotheken

Wirtschaftsstatistische Paneldaten und faktische Anonymisierung

Sarah Hartmann. ORCID DE Förderung der ORCID in Deutschland

Universität zu Köln V O R S T E L L U N G

Peter Bartelheimer Jobs per Selbstbedienung? Themenskizze zum virtuellen Arbeitsmarkt

Die vorliegenden Unterlagen wurden im Rahmen des

Informationen zum Thema Forschungsdatenmanagement

Mikrozensus Datenproduktion und Datenanalyse in der amtlichen Statistik

Spannungsfeld Sozialdatenschutz und Nutzung von Sozialdaten durch die Wissenschaft - Handhabung bei der BA (Teil 2)

1.2. Projektablauf Wann beginnt die Projektlaufzeit? Wann endet die Projektlaufzeit?

Hochschul- und Berufsbildungsdaten der amtlichen Statistik

RADAR. ABLAGE & NACHNUTZUNG von FORSCHUNGSDATEN. Dr. Angelina Kraft. Technische Informationsbibliothek (TIB), Hannover

Fernrechnen, die neue Dimension des Datenzugangs?

Archivierung digitaler Mikrodaten in Baden-Württemberg

Sekundärnutzung arbeits, -organisations- und wirtschaftspsychologischer

Angebot und Zugang zu den Register- und Befragungsdaten der BA und des IAB

Forschungsdatenmanagement mit DARIAH-DE. Lisa Klaffki Herzog August Bibliothek Wolfenbüttel 11. Oktober 2018

Einführung zu Langzeitarchivierung. Frank Dickmann Universitätsmedizin Göttingen

Sozioökonomie weiter denken Projektionen und Szenarien zu Zuwanderung und Digitalisierung. soeb-werkstattgespräch 9. September 2016, Berlin

Konzept zur Anonymisierung der Volkszählung der Bundesrepublik Deutschland im Jahre 1970 zur Verwendung als Public-Use-File

Ein Blick auf die Grid-Architektur

Neue Datenformate warten auf uns: Forschungsprimärdaten in der qualitativen Sozialforschung

Linking Data and Publications Anforderungen und Vorgehensweise am Beispiel des Aufbaus eines publikationsbezogenen Datenarchivs.

Transkript:

Anwendungsfall Sozialwissenschaften: Kollaborative Datenauswertung in virtueller Arbeitsumgebung Begutachtung des WissGrid AP 3 28. Januar 2010, AIP Potsdam Peter Bartelheimer Tanja Schmidt SOFI, Göttingen

Sozioökonomische Berichterstattung (soeb) Berichterstattung zur sozioökonomischen Entwicklung Deutschlands Umbruch in Wirtschafts- und Lebensweise Auswirkungen auf Wohlfahrt und Ungleichheit Wohlfahrtsmessung BIP ist kein Wohlfahrtsmaß Forschungsverbund sozialwissenschaftlicher Institute mit Mitteln der Forschungsförderung (BMBF) Neue Brücken zwischen Sozialforschung und Sozialberichterstattung Übertragung von Forschungsergebnissen in Konzepte und Indikatoren für Dauerbeobachtung Mehr Information: www.soeb.de

Methoden und Datengrundlage Nutzung neuer Infrastruktur (Sozial- und Wirtschaftsdaten) Mikrodatenzugänge über Forschungsdatenzentren prozessproduzierte Längsschnittdaten, Panelstudien Sekundärnutzung amtlicher oder prozessproduzierter Mikrodaten, z.b. Sozio-oekonomisches Panel (GSOEP) Mikrozensus Integrierte Erwerbsbiografien, Linked Employer- Employee-Daten Integration von Mikrodatenanalysen in makroökonometrische Modelle Nutzung von Szenariotechniken und Projektionsmodellen

Stand der Arbeit Erster Bericht zur sozioökonomischen Entwicklung Deutschlands (soeb 1) Arbeit und Lebensweisen (SOFI u.a.) 2005) Zweiter Bericht sozioökonomischen Entwicklung Deutschlands (soeb 2) Teilhabe im Umbruch (im Erscheinen, 2010) Dritter Bericht sozioökonomischen Entwicklung Deutschlands (soeb 3) Fachöffentliche Konzepthase Werkstattreihe 1. Hj. 2010

Modellprojekt VirtAug für soeb 3 Modellprojekt Kollaborative Datenauswertung und Virtuelle Arbeitsumgebung VirtAug Laufzeit August 2009 bis Juli 2010 im Rahmen der Konzeptphase für soeb 3 Förderung durch BMBF Projektdurchführung: SOFI (Göttingen) Dr. Peter Bartelheimer (Projektleitung), Tanja Schmidt Kooperation mit Forschungsdatenzentrum Soziooekonomisches Panel (DIW) Unterauftrag zur technischen Evaluation der Grid- Entwicklung

Ziele des Modellprojekts VirtAug Anforderungsprofil für virtuelle Vernetzung von Verbundpartnern (Forschungseinrichtungen) an verschiedenen Standorten zur Sekundäranalyse von Forschungsprimärdaten Archivierung und Dokumentation von Arbeitsergebnissen Prüfung bestehender IT-Entwicklung in der Grid- Community auf ihre Eignung Erarbeitung eines ersten Umsetzungskonzeptes für die Arbeit an soeb 3 Ggf. Vorarbeiten für einen "Anwendungsfall Sozialwissenschaften" in der D-Grid-Initiative

Langzeitarchivierung... Langzeitarchivierung von Primärdaten durch Datenhalter (FDZ) Anforderungen an Langzeitarchivierung von Arbeitsdateien Regeln guter wissenschaftlicher Praxis (DFG 1998) Originaldaten (Primärdaten), die Grundlage von Veröffentlichungen sind, sollen zehn Jahre aufbewahrt werden Zugangsmöglichkeiten für berechtigte Dritte Überprüfung von Arbeitsergebnissen, Reproduzierbarkeit Arbeit nach Wissensstand ( lege artis ) Regeln für Sicherung und Aufbewahrung von Primärdaten:) Antragsanforderungen Datenmanagementkonzepte als Antragsbestandteil in Forschungsförderung (z.b. DFG)

... und mehr: kollaborative Datenauswertung Arbeitsteilige Arbeit an Forschungsdatensätzen Aufbereitung von Arbeitsdateien, Data Matching (Beispiele SOEP, LIAB) Gemeinsame Erstellung modularer Auswertungssyntax Transfer spezieller Datenexpertise Nutzung von Daten, Syntax in verschiedenen Arbeitspaketen Konvertierung in andere Statistikprogramme Archivierung von Outputs, Übertragung in Excel Nachnutzbarkeit für spätere Arbeitsphasen: Aktualisierung, lange Reihen für berechtigte Dritte

Sekundärnutzung sozialwissenschaftlicher Mikrodaten Forschungsdateninfrastruktur für Einzelnutzer Grundfiles auf viele Forschungsdatenzentren / Datenhalter verteilt Nutzung für Forschung in drei Verfahren Fernrechnen Onsite-Rechnen faktisch anonymisierte Scientific Use Files (SUF) Zugangsbeschränkung in Einzelnutzungsverträge von Verbundpartner/inne/n

Probleme im arbeitsteiligen Arbeitsprozess Kein gemeinsamer Zugriff auf Grunddaten Onsite-Files, SUF nicht identisch Probleme bei explorativer Datenanalyse, Fehlersuche, Übernahme von Syntaxmodulen Gemeinsame Nutzung generierter Arbeitsdateien kann Datenschutzbelangen und Nutzungsregeln der Datenhalter widersprechen Beschränkte PC-Speicher- und Rechenkapazität bei großen Datensätzen (z.b. IEBS; LIAB) bei komplizierten Längsschnittverfahren (z.b. Sequenzanalysen, OMA)

Anwendungsfall Mikrozensus Partnerinstitute arbeiten mit verschiedenen Scientific Use Files (Unterstichproben) Gemeinsame Syntax ergibt keine identischen Ergebnisse Nutzungsvertrag eines Partners mit FDZ für Onsite-File Onsite-Rechnen einer Person zu festgesetzten Zeiten / Terminen mit An- und Abreise Für aktuellsten Mikrozensus (2007) nur Onsite-File Abweichende Datenstruktur von Onsite-File und SUF Zellenbesetzungen können nicht vorab überprüft werden Spieldatensätze lassen keine inhaltliche Kontrolle von Auswertungssyntax über Randverteilungen zu Kein gemeinsamer, gleichzeitiger Zugriff auf Onsite- Outputs

Die (geplante) Grid-Forschungsumgebung (1) Forschungsdatenarchiv Gemeinsamer Zugriff auf Grunddaten (?) Regelungsbedarf mit Forschungsdatenzentren Archivierung und Nachnutzung von Arbeitsdateien Datenschutz und beschränkte Zugriffsrechte entsprechend Nutzungsverträgen mit Datenhaltern entsprechend Interessen der Partnerinstitute Archivierung und Dokumentation von Syntax und Outputs (Gemeinsame Dokumentationsregeln) Archivierung und Dokumentation von Arbeitsunterlagen, Arbeitspapieren

Die (geplante) Grid-Forschungsumgebung (2) Datenkonvertierung Forschungsdaten (Datenformate, z.b. SPSS, Stata) Auswertungssyntax für verschiedene Statistikprogramme Provenienzdienst, Datenextraktion, Valisierung Welche Datensätze sind vorhanden? (Dokumentationsstandards) Wer hat Datensätze, Syntax erstellt? Wie wurde Syntax geprüft? Projekt-WIKI zur internen net-basierten Kommunikation zwischen Kooperationspartnern

Die (geplante) Grid-Forschungsumgebung (3) Unterstützung von Textproduktion Schnittstelle zur Projekt-Website: Ergebnisdokumentation Zugriff auf Outputs durch Dritte Offene Fragen Gemeinsame Lizenz für Statistikprogramme auf Grid-Rechner? Gemeinsame Nutzung von Rechnerkapazität? Geistiges Eigentum an Syntax, Arbeitsdateien

Nächste Schritte in VirtAug Workshop am 9.2.2010: Forschungsverbund, Forschungsdatenzentren, WissGRID (LZA, Fachberater) Spezifikation von Anforderungen an Grid- Forschungsumgebung (Februar 2010) Vergabe einer technischen Expertise zu Nutzungsmöglichkeiten bestehender Grid- Entwicklungen, Abschätzung von Entwicklungsbedarf (ca. März 2010) Projektförmiges Umsetzungskonzept für Verbundprojekt Dritter Bericht zur sozioökonomischen Entwicklung Deutschlands (soeb 3) (Juli 2010)

Exkurs Ein möglicher anderer Anwendungsfall Qualitative Empirie in Verbundinstituten (z.b. Fallstudien, vergleichbar MediGRID) Langzeitarchivierung, Nachnutzung von Korrespondenz Fallbezogenen Dokumenten (für Dokumentenanalysen) Erhebungsinstrumenten (z.b. Leitfäden, ausgefüllte Erhebungsbögen, Beobachtungsprotokolle) Gesprächsmaterial (Audiodateien, Rohtranskripte, anonymisierte Transkripte Memos und Protokollen Identifizierungs- und Pseudonymisierungslisten Nachnutzung, kollaborative Nutzung derzeit nicht geregelt