Angewandte Forschung zu Datenlebenszyklen in der Helmholtz-Gemeinschaft und darüber hinaus

Größe: px
Ab Seite anzeigen:

Download "Angewandte Forschung zu Datenlebenszyklen in der Helmholtz-Gemeinschaft und darüber hinaus"

Transkript

1 Angewandte Forschung zu Datenlebenszyklen in der Helmholtz-Gemeinschaft und darüber hinaus Christopher Jung, KIT (SCC) KIT University of the State of Baden-Wuerttemberg and National Research Center of the Helmholtz Association

2 Overview Motivation Datenlebenszyklus Large Scale Data Facility Large Scale Data Management and Analysis bwfdm-communities Erfahrungen 2

3 Motivation (I): Scientific Big Data Volume Experiment Observation Simulation 3 Value Velocity Datennahme Analyse Transfer Visualisierung Variety Datenquellen Workflows Formate Analysemethoden (Nicht-)Reproduzierbarkeit Kosten Föderationen Verteilter Speicher Verteilte Nutzer Zugriff Sicherheit Datenschutz Nachhaltigkeit Archivierung Preservation Curation Auffindbarkeit Open Access

4 Motivation (II): Data Science Coding Algorithmen Workflows Auffinden von Bottlenecks Debugging 4 Drew Conway Data Science Venn Diagramm (CC A-NC Linzenz), Erklärungen zu Hacking Skills hinzugefügt

5 Wissenschaftlicher Datenlebenszyklus 5

6 Large Scale Data Facility: Überblick Datenservices für Daten-intensive Communities Unterstützt viele Zugriffsprotokolle (NFS, HTTP, SCP, GridFTP, ) Ressourcen für internationale, nationale und Landesprojekte Finanziert durch HGF und Land BW Enge Zusammenarbeit mit WLCG Tier-1 Zentrum GridKa HPC + Cluster

7 Large Scale Data Management and Analysis Dualer Ansatz Data Life Cycle Labs Gemeinsame F&E mit Nuztercommunities Optimierung des Datenlebenszyklus Community-spezifische Tools und Services für Management und Analyse Data Services Integration Team Generische Methoden F&E Daten-Tools und -Services für mehrere Communites Schnittstelle zwischen föderierten Dateninfrastrukturen und DLCLs/Communities 7

8 LSDMA Fakten und Zahlen Helmholtz Portfolio Erweiterung Initiale Projektlaufzeit: Partners: Projektkoordinator: Achim Streit (KIT) Nachhaltigkeit: Aufnahme in die Programmorientierte Förderung der Helmholtz Gemeinschaft ab Helmholtz-Querschnittsverbund Zusammenarbeit mit vielen Projekten 8

9 Ausgewählte LSDMA Aktivitäten (I) DLCL Schlüsseltechnologien Lichtscheibenmikroskopie Mikut et al. (2013), Automated processing of zebrafish imaging data - a survey, Zebrafish 10(3), DOI: /zeb Experimental Microscope 16 TB/d Data Acquisition System Data Ingest Client 400 MB/s Repository Automatic Processing Analysis DLCL Energie Electrical Data Recorder: Hochfrequente 3-Phasen Spannungsmessung zur Qualitätsbestimmung von Stromnetzen EDR-Device 1 EDR-Device n 8.7 GB/d 8.7 GB/d Web Server Generic Data Services LSDF (HDFS/GPFS) Metadata Storage Data Analysis (easimov modeling and analysis toolbox) 9

10 Ausgewählte LSDMA Aktivitäten (II) DLCL Erde&Umwelt GLORIA Projekt Spektrometer auf Flugzeug (DLR) Umstieg auf NoSQL-DB MongoDB Data Services Integration Team Interoperable föderierte Authentifizierungsund Autorisierungs-Infrastruktur Langfristige Bit-Stream Preservation Suche in Metadaten

11 bwfdm-communities Verstehen und analysieren des Forschungsdatenmanagements in allen wissenschaftlichen Arbeitsgruppen an Unis des Landes BW ( Betrachtung des long tail of science ) Einheitliche Darstellung der Portfolios der Uni-Bibliotheken und -Rechenzentren für Forschungsdaten Strukturierte Interviews in zwei Phasen (~20 muss-fragen in erster Phase) Collect, analyze, share Grundlage für Folgeprojekte in Infrastruktur, Services und F&E Laufzeit:

12 Erfahrungen 12 Communities sehr unterschiedlich: Vorwissen Detailtiefe bei Beschreibung des Datenlebenszyklus Genutzte Tools und Services Terminologie Anforderungen bestimmt durch: Ansteigende Datenmengen Kooperation zwischen Gruppen Richtlinien Open Access/Data Sicherung und Aufbewahrung von Primärdaten Laufenden Betrieb In den Communities: Focus auf Datenanalyse Hohe Fluktuation von Computingexperten Allgemein: Interoperable AAI äußerst wichtig Datenschutz rechtlich und technisch eine Herausforderung Communities brauchen Evolution, keine Revolution Anforderungen können sehr spezifisch sein Keine einheitliche Sprache

bwfdm Communities Wissenschaftliches Datenmanagement an den Universitäten Baden Württembergs

bwfdm Communities Wissenschaftliches Datenmanagement an den Universitäten Baden Württembergs bwfdm Communities Wissenschaftliches Datenmanagement an den Universitäten Baden Württembergs Forschungsdatenmanagement an den Universitäten des Landes Baden- Württemberg Bestandsaufnahme und Empfehlungen

Mehr

Forschungsdatenmanagement im interdisziplinären Biodiversität und Klima Forschungszentrum BiK-F

Forschungsdatenmanagement im interdisziplinären Biodiversität und Klima Forschungszentrum BiK-F Forschungsdatenmanagement im interdisziplinären Biodiversität und Klima Forschungszentrum BiK-F Claus Weiland und Thomas Hickler Workshop des AK Forschungsdaten in der WGL 19. Juni 2013 Outline Intro Case

Mehr

Aufbau Datenportal Deutsche Meeresforschung

Aufbau Datenportal Deutsche Meeresforschung Aufbau Datenportal Deutsche Meeresforschung durch das Marine Network for Integrated Data Access MaNIDA MaNIDA-Team Datenintensive marine Forschung 2 26.04.2013 Angela Schäfer Überblick Impuls- und Vernetzungsfonds

Mehr

RADAR. Ein Datenrepositorium für den Long Tail of Research Data RESEARCH DATA REPOSITORY. Angelina Kraft1, Jan Potthoff2

RADAR. Ein Datenrepositorium für den Long Tail of Research Data RESEARCH DATA REPOSITORY. Angelina Kraft1, Jan Potthoff2 http://www.radar RADAR Ein Datenrepositorium für den Long Tail of Research Data Angelina Kraft1, Jan Potthoff2 7. 8. September 2015 1 Technische Informationsbibliothek (TIB), Hannover 2 Karlsruhe Institute

Mehr

Large Scale Data Management

Large Scale Data Management Large Scale Data Management Beirat für Informationsgesellschaft / GOING LOCAL Wien, 21. November 2011 Prof. Dr. Wolrad Rommel FTW Forschungszentrum Telekommunikation Wien rommel@ftw.at Gartner's 2011 Hype

Mehr

Big Data in der Forschung

Big Data in der Forschung Big Data in der Forschung Dominik Friedrich RWTH Aachen Rechen- und Kommunikationszentrum (RZ) Gartner Hype Cycle July 2011 Folie 2 Was ist Big Data? Was wird unter Big Data verstanden Datensätze, die

Mehr

VRE als Prêt à Porter

VRE als Prêt à Porter VRE als Prêt à Porter Session: Virtuelle Forschungsumgebungen 101. Deutscher Bibliothekartag 2012 R. Bertelmann (Bibliothek des Wissenschaftsparks Albert Einstein) J. Klump (Zentrum für Geoinformationstechnologie)

Mehr

Forschung und Entwicklung am

Forschung und Entwicklung am Forschung und Entwicklung am Stefan Kühne, Axel Ngonga Agenda Motivation Projekte Ausblick 2 Aktuelle IT-Trends Dynamic Infrastructure BYOD Social Business Big Data Identity Management Cloud Computing/SaaS

Mehr

Integration von EMC Documentum mit SharePoint 2007. Karsten Eberding Alliance Manager EMC

Integration von EMC Documentum mit SharePoint 2007. Karsten Eberding Alliance Manager EMC Integration von EMC Documentum mit SharePoint 2007 Karsten Eberding Alliance Manager EMC Haben Sie eine Information Management Strategie? Information ist der höchste Wert im Unternehmen Aber wird oft nicht

Mehr

MOSAIC: Zentrales Datenmanagement als Methode zur Verbesserung der Nachnutzbarkeit medizinischer Forschungsdaten

MOSAIC: Zentrales Datenmanagement als Methode zur Verbesserung der Nachnutzbarkeit medizinischer Forschungsdaten MOSAIC: Zentrales Datenmanagement als Methode zur Verbesserung der Nachnutzbarkeit medizinischer Forschungsdaten Martin Bialke Institut für Community Medicine (Abt. VC) Universitätsmedizin Greifswald 25.

Mehr

Umgang mit Forschungsdaten Institutional Long Tail Research Data

Umgang mit Forschungsdaten Institutional Long Tail Research Data Umgang mit Forschungsdaten Institutional Long Tail Research Data Jochen Schirrwagen Universität Bielefeld RDA-Deutschland-Treffen Potsdam, 20-21 Nov 2014 Agenda FDM - Strategie an der Uni Bielefeld RDA

Mehr

RADAR: Interdisziplinäres Forschungsdatenarchiv RESEARCH DATA REPOSITORIUM. Dr. Angelina Kraft Angelina Kraft Hannover, den 30.06.

RADAR: Interdisziplinäres Forschungsdatenarchiv RESEARCH DATA REPOSITORIUM. Dr. Angelina Kraft Angelina Kraft Hannover, den 30.06. RADAR: Interdisziplinäres Forschungsdatenarchiv Dr. Angelina Kraft Angelina Kraft Hannover, den 30.06.2014 Technische Informationsbibliothek, Hannover Potsdam, den 21. November 2014 PROJEKTÜBERSICHT =

Mehr

Thementisch Anwendungsgebiete und

Thementisch Anwendungsgebiete und Thementisch Anwendungsgebiete und b Erfolgsgeschichten KMUs und Big Data Wien 08. Juni 2015 Hermann b Stern, Know-Center www.know-center.at Know-Center GmbH Know-Center Research Center for Data-driven

Mehr

Intelligent Traveller Early Situation Awareness itesa

Intelligent Traveller Early Situation Awareness itesa Intelligent Traveller Early Situation Awareness itesa Dr. Martin Skorsky, Senior Researcher 22. Juni 2015 1 1 Intelligent Traveller Early Situation Awareness Automatischen Alarmsystems, das Reisende in

Mehr

DARIAH Technische Infrastruktur Sicherheit, Datenhaltung, Nachhaltigkeit

DARIAH Technische Infrastruktur Sicherheit, Datenhaltung, Nachhaltigkeit DARIAH Technische Infrastruktur Sicherheit, Datenhaltung, Nachhaltigkeit DARIAH-DE Preconference Workshop Dhd Konferenz, Passau, 26.3.2014 Peter Gietz, DAASI International GmbH Peter.gietz@daasi.de de.dariah.eu

Mehr

Marine Network for Integrated Data Access MaNIDA

Marine Network for Integrated Data Access MaNIDA Marine Network for Integrated Data Access MaNIDA D-GEO Workshop: Datenmanagement und -verwertung in national geförderten Projekten mit Bezug zur Erdsystemforschung 26.06.2013 Angela Schäfer (Alfred-Wegener-Institut)

Mehr

Beweiswerterhaltendes Datenmanagement im elektronischen Forschungsumfeld

Beweiswerterhaltendes Datenmanagement im elektronischen Forschungsumfeld Beweiswerterhaltendes Datenmanagement im elektronischen 5. DFN-Forum Kommunikationstechnologien in Regensburg Jan Potthoff 22. Mai 2012 (SCC) KIT Universität des Landes Baden-Württemberg und nationales

Mehr

Umstellung der KIT-Teamseiten von SharePoint 2007 nach 2013

Umstellung der KIT-Teamseiten von SharePoint 2007 nach 2013 Umstellung der KIT-Teamseiten von SharePoint 2007 nach 2013 Hinweise für Teamseiten-Administratoren (SCC) KIT University of the State of Baden-Wuerttemberg and National Research Center of the Helmholtz

Mehr

Big Data Umgang mit personenbezogenen Daten im Kontext von digitalen Gesundheits-Akten und Archivierungslösungen

Big Data Umgang mit personenbezogenen Daten im Kontext von digitalen Gesundheits-Akten und Archivierungslösungen Big Data Umgang mit personenbezogenen Daten im Kontext von digitalen Gesundheits-Akten und Archivierungslösungen Dr. med. Peter Langkafel MBA General Manager Public Sector / Healthcare MEE (Middle and

Mehr

RADAR. Matthias Razum. 30. April 2014 dbv Sektion 4: Frühjahrssitzung 2014

RADAR. Matthias Razum. 30. April 2014 dbv Sektion 4: Frühjahrssitzung 2014 RADAR Matthias Razum 30. April 2014 dbv Sektion 4: Frühjahrssitzung 2014 Agenda Das DFG-Projekt RADAR Kostenmodelle der LZA Geschäftsmodell für RADAR LZA als Service Seite 2 Motivation /1 Several researchers

Mehr

Workflow generierte Provenienz Metadaten in PubFlow. Peer Brauer Universität zu Kiel

Workflow generierte Provenienz Metadaten in PubFlow. Peer Brauer Universität zu Kiel Workflow generierte Provenienz Metadaten in PubFlow Peer Brauer Universität zu Kiel Kiel, 23.03.2012 1 > Agenda Agenda Daten und ihre Provenienz Das Projekt PubFlow Provenienzdaten-Erfassung in PubFlow

Mehr

Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick. Volker.Hinz@microsoft.com

Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick. Volker.Hinz@microsoft.com Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick Volker.Hinz@microsoft.com Was sagt der Markt? Fakten Meinung der Analysten zu Microsofts Angeboten Nutzen

Mehr

Big Data Mythen und Fakten

Big Data Mythen und Fakten Big Data Mythen und Fakten Mario Meir-Huber Research Analyst, IDC Copyright IDC. Reproduction is forbidden unless authorized. All rights reserved. About me Research Analyst @ IDC Author verschiedener IT-Fachbücher

Mehr

Digitalisiert und dann?

Digitalisiert und dann? Digitalisiert und dann? Der Aufbau eines Workflows zur Verwaltung und Online-Stellung digitaler Reproduktionen des Landesarchivs Baden-Württembergs Made digital Wege und Ziele Koblenz, 26. November 2014

Mehr

Instrument, Compute, Data Sharing Ressourcen gemeinsam nutzen statt selber aufbauen

Instrument, Compute, Data Sharing Ressourcen gemeinsam nutzen statt selber aufbauen Virtuelle Forschungsumgebungen aufbauen mit D Grid Workshop des WissGridFachberater Teams Instrument, Compute, Data Sharing Ressourcen gemeinsam nutzen statt selber aufbauen 19.01.2011 F.Schlünzen / DESY

Mehr

Neue Publikationsformate und -strukturen in der Psychologie

Neue Publikationsformate und -strukturen in der Psychologie Neue Publikationsformate und -strukturen in der Psychologie Möglichkeiten und Herausforderungen für die Bereitstellung und Qualitätssicherung von Forschungsdaten, Metadaten, Skripten & Co. Armin Günther

Mehr

Was ist Big Data? Versuch einer Positionsbestimmung. Wolfgang Marquardt

Was ist Big Data? Versuch einer Positionsbestimmung. Wolfgang Marquardt Was ist Big Data? Versuch einer Positionsbestimmung Wolfgang Marquardt Vorstandsvorsitzender des Forschungszentrum Jülich 02.06.2015 Jahrestagung des deutschen Ethikrates Ganz sicher auch ein Hype hohe

Mehr

Nutzerhandbuch für LSDF-DIS am SCC/KIT

Nutzerhandbuch für LSDF-DIS am SCC/KIT Nutzerhandbuch für LSDF-DIS am SCC/KIT Steinbuch Centre for Computing, KIT Version 0.7 Inhaltsverzeichnis 1 Einleitung... 1 2 Registrierung... 1 3 Zugangsprotokolle... 4 3.1 Zugriff über Network File System

Mehr

Das SCAPE Projekt: Langzeitarchivierung und Skalierbarkeit Teil 1: Überblick über das SCAPE Projekt

Das SCAPE Projekt: Langzeitarchivierung und Skalierbarkeit Teil 1: Überblick über das SCAPE Projekt Das SCAPE Projekt: Langzeitarchivierung und Skalierbarkeit Teil 1: Überblick über das SCAPE Projekt Dr. Sven Schlarb Österreichische Nationalbibliothek SCAPE ½ Informationstag 05. Mai 2014, Österreichische

Mehr

Workflow-basierte Verarbeitung und Archivierung von Ozeanbeobachtungsdaten

Workflow-basierte Verarbeitung und Archivierung von Ozeanbeobachtungsdaten Workflow-basierte Verarbeitung und Archivierung von Ozeanbeobachtungsdaten Prof. Dr. Wilhelm (Willi) Hasselbring Lehrstuhl Software Engineering http://se.informatik.uni-kiel.de/ Kompetenzverbund Software

Mehr

Big-Data and Data-driven Business KMUs und Big Data Imagine bits of tomorrow 2015

Big-Data and Data-driven Business KMUs und Big Data Imagine bits of tomorrow 2015 Big-Data and Data-driven Business KMUs und Big Data Imagine bits of tomorrow 2015 b Wien 08. Juni 2015 Stefanie Lindstaedt, b Know-Center www.know-center.at Know-Center GmbH Know-Center Research Center

Mehr

Cloud-Architekturen auf verschiedenen Ebenen Seminar: Datenbankanwendungen im Cloud Computing

Cloud-Architekturen auf verschiedenen Ebenen Seminar: Datenbankanwendungen im Cloud Computing Cloud-Architekturen auf verschiedenen Ebenen Seminar: Datenbankanwendungen im Cloud Computing Andreas Wixler INSTITUTE FOR PROGRAM STRUCTURES AND DATA ORGANIZATION, FACULTY OF INFORMATICS KIT University

Mehr

Architektur der DARIAH-DE Forschungsinfrastruktur

Architektur der DARIAH-DE Forschungsinfrastruktur Architektur der DARIAH-DE Forschungsinfrastruktur 1. Sitzung des Wissenscha2lichen Beirates von DARIAH- DE 14. September 2012, GöHngen Rainer Stotzka, Peter Gietz, Rene Smolarski, u.v.a. de.dariah.eu Dienste

Mehr

Automatische Speicherverwaltung im HPC Umfeld. Wolfgang Oestreich BlueArc Germany GmbH

Automatische Speicherverwaltung im HPC Umfeld. Wolfgang Oestreich BlueArc Germany GmbH Automatische Speicherverwaltung im HPC Umfeld Wolfgang Oestreich BlueArc Germany GmbH Agenda BlueArc Überblick und Neuigkeiten Lösung im HPC Umfeld am Beispiel eines Sequencers Ausblick BlueArc - Überblick

Mehr

Kosten der digitalen Langzeitarchivierung. AP5 - Kosten

Kosten der digitalen Langzeitarchivierung. AP5 - Kosten Kosten der digitalen Langzeitarchivierung AP5 - Kosten Experten-Workshop 9.12.2008 Frank Dickmann 1 Kosten der LZA Lang, Susanne. 2008. Ist-Zustand der Langzeitarchivierung von Digitalisaten: Die Ergebnisse

Mehr

Datenbankmanagement mit Klimadaten. Frank Toussaint Deutsches Klimarechenzentrum, Hamburg

Datenbankmanagement mit Klimadaten. Frank Toussaint Deutsches Klimarechenzentrum, Hamburg Datenbankmanagement mit Klimadaten Frank Toussaint Deutsches Klimarechenzentrum, Hamburg 1 D K R Z High performance computing Parallelization of climate models Efficient management of highest data volumes

Mehr

Open Access und Open Data in Horizon 2020. Workshop Foster/FFG, Wien, 11. Juni 2015 Barbara Sánchez Solís, Paolo Budroni, Universität Wien

Open Access und Open Data in Horizon 2020. Workshop Foster/FFG, Wien, 11. Juni 2015 Barbara Sánchez Solís, Paolo Budroni, Universität Wien Open Access und Open Data in Horizon 2020 Workshop Foster/FFG, Wien, 11. Juni 2015 Barbara Sánchez Solís, Paolo Budroni, Universität Wien DER KONTEXT Sánchez, Budroni Universität Wien 2 11 Juni 2015 e-infrastructures

Mehr

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria Analyse von unstrukturierten Daten Peter Jeitschko, Nikolaus Schemel Oracle Austria Evolution von Business Intelligence Manuelle Analyse Berichte Datenbanken (strukturiert) Manuelle Analyse Dashboards

Mehr

Informationsinfrastrukturen, Forschungsdaten und Entwicklung von Policies Ein Beispiel aus Österreich

Informationsinfrastrukturen, Forschungsdaten und Entwicklung von Policies Ein Beispiel aus Österreich Informationsinfrastrukturen, Forschungsdaten und Entwicklung von Policies Ein Beispiel aus Österreich Barbara Sánchez Solís Paolo Budroni DINI/nestor Workshop, Berlin, am 2.10.2014 Processes -> terminologies

Mehr

Software development with continuous integration

Software development with continuous integration Software development with continuous integration (FESG/MPIfR) ettl@fs.wettzell.de (FESG) neidhardt@fs.wettzell.de 1 A critical view on scientific software Tendency to become complex and unstructured Highly

Mehr

Die wichtigsten Funktionen von Red Hat Storage Server 2.0 im Überblick:

Die wichtigsten Funktionen von Red Hat Storage Server 2.0 im Überblick: Red Hat Storage Server Die wichtigsten Funktionen von Red Hat Storage Server 2.0 im Überblick: Offene Software Lösung für Storage Ansprache über einen globalen Namensraum Betrachtet Storage als einen virtualisierten

Mehr

Steinbuch Centre for Computing (SCC)

Steinbuch Centre for Computing (SCC) (SCC) Achim Streit (SCC) KIT University of the State of Baden-Wuerttemberg and National Research Center of the Helmholtz Association www.kit.edu Mission of SCC IT-services under

Mehr

Technologieförderschwerpunkt des BMWi

Technologieförderschwerpunkt des BMWi Forschungsbereich Konvergente IKT - Technologieförderschwerpunkt des BMWi Überblick, Trends, Perspektiven Future Internet PPP 22.5.2013 Dr. Alexander Tettenborn Referatsleiter Entwicklung konvergenter

Mehr

Storage Summit 2014. Zellescher Weg 14 Willers-Bau A206 Tel. +49 351-463 - 35450

Storage Summit 2014. Zellescher Weg 14 Willers-Bau A206 Tel. +49 351-463 - 35450 Storage Summit 2014 Zellescher Weg 14 Willers-Bau A206 Tel. +49 351-463 - 35450 Zentrum für Informationsdienste und Hochleistungsrechnen (ZIH) Zentrale wissenschaftliche Einrichtung der Technischen Universität

Mehr

#Big Data in #Austria

#Big Data in #Austria Mario Meir-Huber und Martin Köhler #Big Data in #Austria Big Data Herausforderungen und Potenziale 23.6.2014 Vorstellung Studie Studie #BigData in #Austria Start: 1.11.2013 30.04.2014 Projektpartner: IDC

Mehr

Forschungsdatenmanagement g sind Universitäten und ihre

Forschungsdatenmanagement g sind Universitäten und ihre Forschungsdatenmanagement g sind Universitäten und ihre Infrastruktur-Einrichtungen i darauf vorbereitet? Gerhard Schneider direktor@rz.uni-freiburg.de Forschungsdaten An Universitäten wird mit Daten recht

Mehr

Datenmanagement-Planung im GFBio Projekt Eine Standortbestimmung

Datenmanagement-Planung im GFBio Projekt Eine Standortbestimmung Datenmanagement-Planung im GFBio Projekt Eine Standortbestimmung DINI-Workshop Datenmanagementpläne Berlin 23.03.2015 Björn Quast GFBio Projekt German Federation for Biological Data Ökologie, Monitoring

Mehr

Forschungsdaten in der Hochenergiephysik - Aufgaben der Bibliothek

Forschungsdaten in der Hochenergiephysik - Aufgaben der Bibliothek Forschungsdaten in der Hochenergiephysik - Aufgaben der Bibliothek Dr. Zaven Akopov Deutsches Elektronen-Synchrotron DESY Inhalt DPHEP Aktivität HEP Daten: Herausforderungen und Besonderheiten Anforderungen

Mehr

Sicherheit in Workflow-Management-Systemen

Sicherheit in Workflow-Management-Systemen Sicherheit in Workflow-Management-Systemen Fakultät für Informatik Institut für Programmstrukturen und Datenorganisation KIT University of the State of Baden-Wuerttemberg and National Research Center of

Mehr

Sven Vlaeminck Leibniz-Informationszentrum Wirtschaft (ZBW)

Sven Vlaeminck Leibniz-Informationszentrum Wirtschaft (ZBW) Sven Vlaeminck Leibniz-Informationszentrum Wirtschaft (ZBW) Inhaltsübersicht: > Projekthintergrund > Vorgehen und Zwischenstand Projektphase 1 > Vorgehen und Zwischenergebnisse ökonomische Anreizanalyse

Mehr

mitp Professional Rethink Big Data Volume, Velocity, Variety von Cornel Brücher 1. Auflage

mitp Professional Rethink Big Data Volume, Velocity, Variety von Cornel Brücher 1. Auflage mitp Professional Rethink Big Data Volume, Velocity, Variety von Cornel Brücher 1. Auflage Rethink Big Data Brücher schnell und portofrei erhältlich bei beck-shop.de DIE FACHBUCHHANDLUNG Thematische Gliederung:

Mehr

Energie Management-Systeme und Applikationen

Energie Management-Systeme und Applikationen Energie Management-Systeme und Applikationen Page 1 Dashboard Client Datenquellen SCADA Reporting Datenbereitstellung im Büro und über das Web mit dem EMPURON Anwendungsserver Anwendungsserver im "Cluster"

Mehr

Forschungsdaten-Infrastruktur und Forschungsdatenmanagement an der TU Berlin

Forschungsdaten-Infrastruktur und Forschungsdatenmanagement an der TU Berlin Forschungsdaten-Infrastruktur und Forschungsdatenmanagement an der TU Berlin Monika Kuberek Universitätsbibliothek der TU Berlin Webinar 12./20.05.2015 Helmholtz Open Science Webinare zu Forschungsdaten

Mehr

Sprachtechnologie in der Wissenschaft: Digital-Turn in evidenzbasierter Bildungsforschung und -information

Sprachtechnologie in der Wissenschaft: Digital-Turn in evidenzbasierter Bildungsforschung und -information Sprachtechnologie in der Wissenschaft: Digital-Turn in evidenzbasierter Bildungsforschung und -information Iryna Gurevych Sprachtechnologie-Feuerwerk: Aktuelle Anwendungsbeispiele und Zukunftsvisionen

Mehr

Das Knowledge Grid. Eine Architektur für verteiltes Data Mining

Das Knowledge Grid. Eine Architektur für verteiltes Data Mining Das Knowledge Grid Eine Architektur für verteiltes Data Mining 1 Gliederung 1. Motivation 2. KDD und PDKD Systeme 3. Knowledge Grid Services 4. TeraGrid Projekt 5. Das Semantic Web 2 Motivation Rapide

Mehr

QUICK-START EVALUIERUNG

QUICK-START EVALUIERUNG Pentaho 30 für 30 Webinar QUICK-START EVALUIERUNG Ressourcen & Tipps Leo Cardinaals Sales Engineer 1 Mit Pentaho Business Analytics haben Sie eine moderne und umfassende Plattform für Datenintegration

Mehr

Seminar WS 2012/13. S. Chaudhuri et al, CACM, Aug. 2011. Parallel DBS vs. Open Platforms for Big Data, e.g. HaDoop Near-Realtime OLAP

Seminar WS 2012/13. S. Chaudhuri et al, CACM, Aug. 2011. Parallel DBS vs. Open Platforms for Big Data, e.g. HaDoop Near-Realtime OLAP Seminar WS 2012/13 S. Chaudhuri et al, CACM, Aug. 2011 Parallel DBS vs. Open Platforms for Big Data, e.g. HaDoop Near-Realtime OLAP 2 Vorkonfigurierte, komplette Data Warehouse-Installation Mehrere Server,

Mehr

Mehr Mobilität. Digitale Generation. Vielzahl an Geräten. Schnelllebigkeit. Arbeit und Freizeit verschwimmen. Daten Explosion

Mehr Mobilität. Digitale Generation. Vielzahl an Geräten. Schnelllebigkeit. Arbeit und Freizeit verschwimmen. Daten Explosion Arbeit und Freizeit verschwimmen Mehr Mobilität Digitale Generation Vielzahl an Geräten Daten Explosion Wandel in der IT Schnelllebigkeit Überblick App Services Computing Daten-Dienste Netzwerk Automatisiert

Mehr

Steinbuch Centre for Computing. Internationaler ALICE Computing Workshop am SCC. International ALICE Computing Workshop at SCC

Steinbuch Centre for Computing. Internationaler ALICE Computing Workshop am SCC. International ALICE Computing Workshop at SCC ISSN 1866-4954 Mai 2012 / 1 Steinbuch Centre for Computing Internationaler ALICE Computing Workshop am SCC International ALICE Computing Workshop at SCC SCC Steinbuch Centrum für Computing Helmholtz-Gemeinschaft

Mehr

Aufbau einer Infrastruktur für die digitale Archivierung im Staatsarchiv Basel-Stadt

Aufbau einer Infrastruktur für die digitale Archivierung im Staatsarchiv Basel-Stadt Digitale Archivierung im Basel-Stadt 2. März 2010 Aufbau einer Infrastruktur für die digitale Archivierung im Basel-Stadt Werkstattbericht - 14. Tagung des AK AUdS, 2010 Lambert Kansy AKAUdS 2010 1 Digitale

Mehr

GFBio-Fachdatenzentren an deutschen Sammlungen Langzeitzugriff auf biologische Forschungsdaten

GFBio-Fachdatenzentren an deutschen Sammlungen Langzeitzugriff auf biologische Forschungsdaten GFBio-Fachdatenzentren an deutschen Sammlungen Langzeitzugriff auf biologische Forschungsdaten, Peter Grobe, Anton Güntsch, Gregor Hagedorn, Joachim Holstein, Carola Söhngen, Claus Weiland, Tanja Weibulat

Mehr

Social Monitoring. HAW Hamburg Hochschule für Angewandte Wissenschaften University of Applied Sciences Master Informatik - Anwendungen 1 WS 2013/2014

Social Monitoring. HAW Hamburg Hochschule für Angewandte Wissenschaften University of Applied Sciences Master Informatik - Anwendungen 1 WS 2013/2014 HAW Hamburg Hochschule für Angewandte Wissenschaften University of Applied Sciences Master Informatik - Anwendungen 1 WS 2013/2014 Abdul-Wahed Haiderzadah abdul-wahed.haiderzadah@haw-hamburg.de Betreuer:

Mehr

ein verteiltes und repliziertes Dateisystem XtreemOS IP project is funded by the European Commission under contract IST-FP6-033576

ein verteiltes und repliziertes Dateisystem XtreemOS IP project is funded by the European Commission under contract IST-FP6-033576 ein verteiltes und repliziertes Dateisystem is funded by the European Commission XtreemOS IPunder project contract IST-FP6-033576 1 Das XtreemOS Projekt Europäisches Forschungsprojekt gefördert von der

Mehr

Die DARIAH-DE Demonstratoren

Die DARIAH-DE Demonstratoren Die DARIAH-DE Demonstratoren 1. Sitzung des Wissenschaftlichen Beirates von DARIAH-DE 14. September 2012, Göttingen de.dariah.eu Demonstratoren in DARIAH DARIAH Demonstratoren sind fachwissenschaftliche

Mehr

WILLKOMMEN 100.000. Quantum ist der weltweit GRÖSSTE Spezialist für Backup, Recovery und Archivierung von Daten.

WILLKOMMEN 100.000. Quantum ist der weltweit GRÖSSTE Spezialist für Backup, Recovery und Archivierung von Daten. 85 der Fortune 100-Unternehmen arbeiten mit Quantum 10 -mal Produkt des Jahres WILLKOMMEN Quantum ist der weltweit GRÖSSTE Spezialist für Backup, Recovery und Archivierung von Daten. 33 Jahre Branchenerfahrung

Mehr

dcache! The dcache team

dcache! The dcache team dcache The dcache team Antje Petersen Patrick Fuhrmann, Tigran Mkrtchyan Paul Millar, Karsten Schwank, Christian Bernardt (at DESY) Dmitry Litvintsev, Albert Rossi (Fermilab) Gerd Behrmann (NorduNet (formerly

Mehr

Big Data Projekte richtig managen!

Big Data Projekte richtig managen! Big Data Projekte richtig managen! Stuttgart, Oktober 2014 Praktische Herausforderungen eines Big Data Projektes Definition: Was ist Big Data? Big data is a collection of data sets so large and comple

Mehr

Hochleistungs-Disk-I/O

Hochleistungs-Disk-I/O Hochleistungs-Disk-I/O mit Lustre, dcache und AFS eine vergleichende Betrachtung Stephan Wiesand DESY DV 33. Treffen des ZKI AK Supercomputing Hamburg, 2010-03-04 Computing am DESY Standort Zeuthen Batch

Mehr

Erhöhung der Visibilität von Forschungsdaten am Beispiel der Psychologie

Erhöhung der Visibilität von Forschungsdaten am Beispiel der Psychologie Erhöhung der Visibilität von Forschungsdaten am Beispiel der Psychologie Ina Dehnhard & Erich Weichselgartner Leibniz-Zentrum für Psychologische Information und Dokumentation (ZPID) Trier Warum Daten archivieren

Mehr

Praktikum Entwicklung von Mediensystemen mit ios

Praktikum Entwicklung von Mediensystemen mit ios Praktikum Entwicklung von Mediensystemen mit ios WS 2011 Prof. Dr. Michael Rohs michael.rohs@ifi.lmu.de MHCI Lab, LMU München Today Heuristische Evaluation vorstellen Aktuellen Stand Software Prototyp

Mehr

Scale-Up oder Scale Out?

Scale-Up oder Scale Out? Scale-Up oder Scale Out? Ein Leben ohne Hindernisse mit dem neuen Speicher-Betriebssystem von NetApp Mathias Riediger System Engineer NetApp ein Portfolio Anbieter! EF-Series E-Series FAS 2220 FAS 2240

Mehr

Cloud-Computing Seminar - Vergleichende Technologien: Grid-Computing Hochschule Mannheim

Cloud-Computing Seminar - Vergleichende Technologien: Grid-Computing Hochschule Mannheim Sven Hartlieb Cloud-Computing Seminar Hochschule Mannheim WS0910 1/23 Cloud-Computing Seminar - Vergleichende Technologien: Grid-Computing Hochschule Mannheim Sven Hartlieb Fakultät für Informatik Hochschule

Mehr

Long-term Preservation of Documents

Long-term Preservation of Documents Fujitsu Forum Munich 2013 Long-term Preservation of Documents Security and efficency in electronic business processes C114b Nov 6th, 14:00, Room 12 Thomas Walloschke Principal Business Development Manager

Mehr

Zur Rolle von Bibliotheken bei der Einführung von integrierten Forschungsinformationssystemen -

Zur Rolle von Bibliotheken bei der Einführung von integrierten Forschungsinformationssystemen - Zur Rolle von Bibliotheken bei der Einführung von integrierten Forschungsinformationssystemen - Bewährte Tätigkeitsfelder und neue Herausforderungen Regine Tobias KIT-BIBLIOTHEK KIT Universität des Landes

Mehr

Medical Image Processing MediGRID. GRID-Computing für Medizin und Lebenswissenschaften

Medical Image Processing MediGRID. GRID-Computing für Medizin und Lebenswissenschaften Medical Image Processing in Medical Image Processing Image Processing is of high importantance for medical research, diagnosis and therapy High storage capacity Volume data, high resolution images, screening

Mehr

The right to read is the right to mine!

The right to read is the right to mine! The right to read is the right to mine! Christoph Bruch Helmholtz-Gemeinschaft 17. Helmholtz Open Access Webinar zu Forschungsdaten 10. Dezember 2013, 15:00 Seite 2 Was Sie erwartet Text und Data Mining

Mehr

Revolution Analytics eine kommerzielle Erweiterung zu R

Revolution Analytics eine kommerzielle Erweiterung zu R Revolution Analytics eine kommerzielle Erweiterung zu R Webinar am 17.07.2014 F. Schuster (HMS) Dr. E. Nicklas (HMS) Von der Einzelplatzlösung zur strategischen Unternehmens- Software Zur Einführung Was

Mehr

Legacy-Monster im Rechenzentrum bändigen

Legacy-Monster im Rechenzentrum bändigen Legacy-Monster im Rechenzentrum bändigen Silvio Kleesattel, Cloud Technology Officer @beaservices1 Beck et al. Services Cloudler Silvio Kleesattel Technologiebegeistert seit ca. 1978 Entwickler, Admin,

Mehr

IKM-Dienstleistungen des ZIM

IKM-Dienstleistungen des ZIM IKM-Dienstleistungen des ZIM KIM 16.09.2009 Univ.-Prof. Dr.-Ing. Stephan Olbrich Zentrum für Informations- und Medientechnologie (ZIM) sowie Lehrstuhl für IT-Management / Institut für Informatik Heinrich-Heine-Universität

Mehr

nestor - bericht Digitale Forschungsdaten bewahren und nutzen - für die Wissenschaft und für die Zukunft

nestor - bericht Digitale Forschungsdaten bewahren und nutzen - für die Wissenschaft und für die Zukunft Digitale Forschungsdaten bewahren und nutzen - für die Wissenschaft und für die Zukunft nestor Arbeitsgruppe Grid /e-sience und Langzeitarchivierung nestor - bericht Herausgegeben von nestor - Kompetenznetzwerk

Mehr

Software oder Appliance basierende Deduplikation Was ist die richtige Wahl? Storagetechnology 2010

Software oder Appliance basierende Deduplikation Was ist die richtige Wahl? Storagetechnology 2010 Software oder Appliance basierende Deduplikation Was ist die richtige Wahl? Storagetechnology 2010 Frank Herold Manager PreSales CEE Quantums Portfolio StorNextSoftware DXiSerie ScalarSerie ManagementTools

Mehr

Pavlo Baron. Big Data. für IT-Entscheider. Riesige Datenmengen. und moderne Technologien. gewinnbringend nutzen HANSER

Pavlo Baron. Big Data. für IT-Entscheider. Riesige Datenmengen. und moderne Technologien. gewinnbringend nutzen HANSER Pavlo Baron Big Data für IT-Entscheider Riesige Datenmengen und moderne Technologien gewinnbringend nutzen HANSER Inhalt Vorwort XI 1 Management Summary 1 2 Was? 7 2.1 Mein klassisches Business ist konkurrenzlos,

Mehr

Cloud-Dienste in Forschung und Lehre: Wo liegen Chancen und Risiken?

Cloud-Dienste in Forschung und Lehre: Wo liegen Chancen und Risiken? Cloud-Dienste in Forschung und Lehre: Wo liegen Chancen und Risiken? Professor Dr. Wilfried Juling wilfried.juling@kit.edu CHIEF SCIENCE & INFORMATION OFFICER (CSO/CIO) KIT Universität des Landes Baden-Württemberg

Mehr

Zugang zu Föderationen aus Speicher-Clouds mit Hilfe von Shibboleth und WebDAV

Zugang zu Föderationen aus Speicher-Clouds mit Hilfe von Shibboleth und WebDAV Zugang zu Föderationen aus Speicher-Clouds mit Hilfe von Shibboleth und WebDAV Sebastian Rieger Yang Xiang (Rechenzentrum Garching) Harald Richter (Technische Universität Clausthal)

Mehr

Cloud Computing mit mathematischen Anwendungen

Cloud Computing mit mathematischen Anwendungen Cloud Computing mit mathematischen Anwendungen Vorlesung SoSe 2009 Dr. Marcel Kunze Karlsruhe Institute of Technology (KIT) Steinbuch Centre for Computing (SCC) KIT the cooperation of Forschungszentrum

Mehr

Das Vierte Paradigma

Das Vierte Paradigma Das Vierte Paradigma Forschungsdaten im Wissenschaftsprozess Open Up Your Science Aktuelle Trends der Wissenschaftskommunikation (Teil 2) http://research.microsoft.com/en-us/collaboration/fourthparadigm

Mehr

Sicherheitsanforderungen bei der Langzeitarchivierung medizinischer Forschungsdaten auf Grid-Basis

Sicherheitsanforderungen bei der Langzeitarchivierung medizinischer Forschungsdaten auf Grid-Basis Sicherheitsanforderungen bei der Langzeitarchivierung medizinischer Forschungsdaten auf Grid-Basis Security-Workshop NGI-DE Jahrestreffen 19. Mai 2011, Garching Fred Viezens Anforderungen (1) Nachvollziehbarkeit/Provenienz

Mehr

Diversity Workbench Mobilisation of High Quality Species Occurrence Data for GBIF

Diversity Workbench Mobilisation of High Quality Species Occurrence Data for GBIF Diversity Workbench Mobilisation of High Quality Species Occurrence Data for GBIF Dagmar Triebel Markus Weiss, Dieter Neubacher, Wolfgang Reichert, Gregor Hagedorn, Gerhard Rambold DWB Concept and Design

Mehr

Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien. Berlin, Mai 2013

Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien. Berlin, Mai 2013 Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien Berlin, Mai 2013 The unbelievable Machine Company? 06.05.13 The unbelievable Machine Company

Mehr

Andreas Emhart Geschäftsführer Alegri International Group

Andreas Emhart Geschäftsführer Alegri International Group Andreas Emhart Geschäftsführer Alegri International Group Agenda Vorstellung Alegri International Überblick Microsoft Business Intelligence Sharepoint Standard Business Intelligence Tool Excel Service

Mehr

Konrad Kastenmeier. Die Plattform für Web-Browser-basierte Nutzung von Microsoft Office. Überblick Microsoft Office System

Konrad Kastenmeier. Die Plattform für Web-Browser-basierte Nutzung von Microsoft Office. Überblick Microsoft Office System Die Plattform für Web-Browser-basierte Nutzung von Microsoft Office Überblick Microsoft Office System Die Weiterentwicklung von Microsoft Office Microsoft SharePoint Server das unbekannte Wesen Einsatzszenarien

Mehr

Eingliederung der in DARIAH-DE entwickelten und angebotenen Komponenten in die Strukturen der Rechenzentren (M 2.4.1)

Eingliederung der in DARIAH-DE entwickelten und angebotenen Komponenten in die Strukturen der Rechenzentren (M 2.4.1) Eingliederung der in DARIAH-DE entwickelten und angebotenen Komponenten in die Strukturen der Rechenzentren (M 2.4.1) Version 23.02.2015 Cluster 2 Verantwortlicher Partner RZG DARIAH-DE Aufbau von Forschungsinfrastrukturen

Mehr

H. Enke, Sprecher des AK Forschungsdaten der WGL

H. Enke, Sprecher des AK Forschungsdaten der WGL https://escience.aip.de/ak-forschungsdaten H. Enke, Sprecher des AK Forschungsdaten der WGL 20.01.2015 / Forschungsdaten - DataCite Workshop 1 AK Forschungsdaten der WGL 2009 gegründet - Arbeit für die

Mehr

Fortbildung elearning

Fortbildung elearning Media Design Center (MDC) Fortbildung elearning elearningcms Content Management and Modelling http://elearning.tu-dresden.de/fortbildung elearning@tu-dresden.de Christian Meier Motivation Erstellung und

Mehr

Von Big zu Smart - Wie Daten in Wirtschaft und Gesellschaft zu Innovationen führen

Von Big zu Smart - Wie Daten in Wirtschaft und Gesellschaft zu Innovationen führen Von Big zu Smart - Wie Daten in Wirtschaft und Gesellschaft zu Innovationen führen 27. März 2014 TUM School of Management Technische Universität München W3-Professorin Lehrstuhl für Strategie und Organisation

Mehr

Big Data: Definition, Einführung und Live Democase [C1] Arne Weitzel Uetliberg, 16.09.2014 www.boak.ch

Big Data: Definition, Einführung und Live Democase [C1] Arne Weitzel Uetliberg, 16.09.2014 www.boak.ch Big Data: Definition, Einführung und Live Democase [C1] Arne Weitzel Uetliberg, 16.09.2014 www.boak.ch Unstrukturierte Daten spielen eine immer bedeutender Rolle in Big Data-Projekten. Zunächst gilt es

Mehr

Das LHC-Computing-Grid

Das LHC-Computing-Grid Das LHC-Computing-Grid Von Julian Gethmann WS 11/12 KIT Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der Helmholtz-Gemeinschaft www.kit.edu Überblick Ansprüche an die Rechnerinfrastruktur

Mehr

Fraunhofer Resource Grid

Fraunhofer Resource Grid Fraunhofer Resource Grid Fraunhofer Resource Grid Andreas Hoheisel (andreas.hoheisel@first.fraunhofer.de) Uwe Der (uwe.der@first.fraunhofer.de) Computing Grids Computing Grids Das Netz ist der Computer

Mehr

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher

Mehr

Von Big Data zu Smart Data

Von Big Data zu Smart Data Von Big Data zu Smart Data mit Technologieförderung des BMWi Big Data Summit BITKOM-Konferenz; Bonn, 24.06.2013 Dr. Andreas Goerdeler Unterabteilungsleiter Informationsgesellschaft; Medien Bundesministerium

Mehr