Zusammenfassung. Summary

Ähnliche Dokumente
Langzeitarchivierung am D K R Z

Strukturen der wissenschaftlichen Informationsversorgung

Regionalisierung von Klimadaten: Datenmanagement

e-infrastructures Austria

Energy-Efficient Cluster Computing

DKRZ Datenhierarchie Von der Antragstellung bis zur Archivierung

Modelle der Mensch-Umwelt- Interaktion Leitung: Prof. J. Scheffran und Dr. P.M. Link. Thema: Klima Klimamodellierung - Grenzen und Chancen

Institut für Künstliche Intelligenz

Model Driven Architecture (MDA)

Datenbankmanagement mit Klimadaten. Frank Toussaint Deutsches Klimarechenzentrum, Hamburg

Datenmanagement am DKRZ. Hannes Thiemann Deutsches Klimarechenzentrum GmbH

Diversity Workbench. Systemdesign, Datenflüsse und Datenbank-Infrastruktur für drittmittelgeförderte Forschungsprojekte.

2 Grad globale Erwärmung: Was bedeutet das für unser Klima?

Jahrestagung HZG 25. Juni 2013, 18:30 Uhr

Die mathematische Modellierung von Klimaskeptikern und Umweltaktivisten: Klimaänderungen aus der Sicht der Bayesischen Statistik

Sammeln, sortieren, sichern Klimadaten für unsere Zukunft. Ein DFG-gefördertes Forschungsprojekt zur Langzeitarchivierung von Wetter- und Klimadaten

Configuration Management mit Verbosy OSDC Eric Lippmann

Datenmodellierung für Forschungsdatenmanagementpläne

Modellgetriebene Softwareentwicklung. Gabriele Taentzer WS 2012/2013 Philipps-Universität Marburg

THEMA: SAS DATA INTEGRATION STUDIO FÜR MEHR TRANSPARENZ IM DATENMANAGEMENT EVA-MARIA KEGELMANN

Entwicklungs- und Schutzplan (ESP) Rietberg

Das Semantic Technology Institute (STI)

KnowEsis, die e-science-solutions von FIZ Karlsruhe. 10. InetBib-Tagung 10. April 2008, Würzburg

BIG DATA Die Bewältigung riesiger Datenmengen

Anthropogener Klimawandel - Grundlagen, Fakten, Projektionen

Transparente SOA Governance mit Modellierung. OOP 2010 München, 28. Januar 2010, 12:30 Uhr Modeling Day

1. Einführung. Datenbanken Grundlagen

ESiWACE: Auf dem Weg zu wolkenauflösenden Klimamodellen ESiWACE: Towards cloud resolving climate models

Teil 2: IDP Hinweise,templateId=raw,property=publicationFile.pdf/REMO-IDP_Hinweise.

DINI/nestor-WS5: Werkzeuge Breakout-Session: Metadaten in der Praxis. Moderation: Florian Krämer & Dominik Schmitz

Der westafrikanische Monsun im regionalen Klimamodel COSMO-CLM

Prof. Dr. Frank-Michael Chmielewski

Dienste für eine kollaborative Dateninfrastruktur. Daniel Mallmann Jülich Supercomupting Centre Forschungszentrum Jülich GmbH

Notationen zur Prozessmodellierung

Big-Data and Data-driven Business KMUs und Big Data Imagine bits of tomorrow 2015

Seman&sche Daten für den Webau4ri6 einer Bibliothek

Tim Krämer. Archimetrix - Improved Software Architecture Recovery in the Presence of Design Deficiencies. 08. Mai 2013

Neue Wege der Zusammenarbeit Windows SharePoint Services und Office SharePoint Server 2007

FDM in den Wirtschaftswissenschaften Aktivitäten der ZBW

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006

Medical Data Models Ein offenes Repository Medizinscher Formulare

Repositorys der Universität des Saarlandes mit der lokalen Hochschulbibliographie

CIM-Workshop 2017 Frankfurt/Main Einführung in CIM

WP2. Communication and Dissemination. Wirtschafts- und Wissenschaftsförderung im Freistaat Thüringen

Klimawandel in Lateinamerika

Protokolls der 20. Sitzung des Wissenschaftlichen Lenkungsausschusses (WLA) für die M&D-Gruppe am MPI-M und das Deutsche Klimarechenzentrum GmbH

World Data Center for Climate - Produkte und Services für die Klimaforschung. F. Toussaint, M. Lautenschlager

Das Collaborative Climate Community Data and Processing Grid 1 Gridtechnologien für die Erdsystemforschung

Fachbereich Geowissenschaften. Layoutbeispiel einer Bachelorarbeit

Soil moisture and climate change

Eclipse Modeling Framework

Medical Data Models Ein offenes Repository Medizinscher Formulare

Unified Communications, Wohin geht die Reise

Anforderungen der Ingenieurwissenschaften an ein institutionelles Forschungsdatenrepositorium der Universität Stuttgart

Ein Schlüssel ist eine Menge von Attributen (also eines oder mehrere), die eine Datenzeile (Tupel) einer Tabelle eindeutig identifiziert

Wir in Hamburg Joachim Krohn (HZG), Hans-Heinrich Witte (Präsident der WSD Nord) HH und Hans von Storch (HZG) Forschung vor Anker, Husum, 2009

Geo Open Data - bereitstellen und nutzen Fachaustausch Geoinformation

DKE CIM Informationsveranstaltung

Referent: Alessandro Arrigo AAM1. Professor: Prof. Dr. Heindl. Furtwangen,

Desktop Management Interface und andere Initiativen der DMTF

Pressemitteilung. Seite 1 von 6

Design von Dateninfrastrukturen

Oracle Fusion Middleware Überwachung mit Oracle BAM

Forschungsdatenmanagement im interdisziplinären Biodiversität und Klima Forschungszentrum BiK-F

Klimawandel in Deutschland: Was wissen wir und worauf fußen diese Erkenntnisse? Dr. Thomas Deutschländer Deutscher Wetterdienst.

Ben Weissman. ETL und Datawarehouse Design mit Metadaten Vom Developer zum Architekten

Diversity Workbench Mobilisation of High Quality Species Occurrence Data for GBIF

Logo. Michael Lautenschlager (DKRZ) WissGrid AP3 Review, Potsdam

Expressionsdatenanalyse. Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse

Automatisierungsarchitekturen für das Smart Grid Am Beispiel der OPC UA und der IEC Dr.-Ing. Mathias Uslar, Sebastian Rohjans

Risiko Modellierung mit PillarOne PillarOne Risk Management meets Open Source

Seminarvortrag WS 06/07 Thema SCORM. Referent: Matthias Coester Datum: 20. Februar 2007

In diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen.

powered by Data Driven Marketing in E-Commerce CPX Performance Marketing Gipfel Online Marketing Forum Online B2B Conference Social Media Conference

Forschungsdatenmanagement

E-Akte Public. Flexible Lösungen und moderne Betriebskonzepte in Zeiten wachsender Datenmengen

BIM. Building Information Modeling (BIM) Die ganzheitliche Sichtweise von Siemens. siemens.at/bt

Metadaten für die Informationsversorgung von morgen: Kooperativ erstellen - gemeinsam nutzen

Angewandte Forschung zu Datenlebenszyklen in der Helmholtz-Gemeinschaft und darüber hinaus

befassen wir uns mit der Frage, warum Veränderung notwendig geworden ist, in welcher Form sie stattfindet und wo sie hinführt.

Projizierte Auswirkungen des Klimawandels auf die Region im Hinblick auf den Wasserhaushalt

Vortrag von: Ilias Agorakis & Robert Roginer

Ein Java Repository für digitalen Content in Bibliotheken

Automatische Langzeitarchivierung

Zwischen Bandbreitenmodellen und stabilen Trends - erwartete Klimaänderungen. Daniela Jacob

Studienverlaufspläne M.Sc. Computational Science. 19. Juli 2011

Common Warehouse Metamodel und Imperfektion

Medizinische Versorgung im regionalen Vergleich - Vorstellung des Konzeptes

Enterprise Content Management für Hochschulen

Diversity Workbench. Systemdesign, Datenflüsse und Datenbank-Infrastruktur für drittmittelgeförderte Forschungsprojekte.

CHAMPIONS Communication and Dissemination

Konzeptionelle Modellierung von XML-Dokumenttypen

Master-Studiengang & Bewerbung/Zulassung. Judith Zimmermann Studienkoordinatorin, Departement Informatik, ETH Zürich

Umgang mit Forschungsdaten Organisation, Technik und Rahmenbedingungen

Wieviele Dimensionen hat die Welt?

Das Repositorium für Forschungsdaten und publikationen der TU Berlin als Serviceplattform für die Wissenschaftler

Chemical heat storage using Na-leach

EINFÜHRUNG IN DIE WIRTSCHAFTSINFORMATIK -ÜBUNGEN- Marina Tropmann-Frick

Daten haben wir reichlich! The unbelievable Machine Company 1

ONLINE. RESEARCH. GESTALTEN.

Transkript:

Datenflut in der Klimaforschung und daraus resultierendes Datenmanagement am DKRZ Earth system modeling a data intensive science - and data management at DKRZ Michael Böttinger, Stephan Kindermann, Jana Meyer, Hans Ramthun Deutsches Klimarechenzentrum, Hamburg Korrespondierender Autor E-Mail: jana.meyer@dkrz.de Zusammenfassung 2010 wurde die Gruppe Modelle & Daten ins DKRZ als Abteilung Datenmanagement integriert, welche verantwortlich ist für das WDCC, Konsortialrechnungen sowie einen Langzeit-Archivierungsservices. Das DKRZ ist Partner bei Metafor - einem Projekt, welches ein einheitliches Informationsmodell entwickelt und eine einheitliche Nomenklatur für die in der Klimamodellierung gebrauchten Begriffe aufgestellt hat. 2010 informierte das DKRZ die Öffentlichkeit aktiv über seine Arbeit. Neben der Teilnahme an öffentlichen Veranstaltungen organisierte das DKRZ erstmalig eigene Konferenzen. Summary In 2010 the group M&D became the fourth department data management at DKRZ, being in charge for the WDCC, consortial simulations and a long-term archiving service. DKRZ participates in the Metafor project, which created a Common Information Model. The model describes climate data and the models that produce it in a standard way. In 2010 DKRZ informed the public actively about its work. Apart from the participation in public events DKRZ organized own conferences. Metafor CIM eine Standardbeschreibung für Klimamodell-Daten Ziel der Klimaforschung ist es, das gesamte Klimasystem mit all seinen physikalisch-chemisch-biologischen Prozessen und Wechselwirkungen zu verstehen und mit Modellen möglichst wirklichkeitsnah zu reproduzieren. Klimamodelle sind umfangreiche Computerprogramme, mit denen das Klimasystem simuliert wird. Diese Computerprogramme werden mit bestimmten Einstellungen betrieben, die für einzelne Simulationen variiert und als Experimente zusammengefasst werden. Solche Experimente werden auf Höchstleistungsrechnern durchgeführt und liefern sehr große Datenmengen, welche in einem Archiv so gespeichert werden müssen, dass die weitere Auswertung möglichst effizient erfolgen kann. Die Ergebnisse der Klimamodellierung sollen allen Interessierten, Wissenschaftlern wie auch anderen Personen oder Institutionen zur Verfügung stehen. Vor einer Benutzung für bestimmte Fragestellungen, z.b. 2011 Max-Planck-Gesellschaft www.mpg.de 1/5

zum Auffinden und zur Abschätzung der Relevanz und Qualität der Daten, müssen alle Komponenten wie Modell, Rechner, Experiment, Daten und Qualität beschrieben und parallel zu den eigentlichen Daten abgespeichert werden. Hierfür werden sogenannte Metadaten verwendet. Das Logo des Metafor-Projektes DKRZ Projekt Metafor steht für Common Metadata for Climate Modelling Digital Repositories (Gemeinsame Metadaten für die digitale Speicherung von Klimamodellen, Abb. 1, [1]). Innerhalb des Metafor-Projektes wurde dafür das Common Information Model (CIM) entwickelt. Dieses Modell ermöglicht es, alle benutzten Komponenten und Parameter von Klimamodellen einheitlich zu beschreiben. Diese Beschreibungen werden in einem gemeinsamen Repository gesammelt und dienen der besseren Interpretierbarkeit der Datensätze. Auf dieser Grundlage können Wissenschaftler Daten anhand von wissenschaftlichen Merkmalen finden und einordnen. Das Metafor CIM kann und sollte,das Standard-Schema' für die weltweite Klimaforschung werden. Das zugrunde liegende abstrakte Datenmodell wurde in der Unified Modeling Language (UML) erstellt. Aus dem UML-Modell können konkrete Datenmodelle abgeleitet werden, die etwa zum einheitlichen Informationsaustausch zwischen verschiedenen Forschungsgruppen eingesetzt werden können. Ziel des Metafor-Projektes war - neben der Entwicklung eines einheitlichen Informationsmodelles eine einheitliche Nomenklatur für die in der Klimamodellierung gebrauchten Begriffe zu sammeln und abzustimmen. Alle am Projekt beteiligten Klimamodellierungszentren sollen zukünftig damit ihre Modelle und Datensätze einheitlich beschreiben. Auf dieser Grundlage wurde Metafor von dem World Climate Resarch Programme (WCRP) beauftragt, die Metadaten zum fünften internationalen Modellvergleichsexperiment (CMIP5) zu sammeln. Dieses Experiment wird die wissenschaftliche Basis für den fünften IPCC-Sachstandsbericht liefern. 2011 Max-Planck-Gesellschaft www.mpg.de 2/5

Screenshot des CMIP5-Metadata-Questionnaire, der im Rahm en des Metafor-Projektes entwickelt wurde und es erstm alig in der Geschichte der Klim aforschung erlaubt, Modelle und Daten basierend auf ihren wissenschaftlichen Charakteristika einheitlich zu vergleichen und einzuordnen. DKRZ Um diese Aufgabe zu bewältigen, entwickelte Metafor ein web-basiertes Framework, um die Modelle, Experimente, die dazugehörigen Simulationen, Gitter, genutzte Rechnersysteme und verwendete Einstellungen sowie daran beteiligten Personen und Institute zentral zu erfassen. Dieses sogenannte CMIP5- Questionnaire (Abb. 2, [2]) wird es erstmalig in der Geschichte der Klimaforschung erlauben, Modelle und Daten basierend auf ihren wissenschaftlichen Charakteristika einheitlich zu vergleichen und einzuordnen. Weltweit sind alle wichtigen Modellierungszentren an dem CMIP5-Projekt beteiligt, so auch das Max-Planck- Institut für Meteorologie (MPI-M) in Hamburg. Das MPI-M hat an der Entwicklung von CIM verarbeitenden Werkzeugen in Metafor maßgeblich mitgearbeitet. Das World Data Center for Climate (WDCC, [3]), welches vom DKRZ betrieben wird, agiert zudem als Datenknoten, um CMIP5-Modelldaten abzuspeichern sowie als Gateway, um wissenschaftlichen Anwendern die Infrastruktur mit dem Zugang zu den Daten bereitzustellen. Öffentlichkeitsarbeit am DKRZ 2011 Max-Planck-Gesellschaft www.mpg.de 3/5

Zur Eröffnung der 2. Ham burger Klim awoche inform iert sich der Erste Bürgerm eister der Freien und Hansestadt Ham burg Christoph Ahlhaus am gem einsam en Stand des DKRZ, CSC, Klim acam pus und Max-Planck-Institut über m ögliche zukünftige Niederschlagsänderungen. Böttinger/DKRZ 2010 verstärkte das DKRZ seine Bemühungen, die Öffentlichkeit aktiv über die Arbeit des DKRZ und über Ergebnisse der Klimamodellierung zu informieren. Unter anderem nahm das DKRZ am Hamburger Girls Day, dem 5. Extremwetterkongress in Bremerhaven, der Jahrestagung der GKSS und der 3. Hamburger Klimawoche (Abb. 3, [4]) sowie bei der Veranstaltung des Deutschen Klima-Konsortiums Vor Cancún Aktueller Stand der Klimaforschung [5] in Berlin mit einem Informationsstand teil. In seinem Hause begrüßte das DKRZ mehr als 40 Besuchergruppen mit insgesamt über 230 Besuchern, die sich über aktuelle Klimaforschung und Klimamodellierung sowie die Arbeit des DKRZ informieren und die Rechnerräume und die Datensilos besichtigen wollten. Im Juni 2010 erschien erstmalig das neue Mitteilungsblatt des DKRZ, welches über aktuelle Ereignisse am DKRZ berichtet. Die Mitteilungen werden zukünftig in unregelmäßigen Abständen mehrmals im Jahr erscheinen und den Umfang von zwei Seiten nicht übersteigen. Bis Ende 2010 abonnierten 142 Leser das Mitteilungsblatt. Das DKRZ präsentierte sich und seine Arbeit ebenfalls auf nationalen und internationalen Konferenzen wie im Mai auf der International Supercomputing Conference (ISC 10) in Hamburg und im November auf der Supercomputing Conference (SC 10) in New Orleans. Weiterhin organisierte das DKRZ 2010 eigene Veranstaltungen: So fand im September 2010 die First International Conference on Energy-Aware High Performance Computing [6] statt. Initiator dieser neuen Konferenzserie ist Prof. Dr. Ludwig. Die Veranstalter sind die Universität Hamburg (Fachbereich Informatik), die Firma HiTEC, die die administrativen Aufgaben abwickelt, und das DKRZ. Ziel der Konferenz ist es, Hersteller, Anwender und Forscher aus dem Bereich der Informatik zusammenzubringen, um gemeinsam über die wichtige Frage des Energieverbrauchs beim Hochleistungsrechnen zu diskutieren und neue Ansätze zu einer Verringerung des Verbrauchs zu erarbeiten. Ebenfalls im September war das DKRZ erstmalig Gastgeber für die Jahrestagung HPSS Users Forum 2010 [7]. Zu Gast waren mehr als 65 Anwender und Entwickler des High Performance Storage System (HPSS), einem Hierarchischen Speichermanagement System zur Verwaltung größter Datenarchive. Mit den Teilnehmern aus USA, Europa und Japan waren die Betreiber der weltgrößten Datenarchive mit einer verwalteten Datenmenge von insgesamt 170 PB (1 PetaByte entspricht 1 Mio. Gigabyte) versammelt. Das DKRZ selbst betreibt ein 65 2011 Max-Planck-Gesellschaft www.mpg.de 4/5

PetaByte fassendes Klimadatenarchiv und nimmt damit eine Spitzenstellung im Kreis der weltgrößten HPSS- Installationen ein. Die Konferenz fand zum zweiten Mal in Europa statt, was dem wachsenden Interesse an HPSS in Europa Rechnung trägt. 2011 Max-Planck-Gesellschaft www.mpg.de 5/5