Regionalisierung von Klimadaten: Datenmanagement



Ähnliche Dokumente
ReKliEs-De Abschlussworkshop. Datensuche und Datendownload

DKRZ Datenhierarchie Von der Antragstellung bis zur Archivierung

Logo. Michael Lautenschlager (DKRZ) WissGrid AP3 Review, Potsdam

Die Repositorien-Infrastruktur des Deutschen Klimarechenzentrums

Freiberuflicher IT-Berater Schwerpunkte: Unix, Oracle, Netzwerk. Dipl.-Inform. Joachim Jäckel

Vorstellung SimpliVity. Tristan P. Andres Senior IT Consultant

WISSENSWERTES ÜBER WINDOWS SCALE-OUT FILE SERVER

Keep your SAN simple Spiegeln stag Replizieren

TSM-Migration Hermann Frasch Markus Bader

Sicherheitsaspekte der Langzeitarchivierung am Leibniz- Rechenzentrum. 09. Juni Rosa Freund

2. Einrichtung der Verbindung zum Novell-NetStorage-Server

Elasticsearch aus OPS-Sicht Teil1. Markus Rodi Karlsruhe,

Powershell DSC Oliver Ryf

Sie haben diese Daten auch mobil dabei und synchron auf anderen Geräten! Sie haben eine Sicherheitskopie dieser Belege in einem Cloud-Speicher.

DataSpace 2.0 Die sichere Kommunikations-Plattform für Unternehmen und Organisationen. Your Data. Your Control

Datenbank-Service. RZ-Angebot zur Sicherstellung von Datenpersistenz. Thomas Eifert. Rechen- und Kommunikationszentrum (RZ)

eurovat Magento Extension Magento - Extension Extension V1.4.2 Dokumentation Version 1.0 SNM-Portal UG (haftungsbeschränkt) & Co. KG Vorherstraße 17

mobilepoi 0.91 Demo Version Anleitung Das Software Studio Christian Efinger Erstellt am 21. Oktober 2005

DB2 Codepage Umstellung

Anleitung: XOS Installation ohne XQAND USB Stick

Fragebogen. zur Erschließung und Sicherung von Online-Dokumenten. Auswahl von elektronischen Publikationen

Preise und Leistungen Dynamic Computing Services

Workload-Bewusstsein ist entscheidend. für effektive Hybrid-Cloud-Strategien von Großunternehmen

Matrix42. Use Case - Sicherung und Rücksicherung persönlicher Einstellungen über Personal Backup. Version September

3ware Controller

Federated Identity Management

Lösungsszenarien für die Filearchivierung/ Langzeitdatenspeicherung mit Symantec Enterprise Vault

Der beste Plan für Office 365 Archivierung.

Der Einsatz von PIDs und Normdaten bei wirtschaftswissenschaftlichen

SINUMERIK Integrate for Production. Gültig für Für 840D sl unter Operate 4.5 SP5 Für 828D unter Operate 4.5 SP5

Dedicated Private Cloud - ein Lösungsansatz im Spannungsfeld zwischen Datenhoheit und Mandantenfähigkeit

Einsatz von Dynamic Computing bei einem erfolgreichen Schweizer KMU. Bernard Frossard CEO

Storage-Workshop Dresden Marcus Stier

31. Sitzung des Wissenschaftlichen Lenkungsausschusses der Deutsche Klimarechenzentrum GmbH

ecaros2 Installer procar informatik AG 1 Stand: FS 09/2012 Eschenweg Weiterstadt

TSM 5.2 Experiences Lothar Wollschläger Zentralinstitut für Angewandte Mathematik Forschungszentrum Jülich

IT-Effizienzworkshop bei New Vision GmbH Entry und Midrange Disksysteme

Datenbereitstellung in ESGF 1 und internationale Nutzung

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse?


Aus Augias ins Internet: Die Erstellung von Onlinefindbücher aus Augias-Datenbanken mit dem ELKO- Augias, MidosaXML und MEX

Password Depot für ios

EXCHANGE Neuerungen und Praxis

TSM & PowerSystems TSM in einer virtualisierten Infrastruktur. Ing. Thomas Waldburger, Thomas Altenburger, Msc. und DI Günther Nowotny

NODELOCKED LIZENZ generieren (ab ST4)

Verlust von Unternehmensdaten?

RIS Abbild mit aktuellen Updates

Well-Balanced. Performance Tuning

Transparente SOA Governance mit Modellierung. OOP 2010 München, 28. Januar 2010, 12:30 Uhr Modeling Day

WinVetpro im Betriebsmodus Laptop

Preisvergleich ProfitBricks - Amazon Web Services M3 Instanz

FIREBIRD BETRIEB DER SAFESCAN TA UND TA+ SOFTWARE AUF MEHR ALS EINEM COMPUTER

HMK Open Day 28. Januar 2009 Kronberg. Hierarchisches Storage Management mit SUN SAM-FS

Frederik Wagner Leibniz-Rechenzentrum der Bayerischen Akademie der Wissenschaften

Ausdruck von SAP R/3 PM bzw. EAM-Auftragspapieren und dazugehöriger Dokumente wie Excel, CAD etc. mit PM² Print. Frank Ostwald P&S Consulting

Big Data in der Forschung

Advoware mit VPN Zugriff lokaler Server / PC auf externe Datenbank

BOKUbox. Zentraler Informatikdienst (ZID/BOKU-IT) Inhaltsverzeichnis

Technischer Support (Q&A) Fragen und Antworten TSD-QA (2012/05)

Markus Feichtinger. Power Systems. Der Weg zu POWER! 2009 IBM Corporation

Versionsverwaltung GIT & SVN. Alexander aus der Fünten. Proseminar: Methoden und Werkzeuge, SS Lehrstuhl i9, Prof. Dr. T.

IBM SPSS Statistics Version 22. Konfigurieren von Technologie für behindertengerechte Bedienung

Verteiltes Persistenz-System. Mykhaylo Kabalkin

Nikon Message Center

Time To Market. Eine Plattform für alle Anforderungen. Lokale Betreuung (existierende Verträge und Vertragspartner, ) Kosten

Datensicherung an der Universität Bern Tivoli Storage Manager

Höns-Electronic SPEZIALLÖSUNGEN UND ZUBEHÖR FÜR DIE AUTOMATENBRANCHE

KURZANLEITUNG CYBERDUCK MIT CLOUD OBJECT STORAGE

Installation von MacRepertory X & ReferenceWorks X TIME

Jens Kupferschmidt Universitätsrechenzentrum

MAXDATA b.drive. Externe Festplatte mit integrierter Backup Software

Storage Management und Archivierung

Installationsanleitung unter Windows

Anleitung - Archivierung

cretis Data Lifecycle Manager für Oracle HSM - Lösungsszenarien - Joachim.Daniel@cretis.de cretis cretis service & software GmbH

Deckblatt. SIMOCRANE V4.1 Hotfix 2 SIMOCRANE CMS. FAQ Juli Service & Support. Answers for industry.

HPE StoreOnce im Einsatz

CREATIVE CLOUD FÜR TEAMS

EINSATZ VON MICROSOFT TERMINAL-SERVICES ODER CITRIX METAFRAME

Konfiguration des Novell GroupWise Connectors

Herzlich Willkommen Neuerungen in vsphere 6

Verfügbarkeit von Applikationen und Failover Szenarien. Winfried Wojtenek.

Kanton Zürich Amt für Raumentwicklung Geoinformation Gebäudeadressen in der AV

Lizenzen auschecken. Was ist zu tun?

Safeterms.de AGB Update Schnittstelle gambio Shopsoftware

NEUES BEI BUSINESSLINE WINDOWS

iteracon Productivity Drive

TERRA CLOUD. TERRA NAS Hybrid Lösung

Datenmigration mittels HSM. Ernst M. Mutke Technical Director HMK Computer Technologies GmbH

1CONFIGURATION MANAGEMENT

Dreamweaver 8 Einführung

Ceph. Distributed Storage Julian mino Klinck GPN

11.1 Indirektes Binden (3) 11.1 Indirektes Binden (4) Objektadapterkonfiguration. Unmittelbarer Vorteil des indirekten Bindens

GEZIELT MEHR SICHERHEIT MIT 4I ACCESS SERVER & 4I CONNECT CLIENT

Drei Wege zur sicheren Luftfracht Alternativen nach Einführung des zertifizierten bekannten Versenders

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

Laborübung - Verwalten von virtuellem Speicher in Windows 7

Neues Backup-System 2015

Transkript:

Regionalisierung von Klimadaten: Datenmanagement Stephanie Legutke, DKRZ/Data Management (DM, Lautenschlager) DWD, Offenbach, 23.-24. März 2015

Diskussionspunkte Was sind die drängendsten Fragen? Lösungen und Werkzeuge? Realistische mittelfristige Ziele und benötigte Unterstützung? in Bezug auf Metadaten (MD) Speicherung Zugriff Kapazitäten

Metadaten Definition: Beschreibung von Daten formlos, free text formatiert, Controlled Vocabulary (VC) [[Inter]Nationale]Kooperation* Suche Interpretation Herkunft zur Nachnutzung Referenzierbarkeit Diagnostik (leicht anwendbar, automatisch, koordiniert,...) Im Folgenden wird meistens angenommen, dass die regionalisierten Daten wg. des großen Volumens in einem gemeinsamen* verteilten Archiv gespeichert werden. * Forschungsgruppe(n), Projekt, weltweit

Metadaten Suche, Interpretation CV CORDEX+ DRS* NetCDF4/CF-1.n Standards CMOR, QC am DKRZ Modified** CMIP5 Standard Einbindung vorhandener Archivdaten/Formate NetCDF4/CF-1.n GRIB (ECMWF Aktivität***) *Dateinamen, Verzeichnisstrukturen **where necessary ***http://www.ecmwf.int/en/workshop-closing-grib/netcdf-gap

CORDEX CORDEX DRS output EUR-11 AFR-44 CLMcom ECMWF-ERAINT MPI-M-MPI-ESM-LR MOHC-HadCM3 evaluation historical...... rcp45 r1i1p1 r2i1p1... CLMcom-CCLM4-8-17 v1 mon day 3hr 6hr sem fx 'variable' 'variable'_afr-44_mpi-m-mpi-esm-lr_historical_r2i1p1_clmcom-cclm4-8-17_v1_day_19760101-19801231.nc

Metadaten Herkunft Metadaten für RCMs und Simulationen: CommonInformationModell (CIM) für RCMs Questionaire; pyesdoc

esgfdata.dkrz.de

Metadaten Referenzierbarkeit Checksummen (aufwändig RZ) Archiv Versionierung (kann verloren gehen) tracking ID (CMIP5/CORDEX: NetCDF attribute; CMOR, UUID) PID DOI (aufwändiger WF, zeitverzögert; DataCite DOI DKRZ) PermanentIdentifier handle server und Infrastruktur Lokalisierbarkeit versch. Aggregationsebenen beim ESGF Publikationsprozess vorgeschlagen für CMIP6 (DKRZ) Bearbeitung am DKRZ in Eudat

Metadaten Diagnostik bei verteilter Datenhaltung, Ensembles (z.b. ESGF) lokale zentrale Ausführung download großer Datenmengen verteilte Ausführung (Transferraten, Speicherkapazitäten) Zugang, Portierung der Werkzeuge Koordinierung von Methoden koordinierte Ausführung von Standarddiagnostiken ESMValTool (DLR, Veronika Eyring) o auf ESGF Datenknoten o interfaced with ESGF (DKRZ)

Sven Kotlarski possible ESMValTool Diagnostic: Support ESM selection for downscaling o help chosing ESM forcing (cold/warm, wet/dry model,...) per domain o maximize ESM result spread

Climate Model Data Federation (ESGF) Speicherung&Zugriff Installation Support: DKRZ, SMHI,... March 2015: 41 data nodes 22 index nodes 13

Speicherung & Zugriff ESGF Datenknoten o saml Zugriffskontrolle: unrestricted / non-commercial only o CMIP6 wünscht unrestricted access o MoU in CORDEX : use CMIP6 ToU (Problem für CLMcom?) WDCC (WorlDataCenter of Climate; Cera) o Langzeitarchivierung (LZA): > 10 Jahre o DataCite DOI Daten o Bestand (4 PB); bei größeren Datenvolumen (~20TB) ist ein DataManagementPlan gefordert o Zugriff nur mit account; frei oder Datenfreigabe mit Zustimmung

Speicherung & Zugriff HPSS Bandarchiv am HLRE-2/3: o /arch/<proj> 90%; Speicherung bis 1 Jahr nach Projektende garantiert o 10% in /doku/<proj> für >= 10 Jahre o owner, group, others permissions separately Cloud Speichersystem Swift-based on OpenStack: o o o o o für unstrukturierte Daten; ohne DKRZ account (z.b. den CORDEX Datenpublikationsprozess) 300 TB auf 2x3 Datenknoten redundant nach 2 Wochen nur noch 1 Kopie (kein Zugriff wenn server down) 5 GB per account; project space proportional to HLRE-3 https://swiftbrowser.dkrz.de

HLRE-2 blizzard HLRE-3 mistral Vendor IBM Bull Architecture AIX Linux cluster File System GPFS Lustre Processors per node 16 dual core 24 cores Phase I Jun 15 Phase II Jun 16 Performance 0.158 PF/s 3.000 PF/s 8 x 19 x Cores 8,400 60,000 2.4 x 7.1 x System memory 20 TB 170 TB 3.7 x 8.5 x Disk storage capacity 6 PB 50 PB 2.9 x 8.3 x Disk storage throughput 30 GB/s 400 GB/s 13.3 x Disk drives 7,200 8,500 1.2 x Archive capacity 53 PB 335 PB 3.6 x 6.3 x Archive throughput 9.6 GB/s 21 GB/s 2.2 x Power consumption 1.6 MW 1.3 MW 0.8 x Investment 30 M 41 M 1.4 x HPSS 8 PB/yr 75 PB/yr 9.4 x WDCC 1 PB/yr 8 PB/yr ß.8 x Kapazität

Partners: BTU/CLMcom, CS2.0, DKRZ, DLR, DWD, MPI-M,..? Funding Agency: BMBF? Working Title: Services around CMIP6 in Hamburg/Germany Activities: configure, install, and use of CMOR (all MIPs) compatibility of CDOs with CMIP6+ standards CMOR-lite (easy to use toolkit to CMORize ) CMIP6+ simulations (ScenarioMIP, DAMIP, CORDEX,...) Processing/formatting data for (ESGF) CMIP6 archive o simulations o observations ESGF services additional data products (ECV, climate indices,..?) ESMValTools Fund rising initiative

Ende