TECHNISCHE HERAUSFORDERUNGEN UND ANSÄTZE DER NUTZUNG VON SENTINEL-DATEN CARSTEN BROCKMANN, MARTIN BOETTCHER BROCKMANN CONSULT GMBH

Ähnliche Dokumente
Big Data in der Forschung

Der Cloud Point of Purchase. EuroCloud Conference, 18. Mai 2011 (Christoph Streit, CTO & Co-Founder ScaleUp)"

Wahlmodul MI-IT-Workshop

Big Data Informationen neu gelebt

Big Data Mythen und Fakten

Linked Open Data (LOD) in der Landwirtschaft. Workshop Anwendungsbeispiele nach Themen I

Dominik Stockem Datenschutzbeauftragter Microsoft Deutschland GmbH

Neue Ansätze der Softwarequalitätssicherung

Generalisierung von großen Datenbeständen am Beispiel der Gebäudegeneralisierung mit CHANGE

Copernicus Data Access and Exploitation Collaborative Infrastructure COPACI

UAV-Datenprozessierung. Gabriela Apfl MFB-GeoConsulting

Daten haben wir reichlich! The unbelievable Machine Company 1

Pressegespräch zum Kongress AUTOMATION Juli Umfrage der GMA Smart Technologies und Industrie 4.0. Dr.

Möglichkeiten für bestehende Systeme

Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien. Berlin, Mai 2013

Agiles Design. Dr.-Ing. Uwe Doetzkies Gesellschaft für Informatik mail:

TK-Expertenkonferenz

iteracon Productivity Drive

Entwicklung einer Methode zur Bewertung der Transformierbarkeit von On-Premise Anwendungssystemen in Software as a Service Lösungen

MapReduce und Datenbanken Thema 15: Strom bzw. Onlineverarbeitung mit MapReduce

FORGE2015 HDC Session 4. Nachhaltige Infrastruktur als technologische Herausforderung. Tibor Kálmán Tim Hasler Sven Bingert

Benchmark MES Anbietern

»d!conomy«die nächste Stufe der Digitalisierung

GMES Integrated Application Promotion (IAP)

Effiziente Bestandsaktualisierung von 3D-Stadtmodellen durch Analyse multitemporaler 3D-Punktwolken

Exploration und Klassifikation von BigData

Räumliche Verteilung der HFT-Studierenden analysiert in der Cloud

MULTI-TIER RECHENZENTRUM - EIN DESIGN DER ZUKUNFT? Patrick Pulvermüller

EMC. Data Lake Foundation

Schnellste Realtime Segmentierung weltweit

Das Kompetenznetzwerk Trusted Cloud

Cloud und mobile Apps ein schlagkräftiges Duo?!

Produktvorstellung: CMS System / dynamische Webseiten. 1. Vorwort

Herausforderung SAM Lösung. Erfahrungsbericht SAM-Projekt

Dedicated Private Cloud - ein Lösungsansatz im Spannungsfeld zwischen Datenhoheit und Mandantenfähigkeit

HMS. Statistiken mit SAS ins Internet. HMS Analytical Software GmbH - Johannes Lang

Internet Explorer Version 6

Integriertes Klimaschutzkonzept Regionalforum Bremerhaven Workshop Leitbild Klimakonzept

THE KNOWLEDGE PEOPLE. CompanyFlyer.indd :48:05

Grundbegriffe der Wirtschaftsinformatik Informationssystem I

Online Marketing für weltweite Filialen zentral steuern

Zentrale Jobverarbeitung und IT-Prozessautomatisierung mit UC4

Executive Summary BIG DATA Future Chancen und Herausforderungen für die deutsche Industrie

Leitfaden des BfDI und der BNetzA für eine datenschutzgerechte. Verkehrsdaten. 28. Jour Fixe Telekommunikation, Dipl.-Ing.

Cisco gestern heute morgen

GMES-Echtzeitdienste: Anforderungen an die Bodenempfangsstation und das Datenmanagement

Wettbewerb im SPNV. Herausforderungen und Chancen

Mobile Business-Lösungen im Cloud Computing - Anforderungen, Lösungen und Handlungsempfehlungen

-Virtuelle Jagdfliegerschule- Teamspeak Seite 1 von 6

Advanced Banking Platform

MHP Audit Process Optimization Ihre Lösung für Ihr Mobile Device- Management zur Performancesteigerung!

Fragen zur GridVis MSSQL-Server

Big Data wohin geht das Recht. Claudia Keller, Rechtsanwältin

Nutzungsbedingungen und Datenschutzrichtlinie der Website

Handbuch. Artologik EZ-Equip. Plug-in für EZbooking version 3.2. Artisan Global Software

TechNote: Exchange Journaling aktivieren

IT im Wandel Kommunale Anforderungen - zentrales Clientmanagement versus Standardtechnologie!?

Semesterticket. Was muss geschehen, damit endlich auch bei uns ein bezahlbares Semesterticket eingeführt wird? Informationsveranstaltung

Artenkataster. Hinweise zur Datenbereitstellung. Freie und Hansestadt Hamburg. IT Solutions GmbH. V e r s i o n

Neue Dienstleistungen für Energieversorgungsunternehmen (EVU) Saarbrücken, 19. November 2014 Dr. Ralf Levacher

Februar Newsletter der all4it AG

Freie Universität Berlin

Ein buchner Unternehmen: Starke Software Gmbh Lise-Meitner-Str Schwentinental Tel.:

TNT SWISS POST AG KUNDENSERVICE. Kompetent I lokal I sofort erreichbar in vier Sprachen (DE, FR, IT & EN) THE PEOPLE NETWORK

Big Data oder Grand Management Information Design?

MSSQL Server Fragen GridVis

Eine Mischung aus beiden Vorgangsweisen (Download der Dateien von der Homepage des wohnfonds_wien und Bereitstellung eines Links) ist nicht möglich.

SOA im Zeitalter von Industrie 4.0

C O C O O N. Wo ist Cocoon in die Apache Projekte einzureihen?

Broadcast oder Broadband?

Leseprobe. Thomas Konert, Achim Schmidt. Design for Six Sigma umsetzen ISBN: Weitere Informationen oder Bestellungen unter

Fallbeispiel. Auswahl und Evaluierung eines Software- Lokalisierungstools. Tekom Herbsttagung 2004 Angelika Zerfaß

Gussnummern-Lesesystem


Flowy Apps. Wolfgang-Heilmann-Preis another kind of working Flowy Apps GmbH Fraunhoferstraße Kiel flowyapps.

Fachkräftemangel: Herausforderung für das Personalmanagement?

Private oder public welche Cloud ist die richtige für mein Business? / Klaus Nowitzky, Thorsten Göbel

CODE-DE Copernicus Data and Exploitation Platform Deutschland - Tools/Prozessierung, Projekte und Produkte - Das CODE-DE Team

Risiken bei der Analyse sehr großer Datenmengen. Dr. Thomas Hoppe

SICHERE ZUSAMMENARBEIT BEI VERTRAULICHEN KOMMUNIKATIONSPROZESSEN PREMIUM DATAROOM BRAINLOOP

Wie verändern sich die Bedürfnisse unserer Gesellschaft in der Kommunikation? Jörg Halter, Partner

Persönliche Einladung. Zur IT Managers Lounge am 4. November 2009 in Köln, Hotel im Wasserturm.

Machbarkeitsstudie zum digitalen Lesesaal: Ein gemeinsamer Ansatz der Staatsarchive Basel-Stadt und St.Gallen

Backup-Lösungen. Ihre Daten in sicheren Händen

Systemvoraussetzungen Reifenmanagement RLV

Flowy Apps erzählt eine kurze Geschichte über REDS. Remotely Encrypted Distributed Storage

Thema: - DWF. Das Business Process Management System aus dem Hause PRAXIS AG. Wolfgang Lammel PRAXIS-Consultant

Vorstellung Studienprojekt. Policy4TOSCA. Umsetzung eines Policy-Frameworks für sicheres und energieeffizientes Cloud Computing

Office 2010 ist die beliebteste Office- Version aller Zeiten. 1 Mrd. Office-Anwender. Eines der am schnellsten wachsenden Produkte von Microsoft

der Firma BuchLogistikCompany GmbH Erstellt von Bernhard Neidl

Webseiten mit fragwürdigen Aufrufen von "spy & track" - Unternehmen

Self Service BI der Anwender im Fokus

Big Data: Nutzen und Anwendungsszenarien. CeBIT 2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC

Test zur Bereitschaft für die Cloud

PRESSEINFORMATION. Deutsche betrachten Job und Familie als nicht vereinbar

Herausforderungen an IT-Normung und IT-Standardisierung im Wettbewerb des Marktes

Anforderungen an die HIS

SSI WHITE PAPER Design einer mobilen App in wenigen Stunden

Transkript:

TECHNISCHE HERAUSFORDERUNGEN UND ANSÄTZE DER NUTZUNG VON SENTINEL-DATEN CARSTEN BROCKMANN, MARTIN BOETTCHER BROCKMANN CONSULT GMBH

BROCKMANN CONSULT Gegr. 1999, Geesthacht bei Hamburg 28 Mitarbeiter davon 11 mit PhD + 8 MA bei BG Sweden Informatiker, Physiker and Umweltwissenschaftler 2 Geschäftsbereiche: Umweltinformatik Geo-information-Dienstleistungen Entwickler der Sentinel 3, 2, 1 Toolboxen (ESA Auftrag) Calvalus Massiv parallele Verarbeitung von EO Daten

Zugriff auf Sentinel Daten warum? Systematische Erstellung von Informationsprodukten zur Wasserqualität Nord- und Ostsee Chlorophyll Concentration 3

Zugriff auf Sentinel Daten - Wasserqualität Systematische Erstellung von Informationsprodukten zur Wasserqualität Nord- und Ostsee Datenvolumina und Verarbeitung heute Input ENVISAT/MERIS ~ 135TB FR Level 1 + 25TB RR, ganze Mission MODIS Aqua ~ 17TB/Jahr (~50GB/Tag) WAQSS Dienst (Wasserqualität Nord- und Ostsee) MERIS download ~15 TB/Jahr ~40 GB/Tag Extraktion AOI + höherwertige Produkte (1.5TB/Jahr) MODIS Extraktion und höherwertige Produkte < 1TB/J Spezielle Produkte (Individualprodukte, 50TB/J) 4

Zugriff auf Sentinel Daten - Landdienste Globale und regionale thematische Landoberflächen Kartierung und Klassifikation 9 year global composite surface reflectance (2003 2011) Kartierung Vegetation & Muscheln Wattenmeer 5

Zugriff auf Sentinel Daten - Landdienste Globale und regionale thematische Landoberflächen Kartierung und Klassifikation Datenvolumina und Verarbeitung heute Input ENVISAT/MERIS ~ 135TB FR Level 1 + 25TB RR, ganze Mission SPOT-VGT ~20TB Landsat 5 + 8, 20TB (wachsend) Land Dienste Globale Landprodukte (Albedo, Landcover) ~ 50TB Regionale Produkte < 1TB 6

Zugriff auf Sentinel Daten - Binnengewässer Informationsprodukte Wasserqualität von Seen, global Datenvolumina und Verarbeitung heute Landsat 8, keine systematische Verarbeitung Demonstrationsprodukte < 1TB Abb. Eirini Politi, Uni. Dundee, GloboLakes Projekt Dominante Phytoplankton Spezies, Lake Nicaragua (Brockmann Consult) 7

Datenvolumina Sentinel Ära Sentinel input Daten S1A Level 1: ~432 TB/J (+ same amount for S1B) S2A Level 1: ~751 TB/J (+ same amount for S2B) S3A Level 1: ~451 TB/J (OLCI+SLSTR, + same amount for S3B) Küstengewässer Nord- und Ostsee (WAQSS), nur S3: OLCI S3A+B ~440 TB/Jahr (~1200 GB/Tag), Extraktion Nord- und Ostsee AOI + höherwertige Produkte ~ 40TB/J Binnengewässer (Auswahl, weltweit) Output: S2A 15TB/J + S3A 5TB/J = 20TB/J Globale Landcover Produkte Input: 300m räumliche Auflösung (OLCI) erst 220TB/J (S3A), später 440TB/J (S3A+B) 10m räuml. Auflösung, Kontinente, 750TB/J (S2A), später 1.5PB/J (S2A+B) Output ~ 5TB/J 8

Anforderungen Anwendungsfall 1: NRT Anwendungsfall 2: Zeitserien und statistische Produkte Mehrere Prozessierungen des gesamten Datensatzes erforderlich aufgrund von Agorithmenverbesserungen ENVISAT Ära Globale Prozessierung ist Treiber, Input Daten 140TB Sentinel Ära Sukkessiv anwachsendes Datenvolumen ~ 1PB/Jahr input Subsetting von AOIs und vorhalten in privater cloud Datenvolumen ~100TB/Jahr Hosted processing in privater cloud Langzeitarchivierung beim Datenoriginator oder nationaler Mirror-site 9

Calvalus Ansatz Massive-parallel Prozessierung von Erdbeobachtungsdaten Basierend auf MapReduce & Apache Hadoop Data locality Technologie im Innern der cloud Work-flows Rapid prototyping Level 2 & Level 3 Prozessierung Zeitserien, match-up Analyse Hosted Processing Daten und Software gleichbehandelt Verteilung im System 10

L2/L3 Processing Realisation MERIS RR L1, global, 10-day CoastColour C2W processor 1.5 hours (22 nodes) 1 L3 product L2 Proc. & Spat. L1 File Binning L2 Proc. & Spat. Spa.Bins (Mapper Task) L1 File Binning Spat.Bins L2 Proc. & Spat. (Mapper Task) L1 File Binning Spat.Bins L2 Proc. & Spat. (Mapper Task) L1 File Binning L2 Proc. & Spat. Spat.Bins (Mapper Task) L1 File Binning Spat.Bins (Mapper Task) L3 Temp. Binning (Reducer L3 Temp. Task) Binning (Reducer Task) Temp.Bins Temp.Bins L3 Formatting (Staging) L3 File(s)

Example: Calvalus for Land Cover CCI Quicklook generation for full mission MERIS FRS and RR reads and processes 150 TB input data in 10 hours. This is about 50 Gbit/s. Generation of 7-day composites of surface reflectance from full mission MERIS FRS and RR for CCI Land Cover is a data and computing intensive automated job that runs for 3 months on a 72 nodes Calvalus/Hadoop cluster Other full mission processes are between these two times. 12

Global Lakes Vorverarbeitungssystem Private Cloud Ansatz 13

Systematic Data Driven Work Flow 14

Collaborative Ground Segement Context 15

Fazit Wir werden Sentinel (2+3) als Fortsetzung der Europäischen Datenversorgung nutzen. Verlängerung der Zeitreihe, verbesserte Datenqualität Fortsetzung vorhandener NRT-Services, denen die Europäischen Daten ausgegangen waren Neue Services, um weitere wissenschaftliche Entwicklungen in die Nutzung zu überführen Wir werden einen Teil des Datenstroms in-house verarbeiten Retrieval eines relevanten Ausschnitts des Datenstroms (ausgewählter Sensor, ausgewählte Region) zur lokalen Prozessierung Bereitstellung für Partner und Kunden (private cloud) wiederholte Nutzung, daher auch Speicherung Anbieten von Daten Produkte Anbieten von hosted processing auf den vorverarbeiteten Daten Wir planen, zumindest in den ersten Jahren der Missionen hosted processing zu nutzen stark aggregierte Ergebnisse (von uns seltener genutzte Daten) Zugriff auf Convenience Produkt wäre sehr nützlich (S1+2+3 auf gleichem Raster, Vorklassifikation) Kosten müssten unter Transfer+Speicherung bei uns liegen, um attraktiv zu sein 16