Hochparallele Spatial-Integration umfangreicher heterogener Geodaten. disy Informationssysteme GmbH

Ähnliche Dokumente
Dynamisches SQL. Folien zum Datenbankpraktikum Wintersemester 2009/10 LMU München

Erfahrungsbericht mit Oracle Spatial

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

Die integrierte Zeiterfassung. Das innovative Softwarekonzept

BASIS Karten, WEA-Katalog, Projektierung, Objekte etc.

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

How to do? Projekte - Zeiterfassung

Wir gehen aus von euklidischen Anschauungsraum bzw. von der euklidischen Zeichenebene. Parallele Geraden schneiden einander nicht.

Technische Analyse der Zukunft

Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum:

Prozentrechnung. Wir können nun eine Formel für die Berechnung des Prozentwertes aufstellen:

Das System für Ihr Mitarbeitergespräche

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

Kurzanleitung OOVS. Reseller Interface. Allgemein

[Customer Service by KCS.net] KEEPING CUSTOMERS SUCCESSFUL

Speicher in der Cloud

Inkrementelles Backup

Solarstrom selbst erzeugen und speichern so geht s!

UpToNet Workflow Workflow-Designer und WebClient Anwendung

HIER GEHT ES UM IHR GUTES GELD ZINSRECHNUNG IM UNTERNEHMEN

Backup-Lösungen. Ihre Daten in sicheren Händen

Updatehinweise für die Version forma 5.5.5

Tech-Clarity Perspective: Best Practices für die Konstruktionsdatenverwaltung

Über dieses Buch. Nutzungsrichtlinien

OPERATIONEN AUF EINER DATENBANK

Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER

OUTSOURCING ADVISOR. Analyse von SW-Anwendungen und IT-Dienstleistungen auf ihre Global Sourcing Eignung. Bewertung von Dienstleistern und Standorten

WO IST MEIN HUND? SICHER, SCHNELL UND ZUVERLÄSSIG

1. Weniger Steuern zahlen

zeitgewinn. habel erledigt zeitaufwändige zügig und genau.

Preisvergleich ProfitBricks - Amazon Web Services M3 Instanz

Regeln für das Qualitäts-Siegel

Über dieses Buch. Nutzungsrichtlinien

Eine Bürokratiekostenfolgenabschätzung zum zweiten Gesetz für moderne Dienstleistungen am Arbeitsmarkt im Hinblick auf die Einführung einer Gleitzone

SCHRITT 1: Öffnen des Bildes und Auswahl der Option»Drucken«im Menü»Datei«...2. SCHRITT 2: Angeben des Papierformat im Dialog»Drucklayout«...

Auszug aus der Auswertung der Befragung zur Ermittlung der IT-Basiskompetenz

SJ OFFICE - Update 3.0

SICHERUNG AUSWERTBARER DATEN AUS OTAS-KASSENSYSTEMEN

SDD System Design Document

Aufgabe 1 Berechne den Gesamtwiderstand dieses einfachen Netzwerkes. Lösung Innerhalb dieser Schaltung sind alle Widerstände in Reihe geschaltet.

Glaube an die Existenz von Regeln für Vergleiche und Kenntnis der Regeln

TTS - TinyTimeSystem. Unterrichtsprojekt BIBI

Vorgestellt von Hans-Dieter Stubben

Gesicherte Prozeduren

Anlegen eines SendAs/RecieveAs Benutzer unter Exchange 2003, 2007 und 2010

Geschäftsprozessunterstützung mit Microsoft SharePoint Foundation 2010 Microsoft InfoPath 2010 und Microsoft BizTalk Server 2013

EINSATZ VON MICROSOFT TERMINAL-SERVICES ODER CITRIX METAFRAME

SAP Memory Tuning. Erfahrungsbericht Fritz Egger GmbH & Co OG. Datenbanken sind unsere Welt

Content Management System mit INTREXX 2002.

Fragebogen zur Diplomarbeit von Thomas Friedrich

SSI WHITE PAPER Design einer mobilen App in wenigen Stunden

infach Geld FBV Ihr Weg zum finanzellen Erfolg Florian Mock

Inhalt. 1 Übersicht. 2 Anwendungsbeispiele. 3 Einsatzgebiete. 4 Systemanforderungen. 5 Lizenzierung. 6 Installation. 7 Key Features.

Orientierungstest für angehende Industriemeister. Vorbereitungskurs Mathematik

Systeme 1. Kapitel 6. Nebenläufigkeit und wechselseitiger Ausschluss

IWP Institut für Wirtschafts- und Politikforschung Richter & Schorn gfa@iwp-koeln.org,

Anbindung Borland CaliberRM

e-books aus der EBL-Datenbank

Ergebnisse der Befragung zum Ganztagesbereich in der Schrotenschule, durchgeführt im Juli 2007

Teil 1: IT- und Medientechnik

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Hilfe-Blatt: Ausgabenkontrolle

Führen von blinden Mitarbeitern

FAQs für beglaubigte Übersetzungen Francesca Tinnirello

Ergebnisse der forsa-umfrage: Wie stellt sich der Autokunde den Vertrieb der Zukunft vor?

Benutzerhandbuch. Leitfaden zur Benutzung der Anwendung für sicheren Dateitransfer.

Kommunikations-Management

Ferngesteuerte Logistikprozesse

SMART Newsletter Education Solutions April 2015

3. Stored Procedures und PL/SQL

Kampagnenmanagement mit Siebel Marketing/Oracle BI ein Praxisbericht

Ist Excel das richtige Tool für FMEA? Steve Murphy, Marc Schaeffers

Vermeiden Sie es sich bei einer deutlich erfahreneren Person "dranzuhängen", Sie sind persönlich verantwortlich für Ihren Lernerfolg.

Internet Explorer Version 6

Informationsblatt Induktionsbeweis

Nr. 12-1/Dezember 2005-Januar A 12041

1.3 MDM-Systeme KAPITEL 1 ZAHLEN UND FAKTEN

Ein Vorwort, das Sie lesen müssen!

Beamte und Beihilfe eine beratungsbegleitende Präsentation

QTrade GmbH Landshuter Allee München Seite 1

Corporate Websites MEHRSPRACHIGE MULTICHANNEL-PROJEKTE MIT WORKFLOWS. 18. und 19. September DMEXCO Michael Steinfort, comspace.

Agile Vorgehensmodelle in der Softwareentwicklung: Scrum

Gründe für fehlende Vorsorgemaßnahmen gegen Krankheit

Leichte-Sprache-Bilder

Erstellung von Reports mit Anwender-Dokumentation und System-Dokumentation in der ArtemiS SUITE (ab Version 5.0)

Projektbericht: Aufzeichnung der VL Grundlagen der Trainingswissenschaft

ACDSee 10. ACDSee 10: Fotos gruppieren und schneller durchsuchen. Was ist Gruppieren? Fotos gruppieren. Das Inhaltsverzeichnis zum Gruppieren nutzen

Er musste so eingerichtet werden, dass das D-Laufwerk auf das E-Laufwerk gespiegelt

Ihre Interessentendatensätze bei inobroker. 1. Interessentendatensätze

Rechtssichere -Archivierung

FrontDoor/Monitor mehr sehen von FrontDoor

Data Quality Management: Abgleich großer, redundanter Datenmengen

Wir unterscheiden folgende drei Schritte im Design paralleler Algorithmen:

GLASFASERNETZ DATACENTER RHEIN-NECKAR RHEIN-NECKAR-CLOUD MULTIMEDIA. Fixed Line BESCHREIBUNG. carrier ethernet TBFL_PFK_MA_

Idimager ein Bildverwaltungsprogramm-DAM Software

Empathisches CRM. (Empathic CRM) Sven Bruck, die dialogagenten. die dialogagenten Agentur Beratung Service GmbH Katernberger Straße Wuppertal

Transkript:

Hochparallele Spatial-Integration umfangreicher heterogener Geodaten disy Informationssysteme GmbH

Wachsender Bedarf zur flächendeckenden Verarbeitung und Auswertung umfangreicher Datenmengen Beispiele: Belastung durch Verkehrslärm (Straße, Schiene, Flugverkehr) Hochwassergefährdung Breitband-/Mobilabdeckung Bildquelle: http://www.soundplan-uk.com/graphics.html Flächendeckend sichere Aussagen zu Belastung/Gefährdung/Versorgung Verbesserungsbedarf und Potenzial ermitteln 19.6.2013 2

Projektauftrag Überblick Eingangsdaten Gebäude Adressen (Krankenhäuser, Schulen etc.) frühere Ergebnisse DGM (10 m) Zielbereiche Verarbeitung Gebäudedaten Klötzchenmodell, Metadaten DGM als TIN Ergebnisdaten 19.6.2013 3

Projektauftrag Beispiele durchzuführender Verarbeitungsschritte Auswahl tatsächlich zu verwendender Eingangsdaten Korrektur (SDO-Konformität) Vereinfachung der Geometrien (Datenreduktion!) 63 5 Vereinheitlichung der Koordinatensysteme Prüfung auf Vollständigkeit Zusammenführung der Einzeldatensätze Zuordnung Adressen zu Gebäuden (Nutzung) Triangulierung und Ausdünnen des DGM Zuordnung DGM-Höhe zu Gebäude Reduktion auf Zielbereiche 19.6.2013 4

Herausforderungen des Projekts (1) Datenmenge: ca. 150 GB Rohdaten 30.000 Dateien mit Gebäudedaten (ca. 90 Mio. Gebäude) > 30 Mio. Adressdatensätze > 75 GB Höhendaten DGM 10 m Datenqualität: Ausgangsdaten: Aus > 50 verschiedenen Quellen Unterschiedliche Dateiformate Redundante, teils widersprüchliche Daten Unbekannte, oft nicht ausreichende Qualität Anforderungen an die Ergebnisse: Geeignet als Grundlage weiterer Berechnungen Anforderungen aus EU-Vorgaben 19.6.2013 5

Herausforderungen des Projekts (2) Komplexität Zeitrahmen Gesamtlaufzeit ca. 6 Monate Arbeitsprobe bereits nach ca. 3 Monaten Zusätzliche Anforderungen ggf. Nachbeschaffung von Daten Mehr als 250 Prozess-Schritte! Jederzeit kurzfristig: Abgabe einer Arbeitsprobe Anzusetzende Qualitätsmaßstäbe sind interaktiv mit dem Auftraggeber abzustimmen 19.6.2013 6

Projektaufgabe in einer Metapher 19.6.2013 7

Projektaufgabe in einer Metapher Rohmaterial Mehrere Teilesätze: Varianten, Gebrauchtteile Entscheidung über Farbe erst am fertigen Modell Probefahrt mit verkleinertem Modell zur Projekthalbzeit 19.6.2013 8

Unser Lösungsansatz in der Metapher Hochflexibel Schnell Präzise Wir bauen eine Fabrik! und produzieren bereits, während sich die Fabrik noch im Aufbau befindet! 19.6.2013 9

Der Lösungsansatz im Projekt Übersicht Ausgangsdaten Ergebnisdaten Auswertung Cadenza PL/SQL Hudson CI Ablaufumgebung Tasks GIS- Bibliotheken Testumgebung Eclipse / Java Das Fabrikgelände SVN 19.6.2013 10

Modellierung der Prozess-Schritte Zustand jedes Datensatzes: Statustabellen in der Datenbank Status-Flag Prozess-Schritte: Zeitstempel Task = Java-Klasse Führt einen fachlichen Prozess-Schritt aus Bearbeitet jeweils eine atomare Dateneinheit Nutzt wahlweise PL/SQL, Java GIS-Bibliotheken, Java+SQL, Task-Ausführung: einfache, Java-basierte Ablaufumgebung 19.6.2013 11

Infrastruktur Bottleneck: Lösung: IO-Operationen! Die Datenbank liegt auf einer 250GB RAM-Disk Bewusster Verzicht auf Sicherheit zugunsten von Performance! Dedizierter Datenbankrechner: 2 x E5-2660 8C mit HT + Turbo (entspr. 32 CPUs) 384GB RAM 2 x 10 Gbit + weitere flankierende Systeme 19.6.2013 12

Backup-Strategie Backup nur dediziert durch Anhalten der Datenbank ca. 2 mal wöchentlich, Entscheidung durch Rechenbetreuer Nachteile: Systemausfall = Verlust mehrerer Tage Rechenzeit Anhalten kostet Zeit: Overhead Laufende Tasks zu Ende rechnen lassen 15min Spiegeln der Daten auf Storage-System Erfahrung: Ausfallrisiko 2 Mal eingetreten: Schreiben der RAM-Disk gescheitert Unkontrollierter Shutdown durch Bedienfehler Gesamtstrategie durch hohe Performance während der Gesamtrechenzeit über viele Wochen erfolgreich 19.6.2013 13

Parallelisierung Ziele: Optimale Nutzung der CPUs Keine Verzögerung durch unfertige Prozess-Schritte Strategie: Beliebige Tasks laufen parallel Unabhängige Datensätze werden parallel verarbeitet Umsetzung: Aufbrechen in kleine, unabhängige Schritte Modellierung über Status: Pausiert Erfahrungen: 24 Threads bei 32 Kernen guter Wert Falle: Zeitaufwändige Aktualisierung von Indexen insbes. Schreiben mehrerer Threads in dieselbe Tabelle permanentes Monitoring der Performance, Indexe temporär deaktivieren 19.6.2013 14

Leistungsfähigkeit von Oracle Spatial Beispiel-Prozess-Schritt Vereinigung gepufferter Gebäudepolygone PROCEDURE merge_big(v_table_id IN NUMBER) IS v_tablename VARCHAR2(38) := 'tmp_simple_buffered_' v_table_id; l_merged_buffer MDSYS.sdo_geometry; BEGIN EXECUTE IMMEDIATE 'select SDO_AGGR_UNION(MDSYS.SDOAGGRTYPE(buffered, 0.005)) GEOM FROM ' v_tablename INTO l_merged_buffer; EXECUTE IMMEDIATE 'delete from tmp_big_merged_buffers where identifier = :table_id' USING v_table_id; EXECUTE IMMEDIATE 'insert into tmp_big_merged_buffers(identifier, geometry) values (:identifier, :geometry)' USING v_table_id, l_merged_buffer; END; Konkretes Beispiel: 365.441 Gebäudepolygone (3,3 Mio. Stützpunkte) Rechenzeit: 3,5 Tage Sehr gute Leistungsfähigkeit für große Aufgaben 19.6.2013 15

Zuverlässigkeit von Oracle Spatial Bugs in Oracle Spatial: In Projekten dieser Größe stößt man zwangsläufig auf Fehler! Für Softwareprodukte dieser Größe ist das normal! Positive Erfahrungen: Die wenigsten Fehler waren kritisch Die meisten waren kurz zuvor behoben worden, Patches verfügbar Es gibt oft Alternativwege (oft nicht offiziell dokumentiert) Oft die Rettung: Hints Strategie im Projekt: Nicht lange an Fehlern aufhalten! Stattdessen alternativen Weg oder Technologie nutzen Die Zuverlässigkeit ist in Anbetracht des Funktionsumfangs gut 19.6.2013 16

Oracle Spatial Geocoder: Zuordnung von Adressen zu Gebäuden Nachteil: Hoher initialer Aufwand Dokumentation: Fokus auf Nutzung einer bestehenden Geocoder-Befüllung Geht nicht Out-of-the-Box (Patch p15926096) Aufbau/Befüllen des komplexen Schemas nicht trivial! Vorteile: Unscharfes Matching mit Ausgabe eines Match-Vektors Detaillierte Rückschlüsse auf Qualität der Treffer möglich Auch nutzbar, wenn man nur Teile des Schemas befüllt Hat sich sehr gut bewährt für die Verarbeitung der vorliegenden Rohdaten Separates zukünftiges Vortragsthema? 19.6.2013 17

Wichtige Aspekte im Vorgehen Konsistenz Daten und Zustand jederzeit in der Datenbank Inkrementelles Vorgehen Tasks werden im laufenden Betrieb ergänzt und erweitert Daten werden soweit verarbeitet, wie technisch jeweils bereits möglich Flexibilität in der Werkzeugwahl PL/SQL, Java GIS-Bibliotheken, Java+SQL, Agiles Vorgehen Anwendung agiler Techniken zum Aufbau der Fabrik Do the simplest thing that could possibly work Transparenz keine Black Box Zustandstabellen Fortschritt, Status Zwischentabellen Nachvollziehbarkeit Automatisierung Faktor Mensch nur da, wo er einen Mehrwert bringt Qualität Testabdeckung Nachvollziehbarkeit durch Protokollierung in der Datenbank 19.6.2013 18

Ergebnis des Projekts, Fazit Projektabschluss: in Time und in Budget Hochautomatisierte Datenverarbeitung kann auch für einmalige Datenaufbereitung eine Alternative zu traditionellen Herangehensweisen sein Oracle Spatial ist eine leistungsfähige und verlässliche Kernkomponente einer solchen Lösung Das produzierte Auto entspricht den hohen Erwartungen des Kunden Das Auto ist pünktlich zum Termin vom Band gelaufen obwohl die Fabrik erst zwei Tage zuvor fertiggestellt wurde 19.6.2013 19

Sie haben Fragen, Anmerkungen, ähnliche oder gar konträre Erfahrungen? Sprechen Sie uns bitte an, wir freuen uns: Torsten Brauer Dipl.-Geoökol. Berater, Projektleiter Markus Gebhard Dipl.-Informatiker Entwicklungsleiter, Leiter Business-Team IT/GIS disy Informationssysteme GmbH Tel. +49 721 16006-228 Fax +49 721 16006-05 torsten.brauer@disy.net disy Informationssysteme GmbH Erbprinzenstraße 4-12 76133 Karlsruhe www.disy.net Tel. +49 721 16006-237 Fax +49 721 16006-05 markus.gebhard@disy.net IT-Lösungen für räumliches Datenmanagement und -analyse