Oracle Spatial und Data Warehouse Schaffung von Synergien Joachim Figura, CISS TDI GmbH, und Oliver Röniger, ORACLE Deutschland GmbH Gerade in öffentlichen Verwaltungen und bei Ver- und Entsorgern liegen neben fachlichen Daten komplexe Geodatenbestände aus verschiedenen Quellen vor, die in unterschiedlichen Abteilungen bearbeitet und ausgewertet werden müssen. Die Integration dieser Informationen in Geoinformationssysteme (GIS) erfordert aufwendige Spezialkenntnisse. Oracle Spatial und Data Warehouse eröffnen neue Möglichkeiten der Kombination von fachlichen mit räumlichen Daten und deren Auswertungs- und Darstellungsmöglichkeiten ohne GIS-Spezialwissen. In Navigationssystemen oder über Internet-Dienste wie Google Maps werden laufend Informationen mit Ortsbezug abgerufen und ausgewertet. Der Bedarf an räumlichen Informationen sowie deren Nutzen steigt stetig an. Waren Geoinformationssysteme in vergangenen Zeiten etwas für Spezialisten, so hat sich dies heute grundlegend geändert. Mit Oracle Spatial und Oracle Maps eröffnet sich nun auch die Möglichkeit, räumliche Informationen mit fachlichen Daten zu kombinieren, diese in einer Karte darzustellen und Geodaten mit den üblichen Methoden wie SQL-Abfragen zu bearbeiten beziehungsweise auszuwerten. Außerhalb der GIS-Welt zeigen die Bereiche Business Intelligence und Data Warehousing, wie komplexe Datenbestände verwaltet sowie flexibel analysiert und ausgewertet werden können. Auch die so schon vorgehaltenen Daten haben fast alle einen räumlichen Bezug, das heißt, sie besitzen eine Adresse oder können mit einer Koordinate attributiert werden. Eine Auswertung dieser Daten inklusive der räumlichen Komponente bedeutet einen erheblichen Zusatznutzen für BI-Projekte. Anhand von realen Projektbeispielen werden im Folgenden Grundlagen und Zusammenhänge beider Fachgebiete beleuchtet: Voraussetzungen und Herausforderungen bei der Datenintegration sowie Möglichkeiten der Kombination von fachlichen mit räumlichen Daten und deren Auswertungs- und Darstellungsmöglichkeiten. Begriffsbestimmung Bevor ins Detail gegangen wird, werden die beiden Begriffe Business Intelligence und Geoinformationssystem gegenübergestellt. Unter Business Intelligence versteht man analytische Konzepte, Prozesse und Werkzeuge, um Unternehmensdaten sowie Wettbewerbsdaten in entscheidungsrelevantes Wissen zu transformieren. Es werden unternehmensinterne und -externe Daten als Quellen herangezogen. Der Begriff wird dem Fachgebiet der Wirtschaftsinformatik zugerechnet (siehe http://de.wikipedia.org/wiki/business_ Intelligence). Ein Geoinformationssystem ist ein Teilgebiet der IT und beinhaltet die Erfassung, Verwaltung und Auswertung räumlicher Daten. Historisch gesehen ist dieses Teilgebiet der IT aus der Vermessung entstanden und die Hauptanwender waren die Vermessungsverwaltungen sowie Ver- und Entsorger für die Planung und Dokumentation von Leitungsdaten. Mittlerweile gibt es unzählige Anwendungsgebiete, etwa in den Bereichen Bauleitplanung, Umwelt, Verkehr, Telekommunikation und Industrie. Weitere Fachgebiete gibt es in der Land- und Forstwirtschaft, Funknetzplanung oder bei Polizei und Rettungswesen. Navigationssysteme und Google Maps haben die Geoinformation in unseren Alltag gebracht. Prinzipiell unterscheidet man zwischen Raster- und Vektordaten. Rasterdaten sind analog zu digitalen Fotos Bilder, die in der Regel als Hintergrund-Informationen geeignet sind. Vektordaten bestehen aus Punkten/Symbolen, Linien-Elementen und Flächen, die einzeln identifiziert und manipuliert werden können. Ein GIS fasst Geometriedaten und Sachdaten zu Objekten zusammen. Objektzusammenhänge (Topologie/Nachbarschaftsbeziehung) sind ebenfalls Bestandteil eines vektorbasierenden GIS. Somit enthält ein GIS nicht nur Karten, sondern eine Menge weiterer alphanumerischer Informationen verschiedenster Art. Zu den Objekten können auch weitere Daten wie Bilder, Videos etc. hinterlegt sein. In diesem Artikel wird der Begriff Geodaten für diese Form der Daten verwendet. Nur mit Vektordaten sind intelligente Auswertungen möglich, zum Beispiel wenn bei einer Verunreinigung eines Kanalschachts mit Benzin auf Knopfdruck alle in Fließrichtung betroffenen weiteren Objekte (Haltungen/Schächte) angezeigt werden. Klassisches GIS-Umfeld Aufgrund der Vielfältigkeit der Aufgaben gibt es zahlreiche Firmen, die Software für Geoinformationssysteme herstellen und vertreiben. Marktführende Technologiefirmen sind neben vielen deutschen Fach- und Nischensystemen zum Beispiel Autodesk, ESRI, GE-Smallworld, Intergraph oder Pitney Bowes MapInfo. Aufbauend auf diesen Basis-Technologien gibt es Anwendungen für die verschiedenen Fachbereiche. Die professionelle Beschäftigung mit Geoinformationssystemen verlangt Spezialwissen über die jeweilige Technologie des Herstellers und die entsprechenden Fachanwendungen. Erfassungstools und Auswertungen werden durch Spezialisten, teilweise in systemeigenen Programmiersprachen, erstellt und weiterentwickelt. Der im jeweiligen Hersteller- und Anwen- DOAG Business News 1-2010 21
dungsumfeld begrenzte Markt macht Entwicklungen teuer, die im Vergleich zu kaufmännischen Anwendungen einen verhältnismäßig geringvolumigen Wiederverwertbarkeitsanteil aufweisen. Für die Aufgaben der Fachabteilungen wird es auch künftig keine Alternative zur komplexen GIS-Software geben. Es stellt sich allerdings die berechtigte Frage, ob Analysen und Auswertungen oder generell Folgenutzungen grundsätzlich einer komplexen GIS-Software bedürfen oder ob hierzu wirtschaftlichere, technisch einfachere und allgemeingültige Alternativen aus dem Bereich BI und Data Warehouse genutzt werden können, mit denen beispielsweise universelle und flexible Analyse- und Auswertungstools von Nicht-Geo-Spezialisten erstellt, weiterentwickelt und genutzt werden können. Dieser Ansatz hat sich im Markt noch nicht durchgesetzt. Geodaten können heute als Handelsware begriffen werden, das heißt, es besteht sowohl ein Angebot als auch eine Nachfrage an Geodaten aus unterschiedlichster Sicht wie zum Beispiel: Daten werden verwaltungs- oder unternehmensintern für verschiedene Zwecke der Analyse, Planung und Dokumentation gebraucht Externe Organisationen benötigen Daten mit Raumbezug für ihre unterschiedlichen Aufgabenstellungen Geodaten werden für Bürger öffentlich zugänglich gemacht Versorger müssen Bauauskünfte erteilen Bei Konzessionsübertragungen (Versorger) einzelner Sparten müssen die Daten über die Versorgungsnetze ausgetauscht werden Das Design eines Geodata Warehouses sieht daher gegenüber den Produktionssystemen vereinfachte Datenmodelle, die Übernahme aller für die Nutzer relevanten Informationen in eine Datenbank, die Erzeugung oder Anpassung der Präsentation der Daten und das Ermöglichen des direkten Zugriffs gemäß OGC-Standards vor. Natürlich ist auch ein Auslesen der Daten aus dem Geodata Warehouse für die lokale Weiterverarbeitung sinnvoll. Verbindung zu Data Warehouse und BI Abstrahiert man die Aufgabenstellungen, stellt man sehr schnell fest, dass es große Ähnlichkeiten zum Data- Warehouse- und BI-Umfeld gibt. Beispiele dazu sind: Zusammenführen von fachlichen Informationen aus mehreren Prozessen und Systemen Integration externer Daten unter Beachtung der Datenqualität Vollständige Datensicht und dennoch Komplexitätsreduktion Flexibles Reporting Übersichtliche Darstellung wie die Einbindung von Grafiken (Management Cockpit) zur Unterstützung operativer und strategischer Entscheidungen Die Möglichkeiten von BI-Software zur flexiblen Auswertung von Daten unter Einbezug von Geo-Inhalten und zur Erstellung von Reports sind in der GIS-Fachwelt bisher wenig bekannt, obwohl bei einer gewissen Abstraktion die Aufgabenstellungen sehr ähnlich sind, denn GIS-Anwendungen werden in hohem Maße zu Analyse- und Planungszwecken erstellt und gepflegt. Sie dienen somit als Grundlage für Entscheidungsprozesse. Die Übertragung der Methodik von BI auf GIS ermöglicht flexible Sichten auf die Daten sowie die Erstellung von Analysen und Planungsalternativen mit Standardwerkzeugen der Datenbank und eröffnet so neue Möglichkeiten auch für die GIS-Welt. Beispiel Hannover In einer Großstadt ergeben sich aus den verschiedensten Ämtern die unterschiedlichsten Fragestellungen. Zum Beispiel das Hervorheben aller dreigeschossigen Gebäude in einem Stadtteil, die Eigentum der Stadt sind. In einem nächsten Schritt sollen nur die Gebäude dunkelrot markiert werden, die eine überbaute Fläche von mehr als 200 qm haben (siehe Abbildung 1). Beispiel Mobilfunk Mobilfunkanbieter speichern eine Vielzahl von Informationen zur Netz- und Gesprächsqualität sowie zur Nutzung in unterschiedlichen Datenbanken, in Das bedeutet, dass die Daten aus verschiedenen Produktionssystemen in der Regel in weniger Detailtiefe und geringerer Komplexität nachgefragt werden, aber dafür auf transparente, grafisch aufbereitete und offene Datenmodelle für die vielfältige Nutzung durch unterschiedlichste Technologien abgebildet werden müssen, um so eine globale Sicht auf die Daten zu ermöglichen. Abbildung 1: Ausschnitt Stadtgrundkarte Hannover 22 www.doag.org
Abbildung 2: Auswertung QS-Mobilfunkstationen denen zur Analyse bereits komplexe Berechnungen stattfinden. Die klassische Auswertung dieser Performanz- Indizes geschieht über Top-N-Listen, Delta-Auswertungen oder andere alphanumerische Analysen. In Kombination mit einer Visualisierung der Werte, zum Beispiel bezogen auf die von einem Standort versorgten Zellen, können im Zuge der Netz-Optimierung schneller Entscheidungen getroffen werden, die optimierte Ergebnisse nach sich ziehen. In Abbildung 2 liegt es näher, an den Standorten mit den großen roten Dreiecken das Netz zu optimieren, als an jenen mit den kleineren gelben Dreiecken. Die Größe der Dreiecke gibt die Anzahl der insgesamt stattgefundenen Gespräche an und die Farbe eine prozentuelle Anzahl der nicht zustande gekommenen Gesprächsverbindungen. Neben diesen verfeinerten Auswertungen über mehrere Indizes gehören auch Fragestellungen wie Visualisierung von Nachbarschaften zwischen Mobilfunkzellen, Anzeige von Frequenzen beziehungsweise geplanten oder durchgeführten Frequenzänderungen, Interferenzen oder auch Anzeige von Netzparametern zu den Analysen, die durch eine Kombination zwischen BI und GIS effizienter gelöst werden können. BI needs GIS Klassische BI-Projekte haben keine Anforderungen in Bezug auf Geo-Informa- Abbildung 3: Management-Cockpit mit einer Karte DOAG Business News 1-2010 23
tionen. Das ist bedingt durch den oft kaufmännischen Hintergrund der BI- Anwender. Die Massendaten eines Data Warehouses sind nach verschiedenen Kriterien zu strukturieren und benutzergruppenspezifisch darzustellen: Controller bevorzugen Zahlenkolonnen, die sich möglichst in Excel weiterverarbeiten lassen Marketing-Mitarbeiter bevorzugen Portfolio-, Kuchen- und Balkendiagramme; sie wollen Trends erkennen und verabscheuen Details Das Management erwartet kommentierte, entscheidungsrelevante Informationen, oft in Form von Dossiers und unterfüttert mit Langzeitanalysen zur besseren Vergleichbarkeit Dass Darstellungen in Kartenform analytischen Mehrwert bieten können, war den BI-Anwendern lange Zeit unbekannt und ist auch heute nicht unumstritten. Durch einfaches Geocodieren der analyserelevanten Ereignisse wird es aber möglich, die oben genannten, typisch betriebswirtschaftlichen Darstellungsformen und Karten miteinander zu kombinieren. Abbildung 3 zeigt eine einfache Form eines Management-Cockpits. Neben dem Balkendiagramm und Detail-Tabellen können analyserelevante Objekte parallel auf einer Karte visualisiert werden. Im einfachsten Fall sind die Geschäftsstellen eines Unternehmens mit ihrem Umsatz und ihrer Mitarbeiterzahl als Punkte auf der Karte zu sehen. Filialen eines Unternehmens können trotz großer Differenz in der Postleitzahl sehr dicht beieinander liegen und sich damit kannibalisieren. Dem entfernt operierenden Management wird nur durch die Kartendarstellung deutlich, warum die Umsätze trotz geeigneter Käuferstruktur nicht die erwartete Höhe aufweisen. Wie stark über das erste Markieren hinaus echte Geofunktionalität gefordert wird, hängt sehr stark vom geschäftlichen Kontext der Analyse ab. Mithilfe von Geoinformationen sind zum Beispiel feinere und detailreichere Auswertungen möglich. Vertriebsgebiete können demnach nicht nur nach Oracle BI / GIS Produktarchitekur Relationale Datenhaltung Partitioning OLAP Spatial Data Warehouse / Data Marts Copyright 2009, Oracle and/or its affiliates. All rights reserved. Abbildung 4: Ganzheitliche Oracle Produkt-Architektur Postleitzahlen eingeteilt werden, sondern anhand weiterer räumlicher Kriterien wie nördlich oder südlich der Autobahn verfeinert werden. Topografische Gegebenheiten wie Verkehrswege, große Flüsse oder auch Stadtteilgrenzen können somit in die Analytik mit eingehen. Dabei sind mithilfe der topologischen Informationen weitere Restriktionen zur räumlichen Begrenzung im Detail nutzbar. Die Nutzung von digitalen Vektorkarten kann als weiteres Element eines OLAP-Würfels gesehen werden. Rasterkarten sind aufgrund des bildhaften Charakters kaum zu Auswertungen geeignet. Geodaten unterscheiden sich sowohl durch ihre geometrischen Eigenschaften wie Strichstärke, -farbe oder Ebenen-Informationen als auch durch anhängende Sach-Informationen. So kann man die Objektklasse Autobahnen anhand der grafischen Ausprägung erkennen, das Objekt A61 dann durch einen Zusatztext oder anhand des Sachattributs zur geometrischen Information. Topologische Informationen werden, sofern sie nicht in den Sachdaten enthalten sind, durch geeignete räumliche Abfragen erkannt, wie Oracle Application Server Oracle Maps Oracle Business Intelligence Server Interaktive Dashboards Standardberichte Ad-hoc- Analysen Alerts / Alarme MS Office Plug Ins Business Intelligence Oracle Business Intelligence Suite Enterprise Edition + Auf welchem Flurstück steht das Haus in der Sinziger Str. 25? oder Welche U-Bahn-Stationen befinden sich in meiner Nähe? Abbildung 4 zeigt, wie eine ganzheitliche Oracle Produkt-Architektur aussehen kann, die sowohl das Data Warehouse als auch die Geoinformationen (Datenhaltung und Visualisierung) sowie die Business-Intelligence- Werkzeuge beinhaltet. Die Fachdaten des Data Warehouse werden von der relationalen Datenbank gehalten, bei Bedarf ergänzt von der OLAP-Option. Die Geodatenhaltung erfolgt mittels Oracle Spatial. Alle Daten lassen sich mit SQL analysieren und darstellen. Zur Darstellung stehen moderne BI-Werkzeuge zur Verfügung (unter anderem das oben gezeigte Dashboard) sowie mit Oracle Maps die Karten. Alternativ dazu können auch andere Kartenviewer eingebunden werden, da es sich um eine reine Web- Architektur handelt. Beispiele Kunden, die die kurz skizzierten modernsten BI-Möglichkeiten inklusiver kartografischer Komponenten bereits 24 www.doag.org
nutzen, versprechen sich davon Wettbewerbsvorteile und möchten nicht referenziert werden. Neben den im Kapitel GIS needs BI genannten Beispielen, soll an dieser Stelle deshalb nur ein interessanter Fall kurz beschrieben werden. Beispiel Innere Sicherheit Die Polizei ist für die Innere Sicherheit verantwortlich. Sie soll nicht nur schnellstmöglich Verbrechensdelikte aufklären, sondern auch präventiv arbeiten und Problemherde sowie Phänomene frühzeitig erkennen. Das im polizeilichen Umfeld mit Kartenanalysen gearbeitet wird, ist selbstverständlich, da sich alle Aktivitäten verorten lassen (Tatort, Opfer, Verdächtige, etc.). Auch hier muß der Herausforderung begegnet werden, dass die Polizisten zum ganz großen Teil keine GIS- oder IT-Spezialisten sind und mit hart codierten Geodarstellungen oder programmierten Sichten nicht flexibel genug arbeiten können. Die Dynamik des Polizeialltags bringt es mit sich, dass im Rahmen der täglichen und auch untertägigen Lagebilder variabel auf Informationsveränderungen reagiert werden muß. Wird zum Beispiel festgestellt, dass jeden Dienstag an jeweils verschiedenen S-Bahnstationen im Ruhrgebiet gehäuft Fahrraddiebstähle zu verzeichnen sind, kann die polizeiliche Arbeit darauf ausgerichtet werden. In einer Kartendarstellung läßt sich der lokale Zusammenhang plastisch darstellen, das Phänomen Fahrraddiebstahl dienstags S-Bahn wird anfassbar. Von der Karte kann bei Bedarf wiederum in die BI-Analyse (auch in Form eines Dashboards) verzweigt werden. Beispielsweise werden alle Akten der relevanten Delikte im Detail dargestellt, sodass ausgehend von dieser Sicht eine weitere Einschränkung der Betrachtungsobjekte erfolgen kann. Fazit Die Ausführungen in diesem Beitrag haben gezeigt, dass die GIS- und BI- Welt sich gegenseitig mit fachlichen Ideen und auch technologisch stark befruchten können. Das Vorhandensein von Standards wie SQL und WMS erlaubt es, in offenen Architekturen beide Welten technologisch zusammen zu bringen und das proprietäre Spezialistentum zu überwinden, welches im klassischen GIS-Umfeld vorherrscht. Um erfolgreich Projekte der beschriebenen Art durchführen zu können, muss sich sowohl die GIS-Community öffnen als auch die BI-Community das Verständnis für die Mehrwerte von Kartenanalysen entwickeln. Kontakt: Joachim Figura j.figura@ciss.de Oliver Röniger oliver.roeniger@oracle.com SC NITTSTELLE zum ERFOLG Wir vermitteln unternehmen die passenden IT-Spezialisten IT-Projekte erfordern das Know-How hochrangiger Experten. Mit uns bleibt kein IT-Job unbesetzt und kein IT-Experte ohne Aufgabe. Als Marktführer für die Rekrutierung von Spezialisten vermitteln wir IT-Profis an Topunternehmen: Oracle-Spezialisten, hardwarenahe Software-Entwickler, Datenbankexperten, Java- Profis und viele andere IT-Experten. hays.de/it DOAG Business News 1-2010 25