Das Linked Open Data Warehouse

Ähnliche Dokumente
Das Linked Open Data Warehouse

Semantic Web & TYPO3. Netresearch GmbH & Co. KG -

in die Zukunft Vorträge Workshop Erfahrungsaustausch

Geodatenintegration unter Nutzung von Linked Data Prinzipien Stefan Wiemann Technische Universität Dresden

Dresden, 21 September 2018 Martien Vos. Präsentation RedForce DOAG

CITRA-ConfigCenter, Geodata-Warehouse, CITRA-ExportCenter & Geodatenshop Aufbau einer GDI mit CITRA Tools

Open Access Netzwerk

XML-Technologien Tutorium 6

Nutzung von WFS-Downloaddiensten leicht gemacht. Steffen John

Datenbankbasierte Lösungen

Einsatz von Semantic Web Technologien in der Industrie 4.0

i2b2/shrine Eine alternative Registerplattform

Evaluation verschiedener Triple-Stores zum Speichern von Metadaten im Kontext des Forschungsdatenmanagements

AGENDA. Anwendertreffen M.O.S.S Mittwoch, Stand: :30 Uhr Registrierung & Mittagsimbiss. 12:30 Uhr Begrüßung

Geoinformationen für alle Anwendungsfälle zentral und offen, konsistent und aktuell

Tim Software-Architekt und Entwickler bei.

Präsentation RedForce DOAG. Martien Vos, 22 september 2017

Interoperabler Datenaustausch ein entscheidender Faktor für erfolgreiche BIM-Projekte

Oracle Spatial im Topobase Umfeld SIG Oracle Spatial Event Frankfurt, 18. April 2012

Daten als Treibstoff für intelligente Mobilität

Linked Open Data im Archivportal Europa

mcloud & mfund Daten als Treibstoff für intelligente Mobilität Stefan Kaufhold ITB etravel World 2017 Berlin

deegree: AIXM WFS und WPS Services - GML-Anwendungen im Aviation-Bereich -

Geodaten Online Kaufen Kataster, Luftbild,

ANWENDUNGSSZENARIEN UND REFERENZARCHITEKTUR IN DER INDUSTRIE 4.0 ESK

Einführung in das Forschungsinformationssystem VIVO Hands-On-Lab auf dem 6. Deutschen Bibliothekartag

Modelling Geo Data for Location-based Services. Jörg Roth Fachbereich Informatik Georg-Simon-Ohm Fachhochschule Nürnberg

Verbesserte Nutzbarkeit heterogener und verteilter Geodaten durch Semantische Interoperabilität

Service Portal Die komplette IT auf einen Blick an jedem Ort, auf jedem Device, in Echtzeit. Network Visibility

Geoportale und Geodienste für die Wasserwirtschaft

Digitale, datenbasierte Innovationen und Ideen für die Mobilität 4.0. NWSIB Tage 2017 Gelsenkirchen

RDF & OWL. Praktikum Softwaretechnologie für die Ressourcenlinguistik. Johannes Hellrich & Erik Fäßler SS FSU Jena

- Pflegestelle. OKSTRA und BIM. Dipl.-Phys. Bernd Weidner

OPEN FRIDGE - OFFENE GERÄTESCHNITTSTELLEN FÜR ENERGIEEFFIZIENZ

Linked Data Grundlagen Einführung ins Data Web

Vier aufs Mal. Aufbereitung statistischer Daten für Web Print Open Data RDF Linked Open Data. Jonas Bieri, Statistisches Amt des Kantons Basel-Stadt

Sensor Web in der Praxis

Mobile interoperable Dienste

Bezug von Liegenschaftsdaten und Luftbildern über den Shop

Geodaten intelligent nutzen

megatel GmbH Nordlichtertreffen der Regionalgruppen Bremen, Hamburg und Hannover

Herausforderung Betrieb von zentralen GEO-IT-Diensten im E-Government

Linked Open Data in Musikbibliotheken. am Beispiel des RISM-OPAC. AIBM-Tagung bis in Nürnberg

Internet of Things: Wenn Geräte miteinander kommunizieren können Unterwegs in eine Zukunft der digitalisierten Anlagenwelt

XML-Datenaustausch in der Praxis Projekt TOMIS bei der ThyssenKrupp Stahl AG

Geodateninfrastruktur Berlin: Das virtuelle 3D Stadtmodell

rdf2wp - Publikation von Daten als RDF mittels WordPress-Blogs

INSPIRE Datenüberführung leicht gemacht

Handlungsempfehlungen zur technischen Umsetzung von INSPIRE-konformen Darstellungs- und Downloaddiensten

GeoForum MV am 26. und 27. April 2010 in Warnemünde. Landkreisatlas. GDI-Komponente für alle Kommunen. Uwe Weigel Landratsamt Mittelsachsen

Die Geodateninfrastruktur für den professionellen Einsatz. deegree Enterprise Edition

Firmenprofil. Was heißt CISS TDI? CAD / CAM Informationssysteme Systemanalyse Software. Gesellschaft für Technische DV Informationssysteme mbh

Offene Daten und offene Software. Schweizer Statistiktage August 2018 Michael Grüebler

Metadaten in CLARIN-D

Neue Entwicklungen bei GIS-Servern

Open Spending Visualisierung kommunaler Ausgabenprofile

APPIFICATION OF GEOGRAPHIC INFORMATION SYSTEMS

Ein Konzept zum Fachdokumenten-Management und zum Einsatz von InGrid im Umweltinformationssystem Baden-Württemberg

logarithmo ! 1 Equipping the energy sector with smart applications logarithmo

Aufbau und Vernetzung kommunaler Geoportale unter Verwendung zentraler Komponenten

Car-to-Cloud Kommunikation für einen Automotive Big Data Marktplatz

Data Science als Treiber für Innovation Neue Anforderungen und Chancen für Ausbildung und Wirtschaft

Intergraph GDI-Fachtagung

Forschungsdatenmanagement in den Umweltwissenschaften

Topic Maps. Wissensmanagement in Bildungseinrichtungen. Seminar Web Engineering Lars Heuer,

Gesellschaft für Geodatenservice. Geo-Information Value Management

Oracle als Integrationsplattform - Geodata Warehouse im Konzern Stadt Herten

Netzinformationssystem für Telekom Austria rmdata / J. Strobl 1

INSPIRE Umsetzung bei der Stadt Bielefeld

FUSION Data Service & 3A Konverter Live & Kompakt

Das modulare DWH Modell

Übersicht. Überall. Über alles.

CityGML-Daten als Grundlage für webbasierte Visualisierungen

Linked Open Data: Das Beispiel der Deutschen Nationalbibliothek als Beitrag zum Meinungsbildungsprozess in der AGV Konstanz, den 16.4.

Data Warehouse für boden- und agrarwissenschaftliche Forschungsdaten

Einführung zum OGC Web Processing Service

ESPRESSO - Dipl.-Ing. Martin Fabisch

tdwi E U R D P E OPEN SOURCE BUSINESS INTELLIGENCE HANSER MÖGLICHKEITEN, CHANCEN UND RISIKEN QUELLOFFENER BI-LÖSUNGEN

Datenbanken und Semantic Web

Geodatenpool der Landeshauptstadt München

Best practiceworkshops WebServices+ MapCAD

How Dataport Manages Information

SENSORDATEN IM UMWELTMONITORING. Vivien Stender

Machen Sie Ihre Daten bereit für INSPIRE mit HALE

Was fehlt den semantischen Netzen?

DSpace 5 und Linked (Open) Data. Pascal-Nicolas Becker Technische Universität Berlin German DSpace User Group Meeting 2014 Berlin, 28.

Wirtschaftliches Potenzial öffentlicher Geodaten

Web Engineering Prof. Dr. Martin Gaedke, Dipl.-Inf. Olexiy Chudnovskyy

Kooperation in Sachen Geodienste. WebMapping Days /15. November 2017 Im Posthof am Kornmarkt, Trier

OGD Österreich : mit Kooperation zum Erfolg

Geodateninfrastruktur Deutschland. Dr.-Ing. Winfried Hawerk Stellvertretender Vorsitz Lenkungsgremium GDI-DE

XPlanungs-konforme Bauleitplanung mit GeoOffice

Datenbereitstellung durch das ARE

Business Chancen im Reporting nutzen. Ingo Diekmann Leiter Kooperationen & Business Development IDL GmbH Mitte

Umsetzung von Geodateninfrastrukturen in der Schweiz im Kontext von INSPIRE

Praktischer Nutzen und Potenziale von Punktwolken für kommunale Anwendungen. Rico Richter 8. Oktober 2016 Workshop 3D-Stadtmodelle

Semantic Technologies

Marine Network for Integrated Data Access

Transkript:

Das Linked Open Data Warehouse Deutsche Oracle Anwendergruppe 2017 CISS TDI GmbH, TU Berlin Nürnberg, Saal Helsinki, 16:00-16:45 Uhr, 21.11.2017 Richard Figura (CISS), Alexander Willner (TUB)

Richard Figura CISS TDI GmbH Richard Figura CISS TDI GmbH (Geo-)datenverarbeitung & -vertrieb Business Development, Leiter Forschung richard.figura@ciss.de Universität Duisburg Essen Networked Embedded Systems (NES) External Senior Researcher richard.figura@uni-due.de linkedin.com/in/richard-figura @figura_richard https://ciss.de /company/ciss-tdi-gmbh xing.to/figura https://nes.uni-due.de /companies/cisstdigmbh @ciss_tdi 2

Dr. Alexander Willner Industrial Internet of Things TU Berlin Dr.-Ing. Alexander Willner Technische Universität Berlin Next Generation Networks (AV) Leiter der Industrial Internet of Things Forschungsgruppe alexander.willner@tu-berlin.de Fraunhofer FOKUS Software-based Networks (NGNI) Leiter des Industrial Internet of Things Zentrums alexander.willner@fokus.fraunhofer.de linkedin.com/in/willner @AlexWillner http://iiot-center.org http://xing.to/willner http://openiotfog.org 3

Motivation

Der direkte und indirekte Nutzen offener Daten wird alleine in Europa auf bis zu 900 Milliarden Euro pro Jahr geschätzt.* *McKinsey: Open data: Unlocking innovation and performance with liquid information (2013) 5

Offene Daten sind die Basis neuer Geschäftsideen, erzeugen wirtschaftliches Wachstum und fördern Innovationen in Wirtschaft, Verwaltung und Zivilgesellschaft.* *http://datenwirken.de 6

Geoinformationen stellen einen Rohstoff für Wertschöpfung in allen Wirtschaftsbereichen dar und stehen am Anfang der Wertschöpfungskette.* *Basierend auf MICUS Management Consulting GmbH 7

Das Geld liegt scheinbar auf der Straße Wie lässt sich das Potential von (Open) Data erreichen? 8

Verwendung (offener) Daten in Unternehmensprozessen?? Daten Unternehmensprozesse 9

1. Open Data Herausforderungen Die Daten werden nicht gefunden 10

2. Open Data Herausforderungen Daten müssen verlässlich sein 11

3. Open Data Herausforderungen Die Daten müssen zur Systemlandschaft passen? Daten Nutzeranforderung 12

4. Open Data Herausforderung Wissen Zusammenhänge von Informationen (Vernetzung) Informationen Bedeutung der Daten Daten Interpretation der Zeichen Zeichen Wissensmanagement im Unternehmen, Rehäuser, Jakob; Krcmar, Helmut, 1996 13

4. Open Data Herausforderung: Metainformationen Daten!= Information Flügel 14

4. Open Data Herausforderung: Silos Information!= Wissen (Relationen/Duplikate/Veraltete Daten/ ) 15

Open Data Herausforderungen Klima & Wetter Infrastruktur Luftfahrt Wasserstraßen/ Gewässer Bahn Straßen Bereitstellung von unterschiedlichen Quellen Nutzer muss sich selbst kümmern, um: Datensuche Datenbeschaffung Konvertierung/Vorverarbeitung Verknüpfung 16

Verwendung (offener) Daten in Unternehmensprozessen Bereitstellung Daten 17

Verwendung (offener) Daten in Unternehmensprozessen Bereitstellung Qualitätssicherung Daten 18

Verwendung (offener) Daten in Unternehmensprozessen Bereitstellung Qualitätssicherung Integration Daten 19

Verwendung (offener) Daten in Unternehmensprozessen Integration Bereitstellung Qualitätssicherung Vor- Verarbeitung Daten 20

Verwendung (offener) Daten in Unternehmensprozessen Integration Bereitstellung Qualitätssicherung Vor- Verarbeitung Daten Unternehmensprozesse 21

Lösungsansätze

Derzeitige Lösungsansätze Data Warehouses Das Semantische Web?? 23

Data Warehouse als Lösung für eine heterogene Daten-/Systemlandschaft Extract Transform Load (ETL) Single point of truth Datenintegration Qualitätssicherung Standardisierter Zugriff z.b. durch das Open Geospatial Consortium (OGC) 24

Data Warehouse als Lösung für eine heterogene Daten-/Systemlandschaft Energieversorgunsunternehmen (EVU): Operativ ETL Warehouse Auswertung Leitungsdaten - Smallworld - ALKIS - NAS - Baumaßnahmen Aufbruchsperren - Shape - Direktzugriff Weitere Geodaten aus dem Netz Wasserschutzgebiete - Shape - CITRA Web- Konverter Abgabe von Daten / Shop Höhendaten - Shape - DXF, Shape, 3-D Daten - CityGML - Rasterdaten INSPIRE PDF-Ausdrucke 25

Derzeitige Lösungsansätze Data Warehouses (OGC-)Standard konform Integriert Daten unterschiedlicher Quellen an zentraler Stelle Erlaubt weitere Verarbeitung (Konvertierung/Qualitätssicherung) Das Semantische Web? 26

Das Semantische Web als Lösung für Föderierte Informationssysteme * Daten sind im Web verfügbar 27

Das Semantische Web als Lösung für Föderierte Informationssysteme * Daten sind im Web verfügbar ** Daten sind Maschinenlesbar 28

Das Semantische Web als Lösung für Föderierte Informationssysteme * Daten sind im Web verfügbar ** Daten sind Maschinenlesbar *** Daten in offenen Formaten 29

Das Semantische Web als Lösung für Föderierte Informationssysteme * Daten sind im Web verfügbar ** Daten sind Maschinenlesbar *** Daten in offenen Formaten **** Daten folgen dem RDF Standard 30

Das Semantische Web als Lösung für Föderierte Informationssysteme * Daten sind im Web verfügbar ** Daten sind Maschinenlesbar *** Daten in offenen Formaten **** Daten folgen dem RDF Standard ***** Daten in offenen Formaten 31

Das Semantische Web als Lösung für Föderierte Informationssysteme 32

Cytoscape Screenshots

Das Semantische Web, ein Netz aus Informationen RDF triple Subjekt: Instanz (URI) Prädikat: Link (URI) Objekt: Attribut/Instanz (URI) Beispiel: Rc:cygri hat den Namen Richard Cyganiak Rc:cygri lebt in dbpedia:berlin Dbpedia:Berlin hat 3.405.259 Einwohner 34

SPARQL (SPARQL Protocol And RDF Query Language) Informations -Domäne SPARQL-Anfrage SPARQL-Antwort Informations -Domäne SPARQLendpoint Informations -Domäne 35

SPARQL (SPARQL Protocol And RDF Query Language) Protocol: Definiert HTTP Operationen (Query und Update) Query: Anfragen an einen SPARQL endpoint Finde alle Städte in Deutschland mit mehr als 100.000 Einwohnern und zeige ihr Wappen Zeige alle Städte in Deutschland, die auf den Namen dorf enden und mehr als 100.000 Einwohner haben Zeige alle POIs zu gegebener Koordinate (Schule/Universität/Kindergarten/ ) Zeige die in Wikipedia beliebtesten Plätze Update: Aktualisieren des RDF Graphen in einem Graph Store 36

Derzeitige Lösungsansätze Data Warehouses (OGC-)Standard konform Integriert Daten unterschiedlicher Quellen an zentraler Stelle Erlaubt weitere Verarbeitung (Konvertierung/Qualitätssicherung) Das Semantische Web W3C-Standard konform Erlaubt den Zugriff auf verteilte Informationen (originäre Quelle) Skalierbar, bietet eigene Werkzeuge zur weiteren Verarbeitung 37

Derzeitige Lösungsansätze Data Warehouses (OGC-)Standard konform Integriert Daten unterschiedlicher Quellen an zentraler Stelle Erlaubt weitere Verarbeitung (Konvertierung/Qualitätssicherung) Das Semantische Web W3C-Standard konform Erlaubt den Zugriff auf verteilte Informationen (originäre Quelle) Skalierbar, bietet eigene Werkzeuge zur weiteren Verarbeitung +? 38

Eigener Ansatz: Das Linked Open Data Warehouse

Graph als Bestandteil von Oracle Spatial and Graph Spatial Geodatenmanagement Vektordaten Rasterdaten Topologien Geodienste Graph RDF Graph Unterstützung SPARQL Unterstützung (Jena Anbindung) Inferencing Graph bezogene Filter und Analysen (über 30 Algorithmen für Graphenanalyse) 40

Das Data Warehouse als OGC-W3C Schnittstelle Lokale Ressourcen/klassische Dienste 41

Das Data Warehouse als OGC-W3C Schnittstelle Offene Quellen 42

2 Zielgruppen: Datenlieferant Der Datenlieferant braucht eine Plattform zur Qualitätsgesicherten Bereitstellung seiner Daten: Qualitätsprüfung Vorverarbeitung (+ Metadaten) Bereitstellungswege Geodienste (WFS/WMS) SPARQL-endpoint Export (z.b. CISS-Shop) Datenkonsument Der Datenkonsument braucht eine Plattform zur einfachen Integration bereitgestellter (offener) Daten: Integration in die eigene Datenlandschaft Bezug Qualitätssicherung Konvertierung Weitere Verarbeitung 43

Datenlieferant Verarbeitung Export Dienste Konvertierung CITRA Qualitätssicherung Bereitstellung Semantisches Web Weitere Quellen 44

Datenkonsument Verarbeitung Export Bereitstellung Dienste Qualitätssicherung Direkt- Zugriff Weitere Quellen 45

Qualitätssicherung 46

Qualitätssicherung Attributfehler Eindeutigkeit Wertebereiche Inkonsistenzen Bezeichner: bf_nr Nettobahnsteiglaenge_m 8263 115 8263 115 2616 115 bf_nr == Bf.Nr. Bf. Nr. Station 8263 Ahnatal-Casselbreite 2616 Ahnatal-Heckershausen Geometriefehler Doppelte Digitalisierungspunkte: Defekte Geometrien Unvollständige Topologien: 47

Anwendungsszenarien Ein Versicherer schätzt die Anzahl betroffener Bürger nach einem Sturm: Ein Pharmaunternehmen erfragt die Nebenwirkung von Teilnehmern einer Studie: Für jede Stadt aus DWD:Sturmwarnung:Gestern Summiere Einwohner aus dbpedia:stadt Für jeden Teilnehmer aus Studie:Teilnehmer Für Set aus Medikamente aus Probant:Teilnehmer Liste Nebenwirkung der pharma:medikamten 48

Limbo & Das Linked Open Data Warehouse

Das Linked Open Data Warehouse als Teil des Projektes LIMBO Linked Open Data Warehouse: Qualitätssicherung Konvertierung und Vorverarbeitung Data Warehouse <-> Semantisches Web Limbo zusätzlich: Crawling Question Answering Erstellung geeigneter Vokabulare Kuratierung der Daten Anpassung an unterschiedliche Anwendungsfälle (Mobilität 4.0/Industrie 4.0) Benutzerschnittstellen 50

Das Linked Open Data Warehouse als Teil eines Gesamtkonzeptes Limbo: Linked Data Services for Mobility Fördertopf: mfund / BMVI 9 Partner aus Industrie und Forschung Laufzeit: 3 Jahre Budget: ~ 3 Millionen Startzeitpunkt: vor. 01.06.2017 Thema: Bereitstellung/Verarbeitung von Mobilitätsdaten (wie BMVI, mcloud) als Linked Data Validierungsszenarien: Mobilität 4.0 Industrie 4.0 51

LIMBO, Linked Data Services for Mobility - Partner 52

Die ➌ wichtigsten Punkte zusammengefasst ➊ ➋ ➌ Offene Daten bieten einen Mehrwert für Wirtschaft und Gesellschaft Die Integration Offener Daten erfordert geeignete Werkzeuge Das Linked Open Data Warehouse auf Basis von Oracle Spatial & Graph liefert eine Optimale Voraussetzung

Fragen? Richard Figura Business Development