Linked Open Data: Any Beef? GI Fachgruppe Datenbanken Ralph Traphöner Empolis Information Management GmbH Version 2.3 Seite 1
Unsere Mission Business Intelligence auf Texten Empolis-Lösungen befähigen Unternehmen und Organisationen, die exponentiell wachsende Menge strukturierter und unstrukturierter Daten zu analysieren, zu interpretieren und automatisiert zu verarbeiten. Sie nutzen damit ihr Wissenskapital, um unternehmenskritische Geschäftsprozesse zu optimieren. Entscheider, Mitarbeiter und Kunden erhalten so stets situations- und aufgabengerecht genau die Information, die für sie relevant ist und können so schneller bessere Entscheidungen treffen. Seite 2
Unsere Vision Die richtige Information zur richtigen Zeit zur richtigen Person auf einem beliebigen Endgerät Seite 3
Smart Information Management ist die Integration von Content Management und Knowledge Management Content Management Knowledge Management = Smart Information Management Seite 4
Prozess Wir bieten ein umfassendes Lösungsangebot von der Konzeption über Software-Produkte bis hin zu Roll-Out und Betrieb Analyse Konzeption Entwicklung Roll-Out Training Betrieb Service/Support Information Lösung Technischer Service, Fachverlage, Dokumentation und Vertrieb Smart Content Intelligente Strukturierung und Aufbereitung von Inhalten zur automatisierten und situationsgerechten Informationsbereitstellung Wissensmanagement, Kundenservice, Erfahrungsmanagement, Fehlerbäume und Diagnose Smart Knowledge Optimierung wissensintensiver Geschäftsprozesse mittels semantischer Suche, Case Based Reasoning und adaptiver Entscheidungsbäume Markt- und Wettbewerberbeobachtung, intelligente Recherche, Predictive Analysis Smart Intelligence Systematische Auswertung von Informationen zur Vorhersage von Chancen, zum Erkennen von Risiken und für eine schnelle und intelligente Entscheidungsfindung Erfahrung nutzen Handeln optimieren Chancen wahrnehmen Vergangenheit Gegenwart Zukunft Seite 5
Empolis liefert Lösungen für unternehmenskritische Prozesse Über 25 Jahre Erfahrung 150 Mitarbeiter 250 der Fortune 1.000 Unternehmen 500 Installationen 620.000 Professional User 34 Mio. End-Kunden weltweit Seite 6
BMW Seite 7
Airbus Seite 8
Europäisches Patentamt Seite 9
CCH Australia Seite 10
DATEV eg Seite 11
Von 2009 bis 2020 soll das digitale Informationsvolumen um das 67-fache ansteigen Seite 12
Die Information hat am Information Overload genau so viel Schuld wie das Schwein am Übergewicht Seite 13
Wir brauchen semantische Filter für schwache Signale Seite 14
nach dem Leben, dem Universum und dem ganzen Rest 42 Seite 15
Extreme Information Management Real-time Analysis, Indexing and Visibility Large Linear Scalability Low-latency access Sammeln Verstehen In Kontext setzen Verwenden Structured (high dimensional) Unstructured Text, Audio, Video Many Sources Unified Information Access 32 Languages Domain vocabulary Semantic annotations Seite 16
Fokus auf Skalierung und Betrieb ITWM Hercules Cluster Total Response Time Quad Core Xeon 20 nodes 40 nodes 60 nodes Seite 17
Das IAS skaliert auch für Big Data in Echtzeit Testdaten Volumen Datensatz Dauer Kerne Ein Tag Twitter weltweit 200.000.000 Tweets 0,6KB/tweet 12:41h 16 0:19h 640 Gesamte Wikipedia-DE 1.591.185 Artikel 4KB/doc 1:59h 16 0:03h 640 Ermöglicht wird dies durch eine vollständige Verarbeitung aller Informationen im Hauptspeicher In Memory Computing Seite 18
Das IAS vereint alle Funktionen für einen effektiven und effizienten Zugriff auf Informationen und ist Ready for Big Data Drill-Down Dashboards E-Discovery Monitoring & Alerting Dossiers Fragen in natürlicher Sprache SMILA Unified Information Access Architecture TME Textversteher HSSI Highly Scalable Semantic Index OntoStore Ontology Storage and Management DOS Distributed Object Store 24/7 IAS OntoEdit Admin Console BIG DATA Text, Audio, Video, alle Formate & Sprachen INTERN Service-Notizen, E-mail, Intranet Datenbanken EXTERN Blogs, Wikis, Foren, Internet Wörterbücher Thesaurus Taxonomien Ontologien LINKED OPEN DATA Strukturierte Daten Seite 19
Während der IAS-Entwicklung seit 1992 wurden von Empolis ca. 25 Mio. investiert, davon ca. 20 Mio. Euro seit 2007 1992 1998 2000 2001 2002 2003 2004 2006 2007 2008 2009 2010 2011 2012 Daimler Benz OTTO Arcor BBC DATEV Versatel Thieme EATON BVA Würth Arvato Analog Devices Telekom Neckermann HUK Bertelsmann IBM Vodafone O2 SIEMENS DFS La Caixa Seite 20
Semantik: Gib mir das, was ich meine nicht das, was ich eingebe arbeit raum rente versicherung angestellter Angesteller im öffentlichen Dienst TW 1:3 TW 1:2 arbeitsraum innerhalb der wohnung Ist Ein 1:2 rentenversicherungsangestellter Angesteller Privatwirtschaft M/W 1:1 Syn: 2:4 urteil des obersten gerichtshofs rentenversicherungsangestellte afa häusliches arbeitszimmer Abk: 2:1 Abk: 1:3 TW 1:2 ogh absetzung für abnutzung arbeit zimmer TW 1:3 rente versicherung angestellte Seite 21
Schnipselwelt Seite 22
Concept Graph: Visualisierung von Zusammenhängen Seite 23
Co-Occurrence Zusammenhänge erkennen In der Konzept-Konzept-Matrix werden bedingte Wahrscheinlichkeiten dargestellt, die zeigen, wie oft Konzepte miteinander erwähnt werden. Damit werden Zusammenhänge visualisiert. Seite 24
CUbRIK: History of Europe Seite 25
CUbRIK: Entitypedia Seite 27
Transparenz Seite 28
Modellierung Seite 29
Fachmodelle Seite 30
BBC Monitoring Erstellung eines End-To-End-Publishing-System mit folgenden Funktionalitäten: Erstellen, Bearbeiten und Klassifizieren von Content in XML. Bewertung und Freigabe einschließlich Rechte- Verwaltung für Bilder und Multimedia- Anwendungen. Distribution durch verschiedene Kanäle (Web, E- Mail, Fax, Fingerpost). Webseite erstellt gemäß den BBC-Style- Richtlinien, inkl. Suchfunktion. Ergebnis Relevante Informationen können nun viel besser aufgefunden werden Hohe Akzeptanz der End-Nutzer Seite 31
BBC Monitoring Aggregation als Dienstleistung Zielgruppenspezifisch Annotiert = Mehrwert Seite 32
Thieme Verlag Der THIEME Verlag setzt das Content Lifecycle System zur Pflege von verschiedenen Werken ein. Hauptanwendung ist derzeit die Pflege des Informationsbestandes für eine umfangreiche Diagnose-Datenbank mit hunderttausenden von Abbildungen und über einer halben Million Verlinkungen zu weiterführenden Informationen. Seite 33
Thieme Verlag Vollständige Produktionskette Multi-Channel Publishing Wissensorientiert Vernetzt statt gebunden Seite 34
Tim Burners-Lee s Vision Seite 35
Flugroutenradar der Berliner Morgenpost Seite 36
Präzisionslandwirtschaft Cloud-basierter Remote Service Maschinendaten Produktionsdaten GPS-Koordinaten Feuchtigkeitsmengen Erntemengen Cloud Service Produktionsoptimierung Saatgut Düngermenge Herbizidmengen Pestizidmengen Bild: John Deere GmbH & Co. KG Seite 37
Datenschutz und adaptive Wartung to understand how their products work under various growing conditions and management practices as an input into research and development activities, potentially creating better products for customers in the future. Adaptive und perfektionierende Wartung bedeutet die Anpassung eines Produkts an sich verändernde Umgebungen und die Produktverbesserung. Seite 38
Unsere Welt zu verstehen Unsere Welt zu verstehen erfordert es, die Ähnlichkeiten und Unterscheidungsmerkmale der Dinge zu verstehen, aus denen sie besteht. Robert C. Tryon 1901-1967 Seite 39
Noriaki Kano Kano-Modell Basisfaktoren Leistungsfaktoren Begeisterungsfaktoren Seite 40
Unsere Vision Die richtige Information zur richtigen Zeit zur richtigen Person auf einem beliebigen Endgerät Seite 41
Kontakt Ralph Traphöner Europaallee 10 67657 Kaiserslautern Telefon +49 631 68037-63 Fax +49 631 68037-77 Mobil +49 171 4052636 ralph.traphoener@empolis.com www.empolis.com facebook.com/empolissoftware youtube.com/empolissoftware empolis.com/newsletter twitter.com/empolissoftware empolis.com/google+ Seite 42