Technische Universität Braunschweig Humboldt-Universität zu Berlin Projekt iglos Dr. Christian Stein Ontologie-Design Die nächste Generation des Web für sich nutzen lernen Dr. Christian Stein (christian.stein@hu-berlin.de)
Technische Universität Braunschweig Humboldt-Universität zu Berlin Projekt iglos tekom: Ontologie-Design 1. Die Evolution des Web 2. Die Struktur des Semantic Web 3. Was gibt es bereits? 4. Was bringt mir das? Wie gehe ich heran? Dr. Christian Stein (christian.stein@hu-berlin.de)
Technische Universität Braunschweig Humboldt-Universität zu Berlin Projekt iglos tekom: Ontologie-Design Die Evolution des Web Dr. Christian Stein (christian.stein@hu-berlin.de)
Pre-Web: Das Internet vor www Zugang über die Kommandozeile Zugang zu Information bedarf Expertenwissen Informationsgewinnung / -suche ist sehr teuer!4
Sir Tim Berners-Lee erzeugte die erste Webpage überhaupt: info.cern.ch Erfinder des World Wide Web Erfinder von HTTP von HTML..der URL!5
Web of Document (Web 1.0) Erste Browser tauchen auf Kein Expertenwissen erforderlich Erste Suchmachinen entstehen Einfacher Informationszugriff!6
!7 Interactive Web (Web 2.0) seit ca. 1999 wollen Nutzer nicht mehr nur konsumieren sondern interagieren eigene Inhalte beisteuern kommentieren, bewerten virtuelle Gemeinschaften errichten!7
!8 Das Web wie wir es kennen ist für Menschen gemacht basiert auf der Markup-Sprache HTML, die beschreibt wie Information präsentiert wird wie Information verlinkt wird aber nicht, was diese Information bedeutet Menschen haben Kontextwissen, Weltwissen und die Erfahrung, Bedeutungsprobleme mehr oder weniger gut zu lösen Menschen können implizites Wissen aktivieren und wissen, wann dies notwendig ist Maschinen nicht!!8
!9 Eine typische Webseite!9
!10 Die Vision The Web was designed as an information space, with the goal that it should be useful not only for human-human communication, but also that machines would be able to participate and help... Tim Berners-Lee, Semantic Web Roadmap, Sept 1998!10
Die Fakten The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation" Tim Berners-Lee, James Hendler, Ora Lassila: The Semantic Web, Scientific American, 284(5), pp. 34-43(2001)!11
Das Semantic Web Web-Inhalte mit natürlicher Sprache werden explizit mit semantischen Metadaten annotiert Semantische Metadaten codieren die Bedeutung des Inhaltes in einer Form, die von Maschinen interpretiert werden kann Die Bedeutung von Inhalten wird explizit gemacht durch formale, strukturierte und standardisierte Wissensrepräsentationen (Ontologien, RDF, OWL) Das wird dadurch möglich, dass mit Bedeutungen automatisch gerechnet werden kann, verschiedenste Datenformen und Quellen verbunden werden können, und automatisch implizite Informationen von expliziten Informationen abgeleitet werden können!12
Technische Universität Braunschweig Humboldt-Universität zu Berlin Projekt iglos tekom: Ontologie-Design Die Struktur des Semantic Web Dr. Christian Stein (christian.stein@hu-berlin.de)
Das Semantic Web kann noch mehr es annotiert nicht nur Texte und Objekte mit Metadaten es definiert auch die Struktur des Wissens und generelle Fakten! es definiert Klassen Ober- und Unterklassen Vererbung von Information / Merkmalen Instanzen und mögliche Relationen zwischen Instanzen Ontologie: Einteilung des Seienden, Grundstrukturen der Wirklichkeit und des Möglichen!14
!15 URIs Alle Objekte bzw. Begriffe in einer Ontologie müssen einen eindeutigen Bezeichner haben, der weltweit eindeutig ist Die URI kombiniert eine eindeutige ID mit der Angabe, wo Informationen dazu gefunden werden können Sie sieht aus wie eine URL, die aber nicht (nur) eine Seite aufruft, sondern ein Objekt / Begriff repräsentiert
Tripel Die einfachste Datenstruktur einer Ontologie ist ein Tripel Alle Tripel folgen einem sehr simplen Schema Subjekt (URI) Prädikat (URI) Objekt / Wert (URI/Literal) z.b. Tisch - besteht aus - Tischplatte Tisch - besteht aus - Beinen Tisch - ist Unterbegriff von - Möbel Tisch - wird übersetzt in - table Wissen wird modelliert als eine Vielzahl von Tripeln Diese bilden einen semantischen Graph
!17
!18
!19
Enige Zahlen zur Nutzung... 30 % aller HTML-Seiten beinhalten strukturierte Daten 973 Millionen Seiten beinhalten RDFa (oder kompatible) Yahoo Research / webdatacommons.org!20
Triplestore Spezialisierte Datenbank für Tripel bessere Performanz und weniger Speicherbedarf Anfragen und Änderungen können in der SQL-ähnlichen Sprache SPARQL formuliert werden Können Reasoning durchführen!21
Technische Universität Braunschweig Humboldt-Universität zu Berlin Projekt iglos tekom: Ontologie-Design Was gibt es bereits? Dr. Christian Stein (christian.stein@hu-berlin.de)
Tim Berners-Lee s 5-Star Kriterien für Linked Open Data Available on the web (whatever format) but with an open licence, to be Open Data Available as machine-readable structured data (e.g. excel instead of image scan of a table) as (2) plus non-proprietary format (e.g. CSV instead of excel) All the above plus: use open standards from W3C (RDF and SPARQL) to identify things, so that people can point at your stuff All the above, plus: link your data to other people s data to provide context!23
Linked Open Data (LOD) öffentliche Daten sind hochvernetzt im Web verfügbar sie können mit URIs identifiziert und mit HTTP zugegriffen werden Linked Data ist zu anderen Daten über URIs verbunden ist bereits jetzt sehr sehr groß!!24
Entwicklung des Web of Data lod-cloud.net!25
Entwicklung des Web of Data lod-cloud.net!26
Entwicklung des Web of Data lod-cloud.net!27
Entwicklung des Web of Data > 31 Milliarden Entitäten > 500 Millionen Links (Okt. 2011) lod-cloud.net!28
Technische Universität Braunschweig Humboldt-Universität zu Berlin Projekt iglos tekom: Ontologie-Design Was bringt mir das? Wie gehe ich heran? Dr. Christian Stein (christian.stein@hu-berlin.de)
!30 Daten aus verschiedenen Datenbanken verbinden Universales Datenformat, unterschiedlichste Daten abbildbar Ontologien müssen bestehende Datenbanken nicht ersetzen Verschiedene existierende Datenbanken kombinierbar Big Data Effekt im Unternehmen: Durch zusammengeführte Datenhaltung verborgenes Wissen finden!30
Verbindung von Text und Daten!31
Ontology Design Schritte 1. Domäne und Fokus festlegen 2. Wiederverwendbarkeit prüfen 3. Eine Terminologie entwickeln 4. Klassen und Klassenhierarchien entwickeln 5. Relationen definieren 6. Relationsbeschränkungen definieren 7. Individuen/Instanzen definieren!32
Ontologie-Suche: LOV (lov.okfn.org/)!33
!34
SKOS Simple Knowledge Organization System Begriffsorientierte Ontologie The Simple Knowledge Organization System is a data sharing standard... (Reference) The Simple Knowledge Organization System is a common data model for knowledge organization systems such as thesauri, classification schemes, subject heading systems and taxonomies. (Reference) SKOS occupies a position between the exploitation and analysis of unstructured information, the large and socially-mediated organization of information on an informal level, and the formal representation of knowledge. (Reference)!35
Ontologien und Terminologie Terminologiemanagement mit Ontologie-Funktionen Verbindung von Terminologie- und Wissensmanagement Bildet nicht Listen von Termini ab, sondern den Zusammenhang dieser Verwendet Relationen wie Ober- und Unterbegriffe Synonyme/ Homonyme Bestandsbeziehungen Input-Output-Folgen Fertigungssequenzen Häufige Fehlübersetzung Mehr dazu bei www.iglos.de und in Halle 4, Stand 423!36
Technische Universität Braunschweig Humboldt-Universität zu Berlin Projekt iglos tekom: Ontologie-Design Vielen Dank. Dr. Christian Stein (christian.stein@hu-berlin.de)