Semantic-Web-Sprachen XML, RDF (und RDFS), OWL PTI 991 Wissensmanagementsystemen Dozent: Prof. Sybilla Schwarz 1
Agenda Problem Semantisches Web Semantische Sprache XML RDF RDFS OWL Zusammenfassung 2
Problem Unendliche Informationsmengen im Internet Anstößen an die Grenzen menschlicher Informationsverarbeitung intelligente Verarbeitung der Informationen von Computer 3
Semantisches Web ein neues Konzept bei der Weiterentwicklung des World Wide Webs und des Internets Ziel: Verwertbare Bedeutung (Semantik) der Informationen für Computer Automatische Zuordnung der Informationen im Zuge einer Nutzerabfrage Mittel: Semantische Sprache 4
XML (Extensible Markup Language) Auszeichnungssprache zur Darstellung hierarchisch strukturierter Daten in Form von Textdatei Einsatzmöglichkeiten: Definition von Markup-Sprachen, wie z.b. XHTML (für Online-Informationen auf großen Displays wie z.b. PCs und Fernsehschirmen) MathML (für mathematische Formeln) SVG (für Vektor-Graphiken) Austauschformat für Daten zwischen verschiedenen Programmen und Rechnern 5
XML Syntax und Darstellung <?xml version="1.0" encoding="utf-8" > 6
XML Schema 7
XML - Vorteile Standard (weltweit) Einfachheit hierarchische Struktur leicht erkennbar durch natursprachlich formulierte Ausdrücke gut lesbar Möglichkeit der Definition von eigenen Tags (z.b. gegenüber HTML) einfach zu parsen (XML-Parser, z.b. JAXB) lizenzfrei 8
XML - Nachteile definiert Syntax, kein Semantik Mehrdeutigkeit für Computer keine Möglichkeit die Relationen auszudrücken 9
XML - Umgang mit Mehrdeutigkeiten Problem: gleichen Markierung in unterschiedlichen Quelle Zusammenführung die Informationen Lösung: Zuweisen jeder Quelle eine URI (Uniform Ressource Identifier) Präfix für die Markierung 10
XML - Umgang mit Mehrdeutigkeiten Nachteile: formale Definition von URIs für Namensräume Keine Garantie für die Existenz eines Dokumentes Lösung: Verwendung von RDF (Resource Description Framework) 11
RDF (Ressource Description Framework ) Beschreibungssprache für Informationen einer Webressource dient der Wissensrepräsentation und dem Informationsaustausch Vorschlag des W3C für Kodierung, Austausch und Wiederverwendung von strukturierten Metadaten besitzt Syntax ( verschiedene XML Serialisierungen möglich) Semantik (RDF Datenmodell) 12
RDF - Datenmodell Ressourcen Identifizierung über URIs einfache Werte (Literale) Properties (spezifische Aspekte, Charakteristika, Attribute oder Relationen) beschreiben Ressourcen verbinden Ressourcen miteinander Statements (Tripeln oder Aussagen) Subjekt Prädikat Objekt 13
RDF - Syntaxbeispiel 14
RDF - Statements 15
RDF Argumente zur Erweiterungen keine Einschränkungen für Properties zu bestimmten Ressourcenklassen keine Beschreibung von Klassen möglich kein Konzept für Aufzählungen und Datentypen (außer XML-Datentypen) Semantik ist noch nicht komplex genug um Ontologien zu beschreiben 16
RDFS (RDF Schema) dient zur Definition von einfachen Ontologien für RDF und in RDF definiert die Schemaschicht führt Semantik für Klassen, Typen und Properties ein erlaubt die Einschränkungen von Eigenschaften 17
Wichtige Konstrukte in RDF und RDFS Klasse rdfs : Resource rdfs : Class rdf : Property Property rdf : type rdfs : subclassof rdfs : subpropertyof rdfs : range rdfs : domain 18
RDFS-Argumenten zur Erweiterung keine Aussagen über Kardinalitäten keine Aussagen über Eigenschaften von Eigenschaften (Transitivität, Symmetrie und Inversen) keine Aussagen über Äquivalenz, Schnitt, Vereinigung etc. von Objekten Nicht genug für die Beschreibung von komplexen Ontologien 19
OWL (Web Ontology Language) Erweiterung der bisherigen Web-Standards XML, RDF und RDFS => komplexere Ausdrucksmöglichkeiten Drei Varianten nach Komplexität OWL Lite: Erstellung einfachen Taxonomien und leicht axiomatischen Ontologien OWL DL: Vereinigung von Web Ontologie Language und Description Logic (DL), hierzu diversen Einschränkungen (eine Klasse kann nicht gleichzeitig ein Individual oder eine Property sein) OWL Full: OWL DL ohne die obengenannten Einschränkungen. Aber das bedeutet, dass die Ontologien nicht mehr entscheidbar sind. 20
OWL - Erweiterte Möglichkeiten (In)Äquivalenz (equivalentclass, equivalentproperty, sameas, differentfrom, AllDifferent) Boolsche Ausdrücken (unionof, complementof, intersectionof) Property Characteristika (TransitiveProperty, SymmetricProperty, ObjectProperty usw.) Kardinalität (cardinality, max/mincardinality) Klassen Axiome (oneof, disjointwith, usw.) usw. Bsp.: (http://www.ke.tu-darmstadt.de/lehre/archiv/ws- 11-12/sematic-web/beispiel-ontologie-autohaus/view) 21
Einsatzgebiete von OWL Web portals (z.b. Weinportal) Multimedia collections (z.b. Musikempfehlung-Service) Corporate web site management Design documentation (z.b. Raumschiffindustrie) Agents and services (z.b. Weinagent)
Zusammenfassung XML stellt eine Syntax für strukturierte Dokumente zur Verfügung XML Schema legt die Struktur von XML Dokumenten fest und erweitert XML um die Datentypen. RDF ist ein Datenmodell für Ressourcen und Relationen zwischen diesen, stellt eine einfache Semantik zur Verfügung und kann in XML repräsentiert werden RDF Schema beschreibt die Eigenschaften und Klassen von RDF Ressourcen (komplexe Semantik für verallgemeinernde Hierarchien) OWL stellt noch mehr Komplexität zur Verfügung, z.b. Relationen zwischen Klassen, Kardinalität, Äquivalenz usw.
Quellen A. Dengel, Semantische Technologien, Spektrum Akademischer Verlag Heidelberg 2012 http://www.boku.ac.at/htmleinf/xmlkurz.html http://de.wikipedia.org/wiki/extensible_markup_language http://de.wikipedia.org/wiki/semantisches_web http://www.linkeddatatools.com/introducing-rdf-part-2 http://www.semaweb.org/dokumente/w3/tr/2004/recowl-features-20040210-de.html http://www.semaweb.org/dokumente/w3/tr/2004/recowl-guide-20040210-de.html http://www.w3.org/rdf/ http://www.w3.org/tr/rdf-schema/ 24
25