Semantic Markup für die Dokumentenklassifizierung Seminarvortrag von Mirko Pracht
Ziel des Vortrags Aufbau digitaler Bibliotheken Verbesserung Informationssuche Semantic Markup
Gliederung 1. Grundlagen I. Was sind Metadaten? II. III. 2. Technik Was ist Semantic Markup? Warum Semantic Markup für die Klassifizierung? I. Die Vision des Semantic Web II. III. Ressource Description Framework Topic Maps 3. Anwendung I. Dublin Core Metadata Element Set
Was sind Metadaten? Metadaten sind: Aussagen über Daten Aussagen über Aussagen Metadaten charakterisieren ein Objekt...data associated with objects which relieves their potential users of having to have full advance knowledge of their existence and characteristic. (DESIRE-Projekt)
Formen von Metadaten Formen von Metadaten nach der Position zu den Daten Metadaten innerhalb von Dokumenten (MathML, DocBook) Metadaten in einer unabhängigen Struktur nach der Verwendung administrative strukturelle deskriptive
Was ist Semantic Markup? Auszeichnung der Bedeutung einer Information mittels Metadaten <Name>Weaving the Web</Name> <Name>Tim Berners-Lee</Name> Name Name Definition der Bedeutung der Elemente getrennt von Auszeichnung
Nutzen für die Klassifizierung? Metadaten Semantic Markup Dokument Metastruktur deskriptive Informationen Suche in Metastruktur Assoziation über Link- Mechanismus Informationssuchsysteme benutzergesteuerte Kategoriensuche konzept-basierte Suche
Die Vision des Semantic Web bisher realisiert Ziel des WWW Kommunikation zwischen Menschen zwischen Mensch und Maschine zwischen Maschinen Semantic Web Erweiterung des bestehende Webs Schichtenmodell von Modellierungssprachen Verwendung von Agenten
Semantic Web - Aufbau Logik Ontologien RDF + RDF-Schema Topic Maps XML + XML-NS + XML-Schema Unicode URI
Resource Description Framework Seit 1999 W3C Recommandation (XML Co-Standard) Metadaten-Framework Beschreibung von Aussagen über semantische Netze RDF-Aussage (Statement) <Subjekt> hat <Prädikat> <Objekt> Ressource Eigenschaft Literal Ressource
RDF Aussagen Graphische Darstellung ein Beispiel http://www.w3.org Director Name EMail Tim Berners-Lee timbl@w3.org Der Direktor der Ressource www.w3.org hat den Namen Tim Berners-Lee und die Email- Adresse timbl@w3.org.
RDF Darstellung mittels XML Serialialisierung Umsetzung von der konzeptuellen Ebene in eine für Maschinen verständliche Form Serialization Syntax standardmäßige Syntax Eigenschaften als Elemente Abbreviated Syntax gesteigerte Lesbarkeit und Kompatibilität zu alten Browsern Eigenschaften in Attributen
RDF Container Beschreibung gleichartiger Eigenschaften einer Ressource Bag Ungeordnete Liste Sequence Geordnete Liste Alternative Liste alternativer Elemente
RDF Schema W3C Candidate Recommendation Typsystem für RDF-Modelle Kernklassen: rdfs:resource rdfs:property rdfs:class Kerneigenschaften: rdf:type rdfs:subclassof
Topic Maps ISO-Standard seit Herbst 1999 semantisches Netz aus Verweisen verknüpft mit einer Sammlung von Informationsobjekten TopicMaps.org Spezfikation XML Topic Maps (XTM) 1.0
Topic Maps Topic Topic kann ein beliebiges Objekt sein jedes Topic hat Topic Type Topic Type wiederum eine Topic Topic München Nürnberg Bayern Deutschland Symbol Topic Type Stadt Stadt Bundesland Staat Informationspool
Topic Maps Assoziationen sind Verweise auf andere Topics Occurences sind Verweise auf Ressourcen des Informationspools Assoziationen Bayern München Deutschland München ist in Deutschland Occurences
Dublin Core Metadata Element Set entwickelt von Dublin Core Metadata Initiative (DCMI) aktuelle Version: 1.1 (1999) spezielles Vokabular (RDF-Schema) zur Beschreibung von Ressourcen
Dublin Core Metadata Element Set insgesamt 15 Core Elements, eingeteilt in drei Kategorien Content: Title, Subject, Description Intellectual Property: Creator, Publisher, Rights Instantiation: Language, Identifier, Date jedes Elemente optional und mehrmals verwendbar (RDF Container-Objekte) Bedeutung der Elemente über zehn Attribute definiert Vier charakteristische Attribute mit dem Element Set ist Simple Dublin Core möglich
Dublin Core Metadata Element Set Qualified Dublin Core Elementverfeinerung Spezialisierung der Bedeutung der Element Kodierungsschema Identifizierung von Schemata, die bei Interpretation des Inhaltes helfen Schema: forme Notation oder Regeln zum Parsen des Inhalts
Dublin Core Metadata Element Set Verwendung von DC Einbettung in HTML generische Elemente Darstellung mittels XML/RDF
Fragen