Semantic Markup für die Dokumentenklassifizierung. Seminarvortrag von Mirko Pracht



Ähnliche Dokumente
RDF und RDF Schema. Einführung in die Problematik Von HTML über XML zu RDF

RDF RESOURCE DESCRIPTION FRAMEWORK. Referentin: Claudia Langer

Ressourcen-Beschreibung im Semantic Web

Kapitel WT:VIII (Fortsetzung)

!!!!T!!! Systems!() Multimedia Solutions

Seminarphase PG 402 Thema: Semantic Web Autor: Phillip Look

OWL Web Ontology Language

Semantic Web Technologies 1

... MathML XHTML RDF

RDF Modell und Syntax

Ontologien und Ontologiesprachen

Vorlesung Computerphilologie. Ontologien und Ontologie-Sprachen

KIM Metadatenprofile Schritt für Schritt Stefanie Rühle SUB Göttingen KIM

Semantic Web Services

Semantic Web Technologies 1

Semantic Web Grundlagen

Persistenzschicht in Collaborative Workspace

RDF Containers. Häufig möchte man eine Gruppe von Dingen beschreiben. Hierfür stellt RDF ein Container-Vokabular zur Verfügung.

Entwicklung eines Electronic Resource Management Systems für Bibliotheken auf Basis von Linked Data Technologien

Technologien des Semantic Web und ihre Anwendungen

Thema. Intelligente Agenten im Web

Übersetzung des Dublin Core Metadata Initiative Abstract Model (DCAM)

Entwicklung eines Electronic Resource Management Systems für Bibliotheken auf Basis von Linked Data Technologien

Topic Maps. Wissensmanagement in Bildungseinrichtungen. Seminar Web Engineering Lars Heuer,

XML, Standards und andere Aktivitäten zur Formierung des Semantic Web

Linked Samian Ware: Potentiale von Linked Data in der Archäologie. Florian Thiery M.Sc.

Freie und vernetzte Daten:

Motivation. Inhalt. URI-Schemata (1) URI-Schemata (2)

buildm Erarbeitung eines deskriptiven Metadatenschemas für digitale Gebäudeinformationen im EU-Projekt DURAARK

Workflow, Business Process Management, 4.Teil

Klaus Schild, XML Clearinghouse Namensräume

Anwendungsbeispiel zu XML -MathML

HTML5. Wie funktioniert HTML5? Tags: Attribute:

Metadaten METS. Markus Schnöpf Berlin-Brandenburgische Akademie der Wissenschaften IDE. IDE Autumn School 2012, Chemnitz

HS: Information Retrieval PD Dr. K. Haenelt WS 2003/04. Referent: Youssef Sammari. Semantic Web

DFG-Praxisregeln Digitalisierung. Stefanie Rühle KIM WS

MedizinischeDokumentation. Wiederholung, Taxonomien, Ontologien, Terminologien

BPMN. Suzana Milovanovic

Übersetzung des Singapore Framework für Dublin-Core-Anwendungsprofile

RDF(a) und Microformats

Semantic Web Grundlagen

Einführung in Topic Maps. Von Adi Bekier

YAGO YAGO. A semantic knowledge base. Paul Boeck. Humboldt Universität zu Berlin Institut für Informatik. Dezember /19

XML und Datenmodellierung

Metadaten bei der Digitalisierung von analogen archivalischen Quellen. Kathrin Mileta, Dr. Martina Wiech

LDAP Informationsmodell

Ursprung des Internets und WWW

Semantic Web. Anwendungsbereiche & Entwicklungen. Dr. Michael Granitzer

8. Tübinger Symposium Handschriften, Alte Drucke. VD16/17 Massendigitalisierung Neue Entwicklungen. 8. Tübinger Symposium Handschriften, Alte Drucke

2. XML 2.1 XML 1.0 und XML Schema. Jörg Schwenk Lehrstuhl für Netz- und Datensicherheit

Use Cases. Die Sicht des Nutzers. Fortgeschrittenenpraktikum SS 2004

Mai Hauptseminar: Nichtrelationale Datenbanken Historisch-Kulturwissenschaftliche Informationsverarbeitung Universität zu Köln

Java und XML 2. Java und XML

Modul 5: Semantik im WWW

Qualitätssicherung bei der mobilen Datenerfassung

Einführung. Internet vs. WWW

Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen

Metadaten I: XMP & Co

Predictive Modeling Markup Language. Thomas Morandell

Übersicht. Eclipse Foundation. Eclipse Plugins & Projects. Eclipse Ganymede Simultaneous Release. Web Tools Platform Projekt. WSDL Editor.

Enterprise Content Management

RDF. Resource Description Framework. RDF - Konzepte - Tripel. RDF - Konzepte - Graph. Information Retrieval - Semantic Technologies

Im Folgenden werden die jeweiligen Elemente erklärt. Im Anschluss folgt ein Beispieldatensatz in xml.

VVA Webservice Online Lieferbarkeits-Abfrage

Containerformat Spezifikation

Vertrauenswürdige digitale Archive: DIN Norm 31644

XMPP: Extensible Messaging and Presence Protocol

Semantic Web Technologies I! Lehrveranstaltung im WS10/11! Dr. Andreas Harth! Dr. Sebastian Rudolph!

Übungsaufgaben zu XML:

Containerformat Spezifikation

Sammlung, Archivierung und Bereitstellung von Netzpublikationen durch Die Deutsche Bibliothek

Pflichtenheft. CDIX-Roles. Erweiterung des CDIX Berechtigungssystems. Autor : CD Software GmbH. Copyright CD Software GmbH Version:

Barrierefreie Webseiten erstellen mit TYPO3

XML - Extensible Markup Language. Agenda - Oracle XML DB

Klausurteilnehmer. Wichtige Hinweise. Note: Klausur Informatik Programmierung, Seite 1 von 8 HS OWL, FB 7, Malte Wattenberg.

XML-Technologien Tutorium 6

Webseiten sind keine Gemälde. Webstandards für ein besseres Web. Webstandards für ein besseres Web

DSpace 5 und Linked (Open) Data. Pascal-Nicolas Becker Technische Universität Berlin German DSpace User Group Meeting 2014 Berlin, 28.

Metadaten RDF und DublinCore zur Beschreibung von Dokumenten. Sebastian Niebius,

Semantic Web Technologies 1

Metadaten RDF und DublinCore zur Beschreibung von Dokumenten

Open Archives Initiative - Protocol for Metadata Harvesting (OAI-PMH)

Vorgetragen von. Sanaz Mostowfi Anna Polovets Mandy Neumann

Modul 7 Uniform Resource Identifier (URI)

Übung 4. Musterlösungen

XML Grundlagen. Andreas Rottmann,Sebastian Riedl. 27. August Quit Full Screen Previous Page Next Page GoTo Page Go Forward Go Back

Daten, Information, Wissen explizites und implizites Wissen Expertensysteme (Aufgaben, Aufbau, Komponenten) Diagnoseziel Klassifikation

XDOC Extraktion, Repräsentation und Auswertung von Informationen

Verknüpfte Daten abfragen mit SPARQL. Thomas Tikwinski, W3C.DE/AT

Installation & Konfiguration AddOn CopyObjects

Repräsentationssprachen für Ontologien

elml Flexibilität und Nachhaltigkeit dank XML

Semantische Infomationsintegration à la carte?

LZA-Metadaten für Retrodigitalisate. Anna Kugler

Metadateneditoren für ArcGIS

Fachdidaktik der Informatik Jörg Depner, Kathrin Gaißer

X-Technologien. Ein Überblick. Ulrike Henny. IDE Summer School 2013, Chemnitz

EINFÜHRUNG IOZ AG 1

Usability ohne Maus und ohne Bildschirm

Transkript:

Semantic Markup für die Dokumentenklassifizierung Seminarvortrag von Mirko Pracht

Ziel des Vortrags Aufbau digitaler Bibliotheken Verbesserung Informationssuche Semantic Markup

Gliederung 1. Grundlagen I. Was sind Metadaten? II. III. 2. Technik Was ist Semantic Markup? Warum Semantic Markup für die Klassifizierung? I. Die Vision des Semantic Web II. III. Ressource Description Framework Topic Maps 3. Anwendung I. Dublin Core Metadata Element Set

Was sind Metadaten? Metadaten sind: Aussagen über Daten Aussagen über Aussagen Metadaten charakterisieren ein Objekt...data associated with objects which relieves their potential users of having to have full advance knowledge of their existence and characteristic. (DESIRE-Projekt)

Formen von Metadaten Formen von Metadaten nach der Position zu den Daten Metadaten innerhalb von Dokumenten (MathML, DocBook) Metadaten in einer unabhängigen Struktur nach der Verwendung administrative strukturelle deskriptive

Was ist Semantic Markup? Auszeichnung der Bedeutung einer Information mittels Metadaten <Name>Weaving the Web</Name> <Name>Tim Berners-Lee</Name> Name Name Definition der Bedeutung der Elemente getrennt von Auszeichnung

Nutzen für die Klassifizierung? Metadaten Semantic Markup Dokument Metastruktur deskriptive Informationen Suche in Metastruktur Assoziation über Link- Mechanismus Informationssuchsysteme benutzergesteuerte Kategoriensuche konzept-basierte Suche

Die Vision des Semantic Web bisher realisiert Ziel des WWW Kommunikation zwischen Menschen zwischen Mensch und Maschine zwischen Maschinen Semantic Web Erweiterung des bestehende Webs Schichtenmodell von Modellierungssprachen Verwendung von Agenten

Semantic Web - Aufbau Logik Ontologien RDF + RDF-Schema Topic Maps XML + XML-NS + XML-Schema Unicode URI

Resource Description Framework Seit 1999 W3C Recommandation (XML Co-Standard) Metadaten-Framework Beschreibung von Aussagen über semantische Netze RDF-Aussage (Statement) <Subjekt> hat <Prädikat> <Objekt> Ressource Eigenschaft Literal Ressource

RDF Aussagen Graphische Darstellung ein Beispiel http://www.w3.org Director Name EMail Tim Berners-Lee timbl@w3.org Der Direktor der Ressource www.w3.org hat den Namen Tim Berners-Lee und die Email- Adresse timbl@w3.org.

RDF Darstellung mittels XML Serialialisierung Umsetzung von der konzeptuellen Ebene in eine für Maschinen verständliche Form Serialization Syntax standardmäßige Syntax Eigenschaften als Elemente Abbreviated Syntax gesteigerte Lesbarkeit und Kompatibilität zu alten Browsern Eigenschaften in Attributen

RDF Container Beschreibung gleichartiger Eigenschaften einer Ressource Bag Ungeordnete Liste Sequence Geordnete Liste Alternative Liste alternativer Elemente

RDF Schema W3C Candidate Recommendation Typsystem für RDF-Modelle Kernklassen: rdfs:resource rdfs:property rdfs:class Kerneigenschaften: rdf:type rdfs:subclassof

Topic Maps ISO-Standard seit Herbst 1999 semantisches Netz aus Verweisen verknüpft mit einer Sammlung von Informationsobjekten TopicMaps.org Spezfikation XML Topic Maps (XTM) 1.0

Topic Maps Topic Topic kann ein beliebiges Objekt sein jedes Topic hat Topic Type Topic Type wiederum eine Topic Topic München Nürnberg Bayern Deutschland Symbol Topic Type Stadt Stadt Bundesland Staat Informationspool

Topic Maps Assoziationen sind Verweise auf andere Topics Occurences sind Verweise auf Ressourcen des Informationspools Assoziationen Bayern München Deutschland München ist in Deutschland Occurences

Dublin Core Metadata Element Set entwickelt von Dublin Core Metadata Initiative (DCMI) aktuelle Version: 1.1 (1999) spezielles Vokabular (RDF-Schema) zur Beschreibung von Ressourcen

Dublin Core Metadata Element Set insgesamt 15 Core Elements, eingeteilt in drei Kategorien Content: Title, Subject, Description Intellectual Property: Creator, Publisher, Rights Instantiation: Language, Identifier, Date jedes Elemente optional und mehrmals verwendbar (RDF Container-Objekte) Bedeutung der Elemente über zehn Attribute definiert Vier charakteristische Attribute mit dem Element Set ist Simple Dublin Core möglich

Dublin Core Metadata Element Set Qualified Dublin Core Elementverfeinerung Spezialisierung der Bedeutung der Element Kodierungsschema Identifizierung von Schemata, die bei Interpretation des Inhaltes helfen Schema: forme Notation oder Regeln zum Parsen des Inhalts

Dublin Core Metadata Element Set Verwendung von DC Einbettung in HTML generische Elemente Darstellung mittels XML/RDF

Fragen