Vasari: Wissensextraktion mittels iterativ entwickelter Dokumentbeschreibungen



Ähnliche Dokumente
kreiert Kunstwerk formt Skulptur malt Gemälde malt formt Jüngstes Gericht

RDF und RDF Schema. Einführung in die Problematik Von HTML über XML zu RDF

Predictive Modeling Markup Language. Thomas Morandell

Educase. Release Notes 1.7: Neue Funktionen und Verbesserungen. Base-Net Informatik AG Wassergrabe 14 CH-6210 Sursee

Die Orgadata AG ist ein stark expandierendes Software-Unternehmen aus Leer. Mit unserem System LogiKal

Grundwissen IT 10. Klasse

Maturandentag 2005 Computerlinguistik

Verführung zum Besuch Relaunch der Website des Städel Museums. Daniela Bamberger, Städel Museum Dr. Christian Gries, Janusmedia 28.

Automatisches Übersetzen von Gebärdensprache

Web Mining und Farming

Pablo Picasso gilt als einer der größten Künstler des 20. Jahrhunderts.

FORMBLATT für die BESCHREIBUNG GUTER PRAXIS

Event Recognition Engine

ELAK und Amtssignatur in der Praxis

SOL-IT wawicube. Berechnen. Lenken. Überblicken.

Requirements Engineering I

Dokumenten- und Content Management

Human-Computer-Interaction und Psychologie Aufgaben- und Kontextanalyse

Informatik (G9) Sek I - Differenzierung 8/9/10

Die Zertifizierungsstelle der TÜV Informationstechnik GmbH bescheinigt hiermit dem Unternehmen

Evaluation of Database Design and Reverse Engineering Tools for a Large Software System

VO Sprachtechnologien. Informations- und Wissensmanagement. Bartholomäus Wloka. Zentrum für Translationswissenschaft

Use Cases. Use Cases

Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen

Georg-August-Universität Göttingen Modul B.It.301: Studienrelevanter Auslandsaufenthalt

Metadaten I: XMP & Co

!!!!T!!! Systems!() Multimedia Solutions

Ausblick: Archivierung elektronischer Standesamtsunterlagen

XDOC Extraktion, Repräsentation und Auswertung von Informationen

In Vielfalt geeint Europäische Maler und Gemälde

Fünf einfache Schritte

Gerlinde Knetsch, Patrick Ackermann Umweltbundesamt. FG IV2.1- Informationssysteme Chemikaliensicherheit. Themen

Regelbasiertes Routing unstrukturierter Daten

A Domain Specific Language for Project Execution Models

Hilfe und Support. Statische Hilfe. Inhaltsverzeichnis der Hilfetexte. Reihe TextGrid-Tutorials

Yvonne Höfer-Diehl. Hochs chulcontrolling. %ur Sicherung der Lehreffektivität

Wirtschaftlichkeit, Nachhaltigkeit und Umweltschutz durch ganzheitliche Vernetzung

Installation & Konfiguration AddOn CopyObjects

Europäischer Ausbildungsmarkt

Massendigitalisierung mit Goobi

DSL Entwicklung und Modellierung

Was sind Herausforderungen im Projektmanagement?

DAS STÄDEL MUSEUM. Gegründet Gemälde. 600 Skulpturen Fotografien Zeichnungen und Druckgraphik Besucher im Jahr

Lenkung der QM-Dokumentation

Kapitel 4. Einführung in den Scannergenerator Flex. Einführung in den Scannergenerator Flex Wintersemester 2008/09 1 / 9

<thema> Projektdokumentation zum Softwareentwicklungsprojekt. 25. April Entwickler: <autor1>, <autor2>, <autor3> Auftraggeber: <auftraggeber>

FinishWeb 3 Kurzanleitung Forum

1. XÖV-Anwenderkonferenz. XÖV in der Praxis. Berlin, 11. / 12. November 2009 Bundeshaus. Freie Hansestadt Bremen

Containerformat Spezifikation

Trends in der Softwaredokumentation

Thema. Intelligente Agenten im Web

Arbeitsblatt 1 Albrecht Dürer (Nürnberg, ), deutscher Maler der Renaissance und des Humanismus

Vom Konzept direkt ins Cockpit: Optimierte HMI-Entwicklung mittels automatischer Codegenerierung

COMINN KOMpetenzen für INNovation im Metallsektor DEFINITIONEN DER LERNERGEBNISSE

August Macke. Niveau A2. 1 Berühmte Künstler a) Wer kommt woher? Überlegen Sie und sprechen Sie im Kurs.

Programmmoduls für die CEMES-Plattform zur onlinebasierten Ermittlung der Leistungspunkte

Die Entwicklung eines Glossars (oder eines kontrollierten Vokabulars) für ein Unternehmen geht üblicherweise in 3 Schritten vor sich:

Modellgestütztes Consulting für die Windenergie Ein neuer Ansatz für die Entwicklung

ERP Cloud Tutorial. E-Commerce ECM ERP SFA EDI. Backup. Bilanz- und GuV- Berichte erfassen.

Prozessindikatoren für die Produktentwicklung

openk platform Dokumentation Setup Liferay Version 0.9.1

Implementierung eines HL7 CDA-basierten ereha-entlassungsberichtes mit integrierter Arzneimitteldokumentation und AMTS-Prüfung

Django - ein Python Web-Framework

Informatik (G8) Sek I - Differenzierung 8/9

Praktikum tschechisch-kaufmännischer Mitarbeiter in der Stadtverwaltung Louny

Ansatz für einen CIDOC-CRM-Editor

FRAGEBOGEN ANWENDUNG DES ECOPROWINE SELBSTBEWERTUNG-TOOLS

Fassade. Objektbasiertes Strukturmuster. C. Restorff & M. Rohlfing

Programmieren Formulierung eines Algorithmus in einer Programmiersprache

RDF RESOURCE DESCRIPTION FRAMEWORK. Referentin: Claudia Langer

virtuos Zentrum für Informationsmanagement und virtuelle Lehre Nutzung und Produktion von PmWiki-Lernmodulen in Stud.IP

Produktinformation DaVinci Developer

Werkzeuge für ein innovatives Wissensmanagement. W3L AG

09:00 Begrüßung Erläuterung der Inhalte, Vorstellung der Teilnehmer, deren Erfahrungen, Erwartungshaltung

Duale Zustellung. Standardprofile. Version 1.0.0, DI Arne Tauber

Workflow Monitoring basierend auf den SemTalk Services. Semtation GmbH

Informatik (G8) Sek I - Differenzierung 8/9

Institut für Unternehmensinformatik Konzeption eines Service Repository zur Beschreibung von Services in der Cloud

Konvertierung von Geschäftsdokumenten: Probleme und Lösungen mit XML/XSLT

Mit XML-basierten Web-Standards zur Lernplattform im Projekt ITO

15 Logistische Unterstützung

Inhaltsverzeichnis Inhaltsverzeichnis

Theorie der Informatik

Günther Schmid Bernd Reissert Gert Bruche. Arbeitslosenversicherung und aktive Arbeitsmarktpolitik. Finanzierungs^ysteme im internationalen Vergleich

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006

Containerformat Spezifikation

Projekt Eurodelphes: Multimedia im Geschichtsunterricht

J.6 Programmierung eingebetteter Systeme

Wandlungsfähigkeit von Enterprise Content Management

Business Breakfast. Collaboration and more - Wie Windows 10 die IT-Landschaft in Ihrem Unternehmen beeinflussen wird. Ludwigshafen, 11.

Projektplanung und Wissensmanagement. Kooperative Projektplanung unter Einsatz eines Wissensmanagement Systems

amball ECM business day

Datenqualitätsmodelle

Semantic Web Technologies I! Lehrveranstaltung im WS10/11! Dr. Andreas Harth! Dr. Sebastian Rudolph!

<thema> Projektdokumentation zum Softwareentwicklungsprojekt. (Entwicklerdokumentation) 28. Mai 2015

MindManager. Die Methode. MindManager 9 im Team. MindManager MapShare. MindManager Explorer für SharePoint

CRM QuickStart Best Practice für Microsoft Dynamics CRM. präsentiert von Rainer Klapper Geschäftsführer der QS solutions GmbH

Produktbeschreibung. CoPFlow Prozessmanagement. einfach intuitiv effizient. Web-basiertes Prozessmanagement für den Arbeitsplatz

ABI 4 EINE VISION V O R T R A G A N L Ä S S L I C H S P I K

Transkript:

Vasari: Wissensextraktion mittels iterativ entwickelter Dokumentbeschreibungen Norbert Gövert Norbert Fuhr Universität Dortmund http://ls6-www.cs.uni-dortmund.de/vasari/ Das Vasari-Projekt VaLa: Abstrakte Beschreibung von Quelldokumenten Iterative Erstellung von VaLa-Beschreibungen Zusammenfassung, Ausblick

Das Vasari-Projekt Vasari, Giorgio, Arezzo 30. Juli 1511, Florenz 27. Juni 1574, ital. Maler, Architekt und Kunstschriftsteller. Begründer der Kunstgeschichte. Seine Künstlerbiographien ( Die Lebensbeschreibungen der berühmtesten italienischen Architekten, Maler und Bildhauer, 1546 50, erw. Ausgabe 1568) gehören zu den wichtigsten Grundlagen der Kunstgeschichte. Ziel: Erstellung eines Kunstportals für Fachleute und die interessierte Öffentlichkeit (artregister.org) Quellen: OCR-Texte aus mehr als 20 einschlägigen Lexika Aufgabe: Wissensextraktion aus unterschiedlich stark strukturierten Dokumenten

Das Vasari-Projekt II <kuenstler> <vorname>giorgio</vorname><nachname>vasari</nachname> <geburt><datum>1511-07-30</datum><ort>arezzo</ort></geburt> <tod><datum>1574-06-27</datum><ort>florenz</ort></tod> <beschreibung> ital. <beruf>maler</beruf>, <beruf>architekt</beruf> und <beruf>kunstschriftsteller</beruf>. Begründer der Kunstgeschichte. Seine Künstlerbiographien (<werk><titel>die Lebensbeschreibungen der berühmtesten italienischen Architekten, Maler und Bildhauer</titel>, <datum>1546 50</datum>, erw. Ausgabe <datum>1568</datum></werk>) gehören zu den wichtigsten Grundlagen der Kunstgeschichte. </beschreibung> </kuenstler>

VaLa: Abstrakte Beschreibung von Quelldokumenten [ Vasari Language ] Ziel: automatische XML-Annotierung der Quelldokumente XML Schema Definition von Datentypen und logischer Struktur Kontextausdrücke Zuordnung Inhalt Struktur Zeichenketten: reguläre Ausdrücken linguistische Konstrukte: computerlinguistische Kategorien Entitäten: Wörterbücher Rechts- / Linkskontext

VaLa (II): Beispiel <element name="geburt"> <sequence> <element name="ort"> <pre type="regexp"> <match type=entity"> </element> geb\. place <element name="datum"> <match type="entity"> date... <post type="element"> tod </element> </sequence> </element> </pre> </match> </match> </post> Vasari, Giorgio, geb. Arezzo 30. Juli 1511, <tod>gest. Florenz 27. Juni 1574</tod>, ital.~maler, Architekt und Kunstschriftsteller. Vasari, Giorgio, <geburt>geb. <ort>arezzo</ort> <datum>30. Juli 1511</datum></geburt>, <tod>gest. Florenz 27. Juni 1574</tod>, ital.~maler, Architekt und Kunstschriftsteller.

VaLa (III): Beispiel Vasari, Giorgio, geb. <ort>arezzo</ort> 30. Juli 1511, gest. <ort>florenz</ort> 27. Juni 1574, ital.~maler, Architekt und Kunstschriftsteller. Places Arezzo Caprese Florenz Leiden Mailand Malaga Mougins Picasso, Pablo, geb. <ort>malaga</ort> 25. Oktober 1881, gest. <ort>mougins</ort>, Frankreich 8. April 1973,...

Iterative Erstellung von VaLa-Beschreibungen Ziel: Beschreibung soll möglichst viele Dokumente abdecken Interaktives Werkzeug zur Erstellung von VaLa-Beschreibungen: Entwicklung von Kontextausdrücken anhand von Beispielausdrücken unmittelbare Anwendung auf Beispieldokumente Visualisierung iterative Verbesserung der Beschreibung Bewertung der Annotationen Versionierung der Beschreibungen und Bewertungen

Iterative Erstellung von VaLa-Beschreibungen

Zusammenfassung VaLa: Struktur-Beschreibungssprache für Wissensextraktion Ausnutzung von Delimiterregeln, linguistische Kategorien Werkzeug zur iterativen Erstellung von Dokument-Beschreibungen Such- / Navigationsstrukturen für effektive Informationserschließung

Ausblick Synthese: einheitliche Wissensrepräsentation Fusion von Dokumenten aus unterschiedlichen Quellen Zusammenhänge zwischen Dokumenten herstellen Transformation nach RDF Künstler kreiert Kunstwerk stellt aus Museum Bildhauer formt Skulptur Maler malt Gemälde da Vinci malt Mona Lisa stellt aus Louvre stellt aus Michelangelo malt formt Jüngstes Gericht Sklave instanceof isa property