Kontextbasiertes Information Retrieval

Ähnliche Dokumente
!!!!T!!! Systems!() Multimedia Solutions

RDF RESOURCE DESCRIPTION FRAMEWORK. Referentin: Claudia Langer

Semantic Markup für die Dokumentenklassifizierung. Seminarvortrag von Mirko Pracht

RDF und RDF Schema. Einführung in die Problematik Von HTML über XML zu RDF

Übungsaufgaben. Aufgabe 1 Internetsuchmaschinen. Einführung in das Information Retrieval, 8. Mai 2008 Veranstaltung für die Berufsakademie Karlsruhe

Semantic Web Services

Ressourcen-Beschreibung im Semantic Web

Semantic Web Technologies 1

Verknüpfte Daten abfragen mit SPARQL. Thomas Tikwinski, W3C.DE/AT

Seminarthemen WS 14/15

Modellierung verteilter Systeme Grundlagen der Programm und Systementwicklung

Freie und vernetzte Daten:

Transformation von Regelungen in Softwareanforderungen

Entwicklung eines Electronic Resource Management Systems für Bibliotheken auf Basis von Linked Data Technologien

Thema. Intelligente Agenten im Web

Semantic Web Technologies I! Lehrveranstaltung im WS10/11! Dr. Andreas Harth! Dr. Sebastian Rudolph!

Checkliste zur qualitativen Nutzenbewertung

Themen. Web Services und SOA. Stefan Szalowski Daten- und Online-Kommunikation Web Services

Praktikum/Thesis im Bereich Softwareentwicklung - Embedded Softwareentwicklung

Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen

Einführung Software Domänenspezifische Anpassung Demo Ausblick. ERM mit OntoWiki. Andreas Nareike

Architekturplanung und IS-Portfolio-

Semantic Web Technologies I

ÄTU Clausthal. Kollaborative Modellierung im Software Engineering. Christian Bartelt. SSE-Dissertation 4. Software Systems Engineering

RDF Containers. Häufig möchte man eine Gruppe von Dingen beschreiben. Hierfür stellt RDF ein Container-Vokabular zur Verfügung.

Diplomarbeit: GOMMA: Eine Plattform zur flexiblen Verwaltung und Analyse von Ontologie Mappings in der Bio-/Medizininformatik

Neue Funktionen in Innovator 11 R5

Managementprozesse und Performance

Weiterentwicklung digitaler Bibliothekssysteme zu OpenArchives-Systemen

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse?

Daten, Information, Wissen explizites und implizites Wissen Expertensysteme (Aufgaben, Aufbau, Komponenten) Diagnoseziel Klassifikation

Kapitel 2: Der Software-Entwicklungsprozess

Übungsklausur vom 7. Dez. 2007

Inhaltsübersicht... V. Inhaltsverzeichnis... VI. Abbildungsverzeichnis... XIII. Tabellenverzeichnis... XVII. Abkürzungsverzeichnis...

Suchdienste für Dokumente

SAP Design. Die grafische Entwicklung von ERP

Seminarphase PG 402 Thema: Semantic Web Autor: Phillip Look

SERVICE SUCHE ZUR UNTERSTÜTZUNG

Web Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion

Prototypische Entwicklung einer Software für die Erfassung und Analyse explorativer Suchen in Verbindung mit Tests zur Retrievaleffektivität

Enterprise Content Management

IT-Sicherheitslabor Ein praxisorientierter Ansatz zur Zusammenarbeit von Hochschule und Industrie in der Lehre

XDOC Extraktion, Repräsentation und Auswertung von Informationen

ITIL 3LGM²: Methoden und Werkzeuge für das IT Service Management im Krankenhaus

Entwicklung einer Methode zur Bewertung der Transformierbarkeit von On-Premise Anwendungssystemen in Software as a Service Lösungen

Medieninformatik Ein interdisziplinäres Fach in Forschung und Lehre

Finden Sie Ihr IT-Wunschpraktikum oder eine engagieren Sie sich bei uns mit einer längerfristigen Werkstudentätigkeit!

Implementierung eines steuerlichen Risikomanagementsystems

Use Cases. Die Sicht des Nutzers. Fortgeschrittenenpraktikum SS 2004

Requirements Engineering I

A Domain Specific Language for Project Execution Models

Ursprung des Internets und WWW

Die Orgadata AG ist ein stark expandierendes Software-Unternehmen aus Leer. Mit unserem System LogiKal

Human-Computer-Interaction und Psychologie Aufgaben- und Kontextanalyse

AutoSPARQL. Let Users Query Your Knowledge Base

Zellulare Neuronale Netzwerke

Requirements-Management Ein praktisches Beispiel

Ontologien und Ontologiesprachen

Warum sich das Management nicht für agile Softwareentwicklung interessieren sollte - aber für Agilität

Use Cases. Use Cases

Predictive Modeling Markup Language. Thomas Morandell

2. Workshop: Vorgehensmodelle in der Praxis Reife und Qualität

Master Projekt SoSe Computergestützte Generierung und Validierung von Softwaremodellen. Rene Meis Nazila Gol Mohammadi Prof. Dr.

BPM im Kontext von Unternehmensarchitekturen. Konstantin Gress

Je nach gewählter Authentisierungsmethode kann sich der Anwender an IntelliArchive anmelden:

Mai Hauptseminar: Nichtrelationale Datenbanken Historisch-Kulturwissenschaftliche Informationsverarbeitung Universität zu Köln

Grundlagen Software Engineering

Werkstudent Qualitätssicherung (m/w) (627468)

Andrea Grass & Dr. Marcus Winteroll oose Innovative Informatik GmbH. Geschäftsprozessmanagement und Agilität geht das zusammen?

OWL Web Ontology Language

Agenda. Lösungsentwicklungsprozess Rahmenbedingungen für arvato SPL Entwicklungsarchitektur

Konzeption und Realisierung eines logikbasierten Anfragewerkzeugs für UML-Modelle

Model Driven Architecture (MDA)

Session 8: Projektvorstellung Transferprojekt itsowl-tt-savez 18. August 2015, Gütersloh.

Federated Identity Management

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur

Grundlagen der Künstlichen Intelligenz

Kontinuierliche Prozessverbesserung mit Hilfe eines Living Books Implementierung eines Systems für die Mitarbeiter-getriebene Prozessverbesserung

Entwicklung einer formalen Sprache zur Modelltransformation auf Basis von UML & XMI

Sof o t f waretechn h o n l o og o i g en n f ü f r ü v e v rteilte S yst s eme Übung

Übungen zur Softwaretechnik

PROFESSOR WOLFGANG HENSELER GRÜNDET DESIGNSTUDIO SENSORY-MINDS

TeamSphere. Die Geo-Wissensdatenbank. Entwickelt von

IT-Servicemanagement für die Oracle ebusiness-suite. Service und Applicationmanagement für die Oracle ebusiness-suite

Entwicklung mit Arbortext Editor 6.1

Kernkompetenzen eines Wirtschaftsinformatikers heute und morgen

PQ Explorer. Netzübergreifende Power Quality Analyse. Copyright by Enetech Alle Rechte vorbehalten.

Inhaltsverzeichnis: Definitionen Informationssysteme als Kommunikationssystem Problemlösende Perspektiven Allgemeine System Annäherung Fazit

Praktikant / Abschlussarbeit im Bereich Softwareentwicklung / Mechatronik (m/w)

Transkript:

Kontextbasiertes Information Retrieval Modell, Konzeption und Realisierung kontextbasierter Information Retrieval Systeme Karlheinz Morgenroth Lehrstuhl für Medieninformatik Fakultät Wirtschaftsinformatik und Angewandte Informatik Otto-Friedrich-Universität Bamberg mi.wiai.uni-bamberg.de karlheinz.morgenroth@wiai.uni-bamberg.de

Agenda Motivation Erfassung und Beschreibung von Kontextinformation Nutzung von Kontextinformation im Information Retrieval Anfragebearbeitung mittels RDF Query by Example Fazit und Ausblick Karlheinz Morgenroth Kontextbasiertes Information Retrieval 2

Agenda Motivation Erfassung und Beschreibung von Kontextinformation Nutzung von Kontextinformation im Information Retrieval Anfragebearbeitung mittels RDF Query by Example Fazit und Ausblick Karlheinz Morgenroth Kontextbasiertes Information Retrieval 3

Motivation Ergebnisliste Anfrage als Repräsentation des Informationsbedürfnisses Ähnlichkeitssuche Features der Dokumente Dokumenten- Pool Informationsbedürfnis Dokument Dokument Idee Idee Anfrage Dokumente Karlheinz Morgenroth Kontextbasiertes Information Retrieval 4

Motivation vorliegende Daten, Dokumente Anfrage als Repräsentation des Informationsbedürfnisses Informationsbedürfnis Anbindung an Warenwirtschaft frühere Projekte aktuelle Aufgabe Anfrage Erfahrungen, Kenntnisse, Auszeichnungen Stelle / Rolle Karlheinz Morgenroth Kontextbasiertes Information Retrieval 5

Beispiel: Szenario einer Softwareentwicklung Aktueller Prozess Durch eine Ähnlichkeitssuche abgedeckter Bereich Abgeschlossene oder laufende Prozesse Ähnlichkeitssuche spezifiziert von realisiert durch Software Designer arbeitet an Bereich für das Suchergebnis Kontextinformation Erweiterung bzw.. Eingrenzung der Anfrage Anforderungsdokumente Analysedokumente Design- Dokumente implementiert von Implementierung Karlheinz Morgenroth Kontextbasiertes Information Retrieval 6

Agenda Motivation Erfassung und Beschreibung von Kontextinformation Nutzung von Kontextinformation im Information Retrieval Anfragebearbeitung mittels RDF Query by Example Fazit und Ausblick Karlheinz Morgenroth Kontextbasiertes Information Retrieval 7

Erfassung von Kontextinformation Erschließung des Kontextes in Anwendungssystemen Klassische Client-Anwendungen Client-Server-Anwendungen Server-Anwendungen Verschiedene Granularitätsstufen bei der Erfassung des aktuellen Kontextes eines Anwenders Nachrichten auf Anwendungs- und Systemebene Benutzeraktionen Informationsbedürfnisse Möglichkeit der Transformation in eine höhere Stufe Erkennung von Nachrichtenfolgen als Benutzeraktionen Erkennung von Benutzeraktionen als Informationsbedürfnisse Karlheinz Morgenroth Kontextbasiertes Information Retrieval 8

Beschreibung der Kontextinformation Heterogene Quellen und Inhalte der Kontextinformation Einsatz von Technologie des Semantic Webs Resource Description Framework (RDF) Aussagen über Ressourcen und Dingen Eindeutige Bezeichnung (URI) Vermeidung der Vagheit natürlicher Sprachen Web Ontology Language (OWL) Definition von Konzepten und deren Beziehungen Extensible Markup Language (XML) Abb. aus: Tim Berners-Lee. Semantic Web on XML. http://www.w3.org/2000/talks/1206-xml2k-tbl, Dezember 2000. Karlheinz Morgenroth Kontextbasiertes Information Retrieval 9

Bildung eines einheitlichen Nutzermodells Interaktionskontext Nachrichten Aktionen Aktionsfolgen Interaktion Arbeitskontext strukturierte Aufgaben Workflow Aufgaben Nutzermodell Tätigkeit unstrukturierte Aufgaben Aufgaben Aktionen Kombination von Nutzer- und Kontextmodell in einem Modell Erfassung verschiedener Dimensionen Erfassung zeitlicher Veränderungen Ausgangspunkt für die Ableitung von Kontextprofilen physisch organisatorisch Profile geographisch zeitlich Stelle Rolle Wissen Fähigkeiten Interessen Wissen Fähigkeiten Benutzerkontext persönliches Profil aufgabenspezifisches Profil Karlheinz Morgenroth Kontextbasiertes Information Retrieval 10

Agenda Motivation Erfassung und Beschreibung von Kontextinformation Nutzung von Kontextinformation im Information Retrieval Anfragebearbeitung mittels RDF Query by Example Fazit und Ausblick Karlheinz Morgenroth Kontextbasiertes Information Retrieval 11

Ableitung eines Informationsbedürfnisses Ableitung von Profilen aus den Kontextdimensionen Filterung / Aggregation der im Nutzermodell enthaltenen Kontextinformation Ableitung durch Fenster- und/oder Gewichtungsfunktionen aus den einzelnen Kontextdimensionen Ergebnisse sind Histogramme oder gewichtete RDF-Modelle Resultierende Profile Profil der aktuellen Tätigkeit Profil der zurückliegenden Tätigkeit persönliches / aufgabenspezifische Profil Profil des organisatorischen Kontextes Profil des physischen Kontextes Karlheinz Morgenroth Kontextbasiertes Information Retrieval 12

Modell der Ableitung eines Informationsbedürfnisses Gewichtung Profil der aktuellen Tätigkeit Profil der zurückliegenden Tätigkeit w a,a w a,h w z,a w z,h Σ aktivierend latentes Informationsbedürfnis Persönliches Profil w p,a w p,h Σ Hemmschwelle Profil des organisator. Benutzerkontextes Profile des physischen Benutzerkontextes w o,a w o,h w py,a w py,h hemmend erwartetes tatsächliches Informationsbedürfnis Histogramme oder gewichtete RDF-Modelle Einfaches Modell für automatisch formulierte Suchanfragen Karlheinz Morgenroth Kontextbasiertes Information Retrieval 13

Bildung eines Suchmodells Ausgangspunkt für die Formulierung von Suchanfragen Filter erwartetes tatsächliches Informationsbedürfnis Suchmodell gewichtetes RDF-Modell gewichtetes RDF-Modell Aggregation oder Transformation Karlheinz Morgenroth Kontextbasiertes Information Retrieval 14

Agenda Motivation Erfassung und Beschreibung von Kontextinformation Nutzung von Kontextinformation im Information Retrieval Anfragebearbeitung mittels RDF Query by Example Fazit und Ausblick Karlheinz Morgenroth Kontextbasiertes Information Retrieval 15

Motivation für RDF Query by Example Einsatz von Beispieldaten statt einer Anfragesprache für die Formulierung von Anfragen Query by Example Nutzung vager Ähnlichkeitsanfragen Unterstützung von Volltextanfragen Ermittlung sortierter Ergebnislisten Effiziente Anfragebearbeitung Karlheinz Morgenroth Kontextbasiertes Information Retrieval 16

Ähnlichkeiten zwischen RDF-Statements Anfrage-Statement Vergleichs-Statement Subjekt: cobair:xzy-01 cobair:abc-65 Subjektähnlichkeit sim Sub Prädikat: rdf:type rdf:type Prädikatähnlichkeit sim Pred Objekt: uml:class uml:abstractclass Objektähnlichkeit sim Obj Statementähnlichkeit: sim Stmt = sim Sub = sim Pred sim Obj Ähnlichkeit zwischen Konzepten (URIs) Ontologische Distanz Ähnlichkeit zwischen Literalen (Text, ) Vektorraummodell für Text Karlheinz Morgenroth Kontextbasiertes Information Retrieval 17

Ähnlichkeitsmaß: Ontologische Distanz Berechnung der ontologischen Distanz für uml:class Ontologische Distanz owl:thing owl:subclassof uml:classifier owl:subclassof sim(uml:class,rup:class) = 1 uml:interface owl:subclassof owl:equivalentclass rup:class uml:class sim(uml:class,owl:thing) = 0 sim(uml:class,uml:classifier) = 0.333 sim(uml:class,uml:interface) = 0.666 0 0.333 0.666 1 owl:subclassof uml:superclass owl:subclassof uml:abstractclass sim(uml:class,uml:class) = 1 sim(uml:class,uml:abstractclass) = 0.5 0.5 sim(uml:class,uml:superclass) = 0.5 0 Karlheinz Morgenroth Kontextbasiertes Information Retrieval 18

Ähnlichkeiten zwischen RDF-Bäumen Ermittlung des Gesamtgewichtes für einen Teilbaum sim tree = 0,54875 0,5 uml: rdf:type uml:class uml: QueryResult.java 0,876 0,1 rdf:type uml:abstractclass 0,719 sim tree = 0,719 Contains the result of uml:public uml: uml: rdf:type uml: Insert an item into the list. uml:method uml:class.documentation Defines a collection for uml:class.name PriorityQueue.java uml:attribute.visibility uml:class.attribute uml:public rdf:type 0,5 uml:method 0,657 uml:attribute.documentation Insert an element into the queue. Anfragegraph als strukturell ähnlich identifizierter Teilgraph Karlheinz Morgenroth Kontextbasiertes Information Retrieval 19

Indexstruktur für RDF Query by Example Nutzung einer zweistufigen Invertierten Liste als Indexstruktur für gewichtete RDF-Statements Prädikate (URI) Objekte (URI) Subjekte (URI) uml:class uml:visibility uml:documentation uml:name uml:attribute visibility:public visibility:protected visibility:private cobair:id-001 cobair:id-456 cobair:id-453 cobair:id-687 cobair:id-489 cobair:id-489 Objekte (Literal) Subjekte (URI) stream pseudorandom numbers cobair:id-001 0,865 cobair:id-001 0,456 cobair:id-001 0,123 cobair:id-368 0,789 cobair:id-368 0,378 cobair:id-489 0,023 Karlheinz Morgenroth Kontextbasiertes Information Retrieval 20

Indexstruktur für RDF Query by Example Nutzung einer zweistufigen Invertierten Liste als Indexstruktur für gewichtete RDF-Statements Stromorientierte Anfragebearbeitung Prädikate (URI) Objekte (URI) Subjekte (URI) uml:class uml:visibility uml:documentation uml:name uml:attribute 0,5 0,5 visibility:public visibility:protected visibility:private 0,7 0,3 cobair:id-001 cobair:id-456 cobair:id-453 cobair:id-687 cobair:id-489 cobair:id-489 Objekte (Literal) Subjekte (URI) Ergebnisstrom Kombination der Teilergebnisströme stream pseudorandom numbers Anfragegewichtungen 0,8 0,6 cobair:id-001 0,865 cobair:id-001 0,456 cobair:id-001 0,123 cobair:id-368 0,789 cobair:id-368 0,378 cobair:id-489 0,023 Karlheinz Morgenroth Kontextbasiertes Information Retrieval 21

Agenda Motivation Erfassung und Beschreibung von Kontextinformation Nutzung von Kontextinformation im Information Retrieval Anfragebearbeitung mittels RDF Query by Example Fazit und Ausblick Karlheinz Morgenroth Kontextbasiertes Information Retrieval 22

Fazit und Ausblick Fazit Prototypische Realisierung auf dem Gebiet des Software Engineerings Unterstützung der Tätigkeit von Softwarearchitekten und entwicklern Evaluierung nach quantitativen und qualitativen Kriterien Tragfähigkeit des Ansatzes Ausblick Implementierung und Evaluierung in anderen Anwendungsgebieten Weiterentwicklung der Indexstruktur und deren Implementierung Einsatz in einer Service-Orientierten-Architektur Visuelle Darstellung der Suchergebnisse Weiterverwendung der Suchergebnisse Karlheinz Morgenroth Kontextbasiertes Information Retrieval 23

Vielen Dank! Karlheinz Morgenroth Kontextbasiertes Information Retrieval 24