Kontextbasiertes Information Retrieval Modell, Konzeption und Realisierung kontextbasierter Information Retrieval Systeme Karlheinz Morgenroth Lehrstuhl für Medieninformatik Fakultät Wirtschaftsinformatik und Angewandte Informatik Otto-Friedrich-Universität Bamberg mi.wiai.uni-bamberg.de karlheinz.morgenroth@wiai.uni-bamberg.de
Agenda Motivation Erfassung und Beschreibung von Kontextinformation Nutzung von Kontextinformation im Information Retrieval Anfragebearbeitung mittels RDF Query by Example Fazit und Ausblick Karlheinz Morgenroth Kontextbasiertes Information Retrieval 2
Agenda Motivation Erfassung und Beschreibung von Kontextinformation Nutzung von Kontextinformation im Information Retrieval Anfragebearbeitung mittels RDF Query by Example Fazit und Ausblick Karlheinz Morgenroth Kontextbasiertes Information Retrieval 3
Motivation Ergebnisliste Anfrage als Repräsentation des Informationsbedürfnisses Ähnlichkeitssuche Features der Dokumente Dokumenten- Pool Informationsbedürfnis Dokument Dokument Idee Idee Anfrage Dokumente Karlheinz Morgenroth Kontextbasiertes Information Retrieval 4
Motivation vorliegende Daten, Dokumente Anfrage als Repräsentation des Informationsbedürfnisses Informationsbedürfnis Anbindung an Warenwirtschaft frühere Projekte aktuelle Aufgabe Anfrage Erfahrungen, Kenntnisse, Auszeichnungen Stelle / Rolle Karlheinz Morgenroth Kontextbasiertes Information Retrieval 5
Beispiel: Szenario einer Softwareentwicklung Aktueller Prozess Durch eine Ähnlichkeitssuche abgedeckter Bereich Abgeschlossene oder laufende Prozesse Ähnlichkeitssuche spezifiziert von realisiert durch Software Designer arbeitet an Bereich für das Suchergebnis Kontextinformation Erweiterung bzw.. Eingrenzung der Anfrage Anforderungsdokumente Analysedokumente Design- Dokumente implementiert von Implementierung Karlheinz Morgenroth Kontextbasiertes Information Retrieval 6
Agenda Motivation Erfassung und Beschreibung von Kontextinformation Nutzung von Kontextinformation im Information Retrieval Anfragebearbeitung mittels RDF Query by Example Fazit und Ausblick Karlheinz Morgenroth Kontextbasiertes Information Retrieval 7
Erfassung von Kontextinformation Erschließung des Kontextes in Anwendungssystemen Klassische Client-Anwendungen Client-Server-Anwendungen Server-Anwendungen Verschiedene Granularitätsstufen bei der Erfassung des aktuellen Kontextes eines Anwenders Nachrichten auf Anwendungs- und Systemebene Benutzeraktionen Informationsbedürfnisse Möglichkeit der Transformation in eine höhere Stufe Erkennung von Nachrichtenfolgen als Benutzeraktionen Erkennung von Benutzeraktionen als Informationsbedürfnisse Karlheinz Morgenroth Kontextbasiertes Information Retrieval 8
Beschreibung der Kontextinformation Heterogene Quellen und Inhalte der Kontextinformation Einsatz von Technologie des Semantic Webs Resource Description Framework (RDF) Aussagen über Ressourcen und Dingen Eindeutige Bezeichnung (URI) Vermeidung der Vagheit natürlicher Sprachen Web Ontology Language (OWL) Definition von Konzepten und deren Beziehungen Extensible Markup Language (XML) Abb. aus: Tim Berners-Lee. Semantic Web on XML. http://www.w3.org/2000/talks/1206-xml2k-tbl, Dezember 2000. Karlheinz Morgenroth Kontextbasiertes Information Retrieval 9
Bildung eines einheitlichen Nutzermodells Interaktionskontext Nachrichten Aktionen Aktionsfolgen Interaktion Arbeitskontext strukturierte Aufgaben Workflow Aufgaben Nutzermodell Tätigkeit unstrukturierte Aufgaben Aufgaben Aktionen Kombination von Nutzer- und Kontextmodell in einem Modell Erfassung verschiedener Dimensionen Erfassung zeitlicher Veränderungen Ausgangspunkt für die Ableitung von Kontextprofilen physisch organisatorisch Profile geographisch zeitlich Stelle Rolle Wissen Fähigkeiten Interessen Wissen Fähigkeiten Benutzerkontext persönliches Profil aufgabenspezifisches Profil Karlheinz Morgenroth Kontextbasiertes Information Retrieval 10
Agenda Motivation Erfassung und Beschreibung von Kontextinformation Nutzung von Kontextinformation im Information Retrieval Anfragebearbeitung mittels RDF Query by Example Fazit und Ausblick Karlheinz Morgenroth Kontextbasiertes Information Retrieval 11
Ableitung eines Informationsbedürfnisses Ableitung von Profilen aus den Kontextdimensionen Filterung / Aggregation der im Nutzermodell enthaltenen Kontextinformation Ableitung durch Fenster- und/oder Gewichtungsfunktionen aus den einzelnen Kontextdimensionen Ergebnisse sind Histogramme oder gewichtete RDF-Modelle Resultierende Profile Profil der aktuellen Tätigkeit Profil der zurückliegenden Tätigkeit persönliches / aufgabenspezifische Profil Profil des organisatorischen Kontextes Profil des physischen Kontextes Karlheinz Morgenroth Kontextbasiertes Information Retrieval 12
Modell der Ableitung eines Informationsbedürfnisses Gewichtung Profil der aktuellen Tätigkeit Profil der zurückliegenden Tätigkeit w a,a w a,h w z,a w z,h Σ aktivierend latentes Informationsbedürfnis Persönliches Profil w p,a w p,h Σ Hemmschwelle Profil des organisator. Benutzerkontextes Profile des physischen Benutzerkontextes w o,a w o,h w py,a w py,h hemmend erwartetes tatsächliches Informationsbedürfnis Histogramme oder gewichtete RDF-Modelle Einfaches Modell für automatisch formulierte Suchanfragen Karlheinz Morgenroth Kontextbasiertes Information Retrieval 13
Bildung eines Suchmodells Ausgangspunkt für die Formulierung von Suchanfragen Filter erwartetes tatsächliches Informationsbedürfnis Suchmodell gewichtetes RDF-Modell gewichtetes RDF-Modell Aggregation oder Transformation Karlheinz Morgenroth Kontextbasiertes Information Retrieval 14
Agenda Motivation Erfassung und Beschreibung von Kontextinformation Nutzung von Kontextinformation im Information Retrieval Anfragebearbeitung mittels RDF Query by Example Fazit und Ausblick Karlheinz Morgenroth Kontextbasiertes Information Retrieval 15
Motivation für RDF Query by Example Einsatz von Beispieldaten statt einer Anfragesprache für die Formulierung von Anfragen Query by Example Nutzung vager Ähnlichkeitsanfragen Unterstützung von Volltextanfragen Ermittlung sortierter Ergebnislisten Effiziente Anfragebearbeitung Karlheinz Morgenroth Kontextbasiertes Information Retrieval 16
Ähnlichkeiten zwischen RDF-Statements Anfrage-Statement Vergleichs-Statement Subjekt: cobair:xzy-01 cobair:abc-65 Subjektähnlichkeit sim Sub Prädikat: rdf:type rdf:type Prädikatähnlichkeit sim Pred Objekt: uml:class uml:abstractclass Objektähnlichkeit sim Obj Statementähnlichkeit: sim Stmt = sim Sub = sim Pred sim Obj Ähnlichkeit zwischen Konzepten (URIs) Ontologische Distanz Ähnlichkeit zwischen Literalen (Text, ) Vektorraummodell für Text Karlheinz Morgenroth Kontextbasiertes Information Retrieval 17
Ähnlichkeitsmaß: Ontologische Distanz Berechnung der ontologischen Distanz für uml:class Ontologische Distanz owl:thing owl:subclassof uml:classifier owl:subclassof sim(uml:class,rup:class) = 1 uml:interface owl:subclassof owl:equivalentclass rup:class uml:class sim(uml:class,owl:thing) = 0 sim(uml:class,uml:classifier) = 0.333 sim(uml:class,uml:interface) = 0.666 0 0.333 0.666 1 owl:subclassof uml:superclass owl:subclassof uml:abstractclass sim(uml:class,uml:class) = 1 sim(uml:class,uml:abstractclass) = 0.5 0.5 sim(uml:class,uml:superclass) = 0.5 0 Karlheinz Morgenroth Kontextbasiertes Information Retrieval 18
Ähnlichkeiten zwischen RDF-Bäumen Ermittlung des Gesamtgewichtes für einen Teilbaum sim tree = 0,54875 0,5 uml: rdf:type uml:class uml: QueryResult.java 0,876 0,1 rdf:type uml:abstractclass 0,719 sim tree = 0,719 Contains the result of uml:public uml: uml: rdf:type uml: Insert an item into the list. uml:method uml:class.documentation Defines a collection for uml:class.name PriorityQueue.java uml:attribute.visibility uml:class.attribute uml:public rdf:type 0,5 uml:method 0,657 uml:attribute.documentation Insert an element into the queue. Anfragegraph als strukturell ähnlich identifizierter Teilgraph Karlheinz Morgenroth Kontextbasiertes Information Retrieval 19
Indexstruktur für RDF Query by Example Nutzung einer zweistufigen Invertierten Liste als Indexstruktur für gewichtete RDF-Statements Prädikate (URI) Objekte (URI) Subjekte (URI) uml:class uml:visibility uml:documentation uml:name uml:attribute visibility:public visibility:protected visibility:private cobair:id-001 cobair:id-456 cobair:id-453 cobair:id-687 cobair:id-489 cobair:id-489 Objekte (Literal) Subjekte (URI) stream pseudorandom numbers cobair:id-001 0,865 cobair:id-001 0,456 cobair:id-001 0,123 cobair:id-368 0,789 cobair:id-368 0,378 cobair:id-489 0,023 Karlheinz Morgenroth Kontextbasiertes Information Retrieval 20
Indexstruktur für RDF Query by Example Nutzung einer zweistufigen Invertierten Liste als Indexstruktur für gewichtete RDF-Statements Stromorientierte Anfragebearbeitung Prädikate (URI) Objekte (URI) Subjekte (URI) uml:class uml:visibility uml:documentation uml:name uml:attribute 0,5 0,5 visibility:public visibility:protected visibility:private 0,7 0,3 cobair:id-001 cobair:id-456 cobair:id-453 cobair:id-687 cobair:id-489 cobair:id-489 Objekte (Literal) Subjekte (URI) Ergebnisstrom Kombination der Teilergebnisströme stream pseudorandom numbers Anfragegewichtungen 0,8 0,6 cobair:id-001 0,865 cobair:id-001 0,456 cobair:id-001 0,123 cobair:id-368 0,789 cobair:id-368 0,378 cobair:id-489 0,023 Karlheinz Morgenroth Kontextbasiertes Information Retrieval 21
Agenda Motivation Erfassung und Beschreibung von Kontextinformation Nutzung von Kontextinformation im Information Retrieval Anfragebearbeitung mittels RDF Query by Example Fazit und Ausblick Karlheinz Morgenroth Kontextbasiertes Information Retrieval 22
Fazit und Ausblick Fazit Prototypische Realisierung auf dem Gebiet des Software Engineerings Unterstützung der Tätigkeit von Softwarearchitekten und entwicklern Evaluierung nach quantitativen und qualitativen Kriterien Tragfähigkeit des Ansatzes Ausblick Implementierung und Evaluierung in anderen Anwendungsgebieten Weiterentwicklung der Indexstruktur und deren Implementierung Einsatz in einer Service-Orientierten-Architektur Visuelle Darstellung der Suchergebnisse Weiterverwendung der Suchergebnisse Karlheinz Morgenroth Kontextbasiertes Information Retrieval 23
Vielen Dank! Karlheinz Morgenroth Kontextbasiertes Information Retrieval 24