Semantisches Knowledge Retrieval

Größe: px
Ab Seite anzeigen:

Download "Semantisches Knowledge Retrieval"

Transkript

1 Whitepaper Series Prof. Dr. Rudi Studer 1, Hans-Peter Schnurr 2, Andreas Nierlich 2 1 Institut AIFB, Universität Karlsruhe D Karlsruhe 2 Ontoprise GmbH, Haid-und Neu Straße 7, D Karlsruhe mailto: studer@aifb.uni-karlsruhe.de, {schnurr,nierlich}@ontoprise.de

2 Inhaltsverzeichnis Summary Einführung Wissensmanagement Information Retrieval Methoden und Techniken Information Retrieval in der Anwendung Semantische Ansätze Wissen modellieren - Ontologie Neues Wissen inferieren Knowledge Retrieval in der Anwendung Zukunftsaussichten Fazit...14 Quellenverzeichnis...15 People can t share knowledge if they don t speak a common language Thomas H. Davenport [i] Summary Dieses Whitepaper befasst sich mit der Integration semantischer Technologien in bestehende Ansätze des Information Retrieval und die damit verbundenen weitreichenden Auswirkungen auf Effizienz und Effektivität von Suche und Navigation in Dokumenten. Nach einer Einbettung in die Problematik des Wissensmanagement aus Sicht der Informationstechnik folgt ein Überblick zu den Methoden des Information Retrieval. Anschließend werden die semantischen Technologien Wissen modellieren - Ontologie und Neues Wissen ableiten Inferenz vorgestellt. Ein Integrationsansatz wird im Folgenden diskutiert und die entstehenden Mehrwerte präsentiert. Insbesondere ergeben sich Erweiterungen hinsichtlich einer verfeinerten Suchunterstützung und einer kontextbezogenen Navigation sowie die Möglichkeiten der Auswertung von regelbasierten Zusammenhängen und einfache Integration von strukturierten Informationsquellen. Das Whitepaper schließt mit einem Ausblick auf die zukünftige Entwicklung des WWW hin zu einem Semantic Web und die damit verbundenen Implikationen für semantische Technologien Ontoprise GmbH September

3 1. Einführung Wissensmanagement hat sich in den vergangenen Jahren zu einem kritischen Erfolgsfaktor für Unternehmen entwickelt. Die Globalisierung der Märkte, das Entstehen virtueller Unternehmen, die stärkere Kundenorientierung und die zunehmende Komplexität von Produkten sind einige der Gründe, weshalb das systematische und gezielte Organisieren von Wissen immer mehr an Bedeutung gewinnt. Wissensmanagement ist offensichtlich inhärent interdisziplinär: Personalmanagement, Unternehmensorganisation sowie Unternehmenskultur sind wesentliche Aspekte des Wissensmanagement, gleichwohl spielt die Informationstechnologie (IT) eine wichtige Rolle, als Enabler für eine Vielzahl von Funktionalitäten einer Wissensmanagement- Lösung. IT-basierte Wissensmanagement-Lösungen beinhalten ein Unternehmensgedächtnis (organizational memory), das typischerweise informales, semiformales und formales Wissen umfasst, das vom Wissensarbeiter zur Bearbeitung seiner Aufgaben benötigt wird [ii]. Um dem Wissensarbeiter einen flexiblen und personalisierten Zugang zum Wissen anbieten zu können, bedarf es neben dem intelligenten Zugriff auf strukturiertes und vernetztes Wissen auch den einfachen, flexiblen und integrativen Zugriff auf eine Flut an unstrukturierten Informationen im Unternehmen. Damit verbunden sind Ziele, welche die Verbesserung des Managements der Ressource Wissen erreichen soll: Effektive Nutzung des verfügbaren Wissens Wissensteilung und Wiederverwendung Verbesserte Zugreifbarkeit auf Wissen Einbettung von Wissen in die Arbeitsprozesse Abbildung 1: Praxisaspekte des Wissensmanagements 2001 Ontoprise GmbH September

4 2. Wissensmanagement Wissensmanagement ist eine komplexe und interdisziplinäre Aufgabe, von der neben den technischen vor allem auch organisatorische Bereiche eines Unternehmens betroffen sind. Typische Fragestellungen rund um die Erzeugung, Archivierung und Verteilung von Wissen erfordern unterschiedliche Ansatzpunkte und Maßnahmen im Hinblick auf Technologie, Organisation, Personalmanagement sowie Unternehmenskultur. Während die Bedeutung der IT für das Wissensmanagement in den letzten Jahren deutlich überbewertet wurde, hat man mittlerweile erkannt, dass mit dem Einsatz von IT Systemen allein kein erfolgreiches Wissensmanagement betrieben werden kann. Allerdings ist ohne den sinnvollen Einsatz von Methoden und Technologien der Informationstechnik ein effizientes Wissensmanagement in Unternehmen ebenfalls nicht zu realisieren. Mittels IT Techniken kann relevantes Wissen adäquat archiviert und bedarfsgerecht zur Verfügung gestellt werden. IT ist somit wesentlicher Enabler für die praktische Umsetzung von Wissensmanagement, da sie unabhängig von Ort und Zeit einer prinzipiell beliebigen Nutzeranzahl den Zugriff auf Wissen ermöglicht und effiziente Navigations- und Suchunterstützung leisten kann. Im Rahmen einer technologischen Unterstützung ist der Einsatz von Werkzeugen erforderlich, die unterschiedliche, mit den Prozessphasen des Wissensmanagements verbundene Aufgaben zu erfüllen haben. Die Auswahl und Architektur dieser Werkzeuge muss sich hierbei an den individuellen Bedürfnissen des Unternehmens orientieren. Ein Ansatzpunkt liefert hierfür das Prozessmodell nach Gilbert Probst, siehe Abbildung 2: Abbildung 2: Prozessmodell von Probst Eine gründliche Analyse dieser Wissensprozesse, insbesondere unter den Prämissen der Ziele des Wissensmanagement muss zu Beginn eines Wissensmanagement Projektes erfolgen. Im Rahmen von Workshops werden hier die Grundlagen für effizienten Aufbau und effektive Durchführung von Wissensmanagement Maßnahmen gelegt. Damit wird 2001 Ontoprise GmbH September

5 auch gewährleistet, dass eine Einführung von IT Systemen die Bedürfnisse der Unternehmen punktgenau unterstützt. Oft stellt sich hierbei heraus, dass der einfache Zugriff auf das vorhandene Unternehmenswissen in Dokumenten nicht möglich ist. Für den Zugriff auf Dokumenten- und Datenbestände des Unternehmens nehmen die Technologien des Information Retrieval eine zentrale Rolle ein. Im Folgenden beschreiben wir diese Methoden und Technologien sowie weiterführende Ansätze, um mithilfe semantischer Technologien aus dem Information Retrieval ein Knowledge Retrieval zu erreichen. 3. Information Retrieval 3.1. Methoden und Techniken Ziel des Information Retrieval ist es, gespeicherte Daten (Texte, strukturierte Daten, Bilder, Fakten u.a.) so aufzubereiten und anzubieten, dass sie bei einem konkreten Informationsbedarf mit problemgerechten Suchstrategien möglichst präzise und vollständig herausgesucht werden können. Dabei unterscheidet sich die prototypische Recherchesituation von der Standard-Nutzung eines Datenbank-Managementsystems in verschiedener Hinsicht: Die Semantik der gespeicherten Daten ist im Hinblick auf die Anfragen unscharf und unvollständig. Das Information Retrieval operiert nicht mit den Inhalten eines Dokumentes, sondern fasst ein Dokument als eine Sequenz von Wörtern auf. Die Anfragen sind in dem Sinn unscharf, als der Anfragende seinen Informationsbedarf oft erst in Abhängigkeit von den Zwischenergebnissen seiner interaktiven Suche weiter präzisieren kann. Die Qualität einer Retrievalantwort hängt von vielen Parametern ab: Von der Auswahl der richtigen Datenbasis/-basen, von der Vollständigkeit und Aktualität der Datenbasis, deren formaler und inhaltlicher Aufbereitung, von den angebotenen Retrievalfunktionen und nicht zuletzt von dem Geschick und der Erfahrung des Rechercheurs. Die Retrievalsysteme haben seit den Anfängen nur wenig an methodischer Innovation zu bieten: Die Suche im Freitext erlaubt es, nach jeder im Text auftretenden Wortform zu recherchieren. Zusätzlich stehen zeichenkettenorientierte Operatoren zur Verfügung, um insbesondere Wortformenvarianten abdecken zu können: Rechts- und evtl. Linkstrunkierung sowie Maskierung im Wort. Kontextoperatoren erlauben es, mehrere Wörter mit bestimmtem Wortabstand, im gleichen Satz oder etwa im gleichen Feld zu suchen. Als spezielle Nicht-Standard-Suchfunktionen können etwa gelten: Grundformenrecherche, mit der Wörter unabhängig von ihrer Flektionsform gefunden werden (Suche mit 'Haus', Fundstelle: 'Häuser'), Kompositazerlegung (ersetzt und präzisiert die Linkstrunkierung!), phonetische Recherche, mit der phonetisch gleichlautende oder ähnlich klingende Wörter gefunden werden sowie Unterstützung der Mehrsprachigkeit, um Schlagwörter oder Maßeinheiten sprachunabhängig finden zu können Ontoprise GmbH September

6 Auf der Grundlage dieser Möglichkeiten baut der Benutzer mit den Operatoren der Boole'schen Logik iterativ seine Suchanfrage zusammen und lässt sich im Wesentlichen von den Trefferanzahlen sowie inspizierten Antwortdokumenten leiten: zu viele Treffer erzwingen Einschränkung der Anfrage, zu wenige Treffer erzwingen eine Erweiterung der Fragestellung. Diese auch als 'exact match' bezeichnete Retrievalmethode geht davon aus, dass bereits eine geringfügige Abweichung von den Suchbedingungen ein Dokument als Treffer disqualifiziert und andererseits alle Dokumente, die die Suchbedingung erfüllen, gleichwertig sind - und dies, obwohl die systemgerechte Frageformulierung erkennbar nur eine grobe Näherung an den eigentlichen Informationsbedarf darstellt. Dem steht die 'partial match' Methode gegenüber: Ergebnis einer Anfrage ist nicht eine Antwortmenge, sondern eine Sortierung der Dokumente nach vermuteter Relevanz (Ranking). Eine initiale Anfrage kann also so spezifisch wie möglich gestellt werden. Statt der leeren Menge (wenn kein Dokument die spezifischen Anforderungen erfüllt) werden die bestpassenden als Ergebnis angeboten. Im Indexierungsschritt werden der zugrundeliegende Informationsbedarf f und die Dokumente d auf entsprechende Repräsentationen f' und d' abgebildet. Den Abgleich nimmt die Retrievalfunktion vor, die als eine Abbildung d' x f' -> [0:1] angesehen werden kann. Was konkret als Dokument anzusehen ist (Texte, multimediale Dokumente, Fakten) und die Repräsentationsformen für Dokumente und Fragen (Vektoren, Records, Regeln, semantische Netze,...) sind im Prinzip nicht beschränkt -- und so gibt es eine fast unübersehbare Fülle von Ansätzen, die in Abbildung 3 systematisiert werden. Abbildung 3: Klassifikation von Retrievaltechniken Diese Systematik wird im Folgenden kurz charakterisiert [iii]: 2001 Ontoprise GmbH September

7 Exact match: Diese Retrievaltechnik repräsentiert weitgehend die Retrievalpraxis. Die Retrievalfunktion liefert nur die Werte 0 oder 1: Ein Dokument gehört zur Antwortmenge, - oder nicht. Partial match: auch eine partielle Übereinstimmung zwischen Suchfrage und Dokument wird bewertet: Die Retrievalfunktion liefert Werte zwischen 0 und 1 - als Basis eines Ranking. Isolierte Dokumente vs. Dokumentennetzwerk: unterscheidet, ob einzelne Dokumente oder aber untereinander vernetzte Dokumente Gegenstand des Retrievalprozesses sind. Auch Hypertext-Ansätze sind hierunter zu rechnen, ebenso wie konnektionistische assoziative Modelle, in denen Anfragen aus der Aktivierung einzelner Begriffe bestehen, die sich über ein Netz von Knoten (für Wörter, Begriffe, Dokumente) fortpflanzt, verstärkt, dämpft und als Ergebnis aktivierte Dokumente liefert. Strukturbasierte Ansätze: können sehr vielfältiger Natur sein: Benutzung logisch fundierter Repräsentationen, von semantischen Netzen, Ontologien oder von Frames. Auch computerlinguistische Ansätze, die etwa auf Abhängigkeitsstrukturen zwischen syntaktischen Einheiten aufbauen, sind hierunter zu rechnen. Merkmalsbasierte Ansätze: beschreiben Dokumente und Fragen vektoriell: als eine Zusammenfassung einzelner Merkmale. Da typischerweise das Vorkommen von Wörtern zur Merkmal-Definition herangezogen wird, muss man sich eine sehr große Menge von Merkmalen vorstellen. Im Vektorraummodell werden Fragen und Dokumente als Vektoren eines vieldimensionalen Vektorraumes aufgefasst, der vom Fachvokabular aufgespannt wird. Die Retrievalfunktion versucht, die Ähnlichkeit von Frage und Dokumenten zu bewerten. Dieses älteste aller derartigen Modelle hat besondere heuristische Qualitäten und immer noch Grundlage aktiver Forschung und bestehender Systeme. Probabilistische Modelle versuchen auf der Basis von Auftretenshäufigkeiten von Merkmalen auf die Wahrscheinlichkeit zu schließen, dass ein betrachtetes Dokument auf eine Frage relevant ist. Hat der Benutzer beispielsweise erste vorgelegte Dokumente hinsichtlich Relevanz auf seine Frage beurteilt (Relevance Feedback), kann man grobe Näherungen für die Wahrscheinlichkeit, dass bestimmte Wörter in relevanten /nichtrelevanten Dokumenten vorkommen /nicht vorkommen direkt auszählen und daraus die gesuchte Wahrscheinlichkeit ableiten. Probabilistische Retrievalmodelle sind erklärend und normativ. Sie liefern auch praktisch gute Ergebnisse. Fuzzy set Ansätze können als Erweiterung der Boole'schen Logik (exact match) um eine Gewichtungskomponente angesehen werden Ontoprise GmbH September

8 3.2. Information Retrieval in der Anwendung Die Funktionalität bekannter Internet Suchmaschinen umfasst das permanente Durchsuchen von Web-Sites und eine automatische Verschlagwortung derer Inhalte, wobei durch den Einsatz von Ranking-Algorithmen noch eine zusätzliche Bewertung der Relevanz der Dokumente vorgenommen wird. Suchanfragen werden dann mit dem Schlagwortindex verglichen und die Treffer gemäß des Rankings aufbereitet. In der Regel gehen diese Ansätze über eine exact match Methode nicht hinaus. Diese Technologie kann aufgrund identischer technologischer Basis auch beim Information Retrieval im Intranet eingesetzt werden. Neben diesen, auf Webseiten fokussierte Suchmaschinen, finden beim Information Retrieval in Dokumentenbeständen Index Server (bspw. Microsoft Index Server) Anwendung, die aus Dokumenten gängiger Formate Indexlisten erstellen können. Abbildung 4 zeigt schematisch den Keyword-basierten Zugriff über Indexsuche oder Suchmaschinen in Dokumenten auf File Server oder in Web Server Archiven. Der Nachteil dieser Information Retrieval Ansätze ist, dass eine reine syntaktische Suche nach Begriffen stattfindet, ohne dabei die Bedeutung der Wörter innerhalb der einzelnen Dokumente zu berücksichtigen. Dies führt bei der Suche zu einer hohen Zahl von Treffern, bei denen auch Dokumente gefunden werden, in denen der Begriff in anderer Bedeutung verwendet wird. Eine Suche nach ähnlichen Begriffen, bzw. Eingrenzungen oder Verallgemeinerungen kann von diesen statistischen Ansätzen nicht unterstützt werden. Abbildung 4: Architektur Information Retrieval Während der letzten 30 Jahre fand eine anhaltende Diskussion darüber statt, ob zur Unterstützuon natürlicher Sprachverarbeitung (Natural Language Processing, NLP) auf 2001 Ontoprise GmbH September

9 syntaktische oder semantische Technologien fokussiert werden solle. In beiden Lagern wurden Ansätze diskutiert und vorangetrieben. Immer deutlicher hat sich gezeigt, daß beide Technologien und insbesondere das Zusammenspiel zwischen statistischen Verfahren und semantischer Modellierung die wichtigsten Ansatzpunkte für die Weiterentwicklung der natürlichen Sprachverarbeitung darstellen. In unserem Verständnis ist es nicht ausreichend, sich ausschließlich auf den Text als solchen zu fokussieren. Es ist notwendig, das Gesamtsystem bestehend aus Wissen, Ziel und Welt des Autors, gewähltes Vokabular, Kontext und Wissen des Lesers/Hörers zu erfassen, um die Texte zu verstehen. Die Arbeiten von Ram et al. [iv] zeigen dies in eindrucksvoller Weise. 4. Semantische Ansätze Die Kommunikation ist das einzige Mittel, Wissen und Informationen zwischen zwei Parteien auszutauschen. Auch wenn alle Beteiligten Mensch und/oder Maschine - über das gleiche Vokabular verfügen, so ist damit noch nicht sichergestellt, dass die Parteien die Bedeutung der ausgetauschten Informationen auch verstehen. Aneinander vorbei zu reden hat seine Ursache zumeist darin, dass bestimmte Worte den Beteiligten zwar bekannt sind, aber mit anderen Bedeutungen in Verbindung gebracht werden. Das gilt umso mehr, wenn das Hintergrundwissen des Gesprächspartners oder der Kontext, aus dem heraus Aussagen getroffen wurden nicht oder nur unzureichend bekannt sind. Verdeutlichen lässt sich die Problematik am sogenannten Bedeutungs-Dreieck (vgl. Abbildung 5), welches das Zusammenspiel zwischen Symbolen oder Wörtern (Syntax), Gedanken oder Assoziationen (Semantik) und realen Dingen der Welt erklärt. Abbildung 5: Bedeutungsdreieck Die Beziehung zwischen einem Wort und dem Gegenstand auf den es sich bezieht ist indirekt. Die Verbindung kann nur dann vervollständigt werden, wenn ein Interpret das Wort verarbeitet, was bei ihm eine bestimmte Bedeutung (Begriff) des Wortes hervorruft. Diesen Begriff bringt er mit einem bestimmten Gegenstand oder Sachverhalt der realen Welt in Verbindung. Es wird also klar, dass ein Wort weder das Wesen der Bedeutung 2001 Ontoprise GmbH September

10 eines realen Objektes noch des realen Objektes selbst vollständig erfassen kann, dass aber zumindest ein Zusammenhang zwischen diesen besteht. Dem Leser wird aber auch die Problematik klar, dass die indirekte Verbindung zwischen Wort und realem Gegenstand nur subjektiv eindeutig ist, das heißt vom Verarbeitungsprozess des Interpreten abhängt. So kann das Wort Bank von einem Interpreten mit dem realen Gegenstand Finanzinstitut in Verbindung gebracht werden. Ein anderer Interpreter versteht darunter eher eine Sitzgelegenheit. Dieser Interpretationsschritt wird beeinflusst vom Hintergrundwissen des Interpreten und dem Kontext, in dem er sich bewegt. Er ist also abhängig vom internen Modell der Welt (Weltbild) oder eines entsprechenden Teilausschnittes davon, das der Interpret hat. Das Fehlen eines geteilten oder gemeinsamen Verständnisses führt zu Missverständnissen und fehlerhafter Kommunikation in Organisationen, bzw. zu mangelhafter Interoperabilität und eingeschränkter Wiederverwendbarkeit von Software Systemen. Ziel muss es folglich sein, konzeptuelle und terminologische Verwirrungen und Unklarheiten zu beheben und zu einem gemeinsamen Verständnis zu kommen. Durch die Verwendung von Wissensmodellen, z.b. mittels Ontologien wird dieses Ziel erreicht Wissen modellieren - Ontologie Der Begriff Ontologie stammt ursprünglich aus der Philosophie und beschreibt den Zweig der Metaphysik, der sich mit dem Wesen des Seins befasst. In der Informatik wird unter einer Ontologie die konzeptuelle Formalisierung von Wissensbereichen verstanden. Die am häufigsten zitierte Definition für Ontologie ist die von Gruber: "An Ontology is a shared, explicit specification of a conceptualization" [v]. Eine Ontologie stellt somit ein Modell der Welt oder eines Teils der Welt dar, über deren Begriffe und Zusammenhänge eine Gruppe von Experten/ Nutzern Einigkeit erreichte. Die Ontologie soll dazu eine Wissensstruktur abbilden, wobei durch diese Formalisierung Mehrdeutigkeit vermieden wird. Ontologien sind üblicherweise in Taxonomien, also in einer Baumstruktur mit mehrfacher Vererbung und disjunkten Unterkategorien organisiert. Diese Kategorien (Konzepte) können mit anderen Kategorien über Relationen verknüpft oder mit Attributen detailliert beschrieben werden. Ontologien beschreiben für einen Wissensbereich nicht nur Kategorisierungen, sondern auch Regeln. Ontologische Regelmechanismen lassen auch implizite Verknüpfungen erkennen. Zum Beispiel lässt sich in Regeln festhalten, dass ein Teilnehmer am Workshop Ontologie auch Wissen über Ontologien besitzt. Es existieren weitere Ansätze, Wissensmodelle aufzubauen. Eine ebenfalls verbreitete Methode ist die Verwendung von TopicMaps für die Einordnung und Kategorisierung von Begriffen. Hierbei werden vorhandene Themen (Topics) miteinander verbunden, ein semantisches Netz entsteht. TopicMaps eignen sich insbesondere zur Navigation vorhandener Begrifflichkeiten. Ontologien stellen zusätzlich zur Navigationsunterstützung mächtigere Modellierungsmöglichkeiten zur Verfügung, welche zusätzliche Funktionen des Wissensmodells ermöglichen [vi]. So kann nicht nur eine Beziehung zwischen den Konzepten Mitarbeiter und Thema definiert werden, sondern diese zusätzlich qualitativ 2001 Ontoprise GmbH September

11 belegt werden, z.b. Mitarbeiter ist ein Experte eines Themas. Durch die Verwendung von Regeln über diese Beziehungen können logische Schlussfolgerungsketten aufgebaut und abgebildet werden. Somit werden implizite Beziehungen definiert, die in einer Inferenzmaschine ausgewertet werden können, wie im nächsten Abschnitt beschrieben Neues Wissen inferieren Die erstellten Wissensmodelle lassen neben der Navigationsunterstützung auch die Ableitung über die Ausführung der modellierten Regeln zu. Dadurch wird implizites Wissen transparent und neues Wissen abgeleitet, eine Inferenz gebildet. Unter einer Inferenz versteht man aufbereitetes Wissen, das aufgrund logischer Schlussfolgerungen gewonnen wurde [Duden]. Dies geschieht durch die Kombination mehrerer Informationen aus verteilten und heterogenen Quellen. Diese Ableitungen, die für den Menschen oft durchaus trivial erscheinen, können durch die Verwendung einer Inferenzmaschine in einem Suchsystem verwendet werden. Das folgende Beispiel illustriert eine Inferenz: ((Relationen)) arbeitet_in (Mitarbeiter, Projekt) behandelt_thema (Projekt, Thema) Mitarbeiter arbeitet in Projekt ein Projekt behandelt ein Thema Die über diesen Relationen allgemein definierte Regel lautet folgendermaßen: Arbeitet ein Mitarbeiter X in einem Projekt Y und behandelt Projekt Y das Thema Z, dann hat Mitarbeiter X Kenntnisse zum Thema Z. Auf die Frage " Wer hat Kenntnisse zum Thema Z?" würde dann die Antwort lauten Mitarbeiter X, obwohl diese Aussage in keinem System explizit formuliert sein muss. Es handelt sich also um inhärentes Wissen, das nur mittels dynamischer Abfragemodelle generiert werden kann. Die Verwendung von Ontologien ermöglicht die Formulierung allgemeiner Regeln. So wird, wie im Beispiel gesehen, dieser Regelzusammenhang zwischen Projekt, Thema und Mitarbeiter allgemein formuliert und gilt somit für alle denkbaren Kombinationen in diesem Szenario. In einem üblichen Anwendungsszenario reicht erfahrungsgemäß die Definition von 20 Regeln aus, um einen Großteil der benötigten logischen Zusammenhänge abbilden zu können. Eine Inferenzmaschine mit einer Ontologie wird als Middleware eingesetzt, um auf der informationsliefernden Ebene den Wissensfluss anzureichern [vii]. Im Folgenden wird skizziert, wie der Einsatz der vorgestellten semantischen Technologien herkömmliches Information Retrieval anreichern und somit verbessern kann. Dabei entsteht eine neue Generation an Suchanwendungen, die das Information Retrieval in ein Knowledge Retrieval überführen können, da sie den eingesetzten Kontext und somit den Anwender verstehen Ontoprise GmbH September

12 5. Knowledge Retrieval in der Anwendung Durch die Kombination der vorgestellten Ansätze des Information Retrievals (siehe Kapitel 3) mit semantischen Technologien (Kapitel 4) können erheblich verbesserte Suchergebnisse erzielt werden [viii]. Abbildung 6 zeigt, wie eine derartige Architektur aussieht. Abbildung 6: Architektur Knowledge Retrieval Verbesserte Navigation: Durch den Einsatz von Ontologien kann in einem ersten Schritt die Navigation für den Anwender vereinfacht werden (siehe Abbildung 6 oben links). Dies geschieht einerseits dadurch, dass er durch die modellierten Konzepten und deren Beziehungen einen einfachen Zugriff auf die für ihn relevanten Themen erhält. Durch die Verwendung von Synonymlisten und die thematische Einordnung wird der Nutzer automatisch zur Verwendung des für ihn relevanten Suchbegriffs geleitet. Beispiel: Gibt der Nutzer den Suchbegriff Vertrag ein, werden ihm die verschiedenen Vorkommnisse des Begriffs im Modell zur Auswahl dargestellt. Der Nutzer kann somit die Suche spezifizieren, ob er z.b. einen Vertrag mit einem Kunden oder mit einem Lieferanten sucht. Erhöhte Relevanz: 2001 Ontoprise GmbH September

13 Untersuchungen haben gezeigt, dass Anwender im Schnitt 1,6 Begriffe zur Suche in Eingabefeldern eingeben. In der semantischen Suche wird nach einer logischen Kombination der eingegebenen Begriffe, der dazugehörigen Unterbegriffe (Subkonzepte) und Synonyme gesucht. Je nach Modellierung und Komplexität des Suchthemas wird in einer üblichen semantischen Suchanfrage die Anzahl der verwendeten Begriffe vervielfacht Die durch einfache Auswahl erstellte Anfrage erhält dadurch eine ausreichende Komplexität, um die Relevanz des Ergebnisses stark zu erhöhen. Sucht der Anwender beispielsweise nach allen Marketingaktivitäten in Bezug auf ein bestimmtes Produkt eines Unternehmens, wählt er einfach die Begriffe Marketing und Produkt X aus. Die Suche wird automatisch um die Begriffe Marketing Communications, Events, Messen, Mailings, Produktmarketing, Product Marketing etc. sowie alle möglichen Vorkommnisse des Begriffes Produkt X erweitert. Der Anwender kann hierbei auch definieren, ob er gewisse Begriffe aus der Suche ausschließen will. Somit stellt der Nutzer seine Anfrage nach seinen Bedürfnissen zusammen, wobei ihm auf Grund der Komplexität der logischen Verknüpfung kein relevantes Ergebnis entgeht. Der Nutzer kann nach Erhalt des Ergebnisses durch die Auswahl eines Subkonzeptes die Suche weiter eingrenzen oder durch die Auswahl eines Superkonzeptes die Suche durch einfache Klicks ausweiten. Integration und Auswertung strukturierter Daten: Durch die Kombination einer Suchanfrage mit strukturierten Daten (Listen, Datenbanken, Metadaten) und logischen Regelzusammenhängen kann die Mächtigkeit der vorgestellten Ansätze weiter erhöht werden. Ziel ist es dabei, als Ergebnisliste keine Verweise auf Dokumente, sondern tatsächliche Wissensinhalte aus Dokumenten zu lösen und als konkrete Antworten zu präsentieren. Beispiel hierfür ist die Kombination einer Suchanfrage nach einem gewissen Thema mit einer Liste von Mitarbeitern, die aus einer beliebigen Quelle, also auch direkt aus einem Human-Ressource-System, entnommen werden kann. Als Ergebnis auf eine Anfrage nach Experten erhält der Anwender dadurch keine Dokumente, sondern eine Auswahl von Experten zum gewählten Thema mit einem Ranking. Dies geschieht entweder durch die Verwendung von Metadaten oder durch die Bildung von Kollokationen, wobei eine Kollokation eine inhaltliche Kombinierbarkeit sprachlicher Einheiten miteinander [Duden] ist. Weitere sinnvolle Kombinationsmöglichkeit gibt es z.b. zwischen Fachgebieten und Projekten, um diese inhaltlich zuordnen zu können. Ein weiterer Zusatznutzen entsteht durch die Auswertung der regelbasierten Zusammenhänge mittels Inferenzmaschine. Das implizite Wissen kann somit ebenfalls abgefragt und dargestellt werden. Somit bietet die Verknüpfung semantischer Technologien mit Information Retrieval Verfahren einen klaren Mehrwert. Die Nutzung von Knowledge Retrieval Systemen in der Praxis erzeugt qualitativ hochwertige Suchergebnisse und dadurch kürzere Suchzeiten und verringerte Redundanz in der Dokumenterstellung und Archivierung Ontoprise GmbH September

14 6. Zukunftsaussichten Durch den Einsatz von Knowledge Retrieval Technologien entwickelt sich eine neue Generation an Informationssystemen, die weit mehr leisten können als bisherige Ansätze. Neben dieser pragmatischen Verbindung von Information Retrieval Verfahren mit semantischen Technologien beschäftigen sich zahlreichen Forschungsgruppen weltweit an der Weiterentwicklung des WorldWideWeb zu einem zukünftigen Semantic Web. Unter Leitung des World Wide Web Consortiums (W3C, DAML Projekt) werden derzeit die Standards für diese neue Generation des Web gesetzt. Auch hier zählen die Modellierung von Wissensmodellen, also Ontologien und der Einsatz von Inferenzmaschinen zu den Schlüsseltechnologien, die das Semantic Web ermöglichen [ix]. Eine Folge dieser Entwicklung wird die einfache Verbindung von externer Information aus dem Semantic Web mit internem Wissen aus Intranet und File Server Dokumenten sein. Über gemeinsame Modelle können die unterschiedlichen Informationen verknüpft und ausgewertet werden. 7. Fazit Der Artikel hat gezeigt, dass die bewährten Information Retrieval Verfahren durch den Einsatz semantischer Technologien angereichert werden können. Vier wesentliche Erweiterungen zum Information Retrieval ergeben sich durch diesen neuen Ansatz: 1. Verfeinerte Suchunterstützung: der Zugriff über Keyword-basierte Suche wird über die Inferenzmaschine und die zugrunde liegende Modellierung der Ontologie erweitert und verfeinert. Begriffe können über die Ontologie automatisch mit Synonymen und verknüpften Begriffen erweitert werden. Die Suche wird dadurch intuitiver. 2. Navigationsunterstützung im Kontext: ein zusätzlicher Nutzen entsteht durch die Navigationsmöglichkeiten der Ontologie, in der Abbildung 6 schematisch oben links dargestellt. Der Nutzer kann Verfeinerungs- oder Verallgemeinerungsschritte durchführen; er wird durch seinen Suchkontext geleitet 3. Auswertung der Zusammenhänge: ein weiterer Zusatznutzen entsteht durch die Auswertung der regelbasierten Zusammenhänge mittels Inferenzmaschine. Das implizite Wissen kann somit ebenfalls abgefragt und dargestellt werden. 4. Einfache Integration strukturierter Informationsquellen: durch einfache Verknüpfungsmöglichkeiten der Ontologie mit Datenbankschemata können strukturierte Informationsquellen parallel mit Keyword-basierten Suchanfragen ausgewertet und gemeinsam als Antworten dargestellt werden. Die gezeigten Ansätze existieren und sind bereits in der Anwendung. Die Weiterentwicklung des WorldWideWeb in ein SemanticWeb, in dem Systeme alle Inhalte verstehen und interpretieren können, basiert auf diesen Technologien. Diese zukünftige Vision bietet das enorme Potential der einfachen Integration externer Informationen in interne Wissenslandschaften, abfragbar über Knowledge Retrieval Plattformen Ontoprise GmbH September

15 Quellenverzeichnis [i] Thomas H. Davenport, Laurence Prusak: Working Knowledge : How Organizations Manage What They Know, [ii] R. Dieng, O. Corby, A. Giboin, and M. Ribiere: Methods and tools for corporate knowledge management. Int. Journal of Human-Computer Studies, [iii] Salton, G./McGill, M.J.: Introduction to Modern Information Retrieval. New York: McGraw-Hill, 1984 bzw. in deuscher Übersetzung: Information Retrieval - Grundlegendes für Informationswissenschaftler (Übers.: Keitz, W.von.). Hamburg, New York: McGraw- Hill, [iv] Ram, A. and Moorman, K. (1999) Introduction: Toward a Theory of Reading and Understanding. Ed(Ram and Moorman). Bradford MIT [v] Gruber, T. R.; A translation approach to portable ontology specifications; Knowledge Acquisition; 5: S ; 1993; [vi] S. Staab and A. Maedche. Knowledge portals : ontologies at work. AI Magazine, Summer [vii] Staab, Studer, Schnurr, Sure: Knowledge processes and ontologies. In IEEE Intelligent Systems 01/ [viii] Schnurr, Staab, Studer, Stumme, Sure: Professionelles Wissensmanagement; Erfahrungen und Visionen. Shaker Verlag. Aachen [ix] Studer, Schnurr, Nierlich: Semantik für die nächste Generation Wissensmanagement, Konferenz KnowTech 2001, Dresden Ontoprise GmbH September

Die Bedeutung von Ontologien für das Wissensmanagement

Die Bedeutung von Ontologien für das Wissensmanagement Die Bedeutung von Ontologien für das Wissensmanagement Prof. Dr. Rudi Studer 1, Henrik Oppermann 2, Hans-Peter Schnurr 2 1 Institut AIFB, Universität Karlsruhe, 76128 Karlsruhe http://www.aifb.uni-karlsruhe.de/wbs

Mehr

Information Retrieval

Information Retrieval Information Retrieval 1 Information Retrieval Norbert Fuhr 13. Oktober 2011 Einführung 1 IR in Beispielen 2 Was ist IR? 3 Daten Information Wissen 4 Dimensionen des IR 5 Rahmenarchitektur für IR-Systeme

Mehr

Data Modelling versus Ontology Engineering

Data Modelling versus Ontology Engineering Data Modelling versus Ontology Engineering Ketevan Karbelashvili Seminar: Web Services and Semantic Web Inhalt Was ist Ontologie Datenmodelle vs. Ontologien Ontologie Engineering Ansatz - DOGMA Was ist

Mehr

Studienprojekt TaxoSearch Spezifikation

Studienprojekt TaxoSearch Spezifikation Studienprojekt TaxoSearch Spezifikation Semantisch gestützte Suche im Internet Lehrstuhl für Computerlinguistik Ruprecht-Karls-Universität Heidelberg WS 2002-2003 vorgestellt von Thorsten Beinhorn, Vesna

Mehr

Information Retrieval

Information Retrieval Information Retrieval Norbert Fuhr 12. April 2010 Einführung 1 IR in Beispielen 2 Was ist IR? 3 Dimensionen des IR 4 Daten Information Wissen 5 Rahmenarchitektur für IR-Systeme IR in Beispielen IR-Aufgaben

Mehr

GIN SERVER. From Data to Information. HERAUSFORDERUNG: Verteilte Daten

GIN SERVER. From Data to Information. HERAUSFORDERUNG: Verteilte Daten In der Praxis ist eine übergeordnete Sicht der Daten notwendig, um übergreifende Prozesse zu steuern und geschäftskritische Informationen zu erschließen, die sich erst aus der Kombination der Daten ergeben.

Mehr

Kompendium semantische Netze

Kompendium semantische Netze Klaus Reichenberger Kompendium semantische Netze Konzepte, Technologie, Modellierung Inhaltsverzeichnis 1 Warum dieses Buch? 1 1.1 Was erwartet Sie in diesem Buch? I 2 Grundlagen semantischer Netze 3 2.1

Mehr

Automatische Klassifikation: Stand der Technik und Veränderungen im Berufsbild des Dokumentars. Automatische Klassifikation:

Automatische Klassifikation: Stand der Technik und Veränderungen im Berufsbild des Dokumentars. Automatische Klassifikation: 02. Mai 2005 P R O J E C T C O N S U L T GmbH GmbH 1 Agenda Einführung Automatische Klassifikation Qualität Veränderung des Arbeitsumfeldes Ausblick GmbH 2 1 Einführung GmbH 3 Eine Herausforderung geordnete

Mehr

NOW YOU KNOW [ONTOS TM WHITE PAPER SERIES] Intelligentes Information Mining durch Ontologie [YVES BRENNWALD, ONTOS INTERNATIONAL AG]

NOW YOU KNOW [ONTOS TM WHITE PAPER SERIES] Intelligentes Information Mining durch Ontologie [YVES BRENNWALD, ONTOS INTERNATIONAL AG] NOW YOU KNOW [ SERIES] Intelligentes Information Mining durch Ontologie [YVES BRENNWALD, ONTOS INTERNATIONAL AG] 001 Information Mining Wissen in unstrukturierten Daten aufdecken Information Mining ist

Mehr

CyMON - SDMS. Warum SDMS? Semantisches Dokumenten Management System

CyMON - SDMS. Warum SDMS? Semantisches Dokumenten Management System CyMON - SDMS Semantisches Dokumenten Management System Warum SDMS? Die Informationsgesellschaft basiert auf schneller Verfügbarkeit und einfacher Verwendbarkeit von großen Mengen an Daten und Informationen.

Mehr

Jessica Naundorf. Kritische Analyse von. Employer Awards im Kontext. des Employer Branding

Jessica Naundorf. Kritische Analyse von. Employer Awards im Kontext. des Employer Branding Jessica Naundorf Kritische Analyse von Employer Awards im Kontext des Employer Branding Rainer Hampp Verlag München, Mering 2016 -I- Inhaltsverzeichnis Inhaltsverzeichnis Abbildungsverzeichnis Tabellenverzeichnis

Mehr

Interdisziplinäre fachdidaktische Übung: Sprache und Modelle. SS 2015: Grossmann, Jenko

Interdisziplinäre fachdidaktische Übung: Sprache und Modelle. SS 2015: Grossmann, Jenko Interdisziplinäre fachdidaktische Übung: Sprache und Modelle SS 2015: Grossmann, Jenko Einleitung Was ist ein Modell? Sprachlich orientierte Modelle Beispiele Wie entstehen Modelle? Zusammenhang Modell

Mehr

Lotus Notes als Werkzeug für das Knowledge Management

Lotus Notes als Werkzeug für das Knowledge Management Wirtschaft Andreas Schmidt Lotus Notes als Werkzeug für das Knowledge Management Diplomarbeit Lotus Notes als Werkzeug für das Knowledge Management Diplomarbeit an der Fachhochschule Kiel, Fachbereich

Mehr

Semantic Web: Das Web der nächsten Generation

Semantic Web: Das Web der nächsten Generation Semantic Web: Das Web der nächsten Generation Slim Abdennadher LMU München 8.2.2002 c S. Abdennadher 1 Einleitung Rechner erfunden als Werkzeug zur Durchführung von Berechnungen Dann entdeckt als Werkzeug

Mehr

Verbesserte Nutzbarkeit heterogener und verteilter Geodaten durch Semantische Interoperabilität

Verbesserte Nutzbarkeit heterogener und verteilter Geodaten durch Semantische Interoperabilität Verbesserte Nutzbarkeit heterogener und verteilter Geodaten durch Semantische Interoperabilität Eva Klien 7. Seminar GIS & Internet 15. bis 17. September 2004 UniBwMünchen Überblick Semantische Heterogenitätsprobleme

Mehr

1 EINLEITUNG MESSKONZEPTE UND IHRE EIGENSCHAFTEN... 7

1 EINLEITUNG MESSKONZEPTE UND IHRE EIGENSCHAFTEN... 7 Property-Based Measurement Inhaltsverzeichnis 1 EINLEITUNG... 3 2 GRUNDLEGENDE DEFINITIONEN... 4 2.1 SYSTEME UND MODULE... 4 2.2 MODULARE SYSTEME...6 3 MESSKONZEPTE UND IHRE EIGENSCHAFTEN... 7 3.1 GRÖSSE...

Mehr

1 Inhalte der Funktion Informationsmanagement

1 Inhalte der Funktion Informationsmanagement 1 1 Inhalte der Funktion Informationsmanagement Darstellung der Inhalte der Funktion Informationsmanagement und deren Bedeutung sowohl für handelnde Personen als auch in einem Unternehmen / einer Organisation.

Mehr

zu überprüfen und zu präzisieren. Dabei stehen folgende Fragestellungen im Vordergrund:

zu überprüfen und zu präzisieren. Dabei stehen folgende Fragestellungen im Vordergrund: 1. Einleitung Die Beschreibung und kritische Beurteilung von Alltagsargumentation wird durch das Wissen um häufig gebrauchte Denk- und Schlussmuster in einer Gesellschaft erleichtert. Abseits formal gültiger

Mehr

Information und Produktion. Rolland Brunec Seminar Wissen

Information und Produktion. Rolland Brunec Seminar Wissen Information und Produktion Rolland Brunec Seminar Wissen Einführung Informationssystem Einfluss des Internets auf Organisation Wissens-Ko-Produktion Informationssystem (IS) Soziotechnisches System Dient

Mehr

Suchstrategien 1: Gute Suchbegriffe

Suchstrategien 1: Gute Suchbegriffe Suchstrategien 1: Gute Suchbegriffe Literatur finden Sie problemlos zu jedem Thema. Doch ergab Ihre Recherche auch wirklich relevante Literatur für Ihre schriftliche Arbeit? Um die Sicherheit zu gewinnen,

Mehr

Information Retrieval. Peter Kolb

Information Retrieval. Peter Kolb Information Retrieval Peter Kolb Semesterplan Einführung Boolesches Retrievalmodell Volltextsuche, invertierter Index Boolesche Logik und Mengen Vektorraummodell Evaluation im IR Term- und Dokumentrepräsentation

Mehr

Von der Dokumentenverwaltung zur Wissensbasis und Semantic Enterprise Search

Von der Dokumentenverwaltung zur Wissensbasis und Semantic Enterprise Search Von der Dokumentenverwaltung zur Wissensbasis und Semantic Enterprise Search Gerhard Haberl Nutzen Funktionen Von Dokumentenverwaltung zu Wissensbasis Dokumentenverwaltung Archivierung Scannen Viewer Strukturen

Mehr

Diversifikation und Kernkompetenzen

Diversifikation und Kernkompetenzen Wirtschaft Markus Klüppel Diversifikation und Kernkompetenzen Masterarbeit RheinAhrCampus Remagen Fachbereich: Betriebs- und Sozialwirtschaft Studiengang: MBA Masterthesis Diversifikation und Kernkompetenzen

Mehr

Workshop WissKI für Uni Sammlungen. Martin Scholz , basierend auf

Workshop WissKI für Uni Sammlungen. Martin Scholz , basierend auf Workshop WissKI für Uni Sammlungen Martin Scholz 18.04.2016, basierend auf 26.11.2013 Ontologische Modellierung Was ist eine Ontologie? Terminologie Vokabular, um über Gegenstände eines Fachbereichs zu

Mehr

Case-Based Reasoning und anderen Inferenzmechanismen

Case-Based Reasoning und anderen Inferenzmechanismen Case-Based Reasoning und anderen Inferenzmechanismen Daniel Müller 21 April 2006 DM () CBR und Inferenz 21 April 2006 1 / 31 Contents 1 Einleitung 2 Inferenzmechanismen Statistische Verfahren Data Mining

Mehr

cci Wissensportal kompakt erklärt 1. Die Ampeln cci Wissensportal kompakt erklärt

cci Wissensportal kompakt erklärt 1. Die Ampeln cci Wissensportal kompakt erklärt cci Wissensportal kompakt erklärt Herzlich willkommen in cci Wissensportal. Die folgenden Abschnitte sollen helfen, Benutzern die Funktionalität der Plattform näher zu bringen und ein Verständnis für das

Mehr

XMendeL. Eine integrierte Entwicklungsumgebung für die Planung, Entwicklung und Qualitätssicherung multimedialer Lehrund Lernsysteme

XMendeL. Eine integrierte Entwicklungsumgebung für die Planung, Entwicklung und Qualitätssicherung multimedialer Lehrund Lernsysteme XMendeL Eine integrierte Entwicklungsumgebung für die Planung, Entwicklung und Qualitätssicherung multimedialer Lehrund Lernsysteme Ronald Hartwig Institut für Multimediale und Interaktive Systeme Universität

Mehr

Informationsmanagement mit Semantischen Netzen Dr. Günter Pees, SSG

Informationsmanagement mit Semantischen Netzen Dr. Günter Pees, SSG Informationsmanagement mit Semantischen Netzen Dr. Günter Pees, SSG Inhalt Problembereich Informationsmanagement Lösungsansatz: Der Einsatz semantischer Technologien Referenzbeispiele: Wirtschaft/Öffentlicher

Mehr

Vom Suchen und Finden - Google und andere Ansätze

Vom Suchen und Finden - Google und andere Ansätze Vom Suchen und Finden - Google und andere Ansätze Norbert Fuhr Universität Duisburg Essen FB Ingenieurwissenschaften Abteilung Informatik 12. Mai 2005 Gliederung 1 Einführung 2 Grundlagen 3 Erweiterte

Mehr

Enterprise Content Management für Hochschulen

Enterprise Content Management für Hochschulen Enterprise Content Management für Hochschulen Eine Infrastuktur zur Implementierung integrierter Archiv-, Dokumentenund Content-Managementservices für die Hochschulen des Landes Nordrhein Westfalen Management

Mehr

Normen. Einfach. Managen. Mit Beratung und Lösungen von Beuth.

Normen. Einfach. Managen. Mit Beratung und Lösungen von Beuth. Normen. Einfach. Managen. Mit Beratung und Lösungen von Beuth. WERK RKN KNO NOR RMEN NAN NAL LYSE DIN Software: Wir holen das Beste aus Ihren Werknormen Die Herausforderung: Werknormen effizienter suchen

Mehr

What`s in my backyard? Wie können semantische Webtechnologien die Suche nach Umweltinformationen vereinfachen?

What`s in my backyard? Wie können semantische Webtechnologien die Suche nach Umweltinformationen vereinfachen? What`s in my backyard? Wie können semantische Webtechnologien die Suche nach Umweltinformationen vereinfachen? Clemens Düpmeier, Thorsten Schlachter Arbeitsgruppe WebUIS Institut für Angewandte Informatik

Mehr

Dineso Software - Technische Daten

Dineso Software - Technische Daten Dineso Software - Technische Daten Zahlen, Daten, Fakten zu Software und Anwendung Inhaltsverzeichnis: 1. Allgemeine Informationen zur Dineso Software 2. Technische Voraussetzungen 3. Ablauf eines BI-Projektes

Mehr

Innovationslabor Semantische Integration von Webdaten

Innovationslabor Semantische Integration von Webdaten Innovationslabor Semantische Integration von Webdaten Workflow-basierte Datenintegration und Objekt-Matching Dr. Andreas Thor http://dbs.uni-leipzig.de/format Workflow-basierte Datenintegration Ausgangspunkt

Mehr

Dirk Lewandowski. Web Information Retrieval Technologien zur Informationssuche im Internet. DGI-Schrift (Informationswissenschaft 7}

Dirk Lewandowski. Web Information Retrieval Technologien zur Informationssuche im Internet. DGI-Schrift (Informationswissenschaft 7} Dirk Lewandowski Web Information Retrieval Technologien zur Informationssuche im Internet DGI-Schrift (Informationswissenschaft 7} Inhalt Vorwort 9 Suchmaschinen im Internet - informationswissenschaftlich

Mehr

Sprache systematisch verbessern. Eugen Okon

Sprache systematisch verbessern. Eugen Okon Sprache systematisch verbessern Eugen Okon Sprache systematisch verbessern Gliederung Einleitung Die CLEAR Methode CLEAR in einer Fallstudie Ergebnisse und Bewertung Zusammenfassung Sprache systematisch

Mehr

GWAVA EMEA GmbH. Die TOP 5 Funktionen von Retain. Für die Archivierung Ihrer elektronischen Kommunikation

GWAVA EMEA GmbH. Die TOP 5 Funktionen von Retain. Für die Archivierung Ihrer elektronischen Kommunikation GWAVA EMEA GmbH Die TOP 5 Funktionen von Retain Für die Archivierung Ihrer elektronischen Kommunikation Inhaltsverzeichnis 1. Deduplizierung 2. ediscovery 3. Migrationen 4. Unified Archiving 5. Compliance

Mehr

Semantic Web. Ekaterina Timofeeva & Johannes Knopp Vorlesung Information Retrieval Dr. Karin Haenelt Universität Heidelberg WS2006/07

Semantic Web. Ekaterina Timofeeva & Johannes Knopp Vorlesung Information Retrieval Dr. Karin Haenelt Universität Heidelberg WS2006/07 Semantic Web Ekaterina Timofeeva & Johannes Knopp 29.01.2007 Vorlesung Information Retrieval Dr. Karin Haenelt Universität Heidelberg WS2006/07 Semantic Web - Übersicht Was ist Semantic Web? Idee Wie funktioniert

Mehr

Kriterien zur Bewertung von Geschäftsmodellen der Industrie 4.0. Bachelorarbeit

Kriterien zur Bewertung von Geschäftsmodellen der Industrie 4.0. Bachelorarbeit Kriterien zur Bewertung von Geschäftsmodellen der Industrie 4.0 Bachelorarbeit zur Erlangung des akademischen Grades Bachelor of Science (B. Sc.) im Studiengang Wirtschaftswissenschaft der Wirtschaftswissenschaftlichen

Mehr

Konstruktion von Common Sense-Ontologien durch Analyse natürlicher Sprache

Konstruktion von Common Sense-Ontologien durch Analyse natürlicher Sprache Konstruktion von Common Sense-Ontologien durch Analyse natürlicher Sprache Bachelor of Science Abschlussarbeit Ruth Janning FernUniversität in Hagen Fakultät für Mathematik und Informatik, Lehrgebiet Wissensbasierte

Mehr

Systemgestütztes Management der IT-Sicherheit mit der GRC-Suite iris

Systemgestütztes Management der IT-Sicherheit mit der GRC-Suite iris Systemgestütztes Management der IT-Sicherheit mit der GRC-Suite iris Vorteile eines Toolgestützten Informationssicherheitsmanagements Abweichungen von den Vorgaben (Standards, Normen) werden schneller

Mehr

Boole'sches Modell <is web>

Boole'sches Modell <is web> Boole'sches Modell basiert auf Mengentheorie und Boole'scher Algebra sehr einfaches Modell mit klarer Semantik Dokumente als Mengen von Indextermen Termgewichte sind binär: im Dokument enthalten oder nicht

Mehr

Beispiele zu den Verknüpfungs-Technologien-5.3.0

Beispiele zu den Verknüpfungs-Technologien-5.3.0 5.6.4. Beispiele zu den Verknüpfungs-Technologien-5.3.0 5.6.4. Beispiele zu den Verknüpfungs-Technologien Beispiel 1: Direkte Verknüpfungs-Technologie Wenn Sie diese Verknüpfungs-Technologie zwischen einer

Mehr

Die Suche nach wissenschaftlicher Information in der Physik - nicht nur über GOOGLE

Die Suche nach wissenschaftlicher Information in der Physik - nicht nur über GOOGLE Die Suche nach wissenschaftlicher Information in der Physik - nicht nur über GOOGLE Detlef Görlitz www.physik.uni hamburg.de Die Suche nach wissenschaftlicher Information in der Physik - nicht nur über

Mehr

Ontologien und Ontologiesprachen

Ontologien und Ontologiesprachen Ontologien und Ontologiesprachen Semantische Datenintegration SoSe2005 Uni Bremen Yu Zhao Gliederung 1. Was ist Ontologie 2. Anwendungsgebiete 3. Ontologiesprachen 4. Entwicklung von Ontologien 5. Zusammenfassung

Mehr

Das Projekt Automatische Sacherschließung an der ZBW

Das Projekt Automatische Sacherschließung an der ZBW Das Projekt Automatische Sacherschließung an der ZBW Martin Toepfer (Wissenschaftlicher Mitarbeiter, M. Sc. Informatik) ZBW Leibniz-Informationszentrum Wirtschaft Workshop Computerunterstützte Inhaltserschließung

Mehr

Das C-Teile-Management bei KMU

Das C-Teile-Management bei KMU Wirtschaft Lukas Ohnhaus Das C-Teile-Management bei KMU Identifikation und Analyse der Auswahlkriterien für einen Dienstleister mittels qualitativer Marktstudie Bachelorarbeit Bibliografische Information

Mehr

Vortrag WI Führungsaufgabe. Gronau, N.: Management wissensintensiver Geschäftsprozesse als

Vortrag WI Führungsaufgabe. Gronau, N.: Management wissensintensiver Geschäftsprozesse als Universität Oldenburg Abt. Wirtschaftsinformatik Prof. Dr.-Ing. Norbert Escherweg 2 26121 Oldenburg Tel. (0441) 97 22-150 Fax (0441) 97 22-202 E-Mail:gronau@wi-ol.de www.wi-ol.de Vortrag WI - 2001-09 Norbert

Mehr

Neue Erkenntnisse aus unstrukturierten Daten gewinnen

Neue Erkenntnisse aus unstrukturierten Daten gewinnen Neue Erkenntnisse aus unstrukturierten Daten gewinnen Univ.-Prof. Dr. Josef Küng Institut für anwendungsorientierte Wissensverarbeitung (FAW) Johannes Kepler Universität Linz In Zusammenarbeit mit Mag.

Mehr

Teil 111. Chart-Parsing

Teil 111. Chart-Parsing Teil 111 Chart-Parsing 102 Die im ersten Teil des Buches behandelten einfachen Parsingalgorithmen sind, anders als die meisten vor allem im Compilerbau verwendeten Algorithmen (z.b. die LLoder LR-Parsingalgorithmen),

Mehr

Pendenzen Management

Pendenzen Management , Stoeckackerstrasse 30, CH-4142 Muenchenstein Ph:++41 (0) 61 413 15 00, Fax:++41 (0) 61 413 15 01 http://www.e-serve.ch, email:crm@e-serve.ch e-serve PendenzenManagement Version 7.1: e-serve UPSM Pendenzen

Mehr

Blue Collar 2.0 Kritische Erfolgsfaktoren zur Einbindung von Produktionsmitarbeitern in Soziale Unternehmensnetzwerke.

Blue Collar 2.0 Kritische Erfolgsfaktoren zur Einbindung von Produktionsmitarbeitern in Soziale Unternehmensnetzwerke. Blue Collar 2.0 Kritische Erfolgsfaktoren zur Einbindung von Produktionsmitarbeitern in Soziale Unternehmensnetzwerke Bachelorarbeit zur Erlangung des akademischen Grades Bachelor of Science (B. Sc.) im

Mehr

Lösungskonzept Patentrecherche... Version 1.0

Lösungskonzept Patentrecherche... Version 1.0 Lösungskonzept Patentrecherche... Version 1.0 1 Inhalt 1 Fachliche Anforderungen 3 2 Fachliche Lösung 3 3 Technische Umsetzung 4 3.1 Client 4 3.2 Analyser Tasks 5 3.3 Event Listener 5 3.4 Content Provider

Mehr

Informationen effizienter nutzen durch Semantische Informationsstrukturen

Informationen effizienter nutzen durch Semantische Informationsstrukturen Informationen effizienter nutzen durch Semantische Informationsstrukturen Organisation Norbert Mertes Informationen Dr. Günter Pees Senior Consultant Schneider System GmbH Berlin, 19. Mai 2005 Qualifizierung

Mehr

Wissensmanagement und Innovation

Wissensmanagement und Innovation Wissensmanagement und Innovation Referenzmodellierung zur Prozessoptimierung im Business-to-Business-Marketing von Dr. Paul Nikodemus Inhaltsverzeichnis Vorwort I Einführung l 1 Problemstellung 1 2 Zielbeschreibung

Mehr

Kapitel 1. Aussagenlogik

Kapitel 1. Aussagenlogik Kapitel 1 Aussagenlogik Einführung Mathematische Logik (WS 2012/13) Kapitel 1: Aussagenlogik 1/17 Übersicht Teil I: Syntax und Semantik der Aussagenlogik (1.0) Junktoren und Wahrheitsfunktionen (1.1) Syntax

Mehr

Ein Content Delivery Portal für beliebige CMS und weitere Datenquellen

Ein Content Delivery Portal für beliebige CMS und weitere Datenquellen Ein Content Delivery Portal für beliebige CMS und weitere Datenquellen Christian Mäder, Senior Sales Manager, Empolis Information Management GmbH Content Delivery Symposium, Stuttgart, 27.09.2016 Seite

Mehr

Die Anfänge der Logik

Die Anfänge der Logik Die Anfänge der Logik Die Entwicklung des logischen Denkens vor Aristoteles Holger Arnold Universität Potsdam, Institut für Informatik arnold@cs.uni-potsdam.de Grundfragen Was ist Logik? Logik untersucht

Mehr

Federated Search: Integration von FAST DataSearch und Lucene

Federated Search: Integration von FAST DataSearch und Lucene Federated Search: Integration von FAST DataSearch und Lucene Christian Kohlschütter L3S Research Center BSZ/KOBV-Workshop, Stuttgart 24. Januar 2006 Christian Kohlschütter, 24. Januar 2006 p 1 Motivation

Mehr

Unterstützung des Wissensmanagements durch Informations- und Kommunikationstechnologie

Unterstützung des Wissensmanagements durch Informations- und Kommunikationstechnologie Unterstützung des Wissensmanagements durch Informations- und Kommunikationstechnologie Thorsten Wolf SAP AG Stefan Decker Institut für Angewandte Informatik und formale Beschreibungsverfahren (AIFB) Universität

Mehr

SemTalk Services Stand: September 2015

SemTalk Services Stand: September 2015 SemTalk Services Stand: Was sind SemTalk Services? Navigation, Suche, Kommentierung, Reporting und andere Funktionalitäten über eine große Menge von Prozessen, Objekten und Dokumenten in veröffentlichten

Mehr

Inhalt. Vorwort. Inhalt VII

Inhalt. Vorwort. Inhalt VII Vorwort V Inhalt VII 1 Einleitung 1 1.1 Entwicklungsgeschichte 1 1.2 Begriffsklärungen 3 1.2.1 Web 2.0 3 1.2.2 Social Software und Web 2.0 im Unternehmen 4 1.2.3 Enterprise 2.0, Knowledge Management 2.0

Mehr

Einführung in das Semantic Web

Einführung in das Semantic Web Einführung in das Semantic Web E-Government Workshop Freie Universität Bozen 14. Februar 2003 Raphael Volz FZI & Institut AIFB (Prof. Studer) Universität Karlsruhe (TH) 1 Agenda Eine Problemstellung im

Mehr

Wissenschaftliches Arbeiten und Informationskompetenz in den Wirtschaftswissenschaften (2a)

Wissenschaftliches Arbeiten und Informationskompetenz in den Wirtschaftswissenschaften (2a) Wissenschaftliches Arbeiten und Informationskompetenz in den Wirtschaftswissenschaften (2a) Schlüsselqualifikationen für Bachelor-Studierende (Ergänzungsbereich Modul E1) SoSe 2011 Alexander Holste / Schreibwerkstatt/Universitätsbibliothek

Mehr

Simullda. Structured Interlingua MultiLingual Lexical Database Application. Sonja Weber

Simullda. Structured Interlingua MultiLingual Lexical Database Application. Sonja Weber Simullda Structured Interlingua MultiLingual Lexical Database Application Sonja Weber 1 Gliederung Background Begriffsklärung Multilinguale Datenbanken WordNet Maschinelle Übersetzung Formale Begriffsanalyse

Mehr

Semantische Netze zur Erfassung und Verarbeitung von. Informationen und Wissen in der Produktentwicklung

Semantische Netze zur Erfassung und Verarbeitung von. Informationen und Wissen in der Produktentwicklung Universität des Saarlandes Schriftenreihe Produktionstechnik Herausgeber: D. Bahre und H. Bley Band 49 Ж Jan Conrad Semantische Netze zur Erfassung und Verarbeitung von Informationen und Wissen in der

Mehr

Wissensmanagement für die vernetzte Verwaltung Alexandra South

Wissensmanagement für die vernetzte Verwaltung Alexandra South Wissensmanagement für die vernetzte Verwaltung Alexandra South Staatskanzlei Schleswig-Holstein Zentrales Organisationsmanagement/ Ressortübergreifende Organisationsangelegenheiten Herausforderungen Demografischer

Mehr

7 Hypothesendiskussion

7 Hypothesendiskussion 7 287 Ausgehend von der Erörterung der theoretischen Grundlagen wissensintensiver Kooperationen320 wurden durch den Autor, in Verbindung mit einer Analyse und Darstellung der dem Einsatz aktiver Dokumente

Mehr

EriZone Release Notes Version 5. Process Management. Service Asset & Configuration Management

EriZone Release Notes Version 5. Process Management. Service Asset & Configuration Management EriZone Release Notes Version 5 s Service Catalogue i Process t Incident d Service Level a Service Asset & Configuration 5 p r ezou Dieses Dokument enthält eine Aufstellung der neuen Funktionen und der

Mehr

Caliph & Emir. Retrieval und Annotation von digitalen Photos mit MPEG-7. Mathias Lux

Caliph & Emir. Retrieval und Annotation von digitalen Photos mit MPEG-7.  Mathias Lux Caliph & Emir Retrieval und Annotation von digitalen Photos mit MPEG-7 Mathias Lux mlux@know-center.at - gefördert durch das Kompetenzzentrenprogramm Overview Einleitung Geschichtliches Annotation mit

Mehr

Semantisches Geschäftsprozessmanagement Übung 1

Semantisches Geschäftsprozessmanagement Übung 1 Matthias Dräger 0.05.20 Markus Bischoff Semantisches Geschäftsprozessmanagement Übung Aufgabe : ) Vorteile von BPM und Modellierung - Modellierung zum besseren Verständnis eines Systems / eines Geschäftsprozesses

Mehr

Kapitel IR:II. II. Grundlagen des Information Retrieval. Retrieval-Evaluierung Indexterme

Kapitel IR:II. II. Grundlagen des Information Retrieval. Retrieval-Evaluierung Indexterme Kapitel IR:II II. Grundlagen des Information Retrieval Retrieval-Evaluierung Indexterme IR:II-1 Basics STEIN 2005-2010 Batch-Mode-Retrieval einmaliges Absetzen einer Anfrage; nur eine Antwort wird geliefert

Mehr

Darstellung von Ontologien im Semantic Web - RDFS-

Darstellung von Ontologien im Semantic Web - RDFS- Darstellung von Ontologien im Semantic Web - RDFS- Cristina Vertan Inhalt Was kann man mit RDF nicht ausdrücken? Was sind Ontologien? Wie entwirft man eine Ontologie? Wie beschreibt man eine Ontologie

Mehr

Weil die Informationen eines Unternehmens Strukturen brauchen

Weil die Informationen eines Unternehmens Strukturen brauchen koviko Online-Redaktion Wissen in Content verwandeln Weil die Informationen eines Unternehmens Strukturen brauchen Die Architektur eines Informationsspeichers ist entscheidend. Greifen Baumstruktur und

Mehr

Einführung in das Forschungsinformationssystem VIVO Hands-On-Lab auf dem 6. Deutschen Bibliothekartag

Einführung in das Forschungsinformationssystem VIVO Hands-On-Lab auf dem 6. Deutschen Bibliothekartag Einführung in das Forschungsinformationssystem VIVO Hands-On-Lab auf dem 6. Deutschen Bibliothekartag Martin Barber; Christian Hauschke; Tatiana Walther Technische Informationsbibliothek (TIB) Frankfurt

Mehr

[Arbeiten mit dem Nvu Composer]

[Arbeiten mit dem Nvu Composer] Eine neue Seite erstellen Beim Start des Composers steht automatisch eine neue Composer-Seite zur Verfügung, die direkt verwendet werden kann. Über Datei > Neu > Composer-Seite kann jederzeit eine neue

Mehr

Erweitertes boolsches Retrieval

Erweitertes boolsches Retrieval Erweitertes boolsches Retrieval In diesem Unterabschnitt werden andere Ansätze zur Verbesserung des boolschen Retrievals vorgestellt. Im Gegensatz zum Vektorraummodell wird bei diesen Ansätzen versucht,

Mehr

LLVM$ $EINE$ (KURZE)$ EINFÜHRUNG$

LLVM$ $EINE$ (KURZE)$ EINFÜHRUNG$ LLVM$ $EINE$ (KURZE)$ EINFÜHRUNG$ oderwieichlernteeinencompilerzubauen MarkusDöring-SteffenWeber-MarcelWiaterek-AlexanderZautke Inhaltsverzeichnis. LLVM Eine(kurze)Einführung...3 Entstehungsgeschichte...3

Mehr

Entwicklung von Ontologien unter Berücksichtigung der Anforderungen aus der Domäne Gefahrgutlogistik

Entwicklung von Ontologien unter Berücksichtigung der Anforderungen aus der Domäne Gefahrgutlogistik Entwicklung von Ontologien unter Berücksichtigung der Anforderungen aus der Domäne Gefahrgutlogistik Zusammenfassung der Diplomarbeit Autor: Betreuer: Prüfer: Dipl. Wirt. Inf. Sebastian Roland Dipl. Inf.

Mehr

Interoperabilität heterogener Informationsquellen im Gesundheitswesen auf Grundlage von Standards für die medizinische Kommunikation und Dokumentation

Interoperabilität heterogener Informationsquellen im Gesundheitswesen auf Grundlage von Standards für die medizinische Kommunikation und Dokumentation Interoperabilität heterogener Informationsquellen im Gesundheitswesen auf Grundlage von Standards für die medizinische Kommunikation und Dokumentation Disputation 3..2005 Herausforderung Ich habe Probleme

Mehr

DWH Automatisierung mit Data Vault 2.0

DWH Automatisierung mit Data Vault 2.0 DWH Automatisierung mit Data Vault 2.0 Andre Dörr Trevisto AG Nürnberg Schlüsselworte Architektur, DWH, Data Vault Einleitung Wenn man die Entwicklung von ETL / ELT Prozessen für eine klassische DWH Architektur

Mehr

bmbwf.gv.at Eduthek Betaversion Redaktionsteam Eduthek Eisenstadt,

bmbwf.gv.at Eduthek Betaversion Redaktionsteam Eduthek Eisenstadt, Eduthek Betaversion Redaktionsteam Eduthek Eisenstadt, 11.10.2018 Was ist die Eduthek? Eduthek Betaversion 2 Zielsetzung Verbesserung und Erweiterung des Zugangs von österreichischen Lehrpersonen zu digitalen

Mehr

!!!!T!!! Systems!() Multimedia Solutions

!!!!T!!! Systems!() Multimedia Solutions Inhalt. Was ist das semantische Web? Wie findet man einen Arzttermin mit Hilfe des semantischen Web? Wie gibt man Inhalten einen Sinn? Welche Werkzeuge stehen zur Verfügung? Wo können strukturierte Inhalte

Mehr

Der semantische Discovery Service YEWNO - ein Pilotprojekt an der Bayerischen Staatsbibliothek. Dr. Berthold Gillitzer Bayerische Staatsbibliothek

Der semantische Discovery Service YEWNO - ein Pilotprojekt an der Bayerischen Staatsbibliothek. Dr. Berthold Gillitzer Bayerische Staatsbibliothek 1 Der semantische Discovery Service YEWNO - ein Pilotprojekt an der Bayerischen Staatsbibliothek Dr. Berthold Gillitzer Bayerische Staatsbibliothek Bibliotheken und die digitale Welt sind wir schon angekommen?

Mehr

ITIL Practitioner Prüfungsübersicht und Lehrplan für Kandidaten. AXELOS.com. März 2017 VERTRAULICHE INFORMATIONEN

ITIL Practitioner Prüfungsübersicht und Lehrplan für Kandidaten. AXELOS.com. März 2017 VERTRAULICHE INFORMATIONEN ITIL Practitioner Prüfungsübersicht und AXELOS.com März 2017 2 Prüfungsübersicht und VERTRAULICHE Inhaltsverzeichnis 1 Einführung 3 2 ITIL Practitioner-Prüfungsübersicht 4 3 5 VERTRAULICHE Prüfungsübersicht

Mehr

Anforderungen an die Workflow-Unterstützung für wissensintensive Geschäftsprozesse

Anforderungen an die Workflow-Unterstützung für wissensintensive Geschäftsprozesse Anforderungen an die Workflow-Unterstützung für wissensintensive Geschäftsprozesse - Sven Schwarz - DFKI GmbH Forschungsgruppe Wissensmanagement 14. März 2001 1 Gliederung des Vortrags Motivation: Wissensintensive

Mehr

Gliederung. 1. Kurzeinstieg 2. Warum ist die Semantik so wichtig? 3. OWL 4. GO 5. Übersetzung 6. Zusammenfassung 7. Quellen

Gliederung. 1. Kurzeinstieg 2. Warum ist die Semantik so wichtig? 3. OWL 4. GO 5. Übersetzung 6. Zusammenfassung 7. Quellen Gliederung Gliederung 1. Kurzeinstieg 2. Warum ist die Semantik so wichtig? 3. OWL 4. GO 5. Übersetzung 6. Zusammenfassung 7. Quellen Marcus Lechner - Institut für Informatik Seite 1 Kurzeinstieg 1. Kurzeinstieg

Mehr

Leistungsmerkmale der Analyse-Software Anna4 in Abhängigkeit von TK-Systemen (Standalone) 1 Beschreibung Leistungsmerkmale... 2

Leistungsmerkmale der Analyse-Software Anna4 in Abhängigkeit von TK-Systemen (Standalone) 1 Beschreibung Leistungsmerkmale... 2 Leistungsmerkmale der in Abhängigkeit von TK-Systemen (Standalone) Inhalt 1 Beschreibung Leistungsmerkmale... 2 2 Abhängigkeiten von TK-Systeme und mögliche Einschränkungen... 2 3 Leistungsmerkmale TK-Systeme

Mehr

Hello, DYONIPOS! Vom Forschungsprojekt zum praktischen Einsatz: ein Statusbericht. IRIS 2009 Semantik pro(du a)ktiv: Wissen, nicht managen!

Hello, DYONIPOS! Vom Forschungsprojekt zum praktischen Einsatz: ein Statusbericht. IRIS 2009 Semantik pro(du a)ktiv: Wissen, nicht managen! Hello, DYONIPOS! Vom Forschungsprojekt zum praktischen Einsatz: ein Statusbericht IRIS 2009 Semantik pro(du a)ktiv: Wissen, nicht managen! Josef Makolm [BMF] Doris Ipsmiller [m2n] Agenda Warum DYONIPOS?

Mehr

Ontologien. Institut AIFB, Universität Karlsruhe, D Karlsruhe

Ontologien. Institut AIFB, Universität Karlsruhe, D Karlsruhe Ontologien,3 Alexander Mädche,, Steffen Staab,,,3 Rudi Studer Institut AIFB, Universität Karlsruhe, D-768 Karlsruhe http://www.aifb.uni-karlsruhe.de/wbs Ontoprise GmbH, Haid-und-Neu Straße 7, 763 Karlsruhe

Mehr

BibSpider Eine neue Recherchemethode für Schlagwort- und Titelsuche

BibSpider Eine neue Recherchemethode für Schlagwort- und Titelsuche know-how innovation BibSpider Eine neue Recherchemethode für Schlagwort- und Titelsuche 05.09.2018, Adriano Meyer Broyn solution Zielsetzungen Zusammenspiel von Titeln und Inhaltserschliessung besser verstehen.

Mehr

Vorlesung Information Retrieval Wintersemester 04/05

Vorlesung Information Retrieval Wintersemester 04/05 Vorlesung Information Retrieval Wintersemester 04/05 14. Oktober 2004 Institut für Informatik III Universität Bonn Tel. 02 28 / 73-45 31 Fax 02 28 / 73-43 82 jw@informatik.uni-bonn.de 1 Themenübersicht

Mehr

Simulation als epistemologische Grundlage für intelligente Roboter

Simulation als epistemologische Grundlage für intelligente Roboter 1 Simulation als epistemologische Grundlage für intelligente Roboter Andreas Tolk The MITRE Corporation Umut Durak Deutsches Zentrum für Luft- und Raumfahrt e.v. (DLR) Public Release No. 17-0085 2017 The

Mehr

Unternehmensdokumente mit dem XML Publisher erzeugen

Unternehmensdokumente mit dem XML Publisher erzeugen Unternehmensdokumente mit dem XML Publisher erzeugen Jürgen Menge TSBU Middleware ORACLE Deutschland GmbH XML-Publisher Moderne Lösung zur Entwicklung und Verteilung von Geschäftsdokumenten (Output Management)

Mehr