Hauptseminar Information Retrieval. S. Friedrich und M. Häsner

Größe: px
Ab Seite anzeigen:

Download "Hauptseminar Information Retrieval. S. Friedrich und M. Häsner"

Transkript

1 Hauptseminar Information Retrieval S. Friedrich und M. Häsner 11. Januar 2010

2 1. Einleitung 2. QA-Modell 3. Modifikationen 4. Eigene Implementierung 5.

3

4 Aktuell: Benutzer sucht Informationen und erhält Menge von Dokumenten als Ergebnis (z. B. Suchmachine) Benutzer muss anschließend Ergebnisdokumente selbst auswählen und durchsuchen Idee: direkte Antwort als Ergebnis auf Benutzerfrage liefern

5 erwartet Frage von Benutzer in natürlicher Sprache als Eingabe sucht in großem Dokumentenpool nach passender Antwort präsentiert Benutzer Antwort als Ausgabe Ja/Nein bis komplexe Antworten möglich The Baseball System (1963) erstes Question Answering (QA) System

6 Information Access Systems: Question Answering System Information Retrieval System (z. B. Internet- Suchmaschinen) Natural Language Interface To Database Information Extraction System

7 Closed Domain: spezielle Wissensbasis, Korpus Beispiel: Militär (TARA - Terrorism Activity Resource Application) Anna von IKEA (Webseite) Open Domain: World Wide Web Beispiel: neue Generation von Suchmachine

8

9 Basis der meisten QA Systeme 3 Hauptkomponenten Frageverarbeitung Dokumentenverarbeitung Integration eines Information Retrieval Moduls Antwortverarbeitung

10

11 Vorverarbeitung: Annotation, Chunking, Named Entity Recognition, Stemming, Entfernung von Stoppwörtern

12

13

14 Anpassung der Query in Bezug auf Fragetyp Hinzufügen weiterer Begriffe Gewichten der verschiedenen Begriffe in der Query

15 Extraktion von Fakten aus Dokumentenpool Integration eines Information Extraction Moduls Sicherung in separater Fakten-Datenbank Suche erst in Fakten-Datenbank Verwendung externer Dokumenten pools Internetsuchmaschinen, Internetdatenbanken Ausnutzung von Antwortredundanz, strukturierten Informationen Verbesserte Präzision + Recall

16 Magisterarbeit Semantische Agenten im Information Retrieval von W. Wagner: Dokumentenverarbeitung auf Grundlage vom Semantic Web Verarbeitung durch Semantische Agenten Ontologien für Vokabular der Webseiten (Wissen, Zusammenhänge) Webseiten mit RDF annotiert (Metainformationen)

17 Semantische Agenten im Information Retrieval von W. Wagner (Fortsetzung): Umfeld: Hobbygärtnerei Semantischer Agent: sucht für Eingabe (Gemüse, Jahr) Informationen (Saatzeit, Standort, Boden, ) betrachtet annotierte Webseiten zieht auf Grundlage von Ontologien Schlussfolgerungen

18 Assoziierung von Fragetypen mit Liste von Antwortmustern z. B. Wann wurde X geboren? [Personenname], * [Geburtsdatum] Manuelle Erzeugung aus Dokumentenpool Automatisches Lernen aus großen Korpora

19 Verwendung von 3-Tupel Syntaktische Beziehungen in der Form <Kopf, Beziehung,Modifizierer> z. B. <hat, Subjekt, Merkel> Anzahl übereinstimmender 3-Tupel zwischen Frage und Antwortkandidat für Score

20

21 Programmiersprache: PHP Implementierte Komponenten: Schlüsselwortermittlung: Alle Nomen, Verben, Adjektive aus Frage als Schlüsselwort Verwendung von Part-Of-Speech Tagger Vergabe von Gewichten an Schlüsselwörter, stärkere Gewichtung der Verben Dokumentenpool: Verwendung von Biografien als Dokumente Aufsplittung der Dokumente in Sätze (= Dokumentenpool)

22 Implementierte Komponenten: Information Retrieval Komponente: Basiert auf Vektormodell Query entspricht Schlüsselwörter der Frage Ermittlung der für die Query relevanten Sätze aus Dokumentenpool Antwortverarbeitung: Ermittlung des Antworttyps anhand des Fragewortes Who, Whom = Person, Where = Ort, When = Zeit Person, Ort, Zeit = Entitäten

23 Implementierte Komponenten: Antwortverarbeitung (Fortsetzung): Ermittlung der Antwortkandidaten aus der Ausgabe der IR Komponente Müssen gesuchte Entität enthalten Verwendung von Stemming Berechnung des Score für jeden Antwortkandidaten Score = Summe der Gewichte der im Antwortkandidaten enthaltenen Schlüsselwörter Ranking der Antwortkandidaten nach Score Ausgabe der gesuchten Entität des besten Antwortkandidaten

24 Vorverarbeitung der Dokumente wichtig Anaphern + Ellipsen + Synonyme erschweren Antwortsuche Auswahl Entität bzgl. Antworttyp ungenau Auswahl von Constraints schwierig: Welche Schlüsselwörter? Schlüsselwörter gewichten?

25 Qualität der Antwort des QA Systems von der Arbeit vieler Komponenten abhängig Neue Dokumente höherer Recall, aber niedrigere Präzision Schwerpunkt der Implementierung: Abgleich zwischen Frage + Antwortkandidaten

26

27 Erreichung einer hohen Präzision der Antwort Beispiel: Webclopedia Frage: Where do lobsters like to live? Antwort: on a Canadian airline Ursprung: First-class passengers on a Canadian airline will have to live with lobster and filet mignon now that pate de foie gras is being dropped from the menu, an animal rights group said.

28 Erreichung eines hohen Recalls der Antwort Gefahr: Erhöhung der Präzision Verringerung des Recalls Effizienz der Antwortfindung z. B. durch geeignete Vorverarbeitung des Dokumentenpools

29 Umgang mit komplexen Fragen + Antworten z. B. Warum-, Wie-Fragen z. B. Definition als Antwort Interaktives QA System Dialog zwischen Benutzer + System Berücksichtigung des Fragekontexts wichtig Spracheingabe der Frage Integration eines Spracherkennungsmoduls

30

31 Wagner, Wiebke: Semantische Agenten im Information Retrieval, Universität Heidelberg, Magisterarbeit, URL Zugriffsdatum: Fliedner, Gerhard: Linguistically Informed Question Answering, Universität Saarbrücken, Dissertation, Hirschman, Lynette; Gaizauskas, Robert: Natural language question answering: the view from here, Natural Language Engineering 7, p Cambridge University Press, URL Zugriffsdatum: Narayanan, Srini; Harabagui, Sanda: Question Answering Based on Semantic Structures, The 20th International Conference on Computational Linguistics (COLING), URL Zugriffsdatum: Hermjakob, Ulf; Hovy, Eduard H.;Lin, Chin-Yew: Knowledge-Based Question Answering, TREC-2000, URL pdf Zugriffsdatum: Sinha, Steven; Narayanan, Srini: Model-based Answer Selection, Proceedings of Workshop on Textual Inference for Question Answering at the 20th National Conference on Artificial Intelligence, URL Zugriffsdatum: USC Information Sciences Institute: Question: Does Webclopedia have any sense of humor? URL Zugriffsdatum: Lin, Jimmy; Katz, Boris: Question Answering Techniques for the World Wide Web. URL Zugriffsdatum: Burger, John et. al.: Issues, Tasks and Program Structures to Roadmap Research in Question & Answering (Q&A). URL Zugriffsdatum: Op den Akker, Rieks; Bunt, Harry; Keizer, Simon; Van Schooten, Boris: From Question Answering to Spoken Dialogue: Towards an Information Search Assistant for Interactive Multimodal Information Extraction URL Zugriffsdatum:

Question Answering mit Support Vector Machines

Question Answering mit Support Vector Machines Question Answering mit Support Vector Machines Sabrina Stehwien 30.01.2012 HS Information Retrieval Dozentin: Karin Haenelt Überblick 1. Question Answering Systeme 2. Das SAIQA-II QA-System 3. Support

Mehr

Information Retrieval und Question Answering

Information Retrieval und Question Answering und Question Answering Kai Kugler 19. November 2009 Auffinden von relevantem Wissen Die Relevanz der aufzufindenden Information ist abhängig vom... aktuellen Wissen des Benutzers dem aktuellen Problem

Mehr

Information Retrieval und Question Answering Universität Trier LDV/CL WS 2009/2010 HS Dialogsysteme Kai Kugler

Information Retrieval und Question Answering Universität Trier LDV/CL WS 2009/2010 HS Dialogsysteme Kai Kugler Information Retrieval und Question Answering Universität Trier LDV/CL WS 2009/2010 HS Dialogsysteme Kai Kugler (kugl2203@uni-trier.de) 1 Information Retrieval Information Retrieval (IR) ist das maschinelle,

Mehr

Implementierung eines Vektormodells

Implementierung eines Vektormodells Implementierung eines Vektormodells Hauptseminar Information Retrieval WS 2013/14 Dr. Karin Haenelt Amol Phadke, Mirjam Eppinger Institut für Computerlinguistik Ruprecht-Karls-Universität Heidelberg 03.02.2014

Mehr

Entity Search. Michel Manthey Arne Binder 2013

Entity Search. Michel Manthey Arne Binder 2013 Entity Search Michel Manthey Arne Binder 2013 Gliederung Idee Herausforderungen Allgemeine Herangehensweise Möglichkeiten und angewandte Verfahren Ausblick Quellen Idee Bisher: Suche nach Dokumenten, die

Mehr

Information Retrieval and Semantic Technologies

Information Retrieval and Semantic Technologies Information Retrieval and Semantic Technologies Gerhard Wohlgenannt 6. April 2013 Inhaltsverzeichnis 1 Informationen zur Lehrveranstaltung 2 1.1 Inhalt................................... 2 2 Unterlagen

Mehr

Studienprojekt TaxoSearch Spezifikation

Studienprojekt TaxoSearch Spezifikation Studienprojekt TaxoSearch Spezifikation Semantisch gestützte Suche im Internet Lehrstuhl für Computerlinguistik Ruprecht-Karls-Universität Heidelberg WS 2002-2003 vorgestellt von Thorsten Beinhorn, Vesna

Mehr

Hauptseminar Information Retrieval. Karin Haenelt Vorschläge für Seminarprojekte

Hauptseminar Information Retrieval. Karin Haenelt Vorschläge für Seminarprojekte Hauptseminar Information Retrieval Vorschläge für Seminarprojekte Karin Haenelt 17.10.2010 Projektarten Implementierungsprojekte: Standardalgorithmen Modellierungsexperimente Vorhandene Werkzeuge studieren,

Mehr

WEDKEX. Web-based Engineering Design Knowledge EXtraction. Frank Heyen, Janik M. Hager, Steffen M. Schlinger B.Sc. Informatik

WEDKEX. Web-based Engineering Design Knowledge EXtraction. Frank Heyen, Janik M. Hager, Steffen M. Schlinger B.Sc. Informatik WEDKEX Web-based Engineering Design Knowledge EXtraction Frank Heyen, Janik M. Hager, Steffen M. Schlinger B.Sc. Informatik Motivation Suche nach besseren Komponenten für ein vorhandenes System [HW] 2

Mehr

Anwendungen der KI / SoSe 2018

Anwendungen der KI / SoSe 2018 Anwendungen der KI / SoSe 2018 Organisatorisches Prof. Dr. Adrian Ulges Angewandte Informatik / Medieninformatik / Wirtschaftsinformatik / ITS Fachbereich DSCM Hochschule RheinMain KursWebsite: www.ulges.de

Mehr

Universität Ulm Abteilung Künstliche Intelligenz. ExtrAns. Verarbeitung natürlicher, schriftlicher Sprache. C. Bohnacker

Universität Ulm Abteilung Künstliche Intelligenz. ExtrAns. Verarbeitung natürlicher, schriftlicher Sprache. C. Bohnacker UNIVERSITÄT ULM SCIENDO DOCENDO CURANDO Universität Ulm Abteilung Künstliche Intelligenz ExtrAns Verarbeitung natürlicher, schriftlicher Sprache C. Bohnacker Überblick Motivation Einleitung Eigenschaften

Mehr

Swoogle. Patrice Matthias Brend amour

Swoogle. Patrice Matthias Brend amour Swoogle Finding and Ranking Knowledge on the Semantic Web Patrice Matthias Brend amour Fachbereich Informatik und Informationswissenschaft Universität Konstanz Kurs: Web Services and Semantic Web Datum:

Mehr

Semantic Role Labeling im modernen Text-Analyse-Prozess

Semantic Role Labeling im modernen Text-Analyse-Prozess Semantic Role Labeling im modernen Text-Analyse-Prozess Bastian Haarmann info@bastianhaarmann.de http://www.bastianhaarmann.de Agenda I Text-Analyse-Prozesse 1. Motivation 2. Informationsextraktion 3.

Mehr

Dependency-Based Construction of Semantic Space Models ( Padó, Lapata 2007) Distributionelle Semantik WS 11/

Dependency-Based Construction of Semantic Space Models ( Padó, Lapata 2007) Distributionelle Semantik WS 11/ Dependency-Based Construction of Semantic Space Models ( Padó, Lapata 2007) Distributionelle Semantik WS 11/12 21.11.2011 Lena Enzweiler 1 Was ist das Problem? Wortbasierte Vektormodelle betrachten nur

Mehr

Automatische Rekonstruktion und Spezifizierung von Attributnamen in Webtabellen

Automatische Rekonstruktion und Spezifizierung von Attributnamen in Webtabellen Automatische Rekonstruktion und Spezifizierung von Attributnamen in Webtabellen Mark Reinke Bachelorarbeit TU Dresden 17. Februar 2014 Webtabellen Warum sind Webtabellen von Bedeutung? Sie können relationale

Mehr

Semantik in Suchmaschinen Beispiele. Karin Haenelt 7.12.2014

Semantik in Suchmaschinen Beispiele. Karin Haenelt 7.12.2014 Semantik in Suchmaschinen Beispiele Karin Haenelt 7.12.2014 Inhalt Google Knowledge Graph Freebase schema.org 2 Google Knowledge Graph Zuordnung von Suchtermen zu Weltentitäten Darstellung von Zusammenhängen

Mehr

Automatische Textzusammenfassung

Automatische Textzusammenfassung Ruprecht Karls Universität Heidelberg Lehrstuhl für Computerlinguistik HS Information Retrieval Automatische Textzusammenfassung Referat von Elena Loupanova 23.01.2006 Definition Textzusammenfassung The

Mehr

Erkennung und Visualisierung attribuierter Phrasen in Poetiken

Erkennung und Visualisierung attribuierter Phrasen in Poetiken Erkennung und Visualisierung attribuierter Phrasen in Poetiken Andreas Müller (1) Markus John (2) Steffen Koch (2) Thomas Ertl (2) Jonas Kuhn (1) (1), Universität Stuttgart (2) Institut für Visualisierung

Mehr

Kapitel IR:II. II. Grundlagen des Information Retrieval. Retrieval-Evaluierung Indexterme

Kapitel IR:II. II. Grundlagen des Information Retrieval. Retrieval-Evaluierung Indexterme Kapitel IR:II II. Grundlagen des Information Retrieval Retrieval-Evaluierung Indexterme IR:II-1 Basics STEIN 2005-2010 Batch-Mode-Retrieval einmaliges Absetzen einer Anfrage; nur eine Antwort wird geliefert

Mehr

Technische Universität Kaiserslautern Lehrstuhl für Virtuelle Produktentwicklung

Technische Universität Kaiserslautern Lehrstuhl für Virtuelle Produktentwicklung functions in SysML 2.0 La Jolla, 22.05.2014 12/10/2015 Technische Universität Kaiserslautern Lehrstuhl für Virtuelle Produktentwicklung Dipl. Wirtsch.-Ing. Christian Muggeo Dipl. Wirtsch.-Ing. Michael

Mehr

Semantic Web. Ekaterina Timofeeva & Johannes Knopp Vorlesung Information Retrieval Dr. Karin Haenelt Universität Heidelberg WS2006/07

Semantic Web. Ekaterina Timofeeva & Johannes Knopp Vorlesung Information Retrieval Dr. Karin Haenelt Universität Heidelberg WS2006/07 Semantic Web Ekaterina Timofeeva & Johannes Knopp 29.01.2007 Vorlesung Information Retrieval Dr. Karin Haenelt Universität Heidelberg WS2006/07 Semantic Web - Übersicht Was ist Semantic Web? Idee Wie funktioniert

Mehr

Inhaltsverzeichnis. Geleitwort. Abbildungsverzeichnis. Tabellenverzeichnis. Abkürzungsverzeichnis. Symbolverzeichnis

Inhaltsverzeichnis. Geleitwort. Abbildungsverzeichnis. Tabellenverzeichnis. Abkürzungsverzeichnis. Symbolverzeichnis Inhaltsverzeichnis Geleitwort Vorwort Abbildungsverzeichnis Tabellenverzeichnis Abkürzungsverzeichnis Symbolverzeichnis i iü xi xiii xv xvii 1 Einleitung 1 1.1 Problemstellung 1 1.2 Zielsetzung der Arbeit

Mehr

Centrum für Informations- und Sprachverarbeitung. Dr. M. Hadersbeck, Digitale Editionen, BAdW München

Centrum für Informations- und Sprachverarbeitung. Dr. M. Hadersbeck, Digitale Editionen, BAdW München # 1 Digitale Editionen und Auszeichnungssprachen Computerlinguistische FinderApps mit Facsimile-Reader Wittgenstein s Nachlass: WiTTFind Goethe s Faust: GoetheFind Hadersbeck M. et. al. Centrum für Informations-

Mehr

Exposé zur Studienarbeit. 04. August 2010

Exposé zur Studienarbeit. 04. August 2010 Exposé zur Studienarbeit Relevanzranking in Lucene im biomedizinischen Kontext Christoph Jacob Betreuer: Phillipe Thomas, Prof. Dr. Ulf Leser 04. August 2010 1. Motivation Sucht und ihr werdet finden dieses

Mehr

Proseminar Linguistische Annotation

Proseminar Linguistische Annotation Proseminar Linguistische Annotation Ines Rehbein und Josef Ruppenhofer SS 2010 Ines Rehbein und Josef Ruppenhofer (SS10) Linguistische Annotation April 2010 1 / 22 Seminarplan I. Linguistische Annotation

Mehr

INFORMATIONSEXTRAKTION IN SUCHMASCHINEN

INFORMATIONSEXTRAKTION IN SUCHMASCHINEN INFORMATIONSEXTRAKTION IN SUCHMASCHINEN S E M I N A R S U C H M A S C H I N E N S O M M E R S E M ESTER 2014 S T E FA N L A N G E R, C I S, U N I V E R S I TÄT M Ü N C H E N Schematische Architektur einer

Mehr

XML-Technologien Tutorium 6

XML-Technologien Tutorium 6 XML-Technologien Tutorium 6 Thema: Semantic Web Linked Data RDF SPARQL von: Kain Kordian Gontarska kainkordian@gmail.com Semantic Web Das Internet soll nicht nur aus "dummen" Inhalten bestehen. (Ansammlung

Mehr

Terminologie-Extraktion: Beispiel

Terminologie-Extraktion: Beispiel Terminologie-Extraktion: Beispiel The major risks of long-term cardiotoxicity relate to treatment prior to the BMT, in particular, anthracyclines, ablative-dose Cytoxan (ie, dose > 150 mg/ kg), chest [radiation

Mehr

Butz, Krüger: Mensch-Maschine-Interaktion, Kapitel 16 - Die Benutzerschnittstelle des World Wide Web. Mensch-Maschine-Interaktion

Butz, Krüger: Mensch-Maschine-Interaktion, Kapitel 16 - Die Benutzerschnittstelle des World Wide Web. Mensch-Maschine-Interaktion Folie 1 Mensch-Maschine-Interaktion Kapitel 16 - Die Benutzerschnittstelle des World Wide Web Technische Grundkonzepte des Web Layout: fließend, statisch, adaptiv, responsiv Inhalte: statisch oder dynamisch

Mehr

Named Entity Recognition auf Basis von Wortlisten

Named Entity Recognition auf Basis von Wortlisten Named Entity Recognition auf Basis von Wortlisten EDM SS 2017 Lukas Abegg & Tom Schilling Named Entity Recognition auf Basis von Wortlisten Lukas Abegg - Humboldt Universität zu Berlin Tom Schilling -

Mehr

Ontologien und Ontologiesprachen

Ontologien und Ontologiesprachen Ontologien und Ontologiesprachen Semantische Datenintegration SoSe2005 Uni Bremen Yu Zhao Gliederung 1. Was ist Ontologie 2. Anwendungsgebiete 3. Ontologiesprachen 4. Entwicklung von Ontologien 5. Zusammenfassung

Mehr

INFORMATIONSEXTRAKTION Computerlinguistik Referenten: Alice Holka, Sandra Pyka

INFORMATIONSEXTRAKTION Computerlinguistik Referenten: Alice Holka, Sandra Pyka INFORMATIONSEXTRAKTION 1 22.12.09 Computerlinguistik Referenten: Alice Holka, Sandra Pyka INFORMATIONSEXTRAKTION(IE) 1. Einleitung 2. Ziel der IE 3. Funktionalität eines IE-Systems 4. Beispiel 5. Übung

Mehr

BIW Wahlpflichtmodul. Einführung in Solr, Pipeline und REST. Philipp Schaer, TH Köln (University of Applied Sciences), Cologne, Germany

BIW Wahlpflichtmodul. Einführung in Solr, Pipeline und REST. Philipp Schaer, TH Köln (University of Applied Sciences), Cologne, Germany BIW Wahlpflichtmodul Einführung in Solr, Pipeline und REST Philipp Schaer, TH Köln (University of Applied Sciences), Cologne, Germany Version: 2018-05-29 Überblick über gängige Lösungen 2 3 in a nutshell

Mehr

Was ist Open Domain Question and Answering

Was ist Open Domain Question and Answering Was ist Open Domain Question and Answering Automatisches Beantworten einer Frage Fragen werden meist natürlichsprachlich gestellt Knowledge base ist eine große Sammlung von Texten Texte und Fragen sind

Mehr

Hyperlink Induced Topic Search- HITS. Ying Ren Universität Heidelberg, Seminar Infomation Retrieval

Hyperlink Induced Topic Search- HITS. Ying Ren Universität Heidelberg, Seminar Infomation Retrieval Hyperlink Induced Topic Search- HITS Hyperlink-basiertes Ranking Ying Ren 25.01.2010 Universität Heidelberg, Seminar Infomation Retrieval Grundgedanken zum Link-basierten Rankingverfahren

Mehr

Corporate Smart Content im Corporate Semantic Web

Corporate Smart Content im Corporate Semantic Web Corporate Smart Content im Corporate Semantic Web Prof. Dr. Adrian Paschke und Fraunhofer FOKUS #DKT16, Humboldt Universität Berlin, 11.10.2016 Corporate Semantic Web "Das Corporate Semantic Web fokussiert

Mehr

Projektgruppe. FG Engels. Enthält eine zusätzliche Folie. Fabian Christ, Benjamin Nagel, Henning Wachsmuth. Anmeldung bis 28.

Projektgruppe. FG Engels. Enthält eine zusätzliche Folie. Fabian Christ, Benjamin Nagel, Henning Wachsmuth. Anmeldung bis 28. Enthält eine zusätzliche Folie Projektgruppe Fabian Christ, Benjamin Nagel, Henning Wachsmuth FG Engels Bereich SWT Anmeldung bis 28. Februar 2010 28. Januar 2010 1 Softwarespezifikation in der Praxis...

Mehr

Situation-Adaptive Multimodal Dialogue Platform. Übersicht

Situation-Adaptive Multimodal Dialogue Platform. Übersicht S am Situation-Adaptive Multimodal Dialogue Platform Übersicht Multimodal Dialog System Multimodal Unterstützung verschiedenster Eingabe- und Ausgabekanäle, sowohl alternativ als auch kombiniert What is

Mehr

Caliph & Emir. Retrieval und Annotation von digitalen Photos mit MPEG-7. Mathias Lux

Caliph & Emir. Retrieval und Annotation von digitalen Photos mit MPEG-7.  Mathias Lux Caliph & Emir Retrieval und Annotation von digitalen Photos mit MPEG-7 Mathias Lux mlux@know-center.at - gefördert durch das Kompetenzzentrenprogramm Overview Einleitung Geschichtliches Annotation mit

Mehr

Semantic Web: Das Web der nächsten Generation

Semantic Web: Das Web der nächsten Generation Semantic Web: Das Web der nächsten Generation Slim Abdennadher LMU München 8.2.2002 c S. Abdennadher 1 Einleitung Rechner erfunden als Werkzeug zur Durchführung von Berechnungen Dann entdeckt als Werkzeug

Mehr

Complex Event Processing

Complex Event Processing [10] Armin Steudte HAW Hamburg Masterstudiengang Informatik - WS 2011/2012 Agenda Motivation Grundlagen Event Processing Networks Ausblick Quellen 2 Agenda Motivation Grundlagen Event Processing Networks

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Einführung Laura Kallmeyer Heinrich-Heine-Universität Düsseldorf Summer 2018 1 / 14 Anwendungen der Computerlinguistik Carstensen et al. (2010); Jurafsky and Martin

Mehr

RESI A Natural Language Specification Improver

RESI A Natural Language Specification Improver Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 RESI A Natural Language Specification Improver Dipl. Inform. Sven J. Körner Torben Brumm Prof. Dr. Walter F. Tichy Institute for Programming

Mehr

Ontologies are us: A unified model of social networks and sema

Ontologies are us: A unified model of social networks and sema Ontologies are us: A unified model of social networks and semantics 30. Juni 2009 Inhaltsverzeichnis 1 Einführung Begriffsklärung 2 Folksonomien Anreicherung von Ontologien 3 Ontology emergence in del.icio.us

Mehr

Vortrag im Rahmen der Vorlesung Data Warehouse Dozentin: Prof. Dr. Frey-Luxemburger WS 2011/2012. Referent: Florian Kalisch (GR09)

Vortrag im Rahmen der Vorlesung Data Warehouse Dozentin: Prof. Dr. Frey-Luxemburger WS 2011/2012. Referent: Florian Kalisch (GR09) Vortrag im Rahmen der Vorlesung Data Warehouse Dozentin: Prof. Dr. Frey-Luxemburger WS 2011/2012 Referent: Florian Kalisch (GR09) Rückblick Aktueller Status Einführung in Text-Mining Der Text-Mining Prozess

Mehr

Lexikalisch-semantische Disambiguierung mit WordNet

Lexikalisch-semantische Disambiguierung mit WordNet Lexikalische Semantik Lexikalisch-semantische Disambiguierung mit WordNet Conrad Steffens Paper: Rada Mihalcea & Dan I. Moldovan: A Method for Word Sense Disambiguation of Unrestricted Text Lexikalisch-semantische

Mehr

The Potential of Semantic Technologies for Libraries

The Potential of Semantic Technologies for Libraries The Potential of Semantic Technologies for Libraries Klaus Tochtermann ZBW Leibniz-Informationszentrum Wirtschaft 26. April 2012 Die ZBW ist Mitglied der Leibniz-Gemeinschaft Seite 1 Overview 2008 Semantic

Mehr

OntoWiki - Chancen des Semantik-Web Am Beispiel der Strukturierung und Annotierung von Lernmaterialien

OntoWiki - Chancen des Semantik-Web Am Beispiel der Strukturierung und Annotierung von Lernmaterialien OntoWiki - Chancen des Semantik-Web Am Beispiel der Strukturierung und Annotierung von Lernmaterialien Thomas Riechert Arbeitsgruppe Agile Knowledge Engineering and Semantic Web - Lehrstuhl Betriebliche

Mehr

Information Retrieval. Domenico Strigari Dominik Wißkirchen

Information Retrieval. Domenico Strigari Dominik Wißkirchen Information Retrieval Domenico Strigari Dominik Wißkirchen 2009-12-22 Definition Information retrieval (IR) is finding material (usually documents) of an unstructured nature (usually text) that satisfies

Mehr

Künstliche Intelligenz. Potential und Anwendung

Künstliche Intelligenz. Potential und Anwendung Künstliche Intelligenz Potential und Anwendung Menschliche Intelligenz Intelligentere Maschinen dank künstlicher Intelligenz Bilder Bilder Texte Sprache Texte Sprache Verstehen von strukturierten und unstrukturierten

Mehr

Lehrangebot. Fachgebiet Informationssysteme Prof. Dr. Norbert Fuhr

Lehrangebot. Fachgebiet Informationssysteme Prof. Dr. Norbert Fuhr Lehrangebot Fachgebiet Informationssysteme Prof. Dr. Norbert Fuhr N. Fuhr, U. Duisburg-Essen Lehrangebot 1 Lehrangebot des FG Informationssysteme Datenbanken Internet-Suchmaschinen Information Retrieval

Mehr

Detecting Near Duplicates for Web Crawling

Detecting Near Duplicates for Web Crawling Detecting Near Duplicates for Web Crawling Gurmeet Singh Manku et al., WWW 2007* * 16th international conference on World Wide Web Detecting Near Duplicates for Web Crawling Finde near duplicates in großen

Mehr

Emotionserkennung: Frameworkdesign

Emotionserkennung: Frameworkdesign Willkommen 1 / 27 Emotionserkennung: Frameworkdesign Oliver Steenbuck 07. Juni 2012 2 / 27 Inhalt 1 Interactive Surfaces 2 Ansprüche an ein Framework im Emotionberreich 3 Social Signal Interpretation Framework

Mehr

Interdisziplinäre fachdidaktische Übung: Sprache und Modelle. SS 2015: Grossmann, Jenko

Interdisziplinäre fachdidaktische Übung: Sprache und Modelle. SS 2015: Grossmann, Jenko Interdisziplinäre fachdidaktische Übung: Sprache und Modelle SS 2015: Grossmann, Jenko Einleitung Was ist ein Modell? Sprachlich orientierte Modelle Beispiele Wie entstehen Modelle? Zusammenhang Modell

Mehr

Level 1 German, 2014

Level 1 German, 2014 90886 908860 1SUPERVISOR S Level 1 German, 2014 90886 Demonstrate understanding of a variety of German texts on areas of most immediate relevance 9.30 am Wednesday 26 November 2014 Credits: Five Achievement

Mehr

Extraktion und Visualisierung von multidimensionalen Textinformationen zur Integration von Big Data in unternehmensspezifischen Wissenslandkarten

Extraktion und Visualisierung von multidimensionalen Textinformationen zur Integration von Big Data in unternehmensspezifischen Wissenslandkarten Extraktion und Visualisierung von multidimensionalen Textinformationen zur Integration von Big Data in unternehmensspezifischen Wissenslandkarten FOM Hochschulzentrum Dortmund, Fachbereich Wirtschaftsinformatik

Mehr

Modell und Implementierung einer temporalen Anfragesprache

Modell und Implementierung einer temporalen Anfragesprache Modell und Implementierung einer temporalen Anfragesprache Seminar Information Retrieval WS 2010/11 Agenda Motivation Hintergrund Modell der temporalen Anfragesprache Implementierung der temporalen Anfragesprache

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Sprachtechnologie. Tobias Scheffer Paul Prasse Michael Großhans

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Sprachtechnologie. Tobias Scheffer Paul Prasse Michael Großhans Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Sprachtechnologie Tobias Scheffer Paul Prasse Michael Großhans Organisation Vorlesung/Übung, praktische Informatik. 4 SWS. 6 Leistungspunkte

Mehr

Thema: Prototypische Implementierung des Vektormodells

Thema: Prototypische Implementierung des Vektormodells Ruprecht-Karls-Universität Heidelberg Seminar für Computerlinguistik Hauptseminar: Information Retrieval WS 06/07 Thema: Prototypische Implementierung des Vektormodells Sascha Orf Carina Silberer Cäcilia

Mehr

ShopBot, ein Software-Agent für das Internet

ShopBot, ein Software-Agent für das Internet Software-Agenten p.1/20 ShopBot, ein Software-Agent für das Internet Eine Einführung in (Software-)Agenten Madeleine Theile Software-Agenten p.2/20 Aufbau des Vortrags grundlegende Theorie Definition Autonomy,

Mehr

Web Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion

Web Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion Web Information Retrieval Hauptseminar Sommersemester 2003 Thomas Mandl Überblick Mehrsprachigkeit Multimedialität Heterogenität Qualität, semantisch, technisch Struktur Links HTML Struktur Technologische

Mehr

Google Knowledge Graph. Kursfolien Teil 2. Karin Haenelt

Google Knowledge Graph. Kursfolien Teil 2. Karin Haenelt Google Knowledge Graph Kursfolien Teil 2 Karin Haenelt 1.8.2015 Themen Systemübersicht Datengraph Aufbau Modellierung Auswertungen des Datengraphen Aufschlussreiche Beziehungen Retrievalbeispiele 2 Google

Mehr

Anwendung von Vektormodell und boolschem Modell in Kombination

Anwendung von Vektormodell und boolschem Modell in Kombination Anwendung von Vektormodell und boolschem Modell in Kombination Julia Kreutzer Seminar Information Retrieval Institut für Computerlinguistik Universität Heidelberg 12.01.2015 Motivation Welche Filme sind

Mehr

Lucene eine Demo. Sebastian Marius Kirsch 9. Februar 2006

Lucene eine Demo. Sebastian Marius Kirsch 9. Februar 2006 Lucene eine Demo Sebastian Marius Kirsch skirsch@luusa.org 9. Februar 2006 Text Retrieval wie funktioniert das? Aufgabe: Finde zu Stichwörtern die passenden Dokumente Sortiere sie nach Relevanz zur Suchanfrage.

Mehr

in deutschsprachigen Romanen

in deutschsprachigen Romanen Automatische Erkennung von Figuren in deutschsprachigen Romanen F. Jannidis, M. Krug, I. Reger, M. Toepfer, L. Weimer, F. Puppe (Universität Würzburg) Kontext Korpusbasierte Geschichte des deutschsprachigen

Mehr

Theoretische Grundlagen zu Default Logic

Theoretische Grundlagen zu Default Logic Theoretische Grundlagen zu Default Logic Eric Hildebrand Logik in der Praxis: Logikprogrammierung und unscharfes Schließen WS 08/09 Universität Heidelberg Seminar für Computerlinguistik Institut für allgemeine

Mehr

Linked Open Data & Bibliotheken Warum? Was? Wie? FIS Fachtagung, Frankfurt/Main 22. Mai 2012 Adrian Pohl

Linked Open Data & Bibliotheken Warum? Was? Wie? FIS Fachtagung, Frankfurt/Main 22. Mai 2012 Adrian Pohl Linked Open Data & Bibliotheken Warum? Was? Wie? FIS Fachtagung, Frankfurt/Main 22. Mai 2012 Adrian Pohl 2 3 4 5 Was steckt dahinter? 6 Agenda 1. Warum Linked Open Data? 2. Linked Data

Mehr

Fachbeiträge. und System. Syntaxbasierte Satzgenerierung mit PLNLP. 1 PLNLP - Programmiersprache. Zusammenfassung

Fachbeiträge. und System. Syntaxbasierte Satzgenerierung mit PLNLP. 1 PLNLP - Programmiersprache. Zusammenfassung Fachbeiträge Syntaxbasierte Satzgenerierung mit PLNLP ANDREA BEURER Zusammenfassung In der Programmiersprache PLNLP (wird "Penelope" ausgesprochen und steht für Programming Language for Natural Language

Mehr

Computergestützte Freizeitplanung basierend auf Points of Interest

Computergestützte Freizeitplanung basierend auf Points of Interest Computergestützte Freizeitplanung basierend auf Points of Interest Peter Bücker & Ugur Macit {peter.buecker,ugur.macit}@uni-duesseldorf.de Institut für Sprache und Information Abteilung für Informationswissenschaft

Mehr

Question Answering. Sie holt sich ihr Wissen aus dem Internet. Das bedeutet sie weiß alles! Pixel Perfect, USA 2004. Peter Kolb 12.7.

Question Answering. Sie holt sich ihr Wissen aus dem Internet. Das bedeutet sie weiß alles! Pixel Perfect, USA 2004. Peter Kolb 12.7. Question Answering Sie holt sich ihr Wissen aus dem Internet. Das bedeutet sie weiß alles! Pixel Perfect, USA 2004 Peter Kolb 12.7.2007 Question Answering QAS liefern Antwort auf natürlichsprachige Frage

Mehr

Semi-automatische Ontologieerstellung mittels TextToOnto

Semi-automatische Ontologieerstellung mittels TextToOnto Semi-automatische Ontologieerstellung mittels TextToOnto Mark Hall SE Computational Linguistics 14. Juni 2004 Zusammenfassung Das Erstellen von Ontologien ist ein komplexer und langwieriger Prozess. Um

Mehr

eine (sehr) kurze Einführung in formale Ontologien

eine (sehr) kurze Einführung in formale Ontologien kurzer historischer Überblick eine (sehr) kurze Einführung in Denis Brumann 5. April 2008 eine (sehr) kurze Einführung in kurzer historischer Überblick Ontologien in

Mehr

WMS Block: Management von Wissen in Dokumentenform PART: Text Mining. Myra Spiliopoulou

WMS Block: Management von Wissen in Dokumentenform PART: Text Mining. Myra Spiliopoulou WMS Block: Management von Wissen in nform PART: Text Mining Myra Spiliopoulou WIE ERFASSEN UND VERWALTEN WIR EXPLIZITES WISSEN? 1. Wie strukturieren wir Wissen in nform? 2. Wie verwalten wir nsammlungen?

Mehr

INFORMATIONSGEWINNUNG AUS KURZEN TEXTEN

INFORMATIONSGEWINNUNG AUS KURZEN TEXTEN INFORMATIONSGEWINNUNG AUS KURZEN TEXTEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 14. OKTOBER 2011 1. Schlüsselworte Semantik, Informationsextraktion, Automatisierte Syntaxanalyse, Validierung, Chunking, Tagging,

Mehr

Lehrveranstaltungen im Wintersemester 2012/2013

Lehrveranstaltungen im Wintersemester 2012/2013 Lehrveranstaltungen im Wintersemester 2012/2013 Information Systems and Machine Learning Lab (ISMLL) Prof. Dr. Dr. Lars Schmidt-Thieme Hildesheim, Juli 2012 1 / 1 Übersicht Praktika Hildesheim, Juli 2012

Mehr

Kurze Einführung in Web Data Mining

Kurze Einführung in Web Data Mining Kurze Einführung in Web Data Mining Yeong Su Lee Centrum für Informations- und Sprachverarbeitung (CIS), LMU 17.10.2007 Kurze Einführung in Web Data Mining 1 Überblick Was ist Web? Kurze Geschichte von

Mehr

Benutzungsintuition und Transparenz im Semantic Web. Proseminar WiSe 03 /04 Cristina Vertan

Benutzungsintuition und Transparenz im Semantic Web. Proseminar WiSe 03 /04 Cristina Vertan Benutzungsintuition und Transparenz im Semantic Web Proseminar WiSe 03 /04 Cristina Vertan Das Semantic Web Konzept Literatur über Semantic Web Termine und Themenliste Organisatorisches 2 Das Semantic

Mehr

Vektormodelle. Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig

Vektormodelle. Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig Vektormodelle Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig Gliederung Vektormodelle Vector-Space-Model Suffix Tree Document Model

Mehr

Level 2 German, 2016

Level 2 German, 2016 91126 911260 2SUPERVISOR S Level 2 German, 2016 91126 Demonstrate understanding of a variety of written and / or visual German texts on familiar matters 2.00 p.m. Tuesday 29 November 2016 Credits: Five

Mehr

unter Verwendung von Folien von Herrn Prof. Dr. Flensburg, von Laudon/Laudon/Schoder und von Frau Prof. Dr. Schuhbauer

unter Verwendung von Folien von Herrn Prof. Dr. Flensburg, von Laudon/Laudon/Schoder und von Frau Prof. Dr. Schuhbauer Knowledge Management Wissensmanagement 0. Produktionsfaktoren 1. Data Information Knowledge 2. Knowledge representation Wissensdarstellung 3. Interfaces to artificial intelligence 4. Knowledge management

Mehr

Killy Literaturlexikon: Autoren Und Werke Des Deutschsprachigen Kulturraumes 2., Vollstandig Uberarbeitete Auflage (German Edition)

Killy Literaturlexikon: Autoren Und Werke Des Deutschsprachigen Kulturraumes 2., Vollstandig Uberarbeitete Auflage (German Edition) Killy Literaturlexikon: Autoren Und Werke Des Deutschsprachigen Kulturraumes 2., Vollstandig Uberarbeitete Auflage (German Edition) Walther Killy Click here if your download doesn"t start automatically

Mehr

I am. ich bin. you are. du bist. he is she is it is. er ist sie ist es ist. we are. wir sind. you are. ihr seid. they are.

I am. ich bin. you are. du bist. he is she is it is. er ist sie ist es ist. we are. wir sind. you are. ihr seid. they are. Regel 1: Alle Formen von be a) Das Verb be heißt sein. Hier sind alle Formen: English: German: I am you are he is she is it is we are you are they are ich bin du bist er ist sie ist es ist wir sind ihr

Mehr

I am. ich bin. you are. du bist. he is she is it is. er ist sie ist es ist. we are. wir sind. you are. ihr seid. they are.

I am. ich bin. you are. du bist. he is she is it is. er ist sie ist es ist. we are. wir sind. you are. ihr seid. they are. Regel 1: Alle Formen von be a) Das Verb be heißt sein. Hier sind alle Formen: English: German: I am you are he is she is it is we are you are they are ich bin du bist er ist sie ist es ist wir sind ihr

Mehr

Neue Welten: Externe Daten mit APEX nutzen

Neue Welten: Externe Daten mit APEX nutzen Neue Welten: Externe Daten mit APEX nutzen Carsten Czarski Oracle Application Express Development-Team DOAG Regio München - 17. Mai 2018 Copyright 2017 Oracle and/or its affiliates. All rights reserved.

Mehr

Annotation based presentation models for view rendering and data binding with Linkki and Vaadin

Annotation based presentation models for view rendering and data binding with Linkki and Vaadin Annotation based presentation models for view rendering and data binding with Linkki and Vaadin jan.ortmann@faktorzehn.de 20.02.2017 Faktor-IPM - Architektur 1 Annotation based presentation models for

Mehr

Griesbaum, Heuwing, Ruppenhofer, Werner (Hrsg.) HiER Proceedings des 8. Hildesheimer Evaluierungsund Retrievalworkshop

Griesbaum, Heuwing, Ruppenhofer, Werner (Hrsg.) HiER Proceedings des 8. Hildesheimer Evaluierungsund Retrievalworkshop Griesbaum, Heuwing, Ruppenhofer, Werner (Hrsg.) HiER 2013 Proceedings des 8. Hildesheimer Evaluierungsund Retrievalworkshop Hildesheim, 25. 26. April 2013 J. Griesbaum, B. Heuwing, J. Ruppenhofer, K. Werner

Mehr

Information und Wissen: global, sozial und frei?

Information und Wissen: global, sozial und frei? Joachim Griesbaum, Thomas Mandl, Christa Womser-Hacker (Hrsg.) Information und Wissen: global, sozial und frei? Proceedings des 12. Internationalen Symposiums für Informationswissenschaft (ISI 2011) Hildesheim,

Mehr

Kompositionalität & DSM

Kompositionalität & DSM & DSM 7. Dezember 2011 Mitchell & Lapata (2008) I Evaluation verschiedener Kompositionsmodi: additiv gewichtet additiv (Kintsch, 2001) multiplikativ gemischt p = u + v Vektoraddition p = α u + β v Vektoraddition

Mehr

Datenintegration als automatisierter Prozess

Datenintegration als automatisierter Prozess Datenintegration als automatisierter Prozess Hauptseminar Tom Schöner tom.schoener@haw-hamburg.de Department Informatik, Informatik Master 12.06.2018 1 Inhaltsübersicht Einführung Thema und Fragestellungen

Mehr

Freebase Eine Datenbank mit RDF-Tripeln zu Personen, Orten, Dingen(2005-2012)

Freebase Eine Datenbank mit RDF-Tripeln zu Personen, Orten, Dingen(2005-2012) Freebase Eine Datenbank mit RDF-Tripeln zu Personen, Orten, Dingen(2005-2012) Karin Haenelt 1.5.2015 Inhalt Historie Datenbank 2 Historie 2005-2012 Freebase 7.2005, Metaweb Technologies Inc. entwickelt

Mehr

Big Data bei unstrukturierten Daten. AW1 Vortrag Sebastian Krome

Big Data bei unstrukturierten Daten. AW1 Vortrag Sebastian Krome Big Data bei unstrukturierten Daten AW1 Vortrag Sebastian Krome Agenda Wiederholung Aspekte von Big Data Datenverarbeitungsprozess TextMining Aktuelle Paper Identification of Live News Events Using Twitter

Mehr

Semantische Suche und Visualisierung von biomedizinischen Relationsdaten

Semantische Suche und Visualisierung von biomedizinischen Relationsdaten Semantische Suche und Visualisierung von biomedizinischen Relationsdaten Johannes Hellrich Jena University Language & Information Engineering Lab Friedrich-Schiller-Universität Jena Tagung der Computerlinguistik-Studierenden,

Mehr

Context-adaptation based on Ontologies and Spreading Activation

Context-adaptation based on Ontologies and Spreading Activation -1- Context-adaptation based on Ontologies and Spreading Activation ABIS 2007, Halle, 24.09.07 {hussein,westheide,ziegler}@interactivesystems.info -2- Context Adaptation in Spreadr Pubs near my location

Mehr

Informationsextraktionssystem ANNIE

Informationsextraktionssystem ANNIE Institut für Computerlinguistik Ruprecht-Karls-Universität Heidelberg WS 10/11 Inhalt 1 Einführung: Informationsextraktion Begriffsklärung eines Informationsextraktionssystems 2 Einführung in Getting Started

Mehr

Mathematik Seminar WS 2003: Simulation und Bildanalyse mit Java. Software-Architektur basierend auf dem Plug-in-Konzept

Mathematik Seminar WS 2003: Simulation und Bildanalyse mit Java. Software-Architektur basierend auf dem Plug-in-Konzept Mathematik Seminar WS 2003: Simulation und Bildanalyse mit Java Software-Architektur basierend auf dem Plug-in-Konzept Aufteilung: Probleme mit normaler/alter Software Ziele des Software Engineerings Die

Mehr

Semantische Suche. Ulf Leser

Semantische Suche. Ulf Leser Semantische Suche Ulf Leser Source: http://www.recruitingblogs.com/forum/topics/tutorial-tuesday-what-is Ulf Leser: Semantische Suchmaschinen, 11/2013 3 Conventional Search Semantic Approaches to Semantic

Mehr

Automatische Analyse und Exploration von Mediendaten. Prof. Dr. Ralph Ewerth Technische Informationsbibliothek (TIB)

Automatische Analyse und Exploration von Mediendaten. Prof. Dr. Ralph Ewerth Technische Informationsbibliothek (TIB) Automatische Analyse und Exploration von Mediendaten Prof. Dr. Ralph Ewerth Technische Informationsbibliothek (TIB) Relevante Forschungsthemen Automatische Annotation & semantische Suche (Bilder, Video,

Mehr

Sprachübergreifendes Information Retrieval (CLIR)

Sprachübergreifendes Information Retrieval (CLIR) WikiTranslate Ruprecht-Karls-Universität Heidelberg WS 2009/2010 HS: Information Retrieval Leitung: Dr. Karin Haenelt 18. Januar 2010 Auf den folgenden Folien wird der Ansatz von D. Nguyen, A.Overwijk,

Mehr

Template-based Question Answering over RDF Data

Template-based Question Answering over RDF Data Seminar Maschinelles Lernen Template-based Question Answering over RDF Data Benjamin Lück Quelle: http://www.alchemyapi.com/api/entity/ldata.png Seminar Maschinelles Lernen 1 Resource Description Framework

Mehr