Hauptseminar Information Retrieval. S. Friedrich und M. Häsner
|
|
- Meike Thomas
- vor 5 Jahren
- Abrufe
Transkript
1 Hauptseminar Information Retrieval S. Friedrich und M. Häsner 11. Januar 2010
2 1. Einleitung 2. QA-Modell 3. Modifikationen 4. Eigene Implementierung 5.
3
4 Aktuell: Benutzer sucht Informationen und erhält Menge von Dokumenten als Ergebnis (z. B. Suchmachine) Benutzer muss anschließend Ergebnisdokumente selbst auswählen und durchsuchen Idee: direkte Antwort als Ergebnis auf Benutzerfrage liefern
5 erwartet Frage von Benutzer in natürlicher Sprache als Eingabe sucht in großem Dokumentenpool nach passender Antwort präsentiert Benutzer Antwort als Ausgabe Ja/Nein bis komplexe Antworten möglich The Baseball System (1963) erstes Question Answering (QA) System
6 Information Access Systems: Question Answering System Information Retrieval System (z. B. Internet- Suchmaschinen) Natural Language Interface To Database Information Extraction System
7 Closed Domain: spezielle Wissensbasis, Korpus Beispiel: Militär (TARA - Terrorism Activity Resource Application) Anna von IKEA (Webseite) Open Domain: World Wide Web Beispiel: neue Generation von Suchmachine
8
9 Basis der meisten QA Systeme 3 Hauptkomponenten Frageverarbeitung Dokumentenverarbeitung Integration eines Information Retrieval Moduls Antwortverarbeitung
10
11 Vorverarbeitung: Annotation, Chunking, Named Entity Recognition, Stemming, Entfernung von Stoppwörtern
12
13
14 Anpassung der Query in Bezug auf Fragetyp Hinzufügen weiterer Begriffe Gewichten der verschiedenen Begriffe in der Query
15 Extraktion von Fakten aus Dokumentenpool Integration eines Information Extraction Moduls Sicherung in separater Fakten-Datenbank Suche erst in Fakten-Datenbank Verwendung externer Dokumenten pools Internetsuchmaschinen, Internetdatenbanken Ausnutzung von Antwortredundanz, strukturierten Informationen Verbesserte Präzision + Recall
16 Magisterarbeit Semantische Agenten im Information Retrieval von W. Wagner: Dokumentenverarbeitung auf Grundlage vom Semantic Web Verarbeitung durch Semantische Agenten Ontologien für Vokabular der Webseiten (Wissen, Zusammenhänge) Webseiten mit RDF annotiert (Metainformationen)
17 Semantische Agenten im Information Retrieval von W. Wagner (Fortsetzung): Umfeld: Hobbygärtnerei Semantischer Agent: sucht für Eingabe (Gemüse, Jahr) Informationen (Saatzeit, Standort, Boden, ) betrachtet annotierte Webseiten zieht auf Grundlage von Ontologien Schlussfolgerungen
18 Assoziierung von Fragetypen mit Liste von Antwortmustern z. B. Wann wurde X geboren? [Personenname], * [Geburtsdatum] Manuelle Erzeugung aus Dokumentenpool Automatisches Lernen aus großen Korpora
19 Verwendung von 3-Tupel Syntaktische Beziehungen in der Form <Kopf, Beziehung,Modifizierer> z. B. <hat, Subjekt, Merkel> Anzahl übereinstimmender 3-Tupel zwischen Frage und Antwortkandidat für Score
20
21 Programmiersprache: PHP Implementierte Komponenten: Schlüsselwortermittlung: Alle Nomen, Verben, Adjektive aus Frage als Schlüsselwort Verwendung von Part-Of-Speech Tagger Vergabe von Gewichten an Schlüsselwörter, stärkere Gewichtung der Verben Dokumentenpool: Verwendung von Biografien als Dokumente Aufsplittung der Dokumente in Sätze (= Dokumentenpool)
22 Implementierte Komponenten: Information Retrieval Komponente: Basiert auf Vektormodell Query entspricht Schlüsselwörter der Frage Ermittlung der für die Query relevanten Sätze aus Dokumentenpool Antwortverarbeitung: Ermittlung des Antworttyps anhand des Fragewortes Who, Whom = Person, Where = Ort, When = Zeit Person, Ort, Zeit = Entitäten
23 Implementierte Komponenten: Antwortverarbeitung (Fortsetzung): Ermittlung der Antwortkandidaten aus der Ausgabe der IR Komponente Müssen gesuchte Entität enthalten Verwendung von Stemming Berechnung des Score für jeden Antwortkandidaten Score = Summe der Gewichte der im Antwortkandidaten enthaltenen Schlüsselwörter Ranking der Antwortkandidaten nach Score Ausgabe der gesuchten Entität des besten Antwortkandidaten
24 Vorverarbeitung der Dokumente wichtig Anaphern + Ellipsen + Synonyme erschweren Antwortsuche Auswahl Entität bzgl. Antworttyp ungenau Auswahl von Constraints schwierig: Welche Schlüsselwörter? Schlüsselwörter gewichten?
25 Qualität der Antwort des QA Systems von der Arbeit vieler Komponenten abhängig Neue Dokumente höherer Recall, aber niedrigere Präzision Schwerpunkt der Implementierung: Abgleich zwischen Frage + Antwortkandidaten
26
27 Erreichung einer hohen Präzision der Antwort Beispiel: Webclopedia Frage: Where do lobsters like to live? Antwort: on a Canadian airline Ursprung: First-class passengers on a Canadian airline will have to live with lobster and filet mignon now that pate de foie gras is being dropped from the menu, an animal rights group said.
28 Erreichung eines hohen Recalls der Antwort Gefahr: Erhöhung der Präzision Verringerung des Recalls Effizienz der Antwortfindung z. B. durch geeignete Vorverarbeitung des Dokumentenpools
29 Umgang mit komplexen Fragen + Antworten z. B. Warum-, Wie-Fragen z. B. Definition als Antwort Interaktives QA System Dialog zwischen Benutzer + System Berücksichtigung des Fragekontexts wichtig Spracheingabe der Frage Integration eines Spracherkennungsmoduls
30
31 Wagner, Wiebke: Semantische Agenten im Information Retrieval, Universität Heidelberg, Magisterarbeit, URL Zugriffsdatum: Fliedner, Gerhard: Linguistically Informed Question Answering, Universität Saarbrücken, Dissertation, Hirschman, Lynette; Gaizauskas, Robert: Natural language question answering: the view from here, Natural Language Engineering 7, p Cambridge University Press, URL Zugriffsdatum: Narayanan, Srini; Harabagui, Sanda: Question Answering Based on Semantic Structures, The 20th International Conference on Computational Linguistics (COLING), URL Zugriffsdatum: Hermjakob, Ulf; Hovy, Eduard H.;Lin, Chin-Yew: Knowledge-Based Question Answering, TREC-2000, URL pdf Zugriffsdatum: Sinha, Steven; Narayanan, Srini: Model-based Answer Selection, Proceedings of Workshop on Textual Inference for Question Answering at the 20th National Conference on Artificial Intelligence, URL Zugriffsdatum: USC Information Sciences Institute: Question: Does Webclopedia have any sense of humor? URL Zugriffsdatum: Lin, Jimmy; Katz, Boris: Question Answering Techniques for the World Wide Web. URL Zugriffsdatum: Burger, John et. al.: Issues, Tasks and Program Structures to Roadmap Research in Question & Answering (Q&A). URL Zugriffsdatum: Op den Akker, Rieks; Bunt, Harry; Keizer, Simon; Van Schooten, Boris: From Question Answering to Spoken Dialogue: Towards an Information Search Assistant for Interactive Multimodal Information Extraction URL Zugriffsdatum:
Question Answering mit Support Vector Machines
Question Answering mit Support Vector Machines Sabrina Stehwien 30.01.2012 HS Information Retrieval Dozentin: Karin Haenelt Überblick 1. Question Answering Systeme 2. Das SAIQA-II QA-System 3. Support
MehrInformation Retrieval und Question Answering
und Question Answering Kai Kugler 19. November 2009 Auffinden von relevantem Wissen Die Relevanz der aufzufindenden Information ist abhängig vom... aktuellen Wissen des Benutzers dem aktuellen Problem
MehrInformation Retrieval und Question Answering Universität Trier LDV/CL WS 2009/2010 HS Dialogsysteme Kai Kugler
Information Retrieval und Question Answering Universität Trier LDV/CL WS 2009/2010 HS Dialogsysteme Kai Kugler (kugl2203@uni-trier.de) 1 Information Retrieval Information Retrieval (IR) ist das maschinelle,
MehrImplementierung eines Vektormodells
Implementierung eines Vektormodells Hauptseminar Information Retrieval WS 2013/14 Dr. Karin Haenelt Amol Phadke, Mirjam Eppinger Institut für Computerlinguistik Ruprecht-Karls-Universität Heidelberg 03.02.2014
MehrEntity Search. Michel Manthey Arne Binder 2013
Entity Search Michel Manthey Arne Binder 2013 Gliederung Idee Herausforderungen Allgemeine Herangehensweise Möglichkeiten und angewandte Verfahren Ausblick Quellen Idee Bisher: Suche nach Dokumenten, die
MehrInformation Retrieval and Semantic Technologies
Information Retrieval and Semantic Technologies Gerhard Wohlgenannt 6. April 2013 Inhaltsverzeichnis 1 Informationen zur Lehrveranstaltung 2 1.1 Inhalt................................... 2 2 Unterlagen
MehrStudienprojekt TaxoSearch Spezifikation
Studienprojekt TaxoSearch Spezifikation Semantisch gestützte Suche im Internet Lehrstuhl für Computerlinguistik Ruprecht-Karls-Universität Heidelberg WS 2002-2003 vorgestellt von Thorsten Beinhorn, Vesna
MehrHauptseminar Information Retrieval. Karin Haenelt Vorschläge für Seminarprojekte
Hauptseminar Information Retrieval Vorschläge für Seminarprojekte Karin Haenelt 17.10.2010 Projektarten Implementierungsprojekte: Standardalgorithmen Modellierungsexperimente Vorhandene Werkzeuge studieren,
MehrWEDKEX. Web-based Engineering Design Knowledge EXtraction. Frank Heyen, Janik M. Hager, Steffen M. Schlinger B.Sc. Informatik
WEDKEX Web-based Engineering Design Knowledge EXtraction Frank Heyen, Janik M. Hager, Steffen M. Schlinger B.Sc. Informatik Motivation Suche nach besseren Komponenten für ein vorhandenes System [HW] 2
MehrAnwendungen der KI / SoSe 2018
Anwendungen der KI / SoSe 2018 Organisatorisches Prof. Dr. Adrian Ulges Angewandte Informatik / Medieninformatik / Wirtschaftsinformatik / ITS Fachbereich DSCM Hochschule RheinMain KursWebsite: www.ulges.de
MehrUniversität Ulm Abteilung Künstliche Intelligenz. ExtrAns. Verarbeitung natürlicher, schriftlicher Sprache. C. Bohnacker
UNIVERSITÄT ULM SCIENDO DOCENDO CURANDO Universität Ulm Abteilung Künstliche Intelligenz ExtrAns Verarbeitung natürlicher, schriftlicher Sprache C. Bohnacker Überblick Motivation Einleitung Eigenschaften
MehrSwoogle. Patrice Matthias Brend amour
Swoogle Finding and Ranking Knowledge on the Semantic Web Patrice Matthias Brend amour Fachbereich Informatik und Informationswissenschaft Universität Konstanz Kurs: Web Services and Semantic Web Datum:
MehrSemantic Role Labeling im modernen Text-Analyse-Prozess
Semantic Role Labeling im modernen Text-Analyse-Prozess Bastian Haarmann info@bastianhaarmann.de http://www.bastianhaarmann.de Agenda I Text-Analyse-Prozesse 1. Motivation 2. Informationsextraktion 3.
MehrDependency-Based Construction of Semantic Space Models ( Padó, Lapata 2007) Distributionelle Semantik WS 11/
Dependency-Based Construction of Semantic Space Models ( Padó, Lapata 2007) Distributionelle Semantik WS 11/12 21.11.2011 Lena Enzweiler 1 Was ist das Problem? Wortbasierte Vektormodelle betrachten nur
MehrAutomatische Rekonstruktion und Spezifizierung von Attributnamen in Webtabellen
Automatische Rekonstruktion und Spezifizierung von Attributnamen in Webtabellen Mark Reinke Bachelorarbeit TU Dresden 17. Februar 2014 Webtabellen Warum sind Webtabellen von Bedeutung? Sie können relationale
MehrSemantik in Suchmaschinen Beispiele. Karin Haenelt 7.12.2014
Semantik in Suchmaschinen Beispiele Karin Haenelt 7.12.2014 Inhalt Google Knowledge Graph Freebase schema.org 2 Google Knowledge Graph Zuordnung von Suchtermen zu Weltentitäten Darstellung von Zusammenhängen
MehrAutomatische Textzusammenfassung
Ruprecht Karls Universität Heidelberg Lehrstuhl für Computerlinguistik HS Information Retrieval Automatische Textzusammenfassung Referat von Elena Loupanova 23.01.2006 Definition Textzusammenfassung The
MehrErkennung und Visualisierung attribuierter Phrasen in Poetiken
Erkennung und Visualisierung attribuierter Phrasen in Poetiken Andreas Müller (1) Markus John (2) Steffen Koch (2) Thomas Ertl (2) Jonas Kuhn (1) (1), Universität Stuttgart (2) Institut für Visualisierung
MehrKapitel IR:II. II. Grundlagen des Information Retrieval. Retrieval-Evaluierung Indexterme
Kapitel IR:II II. Grundlagen des Information Retrieval Retrieval-Evaluierung Indexterme IR:II-1 Basics STEIN 2005-2010 Batch-Mode-Retrieval einmaliges Absetzen einer Anfrage; nur eine Antwort wird geliefert
MehrTechnische Universität Kaiserslautern Lehrstuhl für Virtuelle Produktentwicklung
functions in SysML 2.0 La Jolla, 22.05.2014 12/10/2015 Technische Universität Kaiserslautern Lehrstuhl für Virtuelle Produktentwicklung Dipl. Wirtsch.-Ing. Christian Muggeo Dipl. Wirtsch.-Ing. Michael
MehrSemantic Web. Ekaterina Timofeeva & Johannes Knopp Vorlesung Information Retrieval Dr. Karin Haenelt Universität Heidelberg WS2006/07
Semantic Web Ekaterina Timofeeva & Johannes Knopp 29.01.2007 Vorlesung Information Retrieval Dr. Karin Haenelt Universität Heidelberg WS2006/07 Semantic Web - Übersicht Was ist Semantic Web? Idee Wie funktioniert
MehrInhaltsverzeichnis. Geleitwort. Abbildungsverzeichnis. Tabellenverzeichnis. Abkürzungsverzeichnis. Symbolverzeichnis
Inhaltsverzeichnis Geleitwort Vorwort Abbildungsverzeichnis Tabellenverzeichnis Abkürzungsverzeichnis Symbolverzeichnis i iü xi xiii xv xvii 1 Einleitung 1 1.1 Problemstellung 1 1.2 Zielsetzung der Arbeit
MehrCentrum für Informations- und Sprachverarbeitung. Dr. M. Hadersbeck, Digitale Editionen, BAdW München
# 1 Digitale Editionen und Auszeichnungssprachen Computerlinguistische FinderApps mit Facsimile-Reader Wittgenstein s Nachlass: WiTTFind Goethe s Faust: GoetheFind Hadersbeck M. et. al. Centrum für Informations-
MehrExposé zur Studienarbeit. 04. August 2010
Exposé zur Studienarbeit Relevanzranking in Lucene im biomedizinischen Kontext Christoph Jacob Betreuer: Phillipe Thomas, Prof. Dr. Ulf Leser 04. August 2010 1. Motivation Sucht und ihr werdet finden dieses
MehrProseminar Linguistische Annotation
Proseminar Linguistische Annotation Ines Rehbein und Josef Ruppenhofer SS 2010 Ines Rehbein und Josef Ruppenhofer (SS10) Linguistische Annotation April 2010 1 / 22 Seminarplan I. Linguistische Annotation
MehrINFORMATIONSEXTRAKTION IN SUCHMASCHINEN
INFORMATIONSEXTRAKTION IN SUCHMASCHINEN S E M I N A R S U C H M A S C H I N E N S O M M E R S E M ESTER 2014 S T E FA N L A N G E R, C I S, U N I V E R S I TÄT M Ü N C H E N Schematische Architektur einer
MehrXML-Technologien Tutorium 6
XML-Technologien Tutorium 6 Thema: Semantic Web Linked Data RDF SPARQL von: Kain Kordian Gontarska kainkordian@gmail.com Semantic Web Das Internet soll nicht nur aus "dummen" Inhalten bestehen. (Ansammlung
MehrTerminologie-Extraktion: Beispiel
Terminologie-Extraktion: Beispiel The major risks of long-term cardiotoxicity relate to treatment prior to the BMT, in particular, anthracyclines, ablative-dose Cytoxan (ie, dose > 150 mg/ kg), chest [radiation
MehrButz, Krüger: Mensch-Maschine-Interaktion, Kapitel 16 - Die Benutzerschnittstelle des World Wide Web. Mensch-Maschine-Interaktion
Folie 1 Mensch-Maschine-Interaktion Kapitel 16 - Die Benutzerschnittstelle des World Wide Web Technische Grundkonzepte des Web Layout: fließend, statisch, adaptiv, responsiv Inhalte: statisch oder dynamisch
MehrNamed Entity Recognition auf Basis von Wortlisten
Named Entity Recognition auf Basis von Wortlisten EDM SS 2017 Lukas Abegg & Tom Schilling Named Entity Recognition auf Basis von Wortlisten Lukas Abegg - Humboldt Universität zu Berlin Tom Schilling -
MehrOntologien und Ontologiesprachen
Ontologien und Ontologiesprachen Semantische Datenintegration SoSe2005 Uni Bremen Yu Zhao Gliederung 1. Was ist Ontologie 2. Anwendungsgebiete 3. Ontologiesprachen 4. Entwicklung von Ontologien 5. Zusammenfassung
MehrINFORMATIONSEXTRAKTION Computerlinguistik Referenten: Alice Holka, Sandra Pyka
INFORMATIONSEXTRAKTION 1 22.12.09 Computerlinguistik Referenten: Alice Holka, Sandra Pyka INFORMATIONSEXTRAKTION(IE) 1. Einleitung 2. Ziel der IE 3. Funktionalität eines IE-Systems 4. Beispiel 5. Übung
MehrBIW Wahlpflichtmodul. Einführung in Solr, Pipeline und REST. Philipp Schaer, TH Köln (University of Applied Sciences), Cologne, Germany
BIW Wahlpflichtmodul Einführung in Solr, Pipeline und REST Philipp Schaer, TH Köln (University of Applied Sciences), Cologne, Germany Version: 2018-05-29 Überblick über gängige Lösungen 2 3 in a nutshell
MehrWas ist Open Domain Question and Answering
Was ist Open Domain Question and Answering Automatisches Beantworten einer Frage Fragen werden meist natürlichsprachlich gestellt Knowledge base ist eine große Sammlung von Texten Texte und Fragen sind
MehrHyperlink Induced Topic Search- HITS. Ying Ren Universität Heidelberg, Seminar Infomation Retrieval
Hyperlink Induced Topic Search- HITS Hyperlink-basiertes Ranking Ying Ren 25.01.2010 Universität Heidelberg, Seminar Infomation Retrieval Grundgedanken zum Link-basierten Rankingverfahren
MehrCorporate Smart Content im Corporate Semantic Web
Corporate Smart Content im Corporate Semantic Web Prof. Dr. Adrian Paschke und Fraunhofer FOKUS #DKT16, Humboldt Universität Berlin, 11.10.2016 Corporate Semantic Web "Das Corporate Semantic Web fokussiert
MehrProjektgruppe. FG Engels. Enthält eine zusätzliche Folie. Fabian Christ, Benjamin Nagel, Henning Wachsmuth. Anmeldung bis 28.
Enthält eine zusätzliche Folie Projektgruppe Fabian Christ, Benjamin Nagel, Henning Wachsmuth FG Engels Bereich SWT Anmeldung bis 28. Februar 2010 28. Januar 2010 1 Softwarespezifikation in der Praxis...
MehrSituation-Adaptive Multimodal Dialogue Platform. Übersicht
S am Situation-Adaptive Multimodal Dialogue Platform Übersicht Multimodal Dialog System Multimodal Unterstützung verschiedenster Eingabe- und Ausgabekanäle, sowohl alternativ als auch kombiniert What is
MehrCaliph & Emir. Retrieval und Annotation von digitalen Photos mit MPEG-7. Mathias Lux
Caliph & Emir Retrieval und Annotation von digitalen Photos mit MPEG-7 Mathias Lux mlux@know-center.at - gefördert durch das Kompetenzzentrenprogramm Overview Einleitung Geschichtliches Annotation mit
MehrSemantic Web: Das Web der nächsten Generation
Semantic Web: Das Web der nächsten Generation Slim Abdennadher LMU München 8.2.2002 c S. Abdennadher 1 Einleitung Rechner erfunden als Werkzeug zur Durchführung von Berechnungen Dann entdeckt als Werkzeug
MehrComplex Event Processing
[10] Armin Steudte HAW Hamburg Masterstudiengang Informatik - WS 2011/2012 Agenda Motivation Grundlagen Event Processing Networks Ausblick Quellen 2 Agenda Motivation Grundlagen Event Processing Networks
MehrEinführung in die Computerlinguistik
Einführung in die Computerlinguistik Einführung Laura Kallmeyer Heinrich-Heine-Universität Düsseldorf Summer 2018 1 / 14 Anwendungen der Computerlinguistik Carstensen et al. (2010); Jurafsky and Martin
MehrRESI A Natural Language Specification Improver
Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 RESI A Natural Language Specification Improver Dipl. Inform. Sven J. Körner Torben Brumm Prof. Dr. Walter F. Tichy Institute for Programming
MehrOntologies are us: A unified model of social networks and sema
Ontologies are us: A unified model of social networks and semantics 30. Juni 2009 Inhaltsverzeichnis 1 Einführung Begriffsklärung 2 Folksonomien Anreicherung von Ontologien 3 Ontology emergence in del.icio.us
MehrVortrag im Rahmen der Vorlesung Data Warehouse Dozentin: Prof. Dr. Frey-Luxemburger WS 2011/2012. Referent: Florian Kalisch (GR09)
Vortrag im Rahmen der Vorlesung Data Warehouse Dozentin: Prof. Dr. Frey-Luxemburger WS 2011/2012 Referent: Florian Kalisch (GR09) Rückblick Aktueller Status Einführung in Text-Mining Der Text-Mining Prozess
MehrLexikalisch-semantische Disambiguierung mit WordNet
Lexikalische Semantik Lexikalisch-semantische Disambiguierung mit WordNet Conrad Steffens Paper: Rada Mihalcea & Dan I. Moldovan: A Method for Word Sense Disambiguation of Unrestricted Text Lexikalisch-semantische
MehrThe Potential of Semantic Technologies for Libraries
The Potential of Semantic Technologies for Libraries Klaus Tochtermann ZBW Leibniz-Informationszentrum Wirtschaft 26. April 2012 Die ZBW ist Mitglied der Leibniz-Gemeinschaft Seite 1 Overview 2008 Semantic
MehrOntoWiki - Chancen des Semantik-Web Am Beispiel der Strukturierung und Annotierung von Lernmaterialien
OntoWiki - Chancen des Semantik-Web Am Beispiel der Strukturierung und Annotierung von Lernmaterialien Thomas Riechert Arbeitsgruppe Agile Knowledge Engineering and Semantic Web - Lehrstuhl Betriebliche
MehrInformation Retrieval. Domenico Strigari Dominik Wißkirchen
Information Retrieval Domenico Strigari Dominik Wißkirchen 2009-12-22 Definition Information retrieval (IR) is finding material (usually documents) of an unstructured nature (usually text) that satisfies
MehrKünstliche Intelligenz. Potential und Anwendung
Künstliche Intelligenz Potential und Anwendung Menschliche Intelligenz Intelligentere Maschinen dank künstlicher Intelligenz Bilder Bilder Texte Sprache Texte Sprache Verstehen von strukturierten und unstrukturierten
MehrLehrangebot. Fachgebiet Informationssysteme Prof. Dr. Norbert Fuhr
Lehrangebot Fachgebiet Informationssysteme Prof. Dr. Norbert Fuhr N. Fuhr, U. Duisburg-Essen Lehrangebot 1 Lehrangebot des FG Informationssysteme Datenbanken Internet-Suchmaschinen Information Retrieval
MehrDetecting Near Duplicates for Web Crawling
Detecting Near Duplicates for Web Crawling Gurmeet Singh Manku et al., WWW 2007* * 16th international conference on World Wide Web Detecting Near Duplicates for Web Crawling Finde near duplicates in großen
MehrEmotionserkennung: Frameworkdesign
Willkommen 1 / 27 Emotionserkennung: Frameworkdesign Oliver Steenbuck 07. Juni 2012 2 / 27 Inhalt 1 Interactive Surfaces 2 Ansprüche an ein Framework im Emotionberreich 3 Social Signal Interpretation Framework
MehrInterdisziplinäre fachdidaktische Übung: Sprache und Modelle. SS 2015: Grossmann, Jenko
Interdisziplinäre fachdidaktische Übung: Sprache und Modelle SS 2015: Grossmann, Jenko Einleitung Was ist ein Modell? Sprachlich orientierte Modelle Beispiele Wie entstehen Modelle? Zusammenhang Modell
MehrLevel 1 German, 2014
90886 908860 1SUPERVISOR S Level 1 German, 2014 90886 Demonstrate understanding of a variety of German texts on areas of most immediate relevance 9.30 am Wednesday 26 November 2014 Credits: Five Achievement
MehrExtraktion und Visualisierung von multidimensionalen Textinformationen zur Integration von Big Data in unternehmensspezifischen Wissenslandkarten
Extraktion und Visualisierung von multidimensionalen Textinformationen zur Integration von Big Data in unternehmensspezifischen Wissenslandkarten FOM Hochschulzentrum Dortmund, Fachbereich Wirtschaftsinformatik
MehrModell und Implementierung einer temporalen Anfragesprache
Modell und Implementierung einer temporalen Anfragesprache Seminar Information Retrieval WS 2010/11 Agenda Motivation Hintergrund Modell der temporalen Anfragesprache Implementierung der temporalen Anfragesprache
MehrUniversität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Sprachtechnologie. Tobias Scheffer Paul Prasse Michael Großhans
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Sprachtechnologie Tobias Scheffer Paul Prasse Michael Großhans Organisation Vorlesung/Übung, praktische Informatik. 4 SWS. 6 Leistungspunkte
MehrThema: Prototypische Implementierung des Vektormodells
Ruprecht-Karls-Universität Heidelberg Seminar für Computerlinguistik Hauptseminar: Information Retrieval WS 06/07 Thema: Prototypische Implementierung des Vektormodells Sascha Orf Carina Silberer Cäcilia
MehrShopBot, ein Software-Agent für das Internet
Software-Agenten p.1/20 ShopBot, ein Software-Agent für das Internet Eine Einführung in (Software-)Agenten Madeleine Theile Software-Agenten p.2/20 Aufbau des Vortrags grundlegende Theorie Definition Autonomy,
MehrWeb Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion
Web Information Retrieval Hauptseminar Sommersemester 2003 Thomas Mandl Überblick Mehrsprachigkeit Multimedialität Heterogenität Qualität, semantisch, technisch Struktur Links HTML Struktur Technologische
MehrGoogle Knowledge Graph. Kursfolien Teil 2. Karin Haenelt
Google Knowledge Graph Kursfolien Teil 2 Karin Haenelt 1.8.2015 Themen Systemübersicht Datengraph Aufbau Modellierung Auswertungen des Datengraphen Aufschlussreiche Beziehungen Retrievalbeispiele 2 Google
MehrAnwendung von Vektormodell und boolschem Modell in Kombination
Anwendung von Vektormodell und boolschem Modell in Kombination Julia Kreutzer Seminar Information Retrieval Institut für Computerlinguistik Universität Heidelberg 12.01.2015 Motivation Welche Filme sind
MehrLucene eine Demo. Sebastian Marius Kirsch 9. Februar 2006
Lucene eine Demo Sebastian Marius Kirsch skirsch@luusa.org 9. Februar 2006 Text Retrieval wie funktioniert das? Aufgabe: Finde zu Stichwörtern die passenden Dokumente Sortiere sie nach Relevanz zur Suchanfrage.
Mehrin deutschsprachigen Romanen
Automatische Erkennung von Figuren in deutschsprachigen Romanen F. Jannidis, M. Krug, I. Reger, M. Toepfer, L. Weimer, F. Puppe (Universität Würzburg) Kontext Korpusbasierte Geschichte des deutschsprachigen
MehrTheoretische Grundlagen zu Default Logic
Theoretische Grundlagen zu Default Logic Eric Hildebrand Logik in der Praxis: Logikprogrammierung und unscharfes Schließen WS 08/09 Universität Heidelberg Seminar für Computerlinguistik Institut für allgemeine
MehrLinked Open Data & Bibliotheken Warum? Was? Wie? FIS Fachtagung, Frankfurt/Main 22. Mai 2012 Adrian Pohl
Linked Open Data & Bibliotheken Warum? Was? Wie? FIS Fachtagung, Frankfurt/Main 22. Mai 2012 Adrian Pohl 2 3 4 5 Was steckt dahinter? 6 Agenda 1. Warum Linked Open Data? 2. Linked Data
MehrFachbeiträge. und System. Syntaxbasierte Satzgenerierung mit PLNLP. 1 PLNLP - Programmiersprache. Zusammenfassung
Fachbeiträge Syntaxbasierte Satzgenerierung mit PLNLP ANDREA BEURER Zusammenfassung In der Programmiersprache PLNLP (wird "Penelope" ausgesprochen und steht für Programming Language for Natural Language
MehrComputergestützte Freizeitplanung basierend auf Points of Interest
Computergestützte Freizeitplanung basierend auf Points of Interest Peter Bücker & Ugur Macit {peter.buecker,ugur.macit}@uni-duesseldorf.de Institut für Sprache und Information Abteilung für Informationswissenschaft
MehrQuestion Answering. Sie holt sich ihr Wissen aus dem Internet. Das bedeutet sie weiß alles! Pixel Perfect, USA 2004. Peter Kolb 12.7.
Question Answering Sie holt sich ihr Wissen aus dem Internet. Das bedeutet sie weiß alles! Pixel Perfect, USA 2004 Peter Kolb 12.7.2007 Question Answering QAS liefern Antwort auf natürlichsprachige Frage
MehrSemi-automatische Ontologieerstellung mittels TextToOnto
Semi-automatische Ontologieerstellung mittels TextToOnto Mark Hall SE Computational Linguistics 14. Juni 2004 Zusammenfassung Das Erstellen von Ontologien ist ein komplexer und langwieriger Prozess. Um
Mehreine (sehr) kurze Einführung in formale Ontologien
kurzer historischer Überblick eine (sehr) kurze Einführung in Denis Brumann 5. April 2008 eine (sehr) kurze Einführung in kurzer historischer Überblick Ontologien in
MehrWMS Block: Management von Wissen in Dokumentenform PART: Text Mining. Myra Spiliopoulou
WMS Block: Management von Wissen in nform PART: Text Mining Myra Spiliopoulou WIE ERFASSEN UND VERWALTEN WIR EXPLIZITES WISSEN? 1. Wie strukturieren wir Wissen in nform? 2. Wie verwalten wir nsammlungen?
MehrINFORMATIONSGEWINNUNG AUS KURZEN TEXTEN
INFORMATIONSGEWINNUNG AUS KURZEN TEXTEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 14. OKTOBER 2011 1. Schlüsselworte Semantik, Informationsextraktion, Automatisierte Syntaxanalyse, Validierung, Chunking, Tagging,
MehrLehrveranstaltungen im Wintersemester 2012/2013
Lehrveranstaltungen im Wintersemester 2012/2013 Information Systems and Machine Learning Lab (ISMLL) Prof. Dr. Dr. Lars Schmidt-Thieme Hildesheim, Juli 2012 1 / 1 Übersicht Praktika Hildesheim, Juli 2012
MehrKurze Einführung in Web Data Mining
Kurze Einführung in Web Data Mining Yeong Su Lee Centrum für Informations- und Sprachverarbeitung (CIS), LMU 17.10.2007 Kurze Einführung in Web Data Mining 1 Überblick Was ist Web? Kurze Geschichte von
MehrBenutzungsintuition und Transparenz im Semantic Web. Proseminar WiSe 03 /04 Cristina Vertan
Benutzungsintuition und Transparenz im Semantic Web Proseminar WiSe 03 /04 Cristina Vertan Das Semantic Web Konzept Literatur über Semantic Web Termine und Themenliste Organisatorisches 2 Das Semantic
MehrVektormodelle. Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig
Vektormodelle Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig Gliederung Vektormodelle Vector-Space-Model Suffix Tree Document Model
MehrLevel 2 German, 2016
91126 911260 2SUPERVISOR S Level 2 German, 2016 91126 Demonstrate understanding of a variety of written and / or visual German texts on familiar matters 2.00 p.m. Tuesday 29 November 2016 Credits: Five
Mehrunter Verwendung von Folien von Herrn Prof. Dr. Flensburg, von Laudon/Laudon/Schoder und von Frau Prof. Dr. Schuhbauer
Knowledge Management Wissensmanagement 0. Produktionsfaktoren 1. Data Information Knowledge 2. Knowledge representation Wissensdarstellung 3. Interfaces to artificial intelligence 4. Knowledge management
MehrKilly Literaturlexikon: Autoren Und Werke Des Deutschsprachigen Kulturraumes 2., Vollstandig Uberarbeitete Auflage (German Edition)
Killy Literaturlexikon: Autoren Und Werke Des Deutschsprachigen Kulturraumes 2., Vollstandig Uberarbeitete Auflage (German Edition) Walther Killy Click here if your download doesn"t start automatically
MehrI am. ich bin. you are. du bist. he is she is it is. er ist sie ist es ist. we are. wir sind. you are. ihr seid. they are.
Regel 1: Alle Formen von be a) Das Verb be heißt sein. Hier sind alle Formen: English: German: I am you are he is she is it is we are you are they are ich bin du bist er ist sie ist es ist wir sind ihr
MehrI am. ich bin. you are. du bist. he is she is it is. er ist sie ist es ist. we are. wir sind. you are. ihr seid. they are.
Regel 1: Alle Formen von be a) Das Verb be heißt sein. Hier sind alle Formen: English: German: I am you are he is she is it is we are you are they are ich bin du bist er ist sie ist es ist wir sind ihr
MehrNeue Welten: Externe Daten mit APEX nutzen
Neue Welten: Externe Daten mit APEX nutzen Carsten Czarski Oracle Application Express Development-Team DOAG Regio München - 17. Mai 2018 Copyright 2017 Oracle and/or its affiliates. All rights reserved.
MehrAnnotation based presentation models for view rendering and data binding with Linkki and Vaadin
Annotation based presentation models for view rendering and data binding with Linkki and Vaadin jan.ortmann@faktorzehn.de 20.02.2017 Faktor-IPM - Architektur 1 Annotation based presentation models for
MehrGriesbaum, Heuwing, Ruppenhofer, Werner (Hrsg.) HiER Proceedings des 8. Hildesheimer Evaluierungsund Retrievalworkshop
Griesbaum, Heuwing, Ruppenhofer, Werner (Hrsg.) HiER 2013 Proceedings des 8. Hildesheimer Evaluierungsund Retrievalworkshop Hildesheim, 25. 26. April 2013 J. Griesbaum, B. Heuwing, J. Ruppenhofer, K. Werner
MehrInformation und Wissen: global, sozial und frei?
Joachim Griesbaum, Thomas Mandl, Christa Womser-Hacker (Hrsg.) Information und Wissen: global, sozial und frei? Proceedings des 12. Internationalen Symposiums für Informationswissenschaft (ISI 2011) Hildesheim,
MehrKompositionalität & DSM
& DSM 7. Dezember 2011 Mitchell & Lapata (2008) I Evaluation verschiedener Kompositionsmodi: additiv gewichtet additiv (Kintsch, 2001) multiplikativ gemischt p = u + v Vektoraddition p = α u + β v Vektoraddition
MehrDatenintegration als automatisierter Prozess
Datenintegration als automatisierter Prozess Hauptseminar Tom Schöner tom.schoener@haw-hamburg.de Department Informatik, Informatik Master 12.06.2018 1 Inhaltsübersicht Einführung Thema und Fragestellungen
MehrFreebase Eine Datenbank mit RDF-Tripeln zu Personen, Orten, Dingen(2005-2012)
Freebase Eine Datenbank mit RDF-Tripeln zu Personen, Orten, Dingen(2005-2012) Karin Haenelt 1.5.2015 Inhalt Historie Datenbank 2 Historie 2005-2012 Freebase 7.2005, Metaweb Technologies Inc. entwickelt
MehrBig Data bei unstrukturierten Daten. AW1 Vortrag Sebastian Krome
Big Data bei unstrukturierten Daten AW1 Vortrag Sebastian Krome Agenda Wiederholung Aspekte von Big Data Datenverarbeitungsprozess TextMining Aktuelle Paper Identification of Live News Events Using Twitter
MehrSemantische Suche und Visualisierung von biomedizinischen Relationsdaten
Semantische Suche und Visualisierung von biomedizinischen Relationsdaten Johannes Hellrich Jena University Language & Information Engineering Lab Friedrich-Schiller-Universität Jena Tagung der Computerlinguistik-Studierenden,
MehrContext-adaptation based on Ontologies and Spreading Activation
-1- Context-adaptation based on Ontologies and Spreading Activation ABIS 2007, Halle, 24.09.07 {hussein,westheide,ziegler}@interactivesystems.info -2- Context Adaptation in Spreadr Pubs near my location
MehrInformationsextraktionssystem ANNIE
Institut für Computerlinguistik Ruprecht-Karls-Universität Heidelberg WS 10/11 Inhalt 1 Einführung: Informationsextraktion Begriffsklärung eines Informationsextraktionssystems 2 Einführung in Getting Started
MehrMathematik Seminar WS 2003: Simulation und Bildanalyse mit Java. Software-Architektur basierend auf dem Plug-in-Konzept
Mathematik Seminar WS 2003: Simulation und Bildanalyse mit Java Software-Architektur basierend auf dem Plug-in-Konzept Aufteilung: Probleme mit normaler/alter Software Ziele des Software Engineerings Die
MehrSemantische Suche. Ulf Leser
Semantische Suche Ulf Leser Source: http://www.recruitingblogs.com/forum/topics/tutorial-tuesday-what-is Ulf Leser: Semantische Suchmaschinen, 11/2013 3 Conventional Search Semantic Approaches to Semantic
MehrAutomatische Analyse und Exploration von Mediendaten. Prof. Dr. Ralph Ewerth Technische Informationsbibliothek (TIB)
Automatische Analyse und Exploration von Mediendaten Prof. Dr. Ralph Ewerth Technische Informationsbibliothek (TIB) Relevante Forschungsthemen Automatische Annotation & semantische Suche (Bilder, Video,
MehrSprachübergreifendes Information Retrieval (CLIR)
WikiTranslate Ruprecht-Karls-Universität Heidelberg WS 2009/2010 HS: Information Retrieval Leitung: Dr. Karin Haenelt 18. Januar 2010 Auf den folgenden Folien wird der Ansatz von D. Nguyen, A.Overwijk,
MehrTemplate-based Question Answering over RDF Data
Seminar Maschinelles Lernen Template-based Question Answering over RDF Data Benjamin Lück Quelle: http://www.alchemyapi.com/api/entity/ldata.png Seminar Maschinelles Lernen 1 Resource Description Framework
Mehr