Evaluierung von Information Retrieval Systemen Teil 1: Standardverfahren. Karin Haenelt

Größe: px
Ab Seite anzeigen:

Download "Evaluierung von Information Retrieval Systemen Teil 1: Standardverfahren. Karin Haenelt"

Transkript

1 Evaluierung von Information Retrieval Systemen Teil 1: Standardverfahren Karin Haenelt

2 Evaluierungsveranstaltungen TREC Text Retrieval Evaluation Conference jährlich seit 1992 Sponsoren: Defence Advanced Research Projects Agency (DARPA) National Institute of Standards and Technology (NIST) MUC Message Understanding Conference mit Unterstützung der DARPA (Defense Advanced Research Projects Agency), Behörde des Verteidigungsministeriums der USA durchgeführt 2

3 Logische Einteilung der Datenbasis R R nicht-relevante ausgegebene Dokumente nicht-relevante nicht ausgeg. Dokumente relevante ausgegebene Dokumente relevante nicht ausgeg. Dokumente 3

4 Verfahren zur Bestimmung der relevanten Dokumente 4

5 Bestimmung durch Juroren Beobachtungen TREC: Übereinstimmung zwischen 2 Juroren: 70% 5

6 Bestimmung durch Pooling Kowalski,

7 Bestimmung durch Pooling German Indexing and Retrieval Testdatabase (GIRT): relevante Dokumente durch Juroren ermittelt relevante Dokumente durch Pooling ermittelt Frisch/Kluck, 1997, 34 7

8 Standardmaße zur Evaluierung Precision Recall Fallout Genauigkeit des Suchprozesses # relevant _ ausgegeben # gesamt _ ausgegeben Vollständigkeit des Suchprozesses # relevant _ ausgegeben # relevant _ gesamt Effektivität des Suchprozesses # irrelevant _ ausgegeben # irrelevant _ gesamt 8

9 Recall/Precision-Graph Gemessen an 11 Standardmesspunkten: Recall 100%, 90%, 80% 0% Punkte durch Geraden verbunden Geraden haben keine interpolierende Bedeutung Zwischen den 11 Standardmesspunkten sind keine Werte definiert Baeza-Yates/Ribeiro-Neto, 1999,74 9

10 Berechnungsbeispiel Menge der relevanten Dokumente Rq={d 3,d 5,d 9,d 25,d 39,d 44,d 56,d 71,d 89,d 123 } Ranking für query q 1. d d d d d d d d d 250 Recall und Precision 4. d 6 9. d d d d d 3 recall precision d % aller 100% (1 von 1) d 56 20% relevanten 66% (2 von 3) d 9 30% Dokumente 50% (3 von 6) d 25 40% 40% (4 von 10) d 3 50% 33% (5 von 15) - 60% 0% Baeza-Yates/Ribeiro-Neto, 1999,74 10

11 Recall/Precision-Graph Precis sion Recall Baeza-Yates/Ribeiro-Neto, 1999,74 11

12 Durchschnittliche Precision über mehrere Queries P( r) = Nq i= 1 Pi( r) Nq P( r) = durchschnittliche Precision bei Recall- Ebene r Nq Pi = Anzahl der Queries ( r) = Precision bei Recall- Ebene r, für i - te Query Baeza-Yates/Ribeiro-Neto, 1999,74 12

13 Durchschnittliche Precision über mehrere Queries Recall-Ebenen können für einzelne Queries verschieden sein von den 11 Standard-Recall-Ebenen Interpolationsprozedur erforderlich P( rj) = max rj r rj+ 1 P(r) Interpolierte Präzision bei j.ter Standard-Recall-Ebene: höchste bekannte Präzision auf einer Recall-Ebene zwischen der j.ten und der j+1.ten Recall-Ebene Baeza-Yates/Ribeiro-Neto, 1999,76 13

14 Berechnungsbeispiel, interpolierte Werte Menge der relevanten Dokumente Rq={d 3,d 56,d 129 } Ranking für query q Recall und Precision 1. d d d d d d d d d d 6 9. d d d d d 3 recall precision d 56 33,3% aller 33,3% (1 von 3) d ,6% relevanten 25% (2 von 8) d 3 100% Dokumente 20% (3 von 15) Baeza-Yates/Ribeiro-Neto, 1999,77 14

15 Recall/Precision-Graph Precis sion Recall Baeza-Yates/Ribeiro-Neto, 1999,77 15

16 Stand der Inhaltserschließung Information Retrieval No more than 40% precision for 20% recall (Sparck Jones 1987) Message Understanding 60 % der Resultate sind falsch 80 % der relevanten Texte werden nicht gefunden Eingeschränktes Fachgebiet Anfragen vorher bekannt Beste Ergebnisse 55 % precision / 45 % recall 16

17 17

18 Status der Relevanzmenge In all cases, evaluation of Information Retrieval Systems will suffer from the subjective nature of information. There is no deterministic methodology for understanding what is relevant to a user s search. (Kowalski, 1997, 244) non calculable in operational systems. If the system knew the total set of relevant items in the database, it would have been retrieved. (Kowalski, 1997, 5) 18

19 Bedeutung der Relevanzmenge Wieviel Information wird gebraucht? vollständige Information zu einem Sachverhalt hinreichende Information zur Erfüllung einer Aufgabe Wie relevant ist relevant? sicher vielleicht weniger nicht 19

20 Literatur Kowalski, Gerald: Information Retrieval Systems: Theory and Implementation. Kluwer Academic Publishers: Boston/Dordrecht/London,1997. Frisch, Elisabeth und Michael Kluck: Pretest zum Projekt German Indexing and Retrieval Testdatabase (GIRT) unter Anwendung der retrievalsysteme Messenger und freewaissf. IZ-Arbeitsbericht 10. Bonn: Informationszentrum Sozilawissenschaften, Harman, Donna: Overview of the Fourth Text REtrieval Conference (TREC-4). TREC-4 Proceedings. nlpir.nist.gov/trec/t4_proceedings.html Ricardo Baeza-Yates und Bertheir Ribeiro-Neto (Eds.) (1999): Modern Information Retrieval.Essex: Addison Wesley Longman Limited, Kap. 13 Will, Craig A.: Comparing Human and Machine Performance for Natural Language Information Extraction: Results for English Microelectronics from the MUC-5 Evaluation. In: Proc. of the Fifth Message Understanding Conference. Morgan Kaufmann Publishers, pp

Evaluierung und Retrievalmaße. Seminar experimentelle Evaluierung In Information Retrieval WS05/06

Evaluierung und Retrievalmaße. Seminar experimentelle Evaluierung In Information Retrieval WS05/06 Evaluierung und Retrievalmaße Seminar experimentelle Evaluierung In Information Retrieval WS05/06 Einleitung - Evaluierung Wichtig für IR Zusammenhang zwischen einer Suchanfrage und den zurückgegebenen

Mehr

Modellierung menschlicher Sprachen mit Regulären Ausdrücken

Modellierung menschlicher Sprachen mit Regulären Ausdrücken Modellierung menschlicher Sprachen mit Regulären Ausdrücken Kursfolien Karin Haenelt 1 Modellierung mit regulären Ausdrücken Reguläre Ausdrücke als Spezifikationssprache für endliche Automaten Modellierungsfälle

Mehr

Information Retrieval Modelle: Boolesches Modell. Karin Haenelt

Information Retrieval Modelle: Boolesches Modell. Karin Haenelt Information Retrieval Modelle: Boolesches Modell Karin Haenelt 19.10.2009 1 Inhalt Information Retrieval-Modelle: Systemarchitektur und Definition Boolesches Modell Darstellung der Systemkomponenten am

Mehr

Evaluation von IR-Systemen

Evaluation von IR-Systemen Evaluation von IR-Systemen Überblick Relevanzbeurteilung Übereinstimmung zwischen Annotatoren Precision Recall (Präzision u. Vollständigkeit) Text Retrieval Conference (TREC) Testkollektionen Beurteilen

Mehr

Text REtrieval Conferences (cf. TREC hompage: http://www.nist.gov/nlpir/) Ziele von TREC. Spezifika im Vorgehen von TREC. Teilnehmer und Systeme

Text REtrieval Conferences (cf. TREC hompage: http://www.nist.gov/nlpir/) Ziele von TREC. Spezifika im Vorgehen von TREC. Teilnehmer und Systeme Quelle: TREC homepage http://www.nist.gov/nlpir IR 209 IR 210 Text REtrieval Conferences (cf. TREC hompage: http://www.nist.gov/nlpir/) TREC (Text REtrieval Conferences) Leitung: Donna Harman offiziell

Mehr

Klassische Information Retrieval Modelle Einführung

Klassische Information Retrieval Modelle Einführung Klassische Information Retrieval Modelle Einführung Kursfolien Karin Haenelt 21.10.2012 Themen Information Retrieval Konzepte Grundkomponenten Information Retrieval Modell Definition Die klassischen Modelle

Mehr

Informationsextraktion. Karin Haenelt 1.12.2012

Informationsextraktion. Karin Haenelt 1.12.2012 Informationsextraktion Karin Haenelt 1.12.2012 Informationsextraktion Ziel Identifikation bestimmter Information (Daten) in einem unstrukturierten oder teilstrukturierten textuellen Dokument Transformation

Mehr

Besonderheiten der Daten (1) Information Retrieval im Internet. Suchmaschinen: Zentralisierte Architektur. Besonderheiten der Daten (2)

Besonderheiten der Daten (1) Information Retrieval im Internet. Suchmaschinen: Zentralisierte Architektur. Besonderheiten der Daten (2) Besonderheiten der Daten (1) Information Retrieval im Internet Kursfolien Karin Haenelt Verteilte Daten Viele Rechner Verschiedene Plattformen Hohe Volatilitätsrate Schätzung: 40% des Internets verändert

Mehr

Praxisteil. Seminar experimentelle Evaluierung in IR WS05/06 Gruppe A

Praxisteil. Seminar experimentelle Evaluierung in IR WS05/06 Gruppe A Praxisteil Seminar experimentelle Evaluierung in IR WS05/06 Gruppe A Experimental setup Collections: TREC-123, wt10g Index: BM25 und TFIDF Queries: - Topics 51-100 aus trec123.topics (für den ersten Teil)

Mehr

Klassisches Information Retrieval Jan Schrader

Klassisches Information Retrieval Jan Schrader Klassisches Information Retrieval 27.10.2011 Jan Schrader Information Retrieval (IR) Information retrieval (IR) is finding material (usually documents) of an unstructured nature (usually text) that satisfies

Mehr

Thema: Prototypische Implementierung des Vektormodells

Thema: Prototypische Implementierung des Vektormodells Ruprecht-Karls-Universität Heidelberg Seminar für Computerlinguistik Hauptseminar: Information Retrieval WS 06/07 Thema: Prototypische Implementierung des Vektormodells Sascha Orf Carina Silberer Cäcilia

Mehr

Information Retrieval im Internet

Information Retrieval im Internet Information Retrieval im Internet Kursfolien Karin Haenelt 25.11.01 1 Besonderheiten der Daten (1) Verteilte Daten Viele Rechner Verschiedene Plattformen Hohe Volatilitätsrate Schätzung: 40% des Internets

Mehr

Implementation und Evaluation des Vektormodells anhand von TREC-Daten

Implementation und Evaluation des Vektormodells anhand von TREC-Daten Implementation und Evaluation des Vektormodells anhand von TREC-Daten Seminarprojekt Information Retrieval WS 2015/2016 Bastian Beyer, Alexander Birkenkamp Institut für Computerlinguistik Universität Heidelberg

Mehr

Grundlagen der Erschließung von Textinhalten. Karin Haenelt

Grundlagen der Erschließung von Textinhalten. Karin Haenelt Grundlagen der Erschließung von Textinhalten Karin Haenelt Stand der Inhaltserschließung Information Retrieval No more than 40% precision for 20% recall (Sparck Jones 1987) Message Understanding Maschinelle

Mehr

Information-Retrieval: Evaluation

Information-Retrieval: Evaluation Information-Retrieval: Evaluation Claes Neuefeind Fabian Steeg 17. Dezember 2009 Themen des Seminars Boolesches Retrieval-Modell (IIR 1) Datenstrukturen (IIR 2) Tolerantes Retrieval (IIR 3) Vektorraum-Modell

Mehr

The Potential of Semantic Technologies for Libraries

The Potential of Semantic Technologies for Libraries The Potential of Semantic Technologies for Libraries Klaus Tochtermann ZBW Leibniz-Informationszentrum Wirtschaft 26. April 2012 Die ZBW ist Mitglied der Leibniz-Gemeinschaft Seite 1 Overview 2008 Semantic

Mehr

Griesbaum, Heuwing, Ruppenhofer, Werner (Hrsg.) HiER Proceedings des 8. Hildesheimer Evaluierungsund Retrievalworkshop

Griesbaum, Heuwing, Ruppenhofer, Werner (Hrsg.) HiER Proceedings des 8. Hildesheimer Evaluierungsund Retrievalworkshop Griesbaum, Heuwing, Ruppenhofer, Werner (Hrsg.) HiER 2013 Proceedings des 8. Hildesheimer Evaluierungsund Retrievalworkshop Hildesheim, 25. 26. April 2013 J. Griesbaum, B. Heuwing, J. Ruppenhofer, K. Werner

Mehr

Bücher und Artikel zum Thema

Bücher und Artikel zum Thema Materialsammlung zur Implementierung von Information Retrieval Systemen Karin Haenelt 11.12.2005/11.12.2004/06.12.2003/10.11.2002 1 Bücher und Artikel zum Thema Frakes/Baeza-Yates, 1992 Baeza-Yates/Ribeiro-Neto,

Mehr

Materialsammlung zur Implementierung von Information Retrieval Systemen

Materialsammlung zur Implementierung von Information Retrieval Systemen Materialsammlung zur Implementierung von Information Retrieval Systemen Karin Haenelt 11.12.2005/11.12.2004/06.12.2003/10.11.2002 1 Bücher und Artikel zum Thema Frakes/Baeza-Yates, 1992 Baeza-Yates/Ribeiro-Neto,

Mehr

Motivation. Wie evaluiert man die Effektivität eines IR-Systems? Ideal: Ermittle die Zufriedenheit der Benutzer. Praxis:

Motivation. Wie evaluiert man die Effektivität eines IR-Systems? Ideal: Ermittle die Zufriedenheit der Benutzer. Praxis: 5. Evaluation Motivation Wie evaluiert man die Effektivität eines IR-Systems? Zur Erinnerung: Werden die richtigen Dinge getan? Ideal: Ermittle die Zufriedenheit der Benutzer schwierig zu messen (z.b.

Mehr

Darstellung der Methodik in TREC und TREC-basierte Evaluierung

Darstellung der Methodik in TREC und TREC-basierte Evaluierung Darstellung der Methodik in TREC und TREC-basierte Evaluierung Martin Jansson Philip Korte Lukas Wozniak 13. November 2005 Jansson, Korte, Wozniak 1 Inhaltsverzeichnis Was ist TREC? Die Ziele der Konferenz

Mehr

Endliche Automaten. Minimierung. Karin Haenelt. Karin Haenelt, 2004, FSA-Minimierung, ( )

Endliche Automaten. Minimierung. Karin Haenelt. Karin Haenelt, 2004, FSA-Minimierung, ( ) Endliche Automaten Minimierung Karin Haenelt 1 Inhalt Vorteile eines Minimalautomaten Fälle für die Minimierung Minimierungsalgorithmus für deterministische endliche Automaten (mit totaler Übergangsfunktion)

Mehr

Accounting course program for master students. Institute of Accounting and Auditing http://www.wiwi.hu-berlin.de/rewe

Accounting course program for master students. Institute of Accounting and Auditing http://www.wiwi.hu-berlin.de/rewe Accounting course program for master students Institute of Accounting and Auditing http://www.wiwi.hu-berlin.de/rewe 2 Accounting requires institutional knowledge... 3...but it pays: Lehman Bros. Inc.,

Mehr

Information Retrieval Einführung

Information Retrieval Einführung Information Retrieval Einführung Kursfolien Karin Haenelt 22.7.2015 Themen Traditionelles Konzept / Erweitertes Konzept Auffinden von Dokumenten Rankingfunktionen Auffinden und Aufbereiten von Information

Mehr

INFORMATIONSEXTRAKTION

INFORMATIONSEXTRAKTION INFORMATIONSEXTRAKTION Referentin: Syriane Kemayou Yamga Universität Heidelberg, Computerlinguistik, Hauptseminar: Information Retrieval PD. Dr. Karin Haenelt 16.01.2006 Informationsextraktion (IE) 1.

Mehr

Kapitel IR:II. II. Grundlagen des Information Retrieval. Retrieval-Evaluierung Indexterme

Kapitel IR:II. II. Grundlagen des Information Retrieval. Retrieval-Evaluierung Indexterme Kapitel IR:II II. Grundlagen des Information Retrieval Retrieval-Evaluierung Indexterme IR:II-1 Basics STEIN 2005-2010 Batch-Mode-Retrieval einmaliges Absetzen einer Anfrage; nur eine Antwort wird geliefert

Mehr

Introduction to the diploma and master seminar in FSS 2010. Prof. Dr. Armin Heinzl. Sven Scheibmayr

Introduction to the diploma and master seminar in FSS 2010. Prof. Dr. Armin Heinzl. Sven Scheibmayr Contemporary Aspects in Information Systems Introduction to the diploma and master seminar in FSS 2010 Chair of Business Administration and Information Systems Prof. Dr. Armin Heinzl Sven Scheibmayr Objective

Mehr

Webinfolab / CHEVAL: Evaluationslabor für Information Retrieval Systeme mit semantischen und visuellen Komponenten

Webinfolab / CHEVAL: Evaluationslabor für Information Retrieval Systeme mit semantischen und visuellen Komponenten Webinfolab / CHEVAL: Evaluationslabor für Information Retrieval Systeme mit semantischen und visuellen Komponenten Vortrag anlässlich der ODOK 2007 (20. September 2007, Graz) Joachim Pfister Schweizerisches

Mehr

Performance-Evaluierung bei inhaltsbasierter Bildsuche. Andreas Tenge Seminar Bilddatenbanken Technische Fakultät Universität Bielefeld im SS 2003

Performance-Evaluierung bei inhaltsbasierter Bildsuche. Andreas Tenge Seminar Bilddatenbanken Technische Fakultät Universität Bielefeld im SS 2003 Performance-Evaluierung bei inhaltsbasierter Bildsuche Andreas Tenge Seminar Bilddatenbanken Technische Fakultät Universität Bielefeld im SS 2003 Inhaltsverzeichnis 0 Vorwort 1 1 Motivation 1 2 Evaluierung

Mehr

Level 1 German, 2014

Level 1 German, 2014 90886 908860 1SUPERVISOR S Level 1 German, 2014 90886 Demonstrate understanding of a variety of German texts on areas of most immediate relevance 9.30 am Wednesday 26 November 2014 Credits: Five Achievement

Mehr

Learning to Rank Sven Münnich

Learning to Rank Sven Münnich Learning to Rank Sven Münnich 06.12.12 Fachbereich 20 Seminar Recommendersysteme Sven Münnich 1 Übersicht 1. Einführung 2. Methoden 3. Anwendungen 4. Zusammenfassung & Fazit 06.12.12 Fachbereich 20 Seminar

Mehr

USER INTERFACES ZUR AUSSTELLUNGSKURATIERUNG

USER INTERFACES ZUR AUSSTELLUNGSKURATIERUNG USER INTERFACES ZUR AUSSTELLUNGSKURATIERUNG NUTZERZENTRIERTE EINSATZSZENARIEN UND EXPERIMENTELLE TOOLS/VISUALISIERUNGEN #DKT16 Berlin ART+COM, 2016 ART+COM EXPERIENCE CENTER ROYAL JELLING MICROPIA, AMSTERDAM

Mehr

p^db=`oj===pìééçêíáåñçêã~íáçå=

p^db=`oj===pìééçêíáåñçêã~íáçå= p^db=`oj===pìééçêíáåñçêã~íáçå= Error: "Could not connect to the SQL Server Instance" or "Failed to open a connection to the database." When you attempt to launch ACT! by Sage or ACT by Sage Premium for

Mehr

Level 1 German, 2012

Level 1 German, 2012 90886 908860 1SUPERVISOR S Level 1 German, 2012 90886 Demonstrate understanding of a variety of German texts on areas of most immediate relevance 9.30 am Tuesday 13 November 2012 Credits: Five Achievement

Mehr

Internet-Suchmaschinen

Internet-Suchmaschinen Internet-Suchmaschinen Organisatorisches Vorlesung Beginn: 1. November 2005 Dienstag 10:15-11:45 Uhr, Raum 0443 Prof. Gerd Stumme Dr. Andreas Hotho Dipl.-Inform. Christoph Schmitz Wintersemester 2005/06

Mehr

Search Engine Evaluation. Franziska Häger, Lutz Gericke

Search Engine Evaluation. Franziska Häger, Lutz Gericke Search Engine Evaluation Franziska Häger, Lutz Gericke 23.07.2009 Ansätze 2 Tägliche Abfragen mit geringer Ergebnismenge Evaluation von Precision und Recall Revisionsabfrage aus Suchmaschinen-Caches Bestimmung

Mehr

BIW Wahlpflichtmodul. Einführung in trec_eval. Philipp Schaer, TH Köln (University of Applied Sciences), Cologne, Germany. Version:

BIW Wahlpflichtmodul. Einführung in trec_eval. Philipp Schaer, TH Köln (University of Applied Sciences), Cologne, Germany. Version: BIW Wahlpflichtmodul Einführung in trec_eval Philipp Schaer, TH Köln (University of Applied Sciences), Cologne, Germany Version: 2017-06-19 2 Was erwartet Sie heute? Kurze Wiederholung von Precision, Recall,

Mehr

Hyperlink Induced Topic Search- HITS. Ying Ren Universität Heidelberg, Seminar Infomation Retrieval

Hyperlink Induced Topic Search- HITS. Ying Ren Universität Heidelberg, Seminar Infomation Retrieval Hyperlink Induced Topic Search- HITS Hyperlink-basiertes Ranking Ying Ren 25.01.2010 Universität Heidelberg, Seminar Infomation Retrieval Grundgedanken zum Link-basierten Rankingverfahren

Mehr

Evaluierung von Information Retrieval Systemen / /

Evaluierung von Information Retrieval Systemen / / Evaluierung von Information Retrieval Systemen Minimal Test Collection (MTC)- Verfahren Karin Haenelt 4.2.204 / 5.2.203 / 5.2.20 Inhalt Einführung des MTC-Verfahrens Vorbetrachtungen Abkürzungen und Beispiel

Mehr

2 Evaluierung von Retrievalsystemen

2 Evaluierung von Retrievalsystemen 2. Evaluierung von Retrievalsystemen Relevanz 2 Evaluierung von Retrievalsystemen Die Evaluierung von Verfahren und Systemen spielt im IR eine wichtige Rolle. Gemäß der Richtlinien für IR der GI gilt es,...

Mehr

Notice: All mentioned inventors have to sign the Report of Invention (see page 3)!!!

Notice: All mentioned inventors have to sign the Report of Invention (see page 3)!!! REPORT OF INVENTION Please send a copy to An die Abteilung Technologietransfer der Universität/Hochschule An die Technologie-Lizenz-Büro (TLB) der Baden-Württembergischen Hochschulen GmbH Ettlinger Straße

Mehr

Cross-Language Evaluation Forum (CLEF): Europäische Initiative zur Bewertung sprachübergreifender Retrievalverfahren

Cross-Language Evaluation Forum (CLEF): Europäische Initiative zur Bewertung sprachübergreifender Retrievalverfahren Cross-Language Evaluation Forum (CLEF): Europäische Initiative zur Bewertung sprachübergreifender Retrievalverfahren Michael Kluck, Thomas Mandl, Christa Womser-Hacker Abstract: Seit einigen Jahren hat

Mehr

Semantik in Suchmaschinen Beispiele. Karin Haenelt 7.12.2014

Semantik in Suchmaschinen Beispiele. Karin Haenelt 7.12.2014 Semantik in Suchmaschinen Beispiele Karin Haenelt 7.12.2014 Inhalt Google Knowledge Graph Freebase schema.org 2 Google Knowledge Graph Zuordnung von Suchtermen zu Weltentitäten Darstellung von Zusammenhängen

Mehr

Level 2 German, 2016

Level 2 German, 2016 91126 911260 2SUPERVISOR S Level 2 German, 2016 91126 Demonstrate understanding of a variety of written and / or visual German texts on familiar matters 2.00 p.m. Tuesday 29 November 2016 Credits: Five

Mehr

Internet-Suchmaschinen Prof. Gerd Stumme Dr. Andreas Hotho Dipl.-Inform. Christoph Schmitz

Internet-Suchmaschinen Prof. Gerd Stumme Dr. Andreas Hotho Dipl.-Inform. Christoph Schmitz Internet-Suchmaschinen Prof. Gerd Stumme Dr. Andreas Hotho Dipl.-Inform. Christoph Schmitz Wintersemester 2005/06 Organisatorisches Vorlesung Beginn: 1. November 2005 Dienstag 10:15-11:45 Uhr, Raum 0443

Mehr

Internet-Suchmaschinen

Internet-Suchmaschinen Internet-Suchmaschinen Organisatorisches Präsenzübung bedeutet Prof. Dr. Gerd Stumme Beate Krause, MSc Wi.-Inf. Sommersemester 2009 selbständiges Bearbeiten des Übungsblattes in Kleingruppen à 3-4 Personen

Mehr

Pat Trees und Pat Arrays Datenstrukturen zur effizienten Suche in Texten

Pat Trees und Pat Arrays Datenstrukturen zur effizienten Suche in Texten Pat Trees und Pat Arrays Datenstrukturen zur effizienten Suche in Texten Ruprecht-Karls-Universität Heidelberg HS Information Retrieval Dozentin: Dr. Karin Haenelt Referenten: Doina Gliga und Katja Niemann

Mehr

if autotagging becomes real KEYSTONE Switzerland K. Csoknyay

if autotagging becomes real KEYSTONE Switzerland K. Csoknyay if autotagging becomes real KEYSTONE Switzerland K. Csoknyay Challenge Today IMAGINE - Project CTI Research Project Participants are KEYSTONE and HTW Chur Goals automated instead of manual tagging more

Mehr

Einleitung. Komplexe Anfragen. Suche ist teuer. VA-File Verfeinerungen. A0-Algo. GeVAS. Schluß. Folie 2. Einleitung. Suche ist teuer.

Einleitung. Komplexe Anfragen. Suche ist teuer. VA-File Verfeinerungen. A0-Algo. GeVAS. Schluß. Folie 2. Einleitung. Suche ist teuer. Anwendung Input: Query-Bild, Ergebnis: Menge ähnlicher Bilder. Kapitel 8: Ähnlichkeitsanfragen und ihre effiziente Evaluierung Wie zu finden? Corbis, NASA: EOS Bilddatenbank Folie Folie 2 Ähnlichkeitssuche

Mehr

Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz

Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz 04_Evaluation Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz CLEF Cross Language Evaluation Forum Hervorgegangen aus dem Cross-Language Information Retrieval Task der Text

Mehr

Was wird evaluiert? in Abhängigkeit davon Wahl des Evaluierungswerkzeugs. Formen der Evaluierung: Datenanalytische Verfahren

Was wird evaluiert? in Abhängigkeit davon Wahl des Evaluierungswerkzeugs. Formen der Evaluierung: Datenanalytische Verfahren Evaluierung von IRS Evaluierungsarten Rapid-Prototyping Simulationstest (Wizard-of-Oz-Experimente) Kontrollierte Experimente Untersuchungen Empirische Langzeitstudien Managementmethoden wie (Kritische)

Mehr

Informationsextraktion mit endlichen Automaten

Informationsextraktion mit endlichen Automaten Informationsextraktion mit endlichen Automaten HS: Information Retrieval Dozentin: Dr. Karin Haenelt Anna Abykova, Vladlena Belinschi, Wei Wang Ruprecht-Karls-Universität Heidelberg Seminar für Computerlinguistik

Mehr

Evaluierung der Güte von Information-Retrieval-Systemen

Evaluierung der Güte von Information-Retrieval-Systemen Warum Systemevaluierung? Es gibt viele Retrievalmodelle/Algorithmen/Systeme. Evaluierung der Güte von Information-Retrieval-Systemen Welches ist das Beste? Welches ist die beste Komponente für: Ranking-Funktion

Mehr

Evaluierung der Güte von Information-Retrieval-Systemen

Evaluierung der Güte von Information-Retrieval-Systemen Evaluierung der Güte von Information-Retrieval-Systemen Viele Folien in diesem Abschnitt sind eine deutsche Übersetzung der Folien von Raymond J. Mooney (http://www.cs.utexas.edu/users/mooney/ir-course/).

Mehr

Stemming. Referenten: Johannes Lang Rossen Kowatschew

Stemming. Referenten: Johannes Lang Rossen Kowatschew Universität Heidelberg Institut für Computerlinguistik HS Information Retrieval WS 01/02 Leitung: Dr. Karin Haenelt 04.02. 2002 Stemming. Referenten: Johannes Lang Rossen Kowatschew Gliederung Einführung:

Mehr

Advanced Topics in Databases The Anatomy of a Large-Scale Hypertextual Web Search Engine

Advanced Topics in Databases The Anatomy of a Large-Scale Hypertextual Web Search Engine Advanced Topics in Databases The Anatomy of a Large-Scale Hypertextual Web Search Engine Hasso-Plattner-Institut Potsdam Fachgebiet Informationssysteme Markus Güntert WS 2008/2009 20.01.2009 1 The Anatomy

Mehr

Website-Suche mit OpenText Web Site Management. Frank Steffen - Senior Product Manager

Website-Suche mit OpenText Web Site Management. Frank Steffen - Senior Product Manager Website-Suche mit OpenText Web Site Management Frank Steffen - Senior Product Manager Inhalt Überblick Konzepte der Suchmaschinenanbindung Verity K2 Anbindung Der neue OT Search Engine Connector Federated

Mehr

Level 2 German, 2015

Level 2 German, 2015 91126 911260 2SUPERVISOR S Level 2 German, 2015 91126 Demonstrate understanding of a variety of written and / or visual German text(s) on familiar matters 2.00 p.m. Friday 4 December 2015 Credits: Five

Mehr

Lehrangebot. Fachgebiet Informationssysteme Prof. Dr. Norbert Fuhr

Lehrangebot. Fachgebiet Informationssysteme Prof. Dr. Norbert Fuhr Lehrangebot Fachgebiet Informationssysteme Prof. Dr. Norbert Fuhr N. Fuhr, U. Duisburg-Essen Lehrangebot 1 Lehrangebot des FG Informationssysteme Datenbanken Internet-Suchmaschinen Information Retrieval

Mehr

Seminar: Software Engineering verteilter Systeme

Seminar: Software Engineering verteilter Systeme Seminar: Software Engineering verteilter Systeme Hauptseminar im Sommersemester 2011 Programmierung verteilter Systeme Institut für Informatik Universität Augsburg 86135 Augsburg Tel.: +49 821 598-2118

Mehr

Kapitel 9 Architektur eines Retrievalsystems

Kapitel 9 Architektur eines Retrievalsystems Kapitel 9 Architektur eines Retrievalsystems HHU Düsseldorf, WS 2008/09 Information Retrieval 138 HHU Düsseldorf, WS 2008/09 Information Retrieval 139 Zeichensätze ASCII 7-bit-Code (128 Zeichen) 1000111111001011101011100101111001111100110100000100

Mehr

CALCULATING KPI QUANTITY-INDEPENDENT ROUTE TIME

CALCULATING KPI QUANTITY-INDEPENDENT ROUTE TIME CALCULATING KPI QUANTITY-INDEPENDENT ROUTE TIME Wenn Sie diesen Text lesen können, müssen Sie die Folie im Post-Menü mit der Funktion «Folie einfügen» erneut einfügen. Sonst kann die Fläche nicht eingefärbt

Mehr

%VALUIERUNG DER 4EXT2ETRIEVALSYSTEME $OMESTIC )NTELLIGENT -INER FOR 4EXT,ARS )) UND 4EXT%XTENDER

%VALUIERUNG DER 4EXT2ETRIEVALSYSTEME $OMESTIC )NTELLIGENT -INER FOR 4EXT,ARS )) UND 4EXT%XTENDER %VALUIERUNG DER 4EXT2ETRIEVALSYSTEME $OMESTIC )NTELLIGENT -INER FOR 4EXT,ARS )) UND 4EXT%XTENDER 4 + TER - 2ITTBERGER # 7OMSER(ACKER Informationswissenschaft Universität Konstanz 78457 Konstanz Marc.Rittberger@uni-konstanz.de

Mehr

PONS DIE DREI??? FRAGEZEICHEN, ARCTIC ADVENTURE: ENGLISCH LERNEN MIT JUSTUS, PETER UND BOB

PONS DIE DREI??? FRAGEZEICHEN, ARCTIC ADVENTURE: ENGLISCH LERNEN MIT JUSTUS, PETER UND BOB Read Online and Download Ebook PONS DIE DREI??? FRAGEZEICHEN, ARCTIC ADVENTURE: ENGLISCH LERNEN MIT JUSTUS, PETER UND BOB DOWNLOAD EBOOK : PONS DIE DREI??? FRAGEZEICHEN, ARCTIC ADVENTURE: Click link bellow

Mehr

Information Retrieval als Fachgebiet in der Schnittmenge zwischen Informationswissenschaft, Informatik und Computerlinguistik

Information Retrieval als Fachgebiet in der Schnittmenge zwischen Informationswissenschaft, Informatik und Computerlinguistik Rückblick Information Retrieval als Fachgebiet in der Schnittmenge zwischen Informationswissenschaft, Informatik und Computerlinguistik Präzision und Ausbeute als elementare Gütemaße Zerlegung und Normalisierung

Mehr

Internet-Suchmaschinen Prof. Dr. Gerd Stumme Beate Krause, MSc Wi.-Inf.

Internet-Suchmaschinen Prof. Dr. Gerd Stumme Beate Krause, MSc Wi.-Inf. Internet-Suchmaschinen Prof. Dr. Gerd Stumme Beate Krause, MSc Wi.-Inf. Sommersemester 2009 Organisatorisches Vorlesung Beginn: 17. April 2009 Freitag 10:15-11:45 Uhr, Raum 0443 Übungen Beginn: 23. April

Mehr

Informationsextraktion

Informationsextraktion Informationsextraktion Ruprecht-Karls-Universität Heidelberg Institut für allgemeine und angewandte Sprach- und Kulturwissenschaft Seminar für Computerlinguistik HS: Information Retrieval Dozentin: PD

Mehr

"What's in the news? - or: why Angela Merkel is not significant

What's in the news? - or: why Angela Merkel is not significant "What's in the news? - or: why Angela Merkel is not significant Andrej Rosenheinrich, Dr. Bernd Eickmann Forschung und Entwicklung, Unister GmbH, Leipzig UNISTER Seite 1 Unister Holding UNISTER Seite 2

Mehr

Level 2 German, 2013

Level 2 German, 2013 91126 911260 2SUPERVISOR S Level 2 German, 2013 91126 Demonstrate understanding of a variety of written and / or visual German text(s) on familiar matters 9.30 am Monday 11 November 2013 Credits: Five

Mehr

GR5W. General Certificate of Education June 2007 Advanced Level Examination. Unit 5 The Cultural and Social Landscape in Focus. Time allowed: 2 hours

GR5W. General Certificate of Education June 2007 Advanced Level Examination. Unit 5 The Cultural and Social Landscape in Focus. Time allowed: 2 hours General Certificate of Education June 2007 Advanced Level Examination GERMAN Unit 5 The Cultural and Social Landscape in Focus GR5W Thursday 14 June 2007 9.00 am to 11.00 am For this paper you must have:!

Mehr

FASTUS: Ein System zur Informationsextraktion mit Transduktoren

FASTUS: Ein System zur Informationsextraktion mit Transduktoren FASTUS: Ein System zur Informationsextraktion mit Transduktoren (Systembeschreibung) Branimira Nikolova HS Endliche Automaten für die Sprachverarbeitung SS 2004 Dr. Karin Haenelt Information Extraction

Mehr

Information Retrieval im Internet

Information Retrieval im Internet Information Retrieval im Internet Kursfolien Karin Haenelt 25.11.01 1 Besonderheiten der Daten (1) Verteilte Daten Viele Rechner Verschiedene Plattformen Hohe Volatilitätsrate Schätzung: 40% des Internets

Mehr

Providers of climate services in Germany

Providers of climate services in Germany Providers of climate services in Germany National Dialog Prof. Dr. Maria Manez Costa Dr. Jörg Cortekar 2 Procedure Mapping of climate services providers - Germany Network development between the providers

Mehr

Eine Beispieldatenbank enthält folgende Datensätze (Signatur wurde mit gegebener Signaturfunktion berechnet): Signatur (S D ) t1 t2 t3 t4 t5 t6 t7

Eine Beispieldatenbank enthält folgende Datensätze (Signatur wurde mit gegebener Signaturfunktion berechnet): Signatur (S D ) t1 t2 t3 t4 t5 t6 t7 Beispiel Eine Beispieldatenbank enthält folgende Datensätze (Signatur wurde mit gegebener Signaturfunktion berechnet): Name Ort Material Signatur (S D ) t Mandro M Schrauben t Müller B Dichtungen t3 Holz

Mehr

Algorithmische Methoden zur Netzwerkanalyse

Algorithmische Methoden zur Netzwerkanalyse Algorithmische Methoden zur Netzwerkanalyse Prof. Dr. Henning Meyerhenke Institut für Theoretische Informatik 1 KIT Henning Universität desmeyerhenke, Landes Baden-Württemberg Institutund für Theoretische

Mehr

Organisatorisches. Unit1: Intro and Basics. Bewertung. About Me.. Datenorientierte Systemanalyse. Gerhard Wohlgenannt

Organisatorisches. Unit1: Intro and Basics. Bewertung. About Me.. Datenorientierte Systemanalyse. Gerhard Wohlgenannt Organisatorisches Datenorientierte Systemanalyse Unit1: Intro and Basics Gerhard Wohlgenannt Inhalt: Datenorientierte Systemanalyse Umfang: 5 units XX.10.2013 XX.11.2013 09:00-13:30 Uhr Room XXX Infos,

Mehr

Wie komme ich zu einer Note?

Wie komme ich zu einer Note? 3. Dezember 2014 Wie komme ich zu einer Note? http://commons.wikimedia.org/wiki/file:albert_anker _Schreibender_Knabe_c1908.jpg Gewürfelt? http://www.animatedimages.org/imganimated-dice-image-0021-120721.htm

Mehr

GAUSS towards a common certification process for GNSS applications using the European Satellite System Galileo

GAUSS towards a common certification process for GNSS applications using the European Satellite System Galileo GAUSS towards a common certification process for GNSS applications using the European Satellite System Galileo Matthias Grimm, Dr. Michael Meyer zu Hörste Vortragstitel > 11. Juni 2010 > Folie 1 Agenda

Mehr

Level 1 German, 2011

Level 1 German, 2011 90886 908860 1SUPERVISOR S Level 1 German, 2011 90886 Demonstrate understanding of a variety of German texts on areas of most immediate relevance 9.30 am uesday Tuesday 1 November 2011 Credits: Five Achievement

Mehr

DOWNLOAD OR READ : TUTORIUM ANALYSIS 1 UND LINEARE ALGEBRA 1 MATHEMATIK VON STUDENTEN F R STUDENTEN ERKL RT UND KOMMENTIERT PDF EBOOK EPUB MOBI

DOWNLOAD OR READ : TUTORIUM ANALYSIS 1 UND LINEARE ALGEBRA 1 MATHEMATIK VON STUDENTEN F R STUDENTEN ERKL RT UND KOMMENTIERT PDF EBOOK EPUB MOBI DOWNLOAD OR READ : TUTORIUM ANALYSIS 1 UND LINEARE ALGEBRA 1 MATHEMATIK VON STUDENTEN F R STUDENTEN ERKL RT UND KOMMENTIERT PDF EBOOK EPUB MOBI Page 1 Page 2 tutorium analysis 1 und lineare algebra 1 mathematik

Mehr

Rev. Proc Information

Rev. Proc Information Rev. Proc. 2006-32 Information 2006, CPAs 1 Table 1-Total loss of the home Table 2- Near total loss is water to the roofline. Completely gut the home from floor to rafters - wiring, plumbing, electrical

Mehr

Seminar: Advanced Internet Technology. Lehrveranstaltungsnummer: 12ws Lehrveranstaltungstyp: Seminar engl. Erfasste Fragebögen: 9

Seminar: Advanced Internet Technology. Lehrveranstaltungsnummer: 12ws Lehrveranstaltungstyp: Seminar engl. Erfasste Fragebögen: 9 Seminar: Advanced Internet Technology Lehrveranstaltungsnummer: ws-06 Lehrveranstaltungstyp: Seminar engl. Erfasste Fragebögen: 9 Globalwerte Globalindikator - + mw=.6 - mw=.6 + Seminar Concept Auswertungsteil

Mehr

Exploring the knowledge in Semi Structured Data Sets with Rich Queries

Exploring the knowledge in Semi Structured Data Sets with Rich Queries Exploring the knowledge in Semi Structured Data Sets with Rich Queries Jürgen Umbrich Sebastian Blohm Institut AIFB, Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 www.kit.ed Overview

Mehr

Implementierung eines Vektormodells

Implementierung eines Vektormodells Implementierung eines Vektormodells Hauptseminar Information Retrieval WS 2013/14 Dr. Karin Haenelt Amol Phadke, Mirjam Eppinger Institut für Computerlinguistik Ruprecht-Karls-Universität Heidelberg 03.02.2014

Mehr

Suchmaschinentechnologie

Suchmaschinentechnologie Modul: Studiengang: Bibliotheksinformatik Abschluss: Master of Science Modulverantwortliche/r: Sascha Szott & Frank Seeliger Semester: 2 Präsenzstunden: 50.0 Art der Lehrveranstaltung: Pflicht Dauer: 2

Mehr

Information Retrieval und Question Answering

Information Retrieval und Question Answering und Question Answering Kai Kugler 19. November 2009 Auffinden von relevantem Wissen Die Relevanz der aufzufindenden Information ist abhängig vom... aktuellen Wissen des Benutzers dem aktuellen Problem

Mehr

Benutzerorientierte Bewertungsmaßstäbe für Information Retrieval Systeme: Der Robust Task bei CLEF Thomas Mandl

Benutzerorientierte Bewertungsmaßstäbe für Information Retrieval Systeme: Der Robust Task bei CLEF Thomas Mandl Proceedings des Fünften Hildesheimer Evaluierungs- und Retrievalworkshop (HIER 2006) Benutzerorientierte Bewertungsmaßstäbe für Information Retrieval Systeme: Der Robust Task bei CLEF 2006 Thomas Mandl

Mehr

Unit 1. Motivation and Basics of Classical Logic. Fuzzy Logic I 6

Unit 1. Motivation and Basics of Classical Logic. Fuzzy Logic I 6 Unit 1 Motivation and Basics of Classical Logic Fuzzy Logic I 6 Motivation In our everyday life, we use vague, qualitative, imprecise linguistic terms like small, hot, around two o clock Even very complex

Mehr

Level 1 German, 2016

Level 1 German, 2016 90886 908860 1SUPERVISOR S Level 1 German, 2016 90886 Demonstrate understanding of a variety of German texts on areas of most immediate relevance 2.00 p.m. Wednesday 23 November 2016 Credits: Five Achievement

Mehr

APPLICATION. DeutscherAkademischerAustauschDienst GERMAN ACADEMIC EXCHANGE SERVICE 871 UN Plaza, New York, NY 10017

APPLICATION. DeutscherAkademischerAustauschDienst GERMAN ACADEMIC EXCHANGE SERVICE 871 UN Plaza, New York, NY 10017 APPLICATION DeutscherAkademischerAustauschDienst GERMAN ACADEMIC EXCHANGE SERVICE 871 UN Plaza, New York, NY 10017 Telephone: (212) 758-3223 Fax: (212) 755-5780 E-Mail: daadny@daad.org Website: http://www.daad.org

Mehr

Non users after Cochlear Implantation in Single Sided Deafness

Non users after Cochlear Implantation in Single Sided Deafness Non users after Cochlear Implantation in Single Sided Deafness W. Pethe*, J. Langer*, S. Lissel**, K. Begall* *HNO-Klinik, AMEOS Klinikum Halberstadt **Cochlear Implant Rehabilitationszentrum Sachsen-Anhalt

Mehr

Question Answering mit Support Vector Machines

Question Answering mit Support Vector Machines Question Answering mit Support Vector Machines Sabrina Stehwien 30.01.2012 HS Information Retrieval Dozentin: Karin Haenelt Überblick 1. Question Answering Systeme 2. Das SAIQA-II QA-System 3. Support

Mehr

Information Retrieval and Semantic Technologies

Information Retrieval and Semantic Technologies Information Retrieval and Semantic Technologies Gerhard Wohlgenannt 6. April 2013 Inhaltsverzeichnis 1 Informationen zur Lehrveranstaltung 2 1.1 Inhalt................................... 2 2 Unterlagen

Mehr

Elementare Begriffe der Wahrscheinlichkeitstheorie für die Sprachverarbeitung

Elementare Begriffe der Wahrscheinlichkeitstheorie für die Sprachverarbeitung Elementare Begriffe der Wahrscheinlichkeitstheorie für die Sprachverarbeitung Kursfolien Karin Haenelt 1 Übersicht Wahrscheinlichkeitsfunktion P Wahrscheinlichkeit und bedingte Wahrscheinlichkeit Bayes-Formeln

Mehr

Akademisches Lehrmaterial online

Akademisches Lehrmaterial online Akademisches Lehrmaterial online Christian Weber cweber@akleon.de Entstanden im Rahmen des DFN-Projekts META-AKAD gefördert mit Mitteln des BMBF Mitwirkende an der TU Kaiserslautern Universitätsbibliothek

Mehr

Digitale Bibliotheken. Informationssuche, Zugriff und Verbreitung

Digitale Bibliotheken. Informationssuche, Zugriff und Verbreitung Digitale Bibliotheken Informationssuche, Zugriff und Verbreitung Gliederung Einführung Informationssuche Problemstellung Boolesche Suche Vektorraumsuche Stemming Multilinguale Suche Fuzzy Suche Semantische

Mehr