Darstellung der Methodik in TREC und TREC-basierte Evaluierung



Ähnliche Dokumente
2 Evaluierung von Retrievalsystemen

Professionelle Seminare im Bereich MS-Office

Wir machen neue Politik für Baden-Württemberg

User Experience vs. Retrievaltests Wie lässt sich die Relevanz von Suchergebnissen bewerten?

Anwendungsbeispiele. Neuerungen in den s. Webling ist ein Produkt der Firma:

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

potential2 Mitarbeitergespräche als erfolgreiches Führungsinstrument 17. Januar 2013 Susanne Triebs-Lindner // Helmut Lindner Potentialhoch2 (Hamburg)

COMPUTERIA VOM SERIENBRIEFE UND ETIKETTENDRUCK

Multicheck Schülerumfrage 2013

Version smarter mobile(zu finden unter Einstellungen, Siehe Bild) : Gerät/Typ(z.B. Panasonic Toughbook, Ipad Air, Handy Samsung S1):

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Windows XP Jugendschutz einrichten. Monika Pross Molberger PC-Kurse

So gehts Schritt-für-Schritt-Anleitung

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin:

How-to: Webserver NAT. Securepoint Security System Version 2007nx

Anlegen eines SendAs/RecieveAs Benutzer unter Exchange 2003, 2007 und 2010

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

Integrierte Dienstleistungen regionaler Netzwerke für Lebenslanges Lernen zur Vertiefung des Programms. Lernende Regionen Förderung von Netzwerken

Downloadfehler in DEHSt-VPSMail. Workaround zum Umgang mit einem Downloadfehler

GEVITAS Farben-Reaktionstest

Anleitung zur Bearbeitung von Prüferkommentaren in der Nachreichung

Anleitung über den Umgang mit Schildern

Handbuch. Artologik EZ-Equip. Plug-in für EZbooking version 3.2. Artisan Global Software

Massenversand Dorfstrasse 143 CH Kilchberg Telefon 01 / Telefax 01 / info@hp-engineering.com

Dominik Stockem Datenschutzbeauftragter Microsoft Deutschland GmbH

Informationen zum Ambulant Betreuten Wohnen in leichter Sprache

Geld Verdienen im Internet leicht gemacht

1. Einführung. 2. Alternativen zu eigenen Auswertungen. 3. Erstellen eigener Tabellen-Auswertungen

Datenanalyse - Schnittstellendesign

KVIrc installieren (win) i. KVIrc installieren (win)

Das Leitbild vom Verein WIR

Online Newsletter III

s zu Hause lesen

Mit dem Tool Stundenverwaltung von Hanno Kniebel erhalten Sie die Möglichkeit zur effizienten Verwaltung von Montagezeiten Ihrer Mitarbeiter.

Persönliches Adressbuch

Praxisteil. Seminar experimentelle Evaluierung in IR WS05/06 Gruppe A

Das Persönliche Budget in verständlicher Sprache

End User Manual für SPAM Firewall

Widerrufsbelehrung der Free-Linked GmbH. Stand: Juni 2014

Allgemeiner Leitfaden zum Einfügen suchmaschinenoptimierter Texte

Kontakte Dorfstrasse 143 CH Kilchberg Telefon 01 / Telefax 01 / info@hp-engineering.com

Die Gesellschaftsformen

Was meinen die Leute eigentlich mit: Grexit?

OutLook 2003 Konfiguration

Affiliate Marketing Schnellstart Seite 1

Internationales Altkatholisches Laienforum

Erst Lesen dann Kaufen

Die Captimizer BTZ-Datei 2015

Zugang zum Online-Portal mit Passwort Benutzeranleitung (Stand 01/2015)

MORE Profile. Pass- und Lizenzverwaltungssystem. Stand: MORE Projects GmbH

Prozessbewertung und -verbesserung nach ITIL im Kontext des betrieblichen Informationsmanagements. von Stephanie Wilke am

Zeichen bei Zahlen entschlüsseln

INNER WHEEL DEUTSCHLAND

News & RSS. Einleitung: Nachrichten er-(veröffentlichen) und bereitstellen Nachrichten erstellen und bereitstellen

Agentur für Werbung & Internet. Schritt für Schritt: -Konfiguration mit Apple Mail

Idimager ein Bildverwaltungsprogramm-DAM Software

Etikettendruck mit Works 7.0

Lieber SPAMRobin -Kunde!

Nicht über uns ohne uns

Kurzanleitung. MEYTON Aufbau einer Internetverbindung. 1 Von 11

Einrichtung des Cisco VPN Clients (IPSEC) in Windows7

In diesem Tutorial lernen Sie, wie Sie einen Termin erfassen und verschiedene Einstellungen zu einem Termin vornehmen können.

Kurzanleitung RACE APP

Praxistipps für eine effektive Büro - Organisation von Gisela Krahnke

LinguLab GmbH. Bedienungsanleitung Allgemeine Definition

Task: Nmap Skripte ausführen

End User Manual EveryWare SPAM Firewall

Hilfe zur Urlaubsplanung und Zeiterfassung

Wie halte ich Ordnung auf meiner Festplatte?

Fachdidaktik der Informatik Jörg Depner, Kathrin Gaißer

Eigene Seiten erstellen

Gewinnen Sie in Dynamics CRM Erkenntnisse über Ihre Kunden und Ihr Unternehmen im gesamten Social Web in Echtzeit. Version 3.0

Studieren- Erklärungen und Tipps

Anleitung Typo3-Extension - Raumbuchungssystem

PK-Website: Besuche & Seitenaufrufe 2010 und 2011

UserManual. Handbuch zur Konfiguration einer FRITZ!Box. Autor: Version: Hansruedi Steiner 2.0, November 2014

Barrierefreie Webseiten erstellen mit TYPO3

Blumen-bienen-Bären Academy. Kurzanleitung für Google Keyword Planer + Google Trends

2. Einrichtung der ODBC-Schnittstelle aus orgamax (für 32-bit-Anwendungen)

Ihren Kundendienst effektiver machen

Beschreibung Regeln z.b. Abwesenheitsmeldung und Weiterleitung

1. Einführung Erstellung einer Teillieferung Erstellung einer Teilrechnung 6

AW: AW: AW: AW: Kooperationsanfrage anwalt.de

Arbeitshilfen Messecontrolling Wie geht denn das?

Die Invaliden-Versicherung ändert sich

Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen

Mitarbeiter IVR - Wozu

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang

Um das Versenden von Anhängen an s zu ermöglichen, wurde der Assistent für die Kommunikation leicht überarbeitet und wo nötig verbessert.

Sich einen eigenen Blog anzulegen, ist gar nicht so schwer. Es gibt verschiedene Anbieter. ist einer davon.

Webalizer HOWTO. Stand:

Persönliche Zukunftsplanung mit Menschen, denen nicht zugetraut wird, dass sie für sich selbst sprechen können Von Susanne Göbel und Josef Ströbl

Anleitung zur Daten zur Datensicherung und Datenrücksicherung. Datensicherung

Anwendungsbeispiele Buchhaltung

Einführung in. Logische Schaltungen

von: Oktay Arslan Kathrin Steiner Tamara Hänggi Marco Schweizer GIB-Liestal Mühlemattstrasse Liestal ATG

S TAND N OVEMBE R 2012 HANDBUCH DUDLE.ELK-WUE.DE T E R M I N A B S P R A C H E N I N D E R L A N D E S K I R C H E

BENUTZERHANDBUCH für. Inhaltsverzeichnis. 1. Anmeldung. 2. Rangliste ansehen. 3. Platzreservierung. 4. Forderungen anzeigen

SEPA-Leitfaden für PC-VAB Version Inhalt

Transkript:

Darstellung der Methodik in TREC und TREC-basierte Evaluierung Martin Jansson Philip Korte Lukas Wozniak 13. November 2005 Jansson, Korte, Wozniak 1

Inhaltsverzeichnis Was ist TREC? Die Ziele der Konferenz Organisation und Teilnehmer Methoden und Mittel Untersuchung eines TRACKs Vorgehen in TREC 13. November 2005 Jansson, Korte, Wozniak 2

Was ist TREC? Steht für Text REtrieval Conference Wurde 1992 gegründet. Teil des TIPSTER Projektes Wird von dem National Institute of Standards and Technology (NIST) mitfinanziert. 13. November 2005 Jansson, Korte, Wozniak 3

Ziele der Konferenz Nötige Infrastruktur liefern, auf welcher dann die Information Retrieval Community ihre Forschungen im Bereich des Text Retrieval aufbauen kann. Erleichtern von Forschungsanstrengungen im Bereich IR, die auf großen Testmengen aufbauen. Erhöhung des Kommunikationsflusses zwischen Forschung, Industrie und Regierung Schnellere Markteinführung neuer Produkte durch Testen neuer Forschungsergebnisse auf Alltagstauglichkeit Verbesserung von Evaluierungstechniken und deren Anpassung an State-of-the-art Technik 13. November 2005 Jansson, Korte, Wozniak 4

Ablauf von TREC Zu jeder TREC wird von der NIST eine Menge von Dokumenten und Anfragen zur Verfügung gestellt. Diese Dokumentenmenge wird von Experten untersucht. Jedes Dokument wird auf Relevanz bezüglich der Anfragen bewertet. Die Teilnehmer wenden nun ihre eigenen Retrieval Systeme auf die Daten an, und geben der NIST eine Liste der Relevantesten gefundenen Dokumente wieder. Nutzung der Pooling Methode zur Auswertung der Daten 13. November 2005 Jansson, Korte, Wozniak 5

Sonstiges 2003 nahmen 93 Teilnehmer aus 22 Ländern an TREC teil Die erhalteten Ergebnisse werden zusammen mit den Test Kollektionen der Allgemeinheit zur Verfügung gestellt. Als Effekt der Konferenz kann vermerkt werden, dass in den ersten 6 Jahren von TREC die Retrieval Systeme ihre Effektivität ungefähr verdoppelt haben. Große Popularität, da Auseinandersetzng mit verschiedenen Sprachen, wie z.b. Chinesisch 13. November 2005 Jansson, Korte, Wozniak 6

Methoden und Mittel TREC unterscheided zwischen verschiedenen Retrieval Arten, den sogenannten TRACKs, oder Topics. Topics bieten normalerweise ein spezifisches Problem, welches vom normalen Retrieval leicht abweicht. So gibt es beispielsweise ein Topic, in welche das eigene System auf Fragen Antworten liefern muss, wärend ein anderes Topic sich mit Spamerkennung auseinandersetzt. Zu jedem Topic (oder Forschungsgebiet) werden Kollektionen und Problemstellungen (meistens Anfragen) zur Verfügung gestellt, um die Vergleichbarkeit zu gewährleisten. In der Geschichte von TREC gab es bisher 13 verschiedene Topics, von denen dieses Jahr 7 angeboten werden. 13. November 2005 Jansson, Korte, Wozniak 7

Vorgehen in TREC Testbasis Objekte (Dokumente,... ) Anfragen (Topics) einheitliche Relevanzbeurteilung Chronologische Abfolge Ausgabe der Anfragen Einreichen von Ergebnissen Bekanntgabe der Ergebnisse 13. November 2005 Jansson, Korte, Wozniak 8

Die Pooling Methode Recall-Abschätzungen werden durch die Pooling Methode ermittelt, dadurch werden die IR Verfahren vergleichbar Mehrere IR Systeme werden auf den selben Dokumtenbestand angewendet Die Ergebnisse mehrerer Systeme zu den gleichen Anfragen werden zusammengetragen Starke Überlappungen in den Antwortmengen, machen das Verfahren aufwändig! Gemessene Recall Werte i.a. Zu optimistisch, da nur untere Schranken fürrelevanz geliefert werden 13. November 2005 Jansson, Korte, Wozniak 9

Relevanzurteile Sind von entscheidender Wichtigkeit für die Testkollektion Ermöglicht Ermittlung von Recall, Precision und Fallout Für jedes Topic ist es erforderlich eine Liste von relevanten Dokumenten zusammen zu stellen, die auf Anfragen geliefert werden sollten 13. November 2005 Jansson, Korte, Wozniak 10

Topics Sind dazu da, um die wirkliche Benutzer Erfordernis (user need) nachzuahmen Topics sind von Leuten gemacht worden welche sich mit einem Retrieval System beschäftigen Jedes Topic ist auf die selbe standardisierte Weise formatiert worden, um Anfragekonstrukte zu vereinfachen 13. November 2005 Jansson, Korte, Wozniak 11

Beispiel eines Topics Beispiel-Topic <TOP> <HEAD> Tipster Topic Description <NUM> Number: 066 <DOM> Domain: Science and Technology <TITLE> Natural Language Processing <DESC> Document will identify a type of natural language processing technology which is being developed or marketed in the U.S. <NARR> A relevant document will identify a company or institution developing or marketing a natural language processing technology, identify the technology, and identify one or more features of the company s product. <CON>NLP, translation, language, dictionary, font, software <NAT> U.S. </TOP> 13. November 2005 Jansson, Korte, Wozniak 12

Beispiel einer Suchanfrage Werden in der TREC-Collection TOPIC S genannt <top> <num> Number: 168 </num> <title> Topic: Financing AMTRAK </title> <desc> Description: A document will adress the role of the Federal Goverment in Financing the operation of National railroad Transportation Coporation (AMTRAK) <narr> Narrative: A relevant document must provide information on The goverment s responsibility to make AMTRAK an economically viabla entity. It could also discuss the privatization of AMTRAK as an alternative to continuing Goverment subsides given to air and bus transportation with Those provided to AMTRAK would also be relevant. </narr> </top> 13. November 2005 Jansson, Korte, Wozniak 13

Relevanzurteile Relevanzurteile: 51 0 AP880301-0271 1 51 0 AP880302-0275 1 51 0 AP880311-0301 1 51 0 AP880316-0292 1 51 0 AP880318-0287 1 51 0 AP880322-0296 0 51 0 AP880325-0293 1 51 0 AP880329-0252 0 51 0 AP880406-0267 1 51 0 AP880407-0258 1 51 0 AP880412-0268 1 51 0 AP880418-0270 0 51 0 AP880421-0319 0 51 0 AP880427-0272 0 Die 1. Zahl ist die Topic-ID, die 2. Zahl ist zu ignorieren, in der 3. Spalte ist die Dokument-ID (in allen Fällen aus AP), und die letzte Zahl gibt an, ob das Dokument relevant ist (1) oder nicht (0). 13. November 2005 Jansson, Korte, Wozniak 14

Ergebnisse Trec_Eval Queryid (Num): 1000 Total number of documents over all queries Retrieved: 48491 Relevant: 49254 Rel_ret: 10969 Interpolated Recall - Precision Averages: at 0.00 0.7520 at 0.10 0.4196 at 0.20 0.2673 at 0.30 0.2084 at 0.40 0.1722 at 0.50 0.1512 at 0.60 0.1244 at 0.70 0.1042 at 0.80 0.0749 at 0.90 0.0516 at 1.00 0.0300 Average precision (non-interpolated) for all rel docs(averaged over queries) 0.1815 Precision: At 5 docs: 0.4902 At 10 docs: 0.3997 At 15 docs: 0.3545 At 20 docs: 0.3193 At 30 docs: 0.2738 At 100 docs: 0.1097 At 200 docs: 0.0548 At 500 docs: 0.0219 At 1000 docs: 0.0110 R-Precision (precision after R (= num_rel for a query) docs retrieved): Exact: 0.2341 13. November 2005 Jansson, Korte, Wozniak 15

Beispiele für TREC Tracks im Jahr 2005 (1) Enterprise Track Erforschung der Suche im Unternehmen, um den Kunden bestmöglich zufrieden zu stellen Genomics Track Beschaffung von Genstrukturen, Laborergebnissen und Forschungsdokumente 13. November 2005 Jansson, Korte, Wozniak 16

Beispiele für TREC Tracks im Jahr 2005 (2) HARD Track Exakte Wiederbeschaffung von Dokumenten durch Wissen über den Benutzer und / oder den Suchkontext. Dies wird möglich gemacht durch Techniken wie Passage Retrieval und Benutzung von zielgerichteter Interaktion mit dem Suchenden Question Answering Track Versuch sich mehr dem Information Retrieval statt dem Document Retrieval zu nähern SPAM Track SPAM Filter Verbesserung durch Standard Evaluation 13. November 2005 Jansson, Korte, Wozniak 17

TRACKs : Question-Answer Track ( 04) QA Track Bestandteil seit 1999 Ziel : Antworten statt Dokumentenliste mit Antwortmöglichkeiten Frage ist Frageserie, die Informationen sucht. Letzte Teilfrage allgemein : Erzähl mir etwas, dass ich noch nicht wusste. 13. November 2005 Jansson, Korte, Wozniak

Question-Answer Track : Frageserie Bezug der Fragen: -Ding - Organisation -Person [- Event (ab 2005)] Aufbau (max 10): - X Faktenfragen - 0-2 Listenfragen - 1 Other Frage (allgemeine Frage) 13. November 2005 Jansson, Korte, Wozniak

Question-Answer Track : Entwicklung Faktenfragen (1999) Wieviele Kalorien hat ein BigMac? Listenfragen Nenne alle Kaugummisorten Definitionsfragen (2004) Was ist ein goldener Handschlag? 13. November 2005 Jansson, Korte, Wozniak

Question-Answer Track : Fragengenerierung average reader szenario als Grundlage Auswertung der Suchmaschinen Logs Assistenten erstellen Fragen zum Thema Suche der Assistenten: Antworten und Interessantes Nebenwissen (Dokumentenpool ist meistens der AQUANT Corpus of English News Text ) NIST Mitarbeiter erstellen finale Fragen 13. November 2005 Jansson, Korte, Wozniak

Question-Answer Track : Bewertung Antworten werden von Hand ausgewertet Typen (Factoid & List) : - incorrekt - not supported - not exact - correct -NIL Information Nuggest (Other) - vitale und nicht vitale Nuggets 13. November 2005 Jansson, Korte, Wozniak

Question-Answer Track : Bewertung Final Score : 0.50 x FactoidAccuracy + 0.25 x ListAveF + 0.25 x OtherAveF 13. November 2005 Jansson, Korte, Wozniak

Question-Answer Track : Muster http://trec.nist.gov/data/qa.html 13. November 2005 Jansson, Korte, Wozniak

Danke für die Aufmerksamkeit! Noch Fragen? 13. November 2005 Jansson, Korte, Wozniak 25

Quellenangabe Offizielle TREC Homepage http://trec.nist.gov (3. November 2005) Information Retrieval Skriptum zur Vorlesung im SS 05, Norbert Fuhr (4. April 2005) 13. November 2005 Jansson, Korte, Wozniak 26