Webinfolab / CHEVAL: Evaluationslabor für Information Retrieval Systeme mit semantischen und visuellen Komponenten



Ähnliche Dokumente
Prototypische Entwicklung einer Software für die Erfassung und Analyse explorativer Suchen in Verbindung mit Tests zur Retrievaleffektivität

User Experience vs. Retrievaltests Wie lässt sich die Relevanz von Suchergebnissen bewerten?

Task: Nmap Skripte ausführen

Seminarthemen WS 14/15

SERVICE SUCHE ZUR UNTERSTÜTZUNG

Vivit TQA Anwendertreffen 2014

Museen im Web, Objektdatenbanken und Standards Der Stand in der Schweiz

BI in der Cloud eine valide Alternative Überblick zum Leistungsspektrum und erste Erfahrungen

Stock and Order Management

Upgrade auf die Standalone Editionen von Acronis Backup & Recovery 10. Technische Informationen (White Paper)

Themen. Web Services und SOA. Stefan Szalowski Daten- und Online-Kommunikation Web Services

Loggen Sie sich in Ihrem teamspace Team ein, wechseln Sie bitte zur Verwaltung und klicken Sie dort auf den Punkt Synchronisation.

Lebenslagenatlas des Kreis Lippe D115-Behördeninformation und Geoinformation unter einem Dach

Interaktivität in Vorlesungen und Großveranstaltungen

Suchmaschinenoptimierung. Grundlagen zur Optimierung der eigenen Internetseite

ZENITY - Die Software für Ihre Unternehmens-Releaseplanung

Knowledge Management in der Technischen Dokumentation. Knowledge Management in der Technischen Dokumentation

EFFEKTIVE TEAM-UND PROJEKTARBEIT MIT

Webmodule. Informationen zur neuen Version der Online Auftragserfassung / Tracking & Tracing

Trusted Location Based Services

Einführung in das Web Content Management System (CMS) Typo3

Microsoft SharePoint 2013 Designer

Visualisierung von Geodaten

Termin-Umfragen mit Doodle

Evaluation der Veranstaltungen auf der Basis von Stud.IP

S-Verein VereinshomepagePLUS

Content Management System mit INTREXX 2002.

Anleitung zur Nutzung des Blogs

Die Anwendung von Work of Leaders in drei Schritten

Diese Ansicht erhalten Sie nach der erfolgreichen Anmeldung bei Wordpress.

Praktikum/Thesis im Bereich Softwareentwicklung - Embedded Softwareentwicklung

Analyse und Toolevaluierung

ERIS - ein thesaurusbasiertes Bildretrievalsystem mittels Zoomable User Interface

Erste Schritte mit Sharepoint 2013

Mit ApEx 3.1 eine Website mit integriertem CMS entwickeln. Enrico Mischorr merlin.zwo InfoDesign GmbH & Co. KG

Die revidierte Norm SIA 405 Geodaten zu Ver- und Entsorgungsleitungen

PHP Kurs Online Kurs Analysten Programmierer Web PHP

Anleitung zum School Education Gateway

Internet Explorer Version 6

Die Orgadata AG ist ein stark expandierendes Software-Unternehmen aus Leer. Mit unserem System LogiKal

Integration mit. Wie AristaFlow Sie in Ihrem Unternehmen unterstützen kann, zeigen wir Ihnen am nachfolgenden Beispiel einer Support-Anfrage.

Vorhersagemodell für die Verfügbarkeit von IT-Services

REGIONALES RECHENZENTRUM ERLANGEN [ RRZE] Datenbanken. RRZE-Campustreffen, Stefan Roas und Ali Güclü Ercin, RRZE

E-Business Architekturen

ERSTE SCHRITTE.

Hochschul-App Uni Hohhenheim Case Study

Tutorial zum CommSy-Portal des Universitätskollegs

FUTURE NETWORK REQUIREMENTS ENGINEERING

Agile Vorgehensmodelle in der Softwareentwicklung: Scrum

Schritt für Schritt zur Krankenstandsstatistik

Qualitätsmanagement an der Carl von Ossietzky Universität Oldenburg Treffen der Qualitätsmanagementbeauftragten

BENUTZERHANDBUCH BAGE

Leistungsstarke Enterprise Apps. Für Menschen erdacht. Für Veränderungen entwickelt.

Anleitung zur Einrichtung von Kontoweckern im Online Banking

Eclipse Plugins für die komfortablere Verwendung von ibatis SQLMaps

Installationsanleitung. ipoint - Server

-KONVERTIERUNG LEVIGO SOLUTIONS DAY , 13:45 14:15 WAS PASSIERT MIT NICHT KONVERTIERBAREN ANHÄNGEN?

Popup Blocker/Sicherheitseinstellungen

Kurzanweisung für Google Analytics

Der Mängelmelder. Anliegenmanagement & Datenqualität in der Praxis

ANLEITUNG PREMIUM-PROFIL

Kurz-Anleitung zum Erstellen eines HotPot-Test

easycms Content Management System

Windows 10 für Unternehmen: Deployment

Gönnen Sie sich mehr Freizeit

Nadine Edelmann // Klaudia Fernowka // Magdalena Kierat // Anne Schwertfeger


p-cost Benutzerhandbuch Alfred Pabinger

Das Event-Management-Tool

bruederlinpartner «Nearshoring auf höchstem Niveau!»

Universal Dashboard auf ewon Alarmübersicht auf ewon eigener HTML Seite.

Ökonomik der Agrar und Ernährungswirtschaft in ILIAS

Modulhandbuch für den Studiengang Informationswissenschaft (Ergänzungsfach)

Consulting & Software

Web Content Management

Vorstellung der Energieeffizienzsoftware!

MAVE virtualisiert industrielle Geschäftsprozesse und beruht auf den Schultern des Studiengangs Wirtschaftsinformatik 2012.

Corporate Smart Process Content. Wissensmanagement mittels Prozesskontext

Mobiles SAP für Entscheider. Permanente Verfügbarkeit der aktuellen Unternehmenskennzahlen durch den mobilen Zugriff auf SAP ERP.

Anleitung für IQES-Verantwortliche Schulkonto verwalten

Lizenzierung von Windows Server 2012

Installation des CMS-Systems Contao auf einem Windows-Rechner mit XAMPP

Prozessmodellierung mit Objektorientierten Ereignisgesteuerten. und der bflow* Toolbox

Eine Bürokratiekostenfolgenabschätzung zum zweiten Gesetz für moderne Dienstleistungen am Arbeitsmarkt im Hinblick auf die Einführung einer Gleitzone

Projekt: BLUME Basis PDM Lehr- und Projekt Umgebung für kooperative Mechatronische Produkt Entwicklung. TU Wien,

Wie funktioniert automatisierte Übersetzung? Prof. Josef van Genabith (Deutsches Forschungszentrum für Künstliche Intelligenz)

UA03 Interaktive Entscheidungsbäume

Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen

Fragen und Antworten

LINK Konfiguration. Inhaltsverzeichnis

Hilfe und Support. Statische Hilfe. Inhaltsverzeichnis der Hilfetexte. Reihe TextGrid-Tutorials

OUTSOURCING ADVISOR. Analyse von SW-Anwendungen und IT-Dienstleistungen auf ihre Global Sourcing Eignung. Bewertung von Dienstleistern und Standorten

Erfolgreicher Einsatz von Social Media in Unternehmen

Andreas Joppich Weitlingstr Berlin Tel: Mail: - Web:

Fallbeispiel. Auswahl und Evaluierung eines Software- Lokalisierungstools. Tekom Herbsttagung 2004 Angelika Zerfaß

OS Anwendungsbeschreibung

CHLexML: Aktueller Stand

Entwicklungsumgebungen. Packer, Vagrant, Puppet. Alexander Pacnik Mannheim,

Dr. Klaus Körmeier BlueBridge Technologies AG

Transkript:

Webinfolab / CHEVAL: Evaluationslabor für Information Retrieval Systeme mit semantischen und visuellen Komponenten Vortrag anlässlich der ODOK 2007 (20. September 2007, Graz) Joachim Pfister Schweizerisches Institut für Informationswissenschaft (SII) Hochschule für Technik und Wirtschaft, HTW Chur, Schweiz

Agenda 1. Evaluierung von Information Retrieval Systemen (IRS) 2. Motivation 3. Webinfolab / CHEVAL Ziele Evaluationsprozess Architektur 4. Anwendungsszenario 5. Fazit und Ausblick Seite 2

Evaluierung von IRS Ausgangspunkt: Cranfield-Experimente (1962) gemeinsame Testkollektionen (Dokumente und Anfragen) vergleichende Evaluation (vgl. Voorhees und Harmann, 2005) Bekannte Evaluierungs-Initiativen TREC (Text REtrieval Conferences) CLEF (Cross Language Evaluation Forum) INEX (INitiative for the Evaluation of XML retrieval) Weiterentwicklungen der Technologien Visualisierung von Suchergebnissen Semantische Konzepte Web2.0 Konzepte Seite 3

Seite 4

Seite 5

Motivation Evaluation von IRS basiert auf Standardmassen (Recall, Precision, Kombinationsmasse [z.b. F-Measure]) Usability eines IRS wird meist separat bewertet (z.b. Screencapturing, Guidelines, Tagebuchstudien) Einflussfaktoren für IRS-Evaluationen: Komplexe Zusammenhänge zwischen Ergebnispräsentation (Benutzungsoberfläche/GUI) Interaktionsmöglichkeiten Semantischen Technologien Gewöhnungseffekte (De-Facto Standard Google, Yahoo oder MSN) Eine umfassende Evaluation eines IRS (mit Schwerpunkt aus Nutzersicht) muss sowohl Standardmasse als auch Usability-Aspekte kombinieren! Seite 6

CHEVAL Ziele und Vision Webinfolab CHEVAL (CHur EVAluation Laboratory) http://www.cheval-lab.ch (bislang: WIKI) CHEVAL als Framework, dass verschiedene Evaluationsansätze und methoden bereitstellt, verschiedene Arten der Evaluation von IRS-Systemen unterstützt. CHEVAL bietet eine Infrastruktur zum Durchführen von Evaluationen systemunterstützten Auswählen geeigneter Methoden Verwalten von Testkollektionen Überwachen des Verlaufs eines Evaluationsprojekts Speichern der Ergebnisse, auch für Benchmarking Generieren von Berichten Seite 7

Tool mit relevanter Teilfunktionalität (bspw. als Methode in CHEVAL zu integrieren) Retrieval Performance Test mittels des Tools TERS als Beispiel (van Zwol und Ossstendorp, 2004) Seite 8

Phasen einer Evaluation unterstützt durch CHEVAL System N... System B System A Vorbereitungsphase Durchführung Analysephase Vorbereitung Testkollektionen Auswahl Methoden Vorbereitung Testaufgaben Vorbereitung benötiger Materialien Durchführung der Evaluation Speicherung der Resultate Ggf. Berechnung von statistischen Werten und Kennzahlen Benchmarking Administration Testpersonen Seite 9

CHEVAL - Architektur Seite 10

CHEVAL Anwendungsszenario (I.) Einsatzszenario für CHEVAL: Evaluation der Suchfunktion von Unternehmens-Websites Zwei Studien (Herbst 2006: CH, Frühjahr 2007: D), bei der mit weiteren Hochschul- und Wirtschaftspartnern die Suchfunktionalität von Unternehmenswebsites und Websites Öffentlicher Einrichtungen untersucht wurde. (Braschler et al. 2006 und 2007) Suchindex Anfrage- / Dokumenten- Matching Nutzerinteraktion Suchergebnisse Bisher: Medien- und Anwendungsbruch Aufgabenbeschreibung in Papierform Erfassung in Excel-Tabelle (Zwischenergebnisse, Resultate) Durchführung der Tests im Browser Seite 11

CHEVAL Anwendungsszenario (II.) Mit Hilfe von CHEVAL: Verknüpfung von Aufgabenbeschreibung und Möglichkeiten der Ergebniserfassung auf einer Web-Seite Kein Medien- oder Anwendungsbruch Ermöglicht das Testen auf Korrektheit und Vollständigkeit (höhere Datenqualität) Überblick über den aktuellen Status eines Testprojekts (wie viele Tester haben wie viel schon bearbeitet?) Erstellen einer Benchmarking-Datenbank, z.b. im Rahmen einer vergleichenden Evaluation (verschiedene Anbieter eines IRS), der Implementierung eines IRS, um die Konfiguration mit den optimalen Parametern zu ermitteln. Seite 12

Fazit und Ausblick CHEVAL: Framework zum Durchführen und Auswerten von Evaluationen Konkrete Programmierung im Q1 2008 geplant Inkrementelles Vorgehen bei der Implementierung: Nach zunehmender Komplexität werden Funktionalitäten ergänzt. Geplante Evaluations-Dienste (in der Reihenfolge ihrer Umsetzung): Website Search Assessment Kundenzufriedenheitsanalyse IRS Beratungsdienstleistungen IRS Effizienzmessungen (Retrieval Performance Test) Usability Tests Evaluation von IRS mit visuellen oder semantischen Konzepten Bereitstellung der Software als Open Source Software (geplant) Beitrag für die wissenschaftliche Community Weiterentwicklung durch die Community Seite 13

Fragen? Vielen Dank für Ihre Aufmerksamkeit. Ausführlicher Artikel: Bauer, L.; Herget, J.; Hierl, S.; Pfister, J.; Weinhold, T. (2007): Cheval: Das Churer Evaluationskonzept für Information, Systeme und Nutzer - eine Toolbox im Entstehen. Proceedings der DGI-Tagung 2007, 10.-12. Oktober 2007 in Frankfurt am Main, Seiten 285-292. Weinhold, T.; Bauer, L.; Herget, J.; Hierl, S.; Pfister, J. (2007): CHEVAL: Chur Evaluation Laboratory. Proceedings of the European Conference on Information Management and Evaluation 2007 (ECIME 2007), September 20-21, 2007, Montpellier, France. Pages 393-400.

Quellen Braschler, Martin; Herget, Josef; Pfister, Joachim; Schäuble, Peter; Steinbach, Markus; Stuker, Jürg (2006): Evaluation der Suchfunktion von Schweizer Unternehmens- Websites. In: Herget, J; Hierl, S. (Hrsg.): Churer Schriften zur Informationswissenschaft Schrift 12, 2006 Braschler, Martin; Herget, Josef; Pfister, Joachim; Schäuble, Peter; Steinbach, Markus; Stuker, Jürg: Kommunikation im Internet: Die Suchfunktion im Praxistest. In: IWP - Information Wissenschaft & Praxis 58 (2007) 3, S. 159-168 Voorhees, Ellen M. und Harman, Donna K. (2005): The Text REtrieval Conference. In: TREC. Experiment and Evaluation in Information Retrieval. MIT Press : Cambridge, Mass. http://mitpress.mit.edu/books/chapters/0262220733chap1.pdf, verifiziert am 18.09.2007, 11:03 Uhr MEZ Zwol, R. Van und Oostendorp, H. Van (2004) Google's I'm feeling lucky, Truly a Gamble?, Zhou, X. et al. (Eds.): Web Information Systems - WISE 2004, Proceedings of the 5th International Conference on Web Information Systems Engineering, Brisbane, Australia, 378-390. Seite 15