Textbasierte Suche mit Hilfe von Anfrageerweiterungen - technische Realisierung und erste Erfahrungen



Ähnliche Dokumente
Scalable Vector Graphics-basierte

Themenschwerpunkt Social SEO

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006

Navigation. Drucken Klicken Sie auf ein Symbol, um nähere Informationen zu erhalten. Papierhandhabung Anzeigen der Online-Informationen

Volltextsuche im Service Desk

Informatik, Mathematik und Naturwissenschaften

Windows Explorer Das unbekannte Tool. Compi-Treff vom 19. September 2014 Thomas Sigg

Torben Weber. Datensammlung nach den Boarderline Engineering Essentials by systemtrading24 Fachverlag

Suchmaschinenalgorithmen. Vortrag von: Thomas Müller

Synchronisations- Assistent

Business Collaboration

Warum Suche (trotzdem) bedeutend ist

Suchdienste für Dokumente

Internet Ringversuche

Aktualisierung des Internet-Browsers

Datenbank-Recherche der nächsten Generation

1 WEB ANALYTICS: PROFESSIONELLE WEB-ANALYSEN UND REPORTING FÜR IHR ONLINE MARKETING.

Internet Explorer Version 6

Die neue bunte Google-Suche

Kurzleitfaden zur Benutzung der Würth online Holzbaubemessungssoftware

Wie kann ich mein Profil pflegen und/oder ihm ein PDF hinzufügen? Sie vermissen die Antwort auf IHRE Frage? Bitte lassen Sie uns Ihnen weiterhelfen:

Mister Wong - Social Bookmarking im praktischen Einsatz

Vorankündigung Die Verlagsleitung und der Erfolgsautor der Blauen Business-Reihe ist auf der Frankfurter Buchmesse 2007 vertreten.

Die lokale Suchmaschine für Deutschland. Vorgehensweisen und Vermarktungsmöglichkeiten einer lokalen Suchmaschine

Installations- und Bedienungsanleitung CrontoSign Swiss

Handreichung für die Online-Datenlieferung für die finanziellen Transaktionen

SDS Softmine Document Safe. Webfrontend Quick Start Guide Version 2.1 Revision 2

Verteilte Paarprogrammierung mit Eclipse

Interactive exploration of neural networks in Python. 3-d simulation of the e-puck robot in virtual environments

SmartDispatch DMR-Dispatcher. Bestellablauf. SmartDispatch-Bestellablauf V1.0

Erfahrungen mit Hartz IV- Empfängern

MICROSOFT WORD 2007 SERIENBRIEFE

Mobil: 01573/ Als Kleinunternehmer im Sinne von 19 Abs. 1 UStG wird keine Umsatzsteuer berechnet

Herzlich Willkommen. Thema

Von Bearbeiter Telefon-Durchwahl Telefax-Durchwahl DC-IA/SPF75

Web-Services - die GIS-Zukunft?

SKS CAD-Planer Kurzbeschreibung

Wie funktioniert das WWW? Sicher im WWW

Anleitung mtan (SMS-Authentisierung) mit SSLVPN.TG.CH

L & G TECH Industriezerspanung

v2.2 Die innovative Softwarelösung für kundenspezifisches Anrufmanagement Administrator-Handbuch

Suchergebnisdarstellung in Google, Bing, Cuil, etc. Christina Ficsor

Handbuch zur Installation der Software für die Bürgerkarte

Bewertung der aktuellen Standardlastprofile Österreichs und Analyse zukünftiger Anpassungsmöglichkeiten im Strommarkt

Installation Citrix Receiver unter Windows 8

SAPGUI-Installation. Windows Bit-Edition auf x64 (AMD) und Intel EM64T (nur die Editionen

HMC WEB INDEX. Erste große Deutschland Studie. Wie fit sind die Clubs im online marketing?

INSTALLATION der MAILBOX. Inhalt:

Interaktives Fernsehen: Neue Möglichkeiten der sozialen Vernetzung für Senioren

Konfigurationsanleitung zu Siedl Networks Zarafa Demo Server

Praktikables Online-Marketing

Drucken, Mailen und Exportieren mit SAP WebGui

Berechnung der Zuschüsse des KfW-Speicherprogramms in SOLinvest

Erläuterung des technischen Hintergrundes des neues RIWA GIS-Zentrums

Installationsanleitung für Update SC-Line

Von Tags zu Semantischen Netzen

Sichere Anleitung Zertifikate / Schlüssel für Kunden der Sparkasse Germersheim-Kandel. Sichere . der

Bedienungsanleitung für den Dokumentenserver

Gezielt über Folien hinweg springen

Gender-Mainstreaming und Qualitätsmanagement in der betrieblichen Praxis

Installation Citrix Receiver unter Windows 10

Die TMB Contentstrategie die wichtigste Folie!

Installation Citrix Receiver unter Windows 7

XML und seine Anwendungsmöglichkeiten bei der Archivierung im Gesundheitswesen

8. Suchmaschinen Marketing Kongress SEO/SEM-Fehler welche Sie meiden sollten

Popup Blocker/Sicherheitseinstellungen

Betriebliche Gestaltungsfelder

Onlineschulung. Wir setzen Maßstäbe! zu aktuellen Themen. Wago-Curadata Steuerberatungs-Systeme GmbH Schleißheimer Straße München

STLB-Bau Kundenmanager

Der VALUEpilot NEU! Ihr Ass im Ärmel

Grundsätze für das Online-Marketing der TMB

Technische Aspekte einer Videosuchmaschine. Björn Wilmsmann, CEO - MetaSieve GmbH

Mister Wong Eine Community schafft eine Ergänzung zu klassischen Suchmaschinen

robotron*e count robotron*e sales robotron*e collect Anmeldung Webkomponente Anwenderdokumentation Version: 2.0 Stand:

Social Media im Tourismus Oktober 2015

GS-Buchhalter/GS-Office 2015 Saldovorträge in folgenden Wirtschaftsjahren erfassen

MS Outlook Integration

Raoul Borenius, DFN-AAI-Team

CMS Usertreffen

Diplomarbeit: GOMMA: Eine Plattform zur flexiblen Verwaltung und Analyse von Ontologie Mappings in der Bio-/Medizininformatik

Technische Informationen. Fabasoft Cloud

Informationsblatt: Advoware über VPN

GIFONET-VPN unter Windows XP, Windows Vista, Windows 7 und Windows 8

Sales Intelligence. Einfacher Kunden finden und binden

Installation OMNIKEY 3121 USB

Web-Analytics auch für nicht-kommerzielle Websites ein MUSS!

Import Zertifikate ELM

Was Bibliotheken von Suchmaschinen lernen können. Prof. Dr. Dirk Lewandowski

Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen

Präsentation zur Vorstellung meiner Bachelor-Arbeit beim BSE- Seminar. Vortrag von Patrick Bitterling

Webmodule. Informationen zur neuen Version der Online Auftragserfassung / Tracking & Tracing

meinpflegedienst.com Release Notes 3.4

Smart Grids mit GIS effektiver planen und betreiben Herausforderungen und Chancen vor dem Hintergrund zunehmender dezentraler Einspeisungen

Einzelkurs-Auswertung Microsoft Office Excel 2010 Aufbauseminar

conjectcm Systemvoraussetzungen

AbaWeb Treuhand. Hüsser Gmür + Partner AG 30. Oktober 2008

2 Tägliche Aktualisierung notwendig und sehr Personalaufwand -> Kostengünstiger

Vorstellung Version 1.00 vom 03. März 2009 Christian Schnettelker,

CROSS-DATA Ein Informationssystem für die Raumplanung im sächsisch-tschechischen Grenzraum

Reporting Services und SharePoint 2010 Teil 1

Transkript:

Textbasierte Suche mit Hilfe von Anfrageerweiterungen - technische Realisierung und erste Erfahrungen Dr. Thomas Böhme thomas.boehme@tu-ilmenau.de Dipl.-Inf. Mario Kubek mario.kubek@tu-ilmenau.de Dipl.-Inf. Hans Friedrich Witschel witschel@informatik.uni-leipzig.de Vortrag im Rahmen des Workshops Realistische Evaluierungsansätze für P2PIR-Systeme am 29.02.2008 in Leipzig 1/12

Gliederung 1. Motivation für Suchanfragenerweiterung 2. Technische Realisierung Researcher Zweck des Researchers Funktionsweise 3. Realisierung als Komponente in der Firefox-Erweiterung FXResearcher Aufbau der Erweiterung Aktueller Stand (Integration von Volltextsuche und Researcher) 4. Erfahrungen und Tests mit FXResearcher Benutzerführung Fallbeispiele 5. Ausblick 2/12

1. Motivation 1.1 Idee zu textbasierter Suchanfrageerweiterung Entstanden im DFG-Projekt Inhaltsbasierte Suche von Textdokumenten in großen verteilten Systemen Peers halten Dokumente und können auf Basis sozialer Suche andere Peers und deren Dokumente nach Suchanfragen finden Ziel: Ergänzung der semantischen Suche in Peers durch Komponenten der Suchanfragenerweiterung Ermöglichung der Anfragenerweiterung mit Synonymen und themennahen Wörtern auf Basis des jeweiligen Peer-Dokumentenbestands 1.2 Realisierungen Erste Realisierung durch Dipl.-Inf. Frieder Witschel im Jahr 2005 in dem Programm Researcher (Java-basiert) Erweiterung des Researchers durch Dipl.-Inf. Mario Kubek in den Jahren 2007/2008 3/12

2. Technische Realisierung des Researchers 2.1 Zweck des Researchers Eingabe: Suchanfrage Q und Dokumentmenge D Ausgabe: Menge erweiterter Suchanfragen und deren Suchergebnisse 2.2 Funktionsweise Berechnung eines Profils P aus D, das die k wichtigsten Wörter enthält Berechnung des Kookkurrenzgraphen G aus P Rankingverfahren berechnet Ranking der Elemente aus G bezüglich Q Am höchsten gerankte Elemente bilden die Erweiterungsmenge E Neue Suchanfragen bestehend aus Q und ausgewürfelten Elementen aus E werden an Yahoo (früher Google) gesendet Die 10 besten Treffer pro erweiterter Anfrage werden ausgegeben, optional heruntergeladen und auf Ähnlichkeit mit D verglichen 4/12

3. Realisierung als Komponente in der Firefox- Erweiterung FXResearcher 3.1 Warum als Browser-Erweiterung? Kein separates Programm zu Installation nötig Ausnutzung der Netzwerkaktivität von Firefox für den Peer Fortschrittliche Programmierschnittstellen für den Bau v. Erweiterungen 3.1 Aufbau der Erweiterung (Ziel am Ende des DFG-Projekts) Volltextsuche (VTS) Peer Researcher GUI zu Steuerung der Komponenten 3.2 Aktueller Stand Firefox Researcher und Volltextsuche (provisorisch mit Lucene) lauffähig FXRes.-GUI Peer VTS Researcher 5/12

4. Erfahrungen und Tests mit FXResearcher 4.1 Benutzerführung 1. Lokale Suche nach Dokumenten 2. Suchanfrageerweiterung mittels selektierter Dokumente 6/12

7/12

4. Erfahrungen und Tests mit FXResearcher 4.2 Fallbeispiele unterschiedlicher Themendomänen 1. Beispiel: Thema P2P und Semantic Web Gegeben: 7 PDF-Dokumente gefunden mit Google Anfrage im FXResearcher: Semantic Web, max. 10 Anfr., max 10 Ergs. Anfrage wurde 7x erweitert um: Peer-to-Peer Distributed, Peer-to-Peer Piazza, Services, Peer-to-Peer Services, Peer-to-Peer, Services Smart, Piazza Services Zusätzliche themennahe Dokumente via Yahoo gefunden: 33 2. Beispiel: Thema J2ME (Java 2 Micro Edition für mobile Endgeräte) Gegeben: 4 PDF-Dokumente gefunden mit Google Anfrage im FXResearcher: J2ME, max. 10 Anfragen, max 10 Ergs. Anfrage wurde 9x erweitert um: Profile CLDC, CLDC Connected, Profile Foundation, Profile Virtual, CLDC Profile, Profile, Virtual CLDC, Virtual Java, Profile Personal Zusätzliche themennahe Dokumente via Yahoo gefunden: 42 8/12

4. Erfahrungen und Tests mit FXResearcher 4.2 Fallbeispiele unterschiedlicher Themendomänen 3. Beispiel: Thema Affiliate Marketing Gegeben: 6 PDF-Dokumente gefunden mit Google Anfrage im FXResearcher: affiliate, max. 10 Anfr., max 10 Ergs. Anfrage wurde 10x erweitert um: marketing advertisers, advertisers, advertisers network, marketing online, network fees, marketing, network marketing, network, advertisers publishers, network advertisers Zusätzliche themennahe Dokumente via Yahoo gefunden: 61 4. Beispiel: Thema TV Serie Stargate Gegeben: 2 handverlesene Dokumente der englischspr. Wikipedia Anfrage im FXResearcher: Stargate, max. 10 Anfragen, max 10 Ergs. Anfrage wurde 9x erweitert um: SG, SG Season, Atlantis Season, Atlantis SG, SG Atlantis, Atlantis Universe, SG February, Season, Season March Zusätzliche themennahe Dokumente via Yahoo gefunden: 56 9/12

5. Ausblick Fertigstellung der Integration des Peers und Volltextsuche mit Leipziger Texttechnologie Einsatz des FXResearchers als multifunktionales Suchtool mit Browseranbindung Durchführung von Nutzerstudien 10/12

Vielen Dank für Ihre Aufmerksamkeit! 11/12