Computerlinguistik im Service Management eine neue Suche für TOPdesk

Ähnliche Dokumente

Installieren von Microsoft Office Version 2.1

[Bedienungsanleitung] InfoSys App

NTT DATA Helpdesk Benutzerhandbuch

Leitfaden zur ersten Nutzung der R FOM Portable-Version für Windows (Version 1.0)

Schritt 1: Verwenden von Excel zum Erstellen von Verbindungen mit SQL Server-Daten

Outlook 2000 Thema - Archivierung

Neuerungen in ReviPS Version 12g

Schritt 1: Verwenden von Excel zum Erstellen von Verbindungen zu SQL Server Analysis Services-Daten

RIS-ABFRAGEHANDBUCH REICHS-, STAATS- UND BUNDESGESETZBLATT

Dealer Management Systeme. Bedienungsanleitung. Freicon Software Logistik (FSL) für Updates

Audio/Video - Chat - System User Manual

Dokumentation. Black- und Whitelists. Absenderadressen auf eine Blacklist oder eine Whitelist setzen. Zugriff per Webbrowser

SafeRun-Modus: Die Sichere Umgebung für die Ausführung von Programmen

Anleitung zur Bearbeitung von Prüferkommentaren in der Nachreichung

Beispiel Shop-Eintrag Ladenlokal & Online-Shop im Verzeichnis 1

Sie finden im Folgenden drei Anleitungen, wie Sie sich mit dem Server der Schule verbinden können:

Bedienungsanleitung. Matthias Haasler. Version 0.4. für die Arbeit mit der Gemeinde-Homepage der Paulus-Kirchengemeinde Tempelhof

Der vorliegende Konverter unterstützt Sie bei der Konvertierung der Datensätze zu IBAN und BIC.

ecaros2 - Accountmanager

KURZANLEITUNG MSDAS DMS SYSTEM - SILVERDAT II SCHNITTSTELLE

e-books aus der EBL-Datenbank

Benutzer Anleitung Manegger Tourenbuch

Abschnitte. Abschnittswechsel einfügen

OKB Die MS SQL-Volltextsuche für organice SQL einrichten

Beheben von verlorenen Verknüpfungen

Write-N-Cite eine Kurzanleitung

Vergleich: Positionen der Word 2003-Befehle in Word

GEORG-WWW. Online-Kundenmodul. Handbuch-Online-Kunden.docx 1

Der neue persönliche Bereich/die CommSy-Leiste

Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER

Perceptive Document Composition

SharePoint für Site Owner. Dr. Benjamin S. Bergfort. 1. Ausgabe, 1. Aktualisierung, November 2014 ISBN: SHPSO2013

In diesem Tutorial lernen Sie, wie Sie einen Termin erfassen und verschiedene Einstellungen zu einem Termin vornehmen können.

Schumacher, Chris Druckdatum :11:00

Erstellen einer in OWA (Outlook Web App)

4.4 Bibliotheksverwaltung

Kapiteltests zum Leitprogramm Binäre Suchbäume

Handbuch zur Anlage von Turnieren auf der NÖEV-Homepage

Anleitung zur KAT-Datenbank Qualitrail Eingabe Futtermittel

Rillsoft Project - Installation der Software

Departement Bau, Verkehr und Umwelt Abteilung Tiefbau

LIP Formulare Anleitung zum Speichern, Öffnen und Drucken

Aktuelles, Mitteilungen und Veranstaltungen verwalten

Einstieg in Exact Online Buchungen erfassen. Stand 05/2014

Kurzanleitung Registrierung / Kauf Basispaket Anbieter

Stand: Dokumentenverwaltung Modulbeschreibung

Virtueller Seminarordner Anleitung für die Dozentinnen und Dozenten

Verwalten Sie Ihre Homepage von überall zu jeder Zeit! Angebote und Informationen auf

Der Jazz Veranstaltungskalender für Deutschland, Österreich und die Schweiz

Was ist PDF? Portable Document Format, von Adobe Systems entwickelt Multiplattformfähigkeit,

Anleitung OpenCms 8 Webformular Auswertung

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

2. Word-Dokumente verwalten

Lehrer: Einschreibemethoden

SharePoint Demonstration

Informationskompetenz (Elektronisches Buch)

Installationsanleitung. TFSInBox

OPplus Document Capture

Import von Daten aus Word nach KlasseDozent

e LEARNING Kurz-Anleitung zum Erstellen eines Wikis 1. Wiki erstellen

IntelliRestore Seedload und Notfallwiederherstellung

Seite 1. Datum einfügen

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

Anleitung zur Verwendung der UHH-Disk am. Universitätskolleg

Der PhysioNetzwerk Homepageservice ist ein Internettool im Baukastenprinzip mit Content Management Struktur.

Einleitung...1 Datenbereich und Arbeitsgruppe auswählen...2 Neuer Termin anlegen...3 Terminübersicht anzeigen...9

Lernprogramm. EDS Anpassung für Administratoren. support.ebsco.com

Novell Client. Anleitung. zur Verfügung gestellt durch: ZID Dezentrale Systeme. Februar ZID Dezentrale Systeme

Anleitung zur Benutzung des jobup.ch Stellensuchendekontos

Anleitung zum GEPA EXCEL Import Tool

Info-Veranstaltung zur Erstellung von Zertifikaten

EMC SourceOne TM für Microsoft SharePoint 7.1 Archivsuche Kurzreferenz

Rechnung Angebot Zeiterfassung

Neuer Releasestand Finanzbuchhaltung DAM-EDV E Inhaltsverzeichnis. 1. Neuerungen Schnittstelle Telebanking mit IBAN und BIC...

Einleitung Allgemeine Beschreibung Einfachste Bedienung Einen Internetanschluss, sonst nichts Login Anmelden

Alerts für Microsoft CRM 4.0

RGS Homepage Arbeiten im Administratorbereich (Backend)

RIS-ABFRAGEHANDBUCH REGIERUNGSVORLAGEN

Bitte geben Sie hier den Benutzer cubusadmin und das gleichnamige Passwort ein.

Entwurf und Realisierung von Online-Umfragen Entwurf und Realisierung von Online-Umfragen

Excel Pivot-Tabellen 2010 effektiv

1. Allgemeines. Mit der Vertragsverwaltung können u.a.

IAWWeb PDFManager. - Kurzanleitung -

Angaben zu einem Kontakt...1 So können Sie einen Kontakt erfassen...4 Was Sie mit einem Kontakt tun können...7

2. Die eigenen Benutzerdaten aus orgamax müssen bekannt sein

Ordner Berechtigung vergeben Zugriffsrechte unter Windows einrichten

Hilfe zur Urlaubsplanung und Zeiterfassung

Sametime Meetings - Taskreferenz

Auswertungssoftware des Deutschen-Motorik-Tests

Hilfe zur Dokumentenverwaltung

AUTOMATISCHE -ARCHIVIERUNG. 10/07/28 BMD Systemhaus GmbH, Steyr Vervielfältigung bedarf der ausdrücklichen Genehmigung durch BMD!

Um eine Person in Magnolia zu erfassen, gehen Sie wie folgt vor:

Dissertation über MADOC veröffentlichen (10 Schritte)

Anzeigen einer Liste der verfügbaren Schriftarten

Produktbeschreibung utilitas Vertragsverwaltung

Zusammenführen mehrerer Dokumente zu einem PDF In drei Abschnitten erstellen Sie ein Dokument aus mehreren Einzeldokumenten:

Anleitung für das Content Management System

Anleitung. Switch-On Informatik Support Tool

Transkript:

Computerlinguistik im Service Management eine neue Suche für TOPdesk Anna Hunecke Diplom Computerlinguistin TOPdesk A.Hunecke@topdesk.com

Inhalt TOPdesk Suchen in TOPdesk Lucene Lucene in TOPdesk

TOPdesk Entwickelt Service-Management Software TOPdesk Hauptsitz in Delft Niederlassungen in Deutschland, England und Belgien Ca. 320 Mitarbeiter Ca. 3500 Kunden In 6 Sprachen übersetzt

Service Management Kundenservice (Helpdesk) Interner Helpdesk-Support Verwaltung von IT-Hardware und Software Planung von Projekten und Aktivitäten

Service Management in TOPdesk Standardsoftware Verschiedene Module o Besuchermanagement o Reservierungsmanagement o etc.

Aufbau von TOPdesk Daten werden in einer Datenbank abgelegt Ein zentraler Server Nutzer greifen über den Webbrowser auf TOPdesk zu

Suchen Im Laufe der Zeit sammeln sich viele Daten und vor allem Wissen in der TOPdesk-Datenbank an Eine benutzerfreundliche Suche ist wichtig

Suchen in TOPdesk bisher Schnell Nur Volltextsuche möglich Syntax: AND, OR, NOT, Suchindex in der Datenbank gespeichert o Datenbankgröße wird verdoppelt (z.b. 10,5 GB von 20 GB in TOPhelp) o Suchen belastet den normalen Verkehr mit der Datenbank o Generieren des Index ist langsam

So soll die neue Suche aussehen Unterstützung für eine vielfältigere Syntax, vor allem Wildcards und Fuzzy Suche Suche soll mindestens genauso schnell sein wie die alte

Lucene Open-Source Java Bibliothek zum Erzeugen und Durchsuchen von Textindizes Unterstützt eine reichhaltige Syntax Wird unter anderem von der Wikipedia und Monster verwendet http://lucene.apache.org/

Wie funktioniert Lucene? Schritt 1: Indizieren

Wie funktioniert Lucene? Schritt 2: Suchen

Wie funktioniert Lucene? Schritt 1: Indizieren

Indizieren: Dokumente Typischerweise ist ein Dokument ein Artikel, Kapitel in einem Buch oder eine HTML-Seite Dokumente sind strukturiert: Titel, Abschnitt, Paragraph... Dokumente können Meta-Informationen haben: Autor, Datum, Thema... Dokumentstruktur und Metadaten können in Lucene mit Feldern dargestellt werden

Indizieren: Analyzer Analyzer (oder besser, Tokenizer) verwandelt den Text des Dokuments in Tokens: o Entfernung von Satz- und Leerzeichen o Entfernung von Funktionswörtern o Morphologische Analyse Verschiedene Analyzer für Lucene verfügbar

Indizieren: Index Enthält Terme (= Wort + Dokumentfeld) Invertierter Index: Listet die Dokumente in denen ein Term vorkommt Term1 -> doc15, doc50,... Term2 -> doc39, doc40,...... Außerdem Meta-Informationen über den Term o o o Term frequency Position Document frequency

Demo Analyzer

Wie funktioniert Lucene? Schritt 2: Suchen

Suchen: Query Vielfältige Query Syntax: o AND, OR, NOT o Phrasen o Wildcards o Fuzzy search o Intervall o Suche in einzelnen Feldern möglich

Suchen: Analyzer Zur Suche muss derselbe Analyzer verwendet werden wie bei der Erstellung des Suchindex

Suchen: Scoring score(q,d) = coord(q, d) * querynorm(q) * [tf(t in d) * idf(t)² * t.getboost() * norm(t, d)] Siehe: http://lucene.apache.org/java/2_4_0/api/org/apache/lucene/search/similarity.html

Suchen: Scoring score(q,d) = coord(q, d) * querynorm(q) * [tf(t in d) * idf(t)² * t.getboost() * norm(t, d)] Term Frequency Siehe: http://lucene.apache.org/java/2_4_0/api/org/apache/lucene/search/similarity.html

Suchen: Scoring score(q,d) = coord(q, d) * querynorm(q) * [tf(t in d) * idf(t)² * t.getboost() * norm(t, d)] Term Frequency Inverted Document frequency Siehe: http://lucene.apache.org/java/2_4_0/api/org/apache/lucene/search/similarity.html

Suchen: Scoring score(q,d) = Menge der Query-Terme im Dokument coord(q, d) * querynorm(q) * [tf(t in d) * idf(t)² * t.getboost() * norm(t, d)] Term Frequency Inverted Document frequency Siehe: http://lucene.apache.org/java/2_4_0/api/org/apache/lucene/search/similarity.html

Suchen: Scoring score(q,d) = Menge der Query-Terme im Dokument Normalisierungsfaktor coord(q, d) * querynorm(q) * [tf(t in d) * idf(t)² * t.getboost() * norm(t, d)] Term Frequency Inverted Document frequency Siehe: http://lucene.apache.org/java/2_4_0/api/org/apache/lucene/search/similarity.html

Suchen: Scoring score(q,d) = Menge der Query-Terme im Dokument Normalisierungsfaktor coord(q, d) * querynorm(q) * [tf(t in d) * idf(t)² * t.getboost() * norm(t, d)] Term Frequency Inverted Document frequency Term boost Siehe: http://lucene.apache.org/java/2_4_0/api/org/apache/lucene/search/similarity.html

Suchen: Scoring score(q,d) = Menge der Query-Terme im Dokument Normalisierungsfaktor coord(q, d) * querynorm(q) * [tf(t in d) * idf(t)² * t.getboost() * norm(t, d)] Term Frequency Siehe: Inverted Document frequency Term boost - Document boost - Feld boost - Längennormalisierung http://lucene.apache.org/java/2_4_0/api/org/apache/lucene/search/similarity.html

Demo Rezeptindex

Lucene in TOPdesk: Index Für jedes Modul ein eigener Index Jedes Modul hat seine eigene Tabelle Jeder Eintrag in einer Tabelle in der Datenbank entspricht einem Dokument Die Spalten der Tabelle sind die Felder des Dokuments

Lucene in TOPdesk: Analyzer Verzicht auf linguistische Analyse Benutzung des Standard-Analyzers: o Entfernung von Satz- und Leerzeichen o Nur kleine Buchstaben o Erkennung von geläufigen Abkürzungen

Lucene in TOPdesk: Suchen Standardmäßig fuzzy Suche über alle Felder des Dokuments (=alle Spalten der Tabelle) Ergebnisse werden in einer Tabelle angezeigt Relevanz-Anzeige mit Pseudo- Prozentwerten

Benutzereingabe: error 9090 +(+(+((vrijetekst3:error~0.5 vrijetekst4:error~0.5 vrijetekst5:error~0.5 attvrijetekst4:error~0.5 extrabpersoonid:error~0.5 attvrijetekst5:error~0.5 ref_actiedoordynanaaml1:error~0.5 ref_soortmelding:error~0.5 korteomschrijving:error~0.5 verzoek:error~0.5 extraapersoonid:error~0.5 ref_domein:error~0.5 attvrijememo1:error~0.5 attvrijememo2:error~0.5 attvrijememo3:error~0.5 attvrijememo4:error~0.5 attvrijememo5:error~0.5 actie:error~0.5 ref_afdeling:error~0.5 ref_actiedoordynanaam:error~0.5 ref_specificatie:error~0.5 aanmeldernaam:error~0.5 vrijememo5:error~0.5 vrijememo4:error~0.5 aantekeningen:error~0.5 vrijememo3:error~0.5 vrijememo2:error~0.5 extraaid:error~0.5 ref_object:error~0.5 ref_configuratie:error~0.5 registratienummer:error~0.5 ref_debnummer:error~0.5 ref_vestiging:error~0.5 attvrijetekst2:error~0.5 externnummer:error~0.5 vrijememo1:error~0.5 attvrijetekst3:error~0.5 attvrijetekst1:error~0.5 vrijetekst2:error~0.5 vrijetekst1:error~0.5 ref_budgethouder:error~0.5 extrabid:error~0.5 naam:error~0.5)) +((vrijetekst3:9090~0.5 vrijetekst4:9090~0.5 vrijetekst5:9090~0.5 attvrijetekst4:9090~0.5 extrabpersoonid:9090~0.5 attvrijetekst5:9090~0.5 ref_actiedoordynanaaml1:9090~0.5 ref_soortmelding:9090~0.5 korteomschrijving:9090~0.5 verzoek:9090~0.5 extraapersoonid:9090~0.5 ref_domein:9090~0.5 attvrijememo1:9090~0.5 attvrijememo2:9090~0.5 attvrijememo3:9090~0.5 attvrijememo4:9090~0.5 attvrijememo5:9090~0.5 actie:9090~0.5 ref_afdeling:9090~0.5 ref_actiedoordynanaam:9090~0.5 ref_specificatie:9090~0.5 aanmeldernaam:9090~0.5 vrijememo5:9090~0.5 vrijememo4:9090~0.5 aantekeningen:9090~0.5 vrijememo3:9090~0.5 vrijememo2:9090~0.5 extraaid:9090~0.5 ref_object:9090~0.5 ref_configuratie:9090~0.5 registratienummer:9090~0.5 ref_debnummer:9090~0.5 ref_vestiging:9090~0.5 attvrijetekst2:9090~0.5 externnummer:9090~0.5 vrijememo1:9090~0.5 attvrijetekst3:9090~0.5 attvrijetekst1:9090~0.5 vrijetekst2:9090~0.5 vrijetekst1:9090~0.5 ref_budgethouder:9090~0.5 extrabid:9090~0.5 naam:9090~0.5))))

Lucene in TOPdesk: Autocomplete Während der Benutzereingabe werden Vervollständigungsvorschläge mit Hilfe von Wildcard-Suche gemacht Beispiel: print wird zu print* expandiert und alle möglichen Terme aufgelistet

Lucene in TOPdesk: Erweiterte Suche Erweiterte Möglichkeiten für Benutzer, die sich mit der Query-Syntax nicht auskennen Suche per Feld beginnt mit, ist gleich und enthält möglich

Lucene in TOPdesk: Erweiterte Suche Problemnummer: "P 0512" : +(+(+spanfirst(naam:p, 1) +naam:0512*) Kurzbeschreibung: "print" : +(spanfirst(korteomschrijving:printer, 1) spanfirst(korteomschrijving:printing, 1)))

Lucene im Vergleich zu vorherigem Suchindex Suchindex viel kleiner (300MB für TOPhelp) Index wird nicht in der Datenbank gespeichert Suchen auch möglich während Index neu gebaut/ aktualisiert wird Indizieren ist schneller (15 Minuten statt 10 Stunden für TOPhelp) fuzzy Suche

Fragen?