Enterprise Search. Präsentation zur Seminararbeit. im Seminar Moderne Entwurfsmethoden für Innovative Softwaresysteme

Ähnliche Dokumente
ERWEITERUNG CONTAO INDEXIERUNG - SUCHE AUF OFFICE- UND PDF-DATEIEN

Seminararbeit Enterprise Search

Dehnbarer Begriff Verteiltes Suchen mit Elasticsearch

dacore Datenbanksysteme AG Neue Konzepte zur Optimierung der Auslastungsplanung und Big Data im Informationsmanagement

limlhaidftswgirzälhimds

Einführung in. Apache Solr PRAXISEINSTIEG IN DIE INNOVATIVE SUCHTECHNOLOGIE. Markus Klose & Daniel Wrigley

BIW Wahlpflichtmodul. Einführung in Solr, Pipeline und REST. Philipp Schaer, TH Köln (University of Applied Sciences), Cologne, Germany

Scandio SEBOL Search

Apache Lucene und Oracle in der Praxis Volltextsuche in der Cloud. DOAG 2011 Konferenz + Ausstellung Frank Szilinski & Dominic Weiser, esentri

Microsoft Office SharePoint Server 2007 Überblick. Gernot Kühn Partner Technical Specialist Microsoft Deutschland Gmbh

Apache Lucene. Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org

Inhaltsverzeichnis 1 Einführung 2 Formen der Suche im Web 3 Wie Suchmaschinen funktionieren

Apache Lucene und Oracle in der Praxis - Volltextsuche in der Cloud

Whitepaper Lucene 2.0

Federated Search: Integration von FAST DataSearch und Lucene

Umsetzung von BI-Lösungen mit Unterstützung einer Suchmaschine. TDWI Stuttgart Tobias Kraft, exensio GmbH

Web Content Management Systeme

Peter Dikant mgm technology partners GmbH. Echtzeitsuche mit Hadoop und Solr

Eine Untersuchung der Funktionen des Apache Wicket Webframeworks

Architekturen. Von der DB basierten zur Multi-Tier Anwendung. DB/CRM (C) J.M.Joller

Results in time. FLEXIBLER UND KOSTENGÜNSTIGER BETRIEB VON SAP SYSTEMEN. Beratung. Support. Ganzheitliche Lösungen.

Suchmaschinen und ihre Architektur. Seminar: Angewandtes Information Retrieval Referat von Michael Wirz

Suchen und Finden mit Lucene und Solr. Florian Hopf

Neues von Oracle Gut zu wissen...

Agenda. IT-Symposium Secure Enterprise Search. Suchen und finden mit Suchmaschinen. Oracle SES Überblick

Elasticsearch aus OPS-Sicht Teil1. Markus Rodi Karlsruhe,

i-net HelpDesk Erste Schritte

Enterprise Content Management für Hochschulen

Full Text Search in Databases

Themenschwerpunkt Social SEO

Fachtagung Enterprise Search-Systeme Einführung Unternehmensweite Suche

Search-Driven Applications. Florian Hopf, freiberuflicher Softwareentwickler Tobias Kraft, exensio GmbH

Computerlinguistik im Service Management eine neue Suche für TOPdesk

NoSQL Andere Wege in der Speicherung von Geodaten?

Suchmaschinen. Bachelor Informationsmanagement / Modul Digitale Bibliothek (SS 2014) Dr. Jakob Voß

Digitale Archivierung für SAP mit DocuWare realisieren

IBM System z für ISVs Case Study Mobile Business Apps: COMELEO by aformatik

GIS Docker und Azure-Cloud. Neues aus der Entwicklung

Jakarta Lucene. Eine Java-Bibliothek zur Suchindex-Erstellung. Seminararbeit Tilman Schneider

CENIT SERVICEMANAGER Pluscard, Saarbrücken Dirk Günther, Produktmanager ECM R&D

PRESTIGEenterprise. Roadmap. Referent: Peter Woetzel Director Product Management Online Software AG

Einfach. Schneller. Finden! Kunstliteratur und Katalog 2.0. Dr. Maria Effinger, UB Heidelberg 1

egov Suchportal egov-spezifische Suchapplikation am Beispiel von Lawsearch Enterprise

spherecast Content Management System

E-Government-Basiskomponente Geodaten. Vorstellung Geoportal Sachsenatlas

Mischen possible! Ranking und Facettierung heterogener Datenquellen

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik

Brauche ich ein DVCS?

Spring Dynamic Modules for OSGi Service Platforms

Copyright 2014, Oracle and/or its affiliates. All rights reserved.

Suchen allein ist nicht genug!

Mindbreeze Web Parts. für Microsoft SharePoint. Version 2016 Fall Release

Kibana als Werkzeug zur Unterstützung der Metadatenkuration. Kolloquium Wissensinfrastruktur,

David Mika. Donnerstag, den 15. März Verein zur Förderung der privaten Internet Nutzung e.v. Suchen und Finden im Internet.

Erschließen von Datenbank-Inhalten durch die Volltextsuche in Landes-Umweltportalen

Schubert Foo, Douglas Hendry: for Desktop Searching

Search Evolution von Lucene zu Solr und ElasticSearch

Sie haben Ihr Ziel erreicht

Website-Suche mit OpenText Web Site Management. Frank Steffen - Senior Product Manager

d.3 starter kit Starterpaket für den einfachen Einstieg in die digitale Dokumentenverwaltung

Externe Indizierung von OPAC-Inhalten

Mehr wissen. Mehr entdecken. Mehr leisten. Erschließen Sie Informationen mit Enterprise Search.

Vorstellung zu einem Web Desktop: eyeos

A1 Web Presence Service. Servicebeschreibung. Version: 3 Datum: Seite 1 von 7

Integration von XPhone Virtual Directory auf OpenStage 60/80 Telefonen

Weißt du, wieviel Sternlein stehen. Welche Typen von Systemen gibt es?

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur

Google meets Social Media: Wie sich Xing, Facebook & Co. im Google-Index auswirken.

EAC Extended Access Control

Fortbildung elearning

Enterprise Content Management. Präsentationsversion des Vortrages. Das Handout beinhaltet eine ausführlichere Folienzusammenstellung.

2017 tomcom GmbH Seite 1. DAS LFV WEBSITE-KIT AKTUELLER STAND UND AUSBLICK Würzburg,

Mit degov Webseiten betreiben und weiterentwickeln. von Dr. Christoph Breidert 1xINTERNET GmbH

Local SEO - als Unternehmen regional gefunden werden

APEX (Hoch) Verfügbar? Ernst Leber

XML-basiertes Content Management für DFN.de

BIG UNIVERSITÄTSRECHENZENTRUM

Social Media as Sensors. Nikolai Bock FOSSGIS 2014

Integration von heterogenen Datenbanken mit Oracle

Office SharePoint Server Suche anpassen und erweitern. Fabian Moritz Senior Consultant, SharePoint MVP ITaCS GmbH

Datenbanken & Informationssysteme (WS 2016/2017)

LINUX Schulung. FrauenComputerZentrum Berlin. Jutta Horstmann, Mai 2006

Eine zentrale Recherche-Plattform für Bibliotheksressourcen

Gut zu wissen... Lorenz Keller Server Technologies Competence Center Nord

Suchmaschinenoptimierung in der Praxis

Effiziente Informationstechnologie

Agenda. Anwendungsfälle. Integration in Java

Dineso Software - Technische Daten

Systemvoraussetzungen

Die Service Level Agreements der SYNERGY NETWORKS GmbH

Planung auf Aufbau von SharePoint-Suchinfrastrukturen

Oracle Webcenter Content - Best Practises zu Hochverfügbarkeit, Skalierung und Perfomance

FLEXIBILITÄT, DIE FREIRAUM SCHAFFT

Wie Web 2.0 und Suche zusammenwachsen. Prof. Dr. Dirk Lewandowski

Jubiläumsabo März / April 2012 Jubiläumsausgabe #1-12 Deutschland Euro 12,00 ISSN:

Spring Dynamic Modules for OSGi Service Platforms

Transkript:

Enterprise Search Präsentation zur Seminararbeit im Seminar Moderne Entwurfsmethoden für Innovative Softwaresysteme Michael Hübschmann 14. Januar 2014 Betreuung: Dr. Hella Seebach

Überblick 1. Motivation 2. Unternehmensweite Suchmaschine Aufbau einer Suchmaschine Besonderheiten bei Enterprise Search Technische Konzepte 3. Praxisbeispiel ElasticSearch 4. Ausblick 5. Diskussion Überblick 2

MOTIVATION 3

Problem Datenflut in Unternehmen Quelle: Bertram, Jutta. Informationen verzweifelt gesucht - Enterprise Search in österreichischen Großunternehmen. Berlin, 2011. Motivation 4

Ursachen und Lösungsansätze Filesysteme Datenbanken Websites Wikis Mitarbeiter Informationsmanagement Systeme Software von Drittanbietern Motivation 5

UNTERNEHMENSWEITE SUCHMASCHINE 6

Internetsuchmaschine Quelle: www.google.de Unternehmensweite Suche 7

Aufbau einer Suchmaschine Unternehmensweite Suchmaschine 8

Query-Modul Benutzereingabe maschinenlesbar machen Gewichtung von Suchbegriffen Einschränkung der Ergebnisliste Unternehmensweite Suchmaschine - Aufbau einer Suchmaschine - 9

Index-Modul Index (für schnelle Suche optimiert) Indexierung der Quelldaten Push- oder Pull-prinzip Indexeinträge mit Metainformationen Erstelldatum Datum der letzten Änderung Quelldokument Kategorien, Tags Unternehmensweite Suchmaschine - Aufbau einer Suchmaschine - 10

Ranking-Modul Liefert die relevanten Ergebnisse Matching (Ergebnis enthält Suchbegriff exakt) Statische, manuell verwaltete Listen Social-Media Integration Unternehmensweite Suchmaschine - Aufbau einer Suchmaschine - 11

Heterogene Datenquellen Filesysteme Datenbanken Enterprise Search Websites Wikis Informationsmanagement Systeme Unternehmensweite Suchmaschine - Besonderheiten bei Enterprise Search - Software von Drittanbietern Mitarbeiter 12

Filterung Unternehmensweite Suchmaschine - Besonderheiten bei Enterprise Search - Quelle: www.amazon.de 13

Authentifizierung/Rechteproblematik Zugriffsrechte wichtig für Unternehmenserfolg Berücksichtigung bereits bei Indexierung Potentielles Datenleck Berücksichtigung erst beim Suchvorgang Langsame Suche Hohe Belastung der Quellsysteme Unternehmensweite Suchmaschine - Besonderheiten bei Enterprise Search - 14

Technische Konzepte Desktop Suchmaschine Enterprise-Content-Management Suchmaschine Peer-to-peer Suchmaschine Metasuchmaschine Client-Server-Suchmaschine Unternehmensweite Suchmaschine 15

PRAXISBEISPIEL ELASTICSEARCH 16

Praxisbeispiel ElasticSearch Open-Source Client-Server Suchmaschine Offene Webstandards und Technologien REST(HTTP) JSON Apache Lucene Quelle: marketingland.com/marketing-biz-5-34355 Praxisbeispiel ElasticSearch 17

Wurzeln von ElasticSearch 2010 2012 2013 2014 Start als Nachfolger von Compass Firmengründung für Support Version 1.0 Praxisbeispiel ElasticSearch 18

Besondere Stärken von ElasticSearch Flexible Indexeinträge als Dokumente Automatische Verwaltung mehrerer Knoten, Indizes, Shards Hohe Ausfallsicherheit durch Replication near real-time search Vielzahl von Konnektoren ( river ) Praxisbeispiel ElasticSearch 19

Evaluierung: Versuchsaufbau Datenquelle: deutschsprachiges Wikipedia per wikipedia-river (~12GB) Verschiedene Suchanfragen (15000 Suchterme bestehend aus 1-30 Wörtern) Messung der Antwortzeiten mittels Jmeter der Apache Foundation Praxisbeispiel ElasticSearch 20

Evaluierung: Performancevergleich Antwortzeiten des ElasticSearch Servers bei drei verschiedenen Konfigurationen im Vergleich Praxisbeispiel ElasticSearch 21

Evaluierung: Reaktion auf Ausfälle Antwortzeiten des ElasticSearch Servers mit Abschaltung von Knoten während des Testlaufs Praxisbeispiel ElasticSearch 22

Fazit und Ausblick Performanceeinbußen durch mehreren Knoten gering Verlust von Knoten/Shards wird ohne Verzögerung oder Leistungseinbußen kompensiert Enterprise Search Global Player mit Fachpersonal für Enterprise Search Potential vor allem bei mittelständischen Unternehmen Ausblick 23

Außergewöhnliche Anwendungen Gensequenzanalyse Große Datenmengen Vorkommen von Buchstabenfolgen finden Einfache Konfiguration von ElasticSearch Quelle: Tong, Zachary. Going Organic - Genomic sequence alignment in Elasticsearch. [Online] 13. August 2013 http://de.slideshare.net/zacharytong/bostonmeetupgoingorganic. Praxisbeispiel ElasticSearch 24

Diskussion Vielen Dank für die Aufmerksamkeit Diskussion 25