Enterprise Search Präsentation zur Seminararbeit im Seminar Moderne Entwurfsmethoden für Innovative Softwaresysteme Michael Hübschmann 14. Januar 2014 Betreuung: Dr. Hella Seebach
Überblick 1. Motivation 2. Unternehmensweite Suchmaschine Aufbau einer Suchmaschine Besonderheiten bei Enterprise Search Technische Konzepte 3. Praxisbeispiel ElasticSearch 4. Ausblick 5. Diskussion Überblick 2
MOTIVATION 3
Problem Datenflut in Unternehmen Quelle: Bertram, Jutta. Informationen verzweifelt gesucht - Enterprise Search in österreichischen Großunternehmen. Berlin, 2011. Motivation 4
Ursachen und Lösungsansätze Filesysteme Datenbanken Websites Wikis Mitarbeiter Informationsmanagement Systeme Software von Drittanbietern Motivation 5
UNTERNEHMENSWEITE SUCHMASCHINE 6
Internetsuchmaschine Quelle: www.google.de Unternehmensweite Suche 7
Aufbau einer Suchmaschine Unternehmensweite Suchmaschine 8
Query-Modul Benutzereingabe maschinenlesbar machen Gewichtung von Suchbegriffen Einschränkung der Ergebnisliste Unternehmensweite Suchmaschine - Aufbau einer Suchmaschine - 9
Index-Modul Index (für schnelle Suche optimiert) Indexierung der Quelldaten Push- oder Pull-prinzip Indexeinträge mit Metainformationen Erstelldatum Datum der letzten Änderung Quelldokument Kategorien, Tags Unternehmensweite Suchmaschine - Aufbau einer Suchmaschine - 10
Ranking-Modul Liefert die relevanten Ergebnisse Matching (Ergebnis enthält Suchbegriff exakt) Statische, manuell verwaltete Listen Social-Media Integration Unternehmensweite Suchmaschine - Aufbau einer Suchmaschine - 11
Heterogene Datenquellen Filesysteme Datenbanken Enterprise Search Websites Wikis Informationsmanagement Systeme Unternehmensweite Suchmaschine - Besonderheiten bei Enterprise Search - Software von Drittanbietern Mitarbeiter 12
Filterung Unternehmensweite Suchmaschine - Besonderheiten bei Enterprise Search - Quelle: www.amazon.de 13
Authentifizierung/Rechteproblematik Zugriffsrechte wichtig für Unternehmenserfolg Berücksichtigung bereits bei Indexierung Potentielles Datenleck Berücksichtigung erst beim Suchvorgang Langsame Suche Hohe Belastung der Quellsysteme Unternehmensweite Suchmaschine - Besonderheiten bei Enterprise Search - 14
Technische Konzepte Desktop Suchmaschine Enterprise-Content-Management Suchmaschine Peer-to-peer Suchmaschine Metasuchmaschine Client-Server-Suchmaschine Unternehmensweite Suchmaschine 15
PRAXISBEISPIEL ELASTICSEARCH 16
Praxisbeispiel ElasticSearch Open-Source Client-Server Suchmaschine Offene Webstandards und Technologien REST(HTTP) JSON Apache Lucene Quelle: marketingland.com/marketing-biz-5-34355 Praxisbeispiel ElasticSearch 17
Wurzeln von ElasticSearch 2010 2012 2013 2014 Start als Nachfolger von Compass Firmengründung für Support Version 1.0 Praxisbeispiel ElasticSearch 18
Besondere Stärken von ElasticSearch Flexible Indexeinträge als Dokumente Automatische Verwaltung mehrerer Knoten, Indizes, Shards Hohe Ausfallsicherheit durch Replication near real-time search Vielzahl von Konnektoren ( river ) Praxisbeispiel ElasticSearch 19
Evaluierung: Versuchsaufbau Datenquelle: deutschsprachiges Wikipedia per wikipedia-river (~12GB) Verschiedene Suchanfragen (15000 Suchterme bestehend aus 1-30 Wörtern) Messung der Antwortzeiten mittels Jmeter der Apache Foundation Praxisbeispiel ElasticSearch 20
Evaluierung: Performancevergleich Antwortzeiten des ElasticSearch Servers bei drei verschiedenen Konfigurationen im Vergleich Praxisbeispiel ElasticSearch 21
Evaluierung: Reaktion auf Ausfälle Antwortzeiten des ElasticSearch Servers mit Abschaltung von Knoten während des Testlaufs Praxisbeispiel ElasticSearch 22
Fazit und Ausblick Performanceeinbußen durch mehreren Knoten gering Verlust von Knoten/Shards wird ohne Verzögerung oder Leistungseinbußen kompensiert Enterprise Search Global Player mit Fachpersonal für Enterprise Search Potential vor allem bei mittelständischen Unternehmen Ausblick 23
Außergewöhnliche Anwendungen Gensequenzanalyse Große Datenmengen Vorkommen von Buchstabenfolgen finden Einfache Konfiguration von ElasticSearch Quelle: Tong, Zachary. Going Organic - Genomic sequence alignment in Elasticsearch. [Online] 13. August 2013 http://de.slideshare.net/zacharytong/bostonmeetupgoingorganic. Praxisbeispiel ElasticSearch 24
Diskussion Vielen Dank für die Aufmerksamkeit Diskussion 25