Suchmaschinen mit Lucene und SEMS

Größe: px
Ab Seite anzeigen:

Download "Suchmaschinen mit Lucene und SEMS"

Transkript

1 Suchmaschinen mit Lucene und SEMS lizenzfrei it consulting gmbh rainer dollinger

2 Vorstellung Unsere Schwerpunkte Beratung Umsetzung (z.b. Nagios, Lucene, Typo3) Unser Referent Rainer Dollinger Software Entwickler bei lizenzfrei Unsere Referenzen Search Engine for Multiple Systems Relaunch der Homepage von Energiesparverband O.Ö. mit typo3 Projekte für Sony, One, O2, t-mobile, Telekom office linz: landstraße linz office wien: skodagasse 26/ wien

3 Roadmap Lucene Einführung, Vorteile, Einsatz Konzepte, Beispielcode für Indizierung und Suche Query Klassen, Analyzer Weitere Features, Erfahrungen, Quellen SEMS Ziele Architektur, Features Live-Demo

4 Lucene Einführung Framework für hoch performante Volltextsuche Open source bei Apache Software Foundation Java, C++,.NET, Python, Perl, Ruby Entwickelt von Doug Cutting Erstes Open Source Release im März 2000 (Sourceforge)

5 Vorteile von Lucene Inkrementelle Indizierung Datenquellen als String oder InputStream bringt Flexibilität Filter für verbreitete Dokument Typen wie Pdf, Word, Html Content Tagging über Fields Stoppwort Handling Multithreading Support für spezielle Sprachen (z.b. Chinesich)

6 Lucene im Einsatz Nutch Search Engine for Intranet and Internet TheServerSide Homepage Community Homepage for Java Enterprise Development Eclipse SearchBlox DocJar (Javadoc search engine) Celoxis (Project Management Tool)

7 Integration von Lucene

8 Konzepte 1 Index: Behälter für Documents, meist ein Verzeichnis im Filesystem Document: Behälter für Fields, stellt einen Treffer in der Ergebnisliste dar Field: benannter Behälter für Terms Term: ein Text Element, meistens ein Wort

9 Konzepte 2 Typen für Field Text: wird analysiert, indiziert und gespeichert Keyword: wird indiziert und gespeichert, nicht analysiert (z.b. Ul, Sozialversicherungsnr.) UnIndexed: nicht indiziert, nur gespeichert (z.b. Primary Key von Datenbankeinträgen) UnStored: wird indiziert und analysiert aber nicht gespeichert, für große Textmengen

10 Beispielcode Indizierung IndexWriter writer = new IndexWriter(indexDir, new StandardAnalyzer(), true); Document doc = new Document(); doc.add(field.text( titel, titel)); doc.add(field.text( author, author)); doc.add(field.keyword( isbn, isbn)); writer.adddocument(doc); writer.close();

11 Analyzer 1 Analyzing "The BIG brown fox jumped over 1298 lazy dogs in '39 WhitespaceAnalyzer: [The] [BIG] [brown] [fox] [jumped] [over] [1298] [lazy] [dogs] [in] ['39] SimpleAnalyzer: [the] [big] [brown] [fox] [jumped] [over] [lazy] [dogs] [in] StopAnalyzer: [big] [brown] [fox] [jumped] [over] [lazy] [dogs] StandardAnalyzer: [big] [brown] [fox] [jumped] [over] [1298] [lazy] [dogs] [39]

12 Analyzer 2 Analyzing "XY&Z Corporation - WhitespaceAnalyzer: [XY&Z] [Corporation] [-] SimpleAnalyzer: [xy] [z] [corporation] [xyz] [example] [com] StopAnalyzer: [xy] [z] [corporation] [xyz] [example] [com] StandardAnalyzer: [xy&z] [corporation]

13 Beispielcode Suche IndexSearcher searcher = new IndexSearcher(indexDir); String expression = author:hatcher AND Lucene ; Query query = QueryParser.parse(expression, titel, new StandardAnalyzer()); Hits hits = searcher.search(query); for (int i = 0; i < hits.length(); i++) { Document doc = hits.doc(i); System.out.println(doc.get( isbn )); }

14 Query Klassen 1 TermQuery: für exakte Übereinstimmung BooleanQuery: Zusammenfassen mehrerer Queries (AND, OR, NOT, +, -) RangeQuery: um Suche über Bereiche auszuführen. Bsp: length:[050 TO 150] Kriterium: Suchtext kann zu Date geparst werden, ansonsten lexikographische Sortierung bei Strings

15 Query Klassen 2 WildcardQuery: Verwendung von *? Fuzzy query: Toleranz gegenüber Tippfehler Bsp: Suchtext brwon~ liefert auch Treffer für brown Phrase query: für mehrere Suchwörter in engem Abstand zueinander Bsp: Suchtext quick fox ~7 liefert auch Treffer bei the quick brown fox aber nicht für this fox can run very quick

16 Weitere Features RAMDirectory vs. FSDirectory für Performance-tuning Stemming (Beispiel: jumped = jumper = jumps) Indizierung und Suche funktioniert gleichzeitig HighLighter für Anzeige der Suchergebnisse WordNet Synonyme Boost Faktoren: Beeinflussung des Rankings

17 Erfahrungen mit Lucene Sehr hohe Performanz, vor allem bei Verwendung von RAMDirectory um den Index im Hauptspeicher zu durchsuchen Für die meisten Aufgaben sehr einfach einzusetzen Gute Erweiterbarkeit Ausreichend Dokumentation

18 Quellen, Tools Lucene Sandbox Luke The Lucene Index Toolbox Buchempfehlung: Lucene in Action, O.Gospodnetic, E.Hatcher, 2005 Manning Artikel im Internet auf OnJava, TheServerSide,...

19 Was ist SEMS? Search Engine for Multiple Systems Ziele: Effizienzsteigerung bei der Recherche Produktivitätssteigerung der Abläufe Bessere Erschließung der vorhandenen Informationen Optimierung des Faktors: Zeit zu Wissen Verbesserung der Informationsbasis

20 Architektur Indizierer Suchhost Load Balancer Möglichkeit für - Clusterfähigkeit - Ausfallsicherheit - Skalierbarkeit

21 Mögliche Systemarchitektur

22 Screenshot der Anwendung

23 Vielen Dank für Ihre bisherige Aufmerksamkeit! Sie können sich diesen Vortrag gerne unter downloaden. lizenzfrei it consulting gmbh rainer dollinger

Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz

Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz 02_Grundlagen Lucene Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz Was ist Lucene? (1) Apache Lucene is a high-performance, full-featured text search engine library written

Mehr

Jakarta Lucene. Eine Java-Bibliothek zur Suchindex-Erstellung. Seminararbeit Tilman Schneider

Jakarta Lucene. Eine Java-Bibliothek zur Suchindex-Erstellung. Seminararbeit Tilman Schneider Jakarta Lucene Eine Java-Bibliothek zur Suchindex-Erstellung Seminararbeit Tilman Schneider 2004 Tilman Schneider Seminararbeit: Jakarta Lucene Folie 1 Agenda Definition: Suchmaschine Vorstellung von Jakarta

Mehr

Übersicht. Grundidee des Indexing Lucene Wichtige Methoden und Klassen Lucene Indizierungsbeispiele Lucene Suchbeispiele Lucene QueryParser Syntax

Übersicht. Grundidee des Indexing Lucene Wichtige Methoden und Klassen Lucene Indizierungsbeispiele Lucene Suchbeispiele Lucene QueryParser Syntax Indizierung Lucene Übersicht Grundidee des Indexing Lucene Wichtige Methoden und Klassen Lucene Indizierungsbeispiele Lucene Suchbeispiele Lucene QueryParser Syntax Grundideen und Ziel des Indexing Effizientes

Mehr

Search Evolution von Lucene zu Solr und ElasticSearch

Search Evolution von Lucene zu Solr und ElasticSearch Search Evolution von Lucene zu Solr und ElasticSearch 20.06.2013 Florian Hopf @fhopf http://www.florian-hopf.de Index Indizieren Index Suchen Index Term Document Id Analyzing http://www.flickr.com/photos/quinnanya/5196951914/

Mehr

Volltextsuche mit Lucene & Lupy

Volltextsuche mit Lucene & Lupy Ruprecht-Karls-Universität Heidelberg Seminar für Computerlinguistik HS: Information Retrieval PD Dr. Karin Haenelt WS 26/7 Enikö Gross Alina Tokarczyk 22.1.27 Inhalt Lucene Lupy Was ist Lucene? Aufbau

Mehr

Suchen und Finden mit Lucene und Solr. Florian Hopf 04.07.2012

Suchen und Finden mit Lucene und Solr. Florian Hopf 04.07.2012 Suchen und Finden mit Lucene und Solr Florian Hopf 04.07.2012 http://techcrunch.com/2010/08/04/schmidt-data/ Suche Go Suche Go Ergebnis 1 In Ergebnis 1 taucht der Suchbegriff auf... Ergebnis 2 In Ergebnis

Mehr

Datenbanken und Informationssysteme

Datenbanken und Informationssysteme Datenbanken und Informationssysteme Information Retrieval: Konzepte und Beispiele Burkhardt Renz Fachbereich MNI TH Mittelhessen Wintersemester 2015/16 Übersicht Konzepte des Information Retrieval Architektur

Mehr

Java für Computerlinguisten

Java für Computerlinguisten Java für Computerlinguisten 4. Computerlinguistische Anwendungen Christian Scheible Institut für Maschinelle Sprachverarbeitung 30. Juli 2009 Christian Scheible Java für Computerlinguisten 30. Juli 2009

Mehr

design kommunikation development

design kommunikation development http://www.dkd.de dkd design kommunikation development Apache Solr - A deeper look Stefan Sprenger, Developer dkd Olivier Dobberkau, Geschäftsführer dkd Agenda Einführung Boosting Empfehlungen Ausblick

Mehr

Apache Lucene. Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org

Apache Lucene. Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org Apache Lucene Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org 1 Apache Apache Software Foundation Software free of charge Apache Software

Mehr

Hibernate Search. Unterstützung laufender Java Projekte. Perfect Match Rent-a-team Coaching on the project Inhouse Outsourcing

Hibernate Search. Unterstützung laufender Java Projekte. Perfect Match Rent-a-team Coaching on the project Inhouse Outsourcing Orientation in Objects GmbH Weinheimer Str. 68 68309 Mannheim Version: 1.0 www.oio.de info@oio.de Java, XML und Open Source seit 1998 ) Software Factory ) ) Object Rangers ) ) Competence Center) Schlüsselfertige

Mehr

Content Management mit Typo3 >> Funktionen Nutzen Probleme

Content Management mit Typo3 >> Funktionen Nutzen Probleme Content Management mit Typo3 >> Funktionen Nutzen Probleme Content Management mit Typo3 >> Funktionen Nutzen Probleme lizenzfrei it consulting gmbh oliver hager hager@lizenzfrei.at www.lizenzfrei.at Content

Mehr

Website-Suche mit OpenText Web Site Management. Frank Steffen - Senior Product Manager

Website-Suche mit OpenText Web Site Management. Frank Steffen - Senior Product Manager Website-Suche mit OpenText Web Site Management Frank Steffen - Senior Product Manager Inhalt Überblick Konzepte der Suchmaschinenanbindung Verity K2 Anbindung Der neue OT Search Engine Connector Federated

Mehr

Computerlinguistik im Service Management eine neue Suche für TOPdesk

Computerlinguistik im Service Management eine neue Suche für TOPdesk Computerlinguistik im Service Management eine neue Suche für TOPdesk Anna Hunecke Diplom Computerlinguistin TOPdesk A.Hunecke@topdesk.com Inhalt TOPdesk Suchen in TOPdesk Lucene Lucene in TOPdesk TOPdesk

Mehr

Suche mit Apache Solr. Nader Cserny, compuccino

Suche mit Apache Solr. Nader Cserny, compuccino Suche mit Apache Solr Nader Cserny, compuccino Agenda Vorstellung Einführung Funktionen Beispiele Praxis Fragen Vorstellung Vorstellung Entwicklung, Design, Konzeption, Beratung Hamburg.de, BILD, WELT,

Mehr

Dehnbarer Begriff Verteiltes Suchen mit Elasticsearch

Dehnbarer Begriff Verteiltes Suchen mit Elasticsearch Dehnbarer Begriff Verteiltes Suchen mit Elasticsearch Dr. Halil-Cem Gürsoy halil-cem.guersoy@adesso.de www.adesso.de ...über mich 15 Jahre Entwicklung und Beratung 'Software Architect' bei adesso AG, Dortmund

Mehr

Scandio SEBOL Search

Scandio SEBOL Search : : :, München Inhalt 1. Was ist SEBOL?...3 2. Index-Server...4 2.1. Warteschlange zur Indizierung...4 2.2. Plugin-Abarbeitung...4 2.3. Erweiterte Lucene-Indizierung...4 2.4. Index-Verteilung und Management...5

Mehr

PyLucene. Installation, Verwendung, Probleme, Lösungen. DZUG -Tagung 2010. Stefan Schwarzer, SSchwarzer.com info@sschwarzer.com

PyLucene. Installation, Verwendung, Probleme, Lösungen. DZUG -Tagung 2010. Stefan Schwarzer, SSchwarzer.com info@sschwarzer.com PyLucene Installation, Verwendung, Probleme, Lösungen DZUG -Tagung 2010 Stefan Schwarzer, SSchwarzer.com info@sschwarzer.com Dresden, Germany, 2010-09-17 PyLucene Stefan Schwarzer, info@sschwarzer.com

Mehr

Motivation Komponenten Konfiguration Modifikationen Suchmaschine Literatur. colibri Search. Eine Literatursuchmaschine für Fremdsprachenlerner

Motivation Komponenten Konfiguration Modifikationen Suchmaschine Literatur. colibri Search. Eine Literatursuchmaschine für Fremdsprachenlerner colibri Search Eine suchmaschine für Fremdsprachenlerner Seminar für Computerlinguistik Ruprecht-Karls-Universität Heidelberg 11. Januar 2010 Überblick 1 2 3 4 5 colibri Search colibri Search ist eine

Mehr

Vom Suchen und Finden

Vom Suchen und Finden Vom Suchen und Finden Ideen für die behördenweite Suche Thomas Fleischer Technologieberater der Bundesbehörden Public Sector - Federal Microsoft Deutschland GmbH Agenda Vom einfachen Textmatching Internet-Suche

Mehr

Seminararbeit. Effizientes Suchen mit Jakarta Lucene

Seminararbeit. Effizientes Suchen mit Jakarta Lucene zum Thema Effizientes Suchen mit Jakarta Lucene erarbeitet von Tilman Schneider betreut durch Prof. Klaus Gremminger Inhaltsverzeichnis 1 Einführung...3 2 Grundlagen...5 2.1 Definition: Suchmaschine...5

Mehr

Einführung in Javadoc

Einführung in Javadoc Einführung in Javadoc Johannes Rinn http://java.sun.com/j2se/javadoc Was ist Javadoc? Javadoc ist ein Werkzeug, dass eine standardisierte Dokumentation für die Programmiersprache Java unterstützt. Vorteil:

Mehr

SUCHMASCHINEN XAPIAN. Michael Strzempek FH Wiesbaden, 5. Juni 2008

SUCHMASCHINEN XAPIAN. Michael Strzempek FH Wiesbaden, 5. Juni 2008 SUCHMASCHINEN XAPIAN Michael Strzempek FH Wiesbaden, 5. Juni 2008 INHALT 1. Motivation 2. Prinzip / Vokabular 3. Xapian 4. Omega 5. Datenbank Indizierung 6. Levenshtein Distanz 7. Boolesche Suche 8. Probabilistische

Mehr

Integration, Migration und Evolution

Integration, Migration und Evolution 14. Mai 2013 Programm für heute 1 2 Quelle Das Material zu diesem Kapitel stammt aus der Vorlesung Datenintegration & Datenherkunft der Universität Tübingen gehalten von Melanie Herschel im WS 2010/11.

Mehr

Maßgeschneiderte Suchmaschinen

Maßgeschneiderte Suchmaschinen Maßgeschneiderte Suchmaschinen Usability Stammtisch Frankfurt am Main 17.11.2009 Walter Ebert Web Development www.walterebert.de Braucht meine Website eine Suchmachine? Wahrscheinlich, wenn: Eine gute

Mehr

Lucene. Volltextsuche mit Java. Georg Schumann

Lucene. Volltextsuche mit Java. Georg Schumann Lucene Volltextsuche mit Java Georg Schumann Fachhochschule Augsburg Baumgartnerstraße 16, 86161 Augsburg, Masterstudiengang Informatik E-Mail: gschu@fh-augsburg.de 5. Juli 2006 Kurzfassung: Überall in

Mehr

intergator - Intelligente Suche in archivierten und anderen Daten

intergator - Intelligente Suche in archivierten und anderen Daten intergator - Intelligente Suche in archivierten und anderen Daten Agenda: Motivation Besonderheiten von Archiven aus Suchmaschinensicht Typische Szenarien Produktvorstellung Live! Oktober 2014 Ihr Referent:

Mehr

Sie haben Ihr Ziel erreicht

Sie haben Ihr Ziel erreicht Sie haben Ihr Ziel erreicht Innovative Weblösungen aus einer Hand. Sysgrade - intelligent internet. Agenda Überblick behalten! A) TYPO3 Standardsuche: indexed search Funktionsweise Vor- und Nachteile Erweiterungen

Mehr

Die Suche in Liferay Portal

Die Suche in Liferay Portal Die Suche in Liferay Portal Unternehmen brauchen für ihre Mitarbeiter Portale, die es ihnen ermöglichen, auf die verschiedenen relevanten Applikationen und deren Datenbestände schnell zuzugreifen. Eine

Mehr

Suche, Suchmaschinen, Suchmaschinenoptimierung. Workshop TYPO3 17.04.2012 Sybille Peters

Suche, Suchmaschinen, Suchmaschinenoptimierung. Workshop TYPO3 17.04.2012 Sybille Peters Suche, Suchmaschinen, Suchmaschinenoptimierung Workshop TYPO3 17.04.2012 Sybille Peters Sybille Peters Mitarbeiterin TYPO3 Team RRZN seit 4/2011 vorher im Suchmaschinenlabor des RRZN Seite 2 Überblick

Mehr

Full Text Search in Databases

Full Text Search in Databases Full Text Search in Databases Verfasser: Stefan Kainrath (0651066) h0651066@wu-wien.ac.at 0664/1327136 Betreuer: Dipl.-Ing. Mag. Dr. Albert Weichselbraun Inhaltsverzeichnis 1 Motivation... 3 2 Anforderungen...

Mehr

Ebsco Business Source Premier: Recherche

Ebsco Business Source Premier: Recherche Ebsco Business Source Premier: Recherche Wenn Sie in der Datenbank Business Source Premier recherchieren wollen müssen Sie diese auf der Startseite auswählen: Choose Databases: Business Source Premier

Mehr

Indizierungs- und Suchlogs. Version 2015

Indizierungs- und Suchlogs. Version 2015 Indizierungs- und Suchlogs Version 2015 Status: 13. März 2015 Copyright Mindbreeze GmbH, A-4020 Linz, 2015. Alle Rechte vorbehalten. Alle verwendeten Hard- und Softwarenamen sind Handelsnamen und/oder

Mehr

Diplomarbeit: Open Source Rapid Web Development Frameworks - Eine Untersuchung der Skalierungsstrategien

Diplomarbeit: Open Source Rapid Web Development Frameworks - Eine Untersuchung der Skalierungsstrategien Diplomarbeit: Open Source Rapid Web Development Frameworks - Eine Untersuchung der Skalierungsstrategien Ergebnispräsentation Kolloquium Ralf Geschke FOM Köln 27.04.2009 Gliederung Einleitung Vorgehensweise

Mehr

Open Source Lösung Enterprise Search - Solr. Mit Solr Wissen suchen und schnell finden

Open Source Lösung Enterprise Search - Solr. Mit Solr Wissen suchen und schnell finden Open Source Lösung Enterprise Search - Solr Mit Solr Wissen suchen und schnell finden Enterprise Search suchen und schnell finden Kein Enterprise Portal ohne erfolgreiche Suche Portale bilden heute zentrale

Mehr

Agenda. IT-Symposium 2007 19.04.2007. www.hp-user-society.de 1. Secure Enterprise Search. Suchen und finden mit Suchmaschinen. Oracle SES Überblick

Agenda. IT-Symposium 2007 19.04.2007. www.hp-user-society.de 1. Secure Enterprise Search. Suchen und finden mit Suchmaschinen. Oracle SES Überblick Secure Enterprise Search Das Intranet sicher durchsuchen Jürgen Vester, Snr. Manager Sales Consulting Stuttgart Agenda Suchen und finden mit Suchmaschinen Oracle SES Überblick Demo

Mehr

Alternativen zur OpenText Suche. 29. OpenText Web Solutions Anwendertagung Mannheim, 18. Juni 2012 Sebastian Henne

Alternativen zur OpenText Suche. 29. OpenText Web Solutions Anwendertagung Mannheim, 18. Juni 2012 Sebastian Henne Alternativen zur OpenText Suche 29. OpenText Web Solutions Anwendertagung Mannheim, 18. Juni 2012 Sebastian Henne Übersicht Allgemeines zur Suche Die OpenText Common Search Indexierung ohne DeliveryServer

Mehr

PHP Usergroup Berlin. 6. April 2010. Ein Leben mit und ohne Magento

PHP Usergroup Berlin. 6. April 2010. Ein Leben mit und ohne Magento PHP Usergroup Berlin 6. April 2010 Ein Leben mit und ohne Magento Wer wir sind... Volker Pilz () Daniel Nowak (Rocket Internet) xing.com/profle/volker_pilz xing.com/profle/daniel_nowak Senior Software

Mehr

Office SharePoint Server Suche anpassen und erweitern. Fabian Moritz Senior Consultant, SharePoint MVP ITaCS GmbH

Office SharePoint Server Suche anpassen und erweitern. Fabian Moritz Senior Consultant, SharePoint MVP ITaCS GmbH Office SharePoint Server Suche anpassen und erweitern Fabian Moritz Senior Consultant, SharePoint MVP ITaCS GmbH Agenda Topologie und Architektur der MOSS-Suche Crawling, Indexing, Quering? Was ist was?

Mehr

Das Open Source CMS. Gregor Walter. gw@madgeniuses.net info@i-working.de

Das Open Source CMS. Gregor Walter. gw@madgeniuses.net info@i-working.de Das Open Source CMS Gregor Walter gw@madgeniuses.net info@i-working.de Übersicht Einführung und Geschichte von TYPO3 TYPO3 Features Für Webdesigner Für Redakteure TYPO3 Live - am Beispiel fiwm.de Seite

Mehr

Umsetzung von BI-Lösungen mit Unterstützung einer Suchmaschine. TDWI Stuttgart 15.04.2015 Tobias Kraft, exensio GmbH

Umsetzung von BI-Lösungen mit Unterstützung einer Suchmaschine. TDWI Stuttgart 15.04.2015 Tobias Kraft, exensio GmbH Umsetzung von BI-Lösungen mit Unterstützung einer Suchmaschine TDWI Stuttgart 15.04.2015 Tobias Kraft, exensio GmbH Suchmaschinen Elasticsearch BI-Stack mit Elasticsearch Use Cases Pharmabranche 2 Funktionen

Mehr

Praktikum Information Retrieval Wochen 12: Suchmaschine

Praktikum Information Retrieval Wochen 12: Suchmaschine Praktikum Information Retrieval Wochen 12: Suchmaschine Melikka Khosh-Niat Matthias Jordan 23. Mai 3. Juni 2011 Lösungen: Upload bis 3. Juni 2011 Aktuelle Informationen, Ansprechpartner, Material und Upload

Mehr

Literaturrecherche Thema: Analyse sozialer Netzwerke in wissenschaftlichen Communities. Peter Kraker. Empirische Methoden WS09/10 Prof.

Literaturrecherche Thema: Analyse sozialer Netzwerke in wissenschaftlichen Communities. Peter Kraker. Empirische Methoden WS09/10 Prof. Literaturrecherche Thema: Analyse sozialer Netzwerke in wissenschaftlichen Communities Peter Kraker Empirische Methoden WS09/10 Prof. Schlögl Inhalt Themenfindung Ziele der Recherche Recherchestrategie

Mehr

Suchmaschinen und ihre Architektur. Seminar: Angewandtes Information Retrieval Referat von Michael Wirz

Suchmaschinen und ihre Architektur. Seminar: Angewandtes Information Retrieval Referat von Michael Wirz Suchmaschinen und ihre Architektur Seminar: Angewandtes Information Retrieval Referat von Michael Wirz Ziel Rudimentäre Grundkenntnisse über die Funktionsweise von Suchmaschinen und Trends Einführung in

Mehr

emarketing im Focus: Search Engine Optimization SEO für Google & Co. 03.02.2011 Version 1.0 1

emarketing im Focus: Search Engine Optimization SEO für Google & Co. 03.02.2011 Version 1.0 1 emarketing im Focus: Search Engine Optimization SEO für Google & Co. 03.02.2011 Version 1.0 1 Inhaltsverzeichnis emarketing im Überblick Methoden Vorteile Nutzen Fakten & Marktanteile Suchmaschinenoptimierung

Mehr

ht://dig WWW Search Engine Software

ht://dig WWW Search Engine Software ht://dig WWW Search Engine Software Ruprecht-Karls-Universität Heidelberg Seminar für Computerlinguistik Kurs: Information Retrieval Leitung: PD Dr. Karin Haenelt 22.01.2007 Erwin Glockner Übersicht Einführung

Mehr

Search-Driven Applications. Florian Hopf, freiberuflicher Softwareentwickler Tobias Kraft, exensio GmbH

Search-Driven Applications. Florian Hopf, freiberuflicher Softwareentwickler Tobias Kraft, exensio GmbH Search-Driven Applications Florian Hopf, freiberuflicher Softwareentwickler Tobias Kraft, exensio GmbH Agenda Motivation Aufbau der Such-Datenstruktur Anwendungsfälle Fallstricke Was ist Suche? Was wollen

Mehr

Frameworks zur Entwicklung von Suchmaschinen

Frameworks zur Entwicklung von Suchmaschinen Frameworks zur Entwicklung von Suchmaschinen Dipl.-Inf. Frank Hofmann Potsdam 1. Juli 2007 Dipl.-Inf. Frank Hofmann (Potsdam) Frameworks zur Entwicklung von Suchmaschinen 1. Juli 2007 1 / 37 Zielsetzung

Mehr

Content Management mit JSR-170 und dem Open Source CMS Magnolia

Content Management mit JSR-170 und dem Open Source CMS Magnolia Content Management mit JSR-170 und dem Open Source CMS Magnolia Dr. Ralf Hirning LogicaCMG 2006. All rights reserved Agenda Überblick Features Redaktionsprozess Beispielimplementierung Magnolia Editionen

Mehr

Vom Suchen und Finden:

Vom Suchen und Finden: Vom Suchen und Finden: Enterprise Search und Website Search September 2015 Ob im Web allgemein oder in Unternehmen: Die Menge an digital verfügbaren Informationen wächst laufend, auf praktisch allen Gebieten

Mehr

Struts 2 Das Imperium schlägt zurück?

Struts 2 Das Imperium schlägt zurück? Struts 2 Das Imperium schlägt zurück? Orientation in Objects GmbH Weinheimer Str. 68 68309 Mannheim Tobias Kieninger www.oio.de info@oio.de Java, XML und Open Source seit 1998 ) Software

Mehr

Roland Tilgner. Solution Architects & Team Coaching DEVELOPMENT. ORACLE TEXT AUS PL/SQL-SICHT Features und Möglichkeiten

Roland Tilgner. Solution Architects & Team Coaching DEVELOPMENT. ORACLE TEXT AUS PL/SQL-SICHT Features und Möglichkeiten Roland Tilgner Solution Architects & Team Coaching DEVELOPMENT ORACLE TEXT AUS PL/SQL-SICHT Features und Möglichkeiten ZURPERSON Roland Tilgner ZURFIRMA Roland Tilgner Solution Architects & Team Coaching

Mehr

Florian Hopf www.florian-hopf.de @fhopf. elasticsearch. Bern 07.10.2015

Florian Hopf www.florian-hopf.de @fhopf. elasticsearch. Bern 07.10.2015 Florian Hopf www.florian-hopf.de @fhopf elasticsearch. Bern 07.10.2015 Agenda Suche Verteilung Elasticsearch und Java Aggregationen Zentralisiertes Logging Suche Installation # download archive wget https://download.elastic.co/elasticsearch

Mehr

NESTOR Workshop, 16.10.13 in Baden-Baden

NESTOR Workshop, 16.10.13 in Baden-Baden NESTOR Workshop, 16.10.13 in Baden-Baden Dominik Frey HA Information, Dokumentation und Archive des Südwestrundfunks und des Saarländischen Rundfunks dominik.frey@swr.de Agenda Webarchiv Wayback Integration

Mehr

Ersetzt die Suchmaschine den Verbund-OPAC? Erfahrungen, Perspektiven und mögliche Kooperationsfelder aus Sicht der Verbünde

Ersetzt die Suchmaschine den Verbund-OPAC? Erfahrungen, Perspektiven und mögliche Kooperationsfelder aus Sicht der Verbünde Ersetzt die Suchmaschine den Verbund-OPAC? Erfahrungen, Perspektiven und mögliche Kooperationsfelder aus Sicht der Verbünde Hermann Kronenberg 94. DBT Düsseldorf, 16. März 2005 Inhalt Katalog oder Suchmaschine?

Mehr

Suche, Suchmaschinen, Suchmaschinenoptimierung. Workshop TYPO3 17.04.2012 Sybille Peters

Suche, Suchmaschinen, Suchmaschinenoptimierung. Workshop TYPO3 17.04.2012 Sybille Peters Suche, Suchmaschinen, Suchmaschinenoptimierung Workshop TYPO3 17.04.2012 Sybille Peters Sybille Peters Mitarbeiterin TYPO3 Team RRZN seit 4/2011 vorher im Suchmaschinenlabor des RRZN Seite 2 Überblick

Mehr

5. Programmierschnittstellen für XML

5. Programmierschnittstellen für XML 5. Programmierschnittstellen für Grundlagen Dr. E. Schön FH Erfurt Sommersemester 2015 Seite 135 Programmierschnittstelle Notwendigkeit: Zugriff auf -Daten durch Applikationen wiederverwendbare Schnittstellen

Mehr

5. Programmierschnittstellen für XML

5. Programmierschnittstellen für XML 5. Programmierschnittstellen für für Medientechnologen Dr. E. Schön Wintersemester 2015/16 Seite 146 Notwendigkeit: Programmierschnittstelle Zugriff auf -Daten durch Applikationen wiederverwendbare Schnittstellen

Mehr

Content Management Systeme

Content Management Systeme Content Management Systeme Ein Vergleich unter besonderer Berücksichtigung von CoreMedia und TYPO3 Bachelorthesis im Kooperativen Bachelor Studiengang Informatik (KoSI) der Fachhochschule Darmstadt University

Mehr

Gut zu wissen... Lorenz Keller Server Technologies Competence Center Nord

Gut zu wissen... Lorenz Keller Server Technologies Competence Center Nord Gut zu wissen... Lorenz Keller Server Technologies Competence Center Nord Agenda Neue Produkte Oracle Secure Enterprise Search SQL Developer (Raptor) XML-Publisher Application Server/ JDeveloper 10.1.3

Mehr

Acrolinx Produktstrategie. Roadmap. 10. Oktober 2014. #AcrolinxUserConference. Start um 10:08

Acrolinx Produktstrategie. Roadmap. 10. Oktober 2014. #AcrolinxUserConference. Start um 10:08 Acrolinx Produktstrategie und Roadmap 10. Oktober 2014 #AcrolinxUserConference Start um 10:08 SAFE HARBOR ERKLÄRUNG Die folgende Präsentation skizziert die allgemeine Richtung der Produktentwicklung von

Mehr

MO 27. Aug. 2007, 17:00 UHR JAVA FRAMEWORKS TIPPS VON PROFI-GÄRTNERN GEGEN WILDWUCHS

MO 27. Aug. 2007, 17:00 UHR JAVA FRAMEWORKS TIPPS VON PROFI-GÄRTNERN GEGEN WILDWUCHS 072 MO 27. Aug. 2007, 17:00 UHR JAVA FRAMEWORKS TIPPS VON PROFI-GÄRTNERN GEGEN WILDWUCHS Die Flut von Open Source Frameworks ist vergleichbar mit dem Markt von kommerziellen Produkten Es gibt eine Vielzahl

Mehr

Frameworks zur Entwicklung von Suchmaschinen

Frameworks zur Entwicklung von Suchmaschinen Frameworks zur Entwicklung von Suchmaschinen Dipl.-Inf. Frank Hofmann 2. April 2007 Zielsetzung Fragen, die sich jeder stellt Wie funktioniert eine Suchmaschine? Warum finde ich eigentlich nicht das, was

Mehr

SharePoint Search Workshop

SharePoint Search Workshop SharePoint Search Workshop Fabian Moritz MVP Office SharePoint Server Goldsponsor: Partner: Silbersponsoren: Veranstalter: Themen des Workshops Einführung in die Technologie Planung einer Suchinfrastruktur

Mehr

Elisabeth Stettler. Business Consultant. Andreas Gerig. Consultant/Projekt Manager.

Elisabeth Stettler. Business Consultant. Andreas Gerig. Consultant/Projekt Manager. TopSoft. Business Software. Effizienzperlen beim Einsatz von SharePoint. Namics. Elisabeth Stettler. Business Consultant. Andreas Gerig. Consultant/Projekt Manager. 24. September 2009 TopSoft. Business

Mehr

ETH Web-Relaunch: Wichtige Entscheide gefällt

ETH Web-Relaunch: Wichtige Entscheide gefällt ETH Web-Relaunch: Wichtige Entscheide gefällt Web-Re-Lounge 9. November 2011 1 Inhalt 1. Projekt-Status Teilprojekte TP 1, 2: Fachkonzept Informationsarchitektur TP 3-5: Die Teilprojekte der ID TP 6: Visuelles

Mehr

Integration von Web Services in J EE Anwendungen mit XFire. 1/26 André Janus - Integration von Web Services in J EE Anwendungen mit XFire

Integration von Web Services in J EE Anwendungen mit XFire. 1/26 André Janus - Integration von Web Services in J EE Anwendungen mit XFire Integration von Web Services in J EE Anwendungen mit XFire 1/26 André Janus - Integration von Web Services in J EE Anwendungen mit XFire univativ : = Umsetzung durch Studenten und Young Professionals.

Mehr

Einführung Aufbau des Analyzer Analyse deutscher Texte. Analyse mit Lucene. Dr. Christian Herta. Mai, 2009 1 / 35

Einführung Aufbau des Analyzer Analyse deutscher Texte. Analyse mit Lucene. Dr. Christian Herta. Mai, 2009 1 / 35 Analyse mit Lucene Dr. Christian Herta Mai, 2009 1 / 35 Lernziele - Inhalt Einführung Analyse-Prozess Einuss der Analyse auf die Indizierung und Suche über QueryParser wichtigen Klassen und Methoden zur

Mehr

Sprecher. Stephan Krauß Enterprise Portale E-Commerce. Dipl.-Phys. Johannes Knauf Business Analytics Data Science

Sprecher. Stephan Krauß Enterprise Portale E-Commerce. Dipl.-Phys. Johannes Knauf Business Analytics Data Science Sprecher Stephan Krauß Enterprise Portale E-Commerce T +49 (0)911 25 25 68 0 F +49 (0)911 25 25 68 68 info@ancud.de http://www.ancud.de Dipl.-Phys. Johannes Knauf Business Analytics Data Science T +49

Mehr

Content Managament mit TYPO3 Einführung und praktische Vorführung

Content Managament mit TYPO3 Einführung und praktische Vorführung Content Managament mit TYPO3 Einführung und praktische Vorführung Präsentation für den Berliner Arbeitskreis Information BAK 17/03, 26.11.2003 Tobias Müller-Prothmann, Dipl.-Soz. Institut für Publizistik-

Mehr

Übersicht. Eclipse Foundation. Eclipse Plugins & Projects. Eclipse Ganymede Simultaneous Release. Web Tools Platform Projekt. WSDL Editor.

Übersicht. Eclipse Foundation. Eclipse Plugins & Projects. Eclipse Ganymede Simultaneous Release. Web Tools Platform Projekt. WSDL Editor. Eclipse WSDL-Editor Übersicht Eclipse Foundation Eclipse Plugins & Projects Eclipse Ganymede Simultaneous Release Web Tools Platform Projekt WSDL Editor Bug #237918 Eclipse Foundation Was ist Eclipse?

Mehr

David Mika. Donnerstag, den 15. März 2012. Verein zur Förderung der privaten Internet Nutzung e.v. Suchen und Finden im Internet. david@ping.

David Mika. Donnerstag, den 15. März 2012. Verein zur Förderung der privaten Internet Nutzung e.v. Suchen und Finden im Internet. david@ping. Suchen im David Mika Verein zur Förderung der privaten Nutzung e.v. Donnerstag, den 15. März 2012 Themenüberblick 1 2 3 4 5 6 Informationsflut im Jeder kann schnell und einfach Dokumente publizieren Aktuell

Mehr

Florian Hopf www.florian-hopf.de @fhopf. elasticsearch.

Florian Hopf www.florian-hopf.de @fhopf. elasticsearch. Florian Hopf www.florian-hopf.de @fhopf elasticsearch. Agenda Suche Verteilung Elasticsearch und Java Aggregationen Zentralisiertes Logging Suche Suche Installation # download archive wget https://download.elastic.co/elasticsearch

Mehr

Was hier fehlt? Enterprise Search mit der Intelligenz von Google. Jetzt von Kapsch.

Was hier fehlt? Enterprise Search mit der Intelligenz von Google. Jetzt von Kapsch. Kapsch BusinessCom DE Was hier fehlt? Enterprise Search mit der Intelligenz von Google. Jetzt von Kapsch. always one step ahead Gesucht? Bilder, Dokumente, Links, Personen, Dateien, Mails, Webseiten. Irgendwo

Mehr

NEWSLETTER. FileDirector Version 2.5 Novelties. Filing system designer. Filing system in WinClient

NEWSLETTER. FileDirector Version 2.5 Novelties. Filing system designer. Filing system in WinClient Filing system designer FileDirector Version 2.5 Novelties FileDirector offers an easy way to design the filing system in WinClient. The filing system provides an Explorer-like structure in WinClient. The

Mehr

PHP 6 Beliebte Webskriptsprache wird erwachsen. Linux User Group Bern 14.05.2009 René Moser

PHP 6 Beliebte Webskriptsprache wird erwachsen. Linux User Group Bern 14.05.2009 René Moser <mail@renemoser.net> PHP 6 Beliebte Webskriptsprache wird erwachsen Linux User Group Bern 14.05.2009 René Moser Inhalt 1.Wie entstand PHP? 2.Was PHP? 3.Warum PHP? 4.Wie installiere ich PHP? 5.Wie programmiere

Mehr

The Web in your Hands

The Web in your Hands The Web in your Hands Open Source Content Management mit TYPO3 Referent: Dominic Brander, snowflake productions gmbh Spannende Minuten Wer ist... Vorstellung Was ist TYPO3? Über das ECMS TYPO3 Das kann

Mehr

Enterprise Monitoring mit Icinga

Enterprise Monitoring mit Icinga Referent: Bernd Erk Enterprise Monitoring mit Icinga 06.04.2011 OSDC 2011 Agenda DESTINATION TIME REMARK KURZVORSTELLUNG DAS ICINGA PROJEKT ICINGA ARCHITEKTURE ICINGA VS. NAGIOS ENTERPRISE FEATURES ERWEITERUNGEN

Mehr

Ein Überblick über KDevelop

Ein Überblick über KDevelop Inhalt KDevelop? Was ist das eigentlich? Inhalt KDevelop? Was ist das eigentlich? Was ist KDevelop 4.x? im Kern: C++-IDE basierend auf KDE- und Qt-Bibliotheken Komplettes Rewrite von Version 3 erstes 4.0-Release

Mehr

Microsoft Office Sharepoint 2010

Microsoft Office Sharepoint 2010 Microsoft Office Sharepoint 2010 Dr. Lutz Netik 05.09.2010 Dr. Netik & Partner GmbH 1 Wofür Sharepoint? Sharepoint Services kostenloser Dienst des Windows Server Webseitensammlung mit einem leistungsfähigen

Mehr

DDM. Digital Document Management

DDM. Digital Document Management DDM. Digital Document Management Einfache Suche Erweiterte Suche Download von Dokumenten Direktversand per E-Mail Videos und Neuheiten Account-Verwaltung Online-Nutzung von PDF Dokumenten, Präsentationen,

Mehr

Das Internet ist mobil. John Riordan Bern, 17. Jan 2013

Das Internet ist mobil. John Riordan Bern, 17. Jan 2013 Das Internet ist mobil John Riordan Bern, 17. Jan 2013 Präsentation 1/17 /13 2 Das Handy als Instrument für den Internetzugang Über 3 Mio. Schweizer mobil im Netz 2012 werden weltweit erstmals mehr Smartphones

Mehr

Peter Dikant mgm technology partners GmbH. Echtzeitsuche mit Hadoop und Solr

Peter Dikant mgm technology partners GmbH. Echtzeitsuche mit Hadoop und Solr Peter Dikant mgm technology partners GmbH Echtzeitsuche mit Hadoop und Solr ECHTZEITSUCHE MIT HADOOP UND SOLR PETER DIKANT MGM TECHNOLOGY PARTNERS GMBH WHOAMI peter.dikant@mgm-tp.com Java Entwickler seit

Mehr

Fundraising Kongress Berlin 2014 Marcus Koch Twitter: @marcus_koch

Fundraising Kongress Berlin 2014 Marcus Koch Twitter: @marcus_koch Fundraising Kongress Berlin 2014 Marcus Koch Twitter: @marcus_koch Festlegung der Online Marketing Ziele Eigentlich eine einfache Übung.. Ziele, Kennzahlen, Key Performance Indikatoren Wir sind was wir

Mehr

Relevantes schneller finden mit Lucene und Solr

Relevantes schneller finden mit Lucene und Solr Relevantes schneller finden mit Lucene und Solr Martin Rödig SHI Elektronische Medien GmbH 2010 www.shi-gmbh.com Martin Rödig Projektmanagement Requirements Engineering Trainer für Solr Wer ist SHI? Seit

Mehr

CENIT SERVICEMANAGER Pluscard, Saarbrücken 26.11.2014. Dirk Günther, Produktmanager ECM R&D

CENIT SERVICEMANAGER Pluscard, Saarbrücken 26.11.2014. Dirk Günther, Produktmanager ECM R&D CENIT SERVICEMANAGER Pluscard, Saarbrücken 26.11.2014 Dirk Günther, Produktmanager ECM R&D Agenda Überblick Was ist neu Anwendungsfälle Migration Schulung Zusammenfassung 02.12.2014 2 Überblick Was ist

Mehr

TYPO3-Suchmaschinenoptimierung für Redakteure

TYPO3-Suchmaschinenoptimierung für Redakteure TYPO3-Suchmaschinenoptimierung für Redakteure TYPO3 Version 7.6 LTS Allgemeines Dieses Dokument beschreibt redaktionelle Maßnahmen zur Verbesserung des Suchmaschinen- Rankings. Diese Maßnahmen sind Teil

Mehr

Systemmanagement mit Puppet und Foreman

Systemmanagement mit Puppet und Foreman Foreman CLT 2014 16. März 2014 Mattias Giese Solution Architect for Systemsmanagement and Monitoring giese@b1-systems.de - Linux/Open Source Consulting, Training, Support & Development Agenda Vorstellung

Mehr

Exposé zur Studienarbeit. 04. August 2010

Exposé zur Studienarbeit. 04. August 2010 Exposé zur Studienarbeit Relevanzranking in Lucene im biomedizinischen Kontext Christoph Jacob Betreuer: Phillipe Thomas, Prof. Dr. Ulf Leser 04. August 2010 1. Motivation Sucht und ihr werdet finden dieses

Mehr

neofonie DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR

neofonie DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR neofonie DER SPEZIALIST FÜR IHRE INFORMATIONSARCHITEKTUR Suchportale der nächsten Generation Dr. Thomas Schwotzer Leiter Forschung, neofonie Suche eine Folien Geschichte 1993: Beginn der HTML-Ära 1993

Mehr

Microsoft SharePoint. share it, do it! www.klockwork.at

Microsoft SharePoint. share it, do it! www.klockwork.at Microsoft SharePoint share it, do it! www.klockwork.at Share it do it! Das Wissen steckt vor allem in den Köpfen unserer Mitarbeiter. Deshalb ermutigen wir sie, ihr Wissen aufzuzeichnen und zu teilen.

Mehr

Textdokument-Suche auf dem Rechner Implementierungsprojekt

Textdokument-Suche auf dem Rechner Implementierungsprojekt Textdokument-Suche auf dem Rechner Implementierungsprojekt Referent: Oliver Petra Seminar: Information Retrieval Institut für Computerlinguistik Ruprecht-Karls-Universität Heidelberg 19.01.2015 Überblick

Mehr

Geschichte der Suchmaschinen und heutige Vernetzungsstrukturen

Geschichte der Suchmaschinen und heutige Vernetzungsstrukturen Geschichte der Suchmaschinen und heutige Vernetzungsstrukturen Seminar Web Suchmaschinen - WS0304 I. Was gab es vor den WWW Suchmaschinen II. Die Geschichte der WWW Suchmaschinen III. Zusammenfassung und

Mehr

Eclipse Equinox als Basis für Smart Client Anwendungen. Christian Campo, compeople AG, 5.7.2007 Java Forum Stuttgart 2007

Eclipse Equinox als Basis für Smart Client Anwendungen. Christian Campo, compeople AG, 5.7.2007 Java Forum Stuttgart 2007 Eclipse Equinox als Basis für Smart Client Anwendungen Christian Campo, compeople AG, 5.7.2007 Java Forum Stuttgart 2007 Übersicht Definition / Architektur Smart Client Smart Client mit RCP / Equinox Gesamtfazit

Mehr

Besser crawlen, schneller finden

Besser crawlen, schneller finden Besser crawlen, schneller finden Suchmaschinen Im Allgemeinen und bei PANVISION Felix Fürer Björn Schmidt Panvision November 2013 Roadmap Entstehungsgeschichte Suchmaschinen Erweiterung der Fähigkeiten

Mehr

Konfiguration von Fabasoft Mindbreeze Enterprise für IBM Lotus

Konfiguration von Fabasoft Mindbreeze Enterprise für IBM Lotus Konfiguration von Fabasoft Mindbreeze Enterprise für IBM Lotus Installation und Konfiguration Version 2013 Spring Release Status: 09. März 2013 Copyright Mindbreeze Software GmbH, A-4020 Linz, 2013. Alle

Mehr

Erweiterbare Architekturen

Erweiterbare Architekturen 1 Florian Deißenböck Erweiterbare Architekturen 23. September 2005 Architektenworkshop 2 Gliederung Hintergrund Persönliches, Software-Qualität, Wartbarkeit ConQATs Architektur Entwurf, Prototypen, Konfiguration

Mehr

Apache Solr. Apache Solr. ALD:HS WiSe 2011/2012. Einleitung. Features. Implementation. Verwaltung. Benutzung

Apache Solr. Apache Solr. ALD:HS WiSe 2011/2012. Einleitung. Features. Implementation. Verwaltung. Benutzung Universität zu Köln Sprachliche Informationsverarbeitung Hauptseminar: Angewandte linguistische Datenverarbeitung Dozent: Prof. Dr. Jürgen Rolshoven Referent: Patrick Pelinski 1 Gliederung Beschreibung,

Mehr

BEDIFFERENT ACE G E R M A N Y. aras.com. Copyright 2012 Aras. All Rights Reserved.

BEDIFFERENT ACE G E R M A N Y. aras.com. Copyright 2012 Aras. All Rights Reserved. BEDIFFERENT ACE G E R M A N Y Aras Corporate ACE Germany Communities Welche Vorteile? Rolf Laudenbach Director Aras Community Slide 3 Aras Communities Public Community Projects Forums Blogs Wikis Public

Mehr